python模块思维导图模板_ProcessOn思维导图、流程图

random模块

模块名称:random 导入方法:import random

常用方法

random.random() # 大于0且小于1之间的小数 0.7664338663654585

#随机整数 random.randint(1,5) # 大于等于1且小于等于5之间的整数 random.randrange(1,10,2) # 大于等于1且小于10之间的奇数

#随机选择一个返回 random.choice([1,'23',[4,5]]) # #1或者23或者[4,5] #随机选择多个返回，返回的个数为函数的第二个参数 random.sample([1,'23',[4,5]],2) # #列表元素任意2个组合 [[4, 5], '23']

#打乱列表顺序 item=[1,3,5,7,9] random.shuffle(item) # 打乱次序 item [5, 1, 3, 7, 9] random.shuffle(item) item [5, 9, 7, 1, 3]

生成随机验证码

import random def func(n = 6): a = '' for i in range(n): num = str(random.randint(0,9)) alpha = chr(random.randint(97,122)) alpha_A = chr(random.randint(65,90)) ret = random.choice([num,alpha,alpha_A]) a += ret return a print(func())

sys模块

模块名称:sys 导入方法:import sys

常用方法

sys.argv

命令行参数List，第一个元素是程序本身路径

sys.exit(n)

退出程序，正常退出时exit(0),错误退出sys.exit(1)

sys.version

获取Python解释程序的版本信息

sys.path

返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值

sys.platform

返回操作系统平台名称

sys.modules

子主题

序列化模块

json模块

模块名称:json 导入方法:import json

常用方法

json.dumps()

序列化：将一个字典转换成一个字符串

import json dic = {'k1':'v1','k2':'v2','k3':'v3'} str_dic = json.dumps(dic) #序列化：将一个字典转换成一个字符串 print(type(str_dic),str_dic) #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"} #注意，json转换完的字符串类型的字典中的字符串是由""表示的

json.loads()

反序列化：将一个字符串格式的字典转换成一个字典

dic2 = json.loads(str_dic) #反序列化：将一个字符串格式的字典转换成一个字典 #注意，要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示 print(type(dic2),dic2) #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}

json.dump()

dump方法接收一个文件句柄，直接将字典转换成json字符串写入文件

import json f = open('json_file','w') dic = {'k1':'v1','k2':'v2','k3':'v3'} json.dump(dic,f) #dump方法接收一个文件句柄，直接将字典转换成json字符串写入文件 f.close()

json.load()

load方法接收一个文件句柄，直接将文件中的json字符串转换成数据结构返回

f = open('json_file') dic2 = json.load(f) #load方法接收一个文件句柄，直接将文件中的json字符串转换成数据结构返回 f.close() print(type(dic2),dic2)

ensure_ascii=False关键字参数

import json f = open('file','w') json.dump({'国籍':'中国'},f) ret = json.dumps({'国籍':'中国'}) f.write(ret+'\n') json.dump({'国籍':'美国'},f,ensure_ascii=False) ret = json.dumps({'国籍':'美国'},ensure_ascii=False) f.write(ret+'\n') f.close()

pickle模块

pickle.dumps()

序列化:将一个字典转换成一串二进制内容

import pickle dic = {'k1':'v1','k2':'v2','k3':'v3'} str_dic = pickle.dumps(dic) print(str_dic) #一串二进制内容

pickle.loads()

反序列化:将一个二进制格式的字典转换成一个字典

dic2 = pickle.loads(str_dic) print(dic2)

time模块

模块名称:time 导入方法:import time

常用方法

time.sleep(secs) (线程)推迟制定的时间运行.单位为秒

time.time() 获取当前时间戳

表示时间的三种方 在Python中，通常有这 三种方式来表示时间： 时间戳、元组(struct_time)、 格式化的时间字符串

时间戳(timestamp): 通常来说,时间戳表示的是从1970年1月1日 00:00:00 开始按秒计算的偏移量.我们运行"type(time.time())", 返回的是float类型.

time.time() 1500875844.800804

格式化的时间字符串(Format String): %y 两位数的年份表示（00-99） %Y 四位数的年份表示（000-9999） %m 月份（01-12） %d 月内中的一天（0-31） %H 24小时制小时数（0-23） %I 12小时制小时数（01-12） %M 分钟数（00=59） %S 秒（00-59） %a 本地简化星期名称 %A 本地完整星期名称 %b 本地简化的月份名称 %B 本地完整的月份名称 %c 本地相应的日期表示和时间表示 %j 年内的一天（001-366） %p 本地A.M.或P.M.的等价符 %U 一年中的星期数（00-53）星期天为星期的开始 %w 星期（0-6），星期天为星期的开始 %W 一年中的星期数（00-53）星期一为星期的开始 %x 本地相应的日期表示 %X 本地相应的时间表示 %Z 当前时区的名称 %% %号本身

time.strftime("%Y-%m-%d %X") '2017-07-24 13:54:37' >>>time.strftime("%Y-%m-%d %H-%M-%S") '2017-07-24 13-55-04'

元组(struct_time): struct_time元组共有9个元素:( 年,月.日,分,秒,一年中第几周,一 年中第几天等)

#时间元组:localtime将一个时间戳转换为当前时区的struct_time time.localtime() time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24, 　　　　　　　　　　tm_hour=13, tm_min=59, tm_sec=37, tm_wday=0, tm_yday=205, tm_isdst=0)

三种格式之间的转换

#时间戳-->结构化时间 #time.gmtime(时间戳) #UTC时间，与英国伦敦当地时间一致 #time.localtime(时间戳) #当地时间。例如我们现在在北京执行这个方法：与UTC时间相差8小时，UTC时间+8小时 = 北京时间 >>>time.gmtime(1500000000) time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=2, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0) >>>time.localtime(1500000000) time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=10, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0)

#结构化时间-->时间戳　 #time.mktime(结构化时间) >>>time_tuple = time.localtime(1500000000) >>>time.mktime(time_tuple) 1500000000.0

#结构化时间-->字符串时间 #time.strftime("格式定义","结构化时间") 结构化时间参数若不传，则显示当前时间 >>>time.strftime("%Y-%m-%d %X") '2017-07-24 14:55:36' >>>time.strftime("%Y-%m-%d",time.localtime(1500000000)) '2017-07-14'

#字符串时间-->结构化时间 #time.strptime(时间字符串,字符串对应格式) >>>time.strptime("2017-03-16","%Y-%m-%d") time.struct_time(tm_year=2017, tm_mon=3, tm_mday=16, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=75, tm_isdst=-1) >>>time.strptime("07/24/2017","%m/%d/%Y") time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=0, tm_yday=205, tm_isdst=-1)

#结构化时间 --> %a %b %d %H:%M:%S %Y串 #time.asctime(结构化时间) 如果不传参数，直接返回当前时间的格式化串 >>>time.asctime(time.localtime(1500000000)) 'Fri Jul 14 10:40:00 2017' >>>time.asctime() 'Mon Jul 24 15:18:33 2017'

#时间戳 --> %a %b %d %H:%M:%S %Y串 #time.ctime(时间戳) 如果不传参数，直接返回当前时间的格式化串 >>>time.ctime() 'Mon Jul 24 15:19:07 2017' >>>time.ctime(1500000000) 'Fri Jul 14 10:40:00 2017'

os模块

模块名称:os 导入方法:import os

文件操作

可生成多层递归目录

os.makedirs('dirname1/dirname2'

若目录为空，则删除， 并递归到上一级目录， 如若也为空，则删除， 依此类推

os.removedirs('dirname1')

生成单级目录

os.mkdir('dirname')

删除单级空目录，若目录不为空则无法删除，报错

os.rmdir('dirname')

列出指定目录下的所有文件和子目录，包括隐藏文件，并以列表方式打印

os.listdir('dirname')

删除一个文件

os.remove()

重命名文件/目录

os.rename("oldname","newname")

获取文件/目录信息

os.stat('path/filename')

os.path

返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回

os.path.abspath(path)

返回path的目录。其实就是os.path.split(path)的第一个元素

os.path.dirname(path)

返回path最后的文件名。如何path以／或\结尾，那么就会返回空值。 即os.path.split(path)的第二个元素

os.path.basename(path)

如果path存在，返回True；如果path不存在，返回False

os.path.exists(path)

如果path是绝对路径，返回True

os.path.isabs(path)

如果path是一个存在的文件，返回True。否则返回False

os.path.isfile(path)

如果path是一个存在的目录，则返回True。否则返回False

os.path.isdir(path)

将多个路径组合后返回，第一个绝对路径之前的参数将被忽略

os.path.join(path1[, path2[, ...]])

返回path所指向的文件或者目录的最后访问时间

os.path.getatime(path)

返回path所指向的文件或者目录的最后修改时间

os.path.getmtime(path)

返回path的大小

os.path.getsize(path)

统计文件夹大小

递归版

import os def func(path): # r'D:\sylar\s15' size_sum = 0 name_lst = os.listdir(path) for name in name_lst: path_abs = os.path.join(path,name) if os.path.isdir(path_abs): size = func(path_abs) size_sum += size else: size_sum += os.path.getsize(path_abs) return size_sum ret = func(r'D:\sylar\s15') print(ret)

for循环版

import os lst = [r'D:\sylar\s15',] # 列表的第一个目录就是我要统计的目录 size_sum = 0 while lst: # [r'D:\sylar\s15',] lst = ['D:\sylar\s15\day01','D:\sylar\s15\day01'..] path = lst.pop() # path = 'D:\sylar\s15' lst = [] path_list = os.listdir(path) # path_list = ['day01',day02',aaa,day15.py] for name in path_list: # name = day01 abs_path = os.path.join(path,name) if os.path.isdir(abs_path): # 文件夹的逻辑 lst.append(abs_path) # lst.append('D:\sylar\s15\day01') lst = ['D:\sylar\s15\day01'] else: size_sum += os.path.getsize(abs_path) print(size_sum)

执行doc命令

执行字符串数据类型的操作系统命令

os.system()

执行字符串数据类型的操作系统命令,并返回结果

os.popen()

re模块

模块名称:re 导入方法:import re

常用方法

findall

匹配所有每一项都是列表中的一个元素

import re ret = re.findall('\d+','sjkhk172按实际花费928') # 正则表达式,带匹配的字符串,flag ret = re.findall('\d','sjkhk172按实际花费928') # 正则表达式,带匹配的字符串,flag print(ret)

search

只匹配从左到右的第一个,得到的不是直接的结果, 而是一个变量,通过这个变量的group方法来获取结果 如果没有匹配到,会返回None,使用group会报错

import re ret = re.search('\d+','sjkhk172按实际花费928') print(ret) # 内存地址,这是一个正则匹配的结果 print(ret.group()) # 通过ret.group()获取真正的结果

match

从头开始匹配,相当于search中的正则表达式加上一个^

import re ret = re.match('\d+$','172sjkhk按实际花费928') print(ret)

split

切割

s = 'alex83taibai40egon25' ret = re.split('\d+',s) print(ret)

sub/subn

替换

import re # sub # 谁旧的新的替换次数 ret = re.sub('\d+','H','alex83taibai40egon25') print(ret) ret = re.sub('\d+','H','alex83taibai40egon25',1) print(ret) # subn 返回一个元组,第二个元素是替换的次数 ret = re.subn('\d+','H','alex83taibai40egon25') print(ret)

正则表达式

元字符:

匹配所有的数字

\d

匹配数字,字母,下划线

/w

匹配所有的空白符回车/换行符制表符空格

/s

匹配换行符

/n

匹配制表符

/t

表示单词的边界

/b

匹配除了数字,字母,下划线以外的所有字符

/W

匹配除了数字以外的所有字符

\D

匹配除了空白符回车换行符制表符空格以外的所有内容

\S

匹配一个字符串的开始

^

匹配一个字符串的结束

$

匹配除换行符之外的所有字符

.

出现在中括号内的内容都可以被匹配

[]

只要不出现在中括号中的内容都可以被匹配

[^]

"或" 符合a规则或者符合b规则的都可以被匹配 (ps:将更复杂的/更长的规则写在最前面)

a|b

分组表示给几个字符加上量词约束的需求的时候,就给这些量词分在一个组

()

量词:

表示这个量词之前的字符出现n次

{n}

表示这个量词之前的字符至少出现n次

{n,}

表示这个量词之前的字符出现n-m次

{n,m}

表示匹配量词之前的字符出现 0次或者 1次

?

表示匹配量词之前的字符出现 1次或者多次

+

表示匹配量词之前的字符出现 0次或者多次

*

进阶:节省时间/空间

节省时间:compile

ret = re.compile('\d+') # 已经完成编译了 print(ret) res = ret.findall('alex83taibai40egon25') print(res) res = ret.search('sjkhk172按实际花费928') print(res.group())

节省空间:finditer

import re ret = re.finditer('\d+','alex83taibai40egon25') for i in ret: print(i.group())

博客园