python模块
2018-08-20 16:57:13 0 举报
AI智能生成
python常用模块(未完成版)
作者其他创作
大纲/内容
random模块
模块名称:random<br>导入方法:<font color="#f68b1f">import random</font>
常用方法
<font color="#f68b1f">random.random()</font> # 大于0且小于1之间的小数
<br>0.7664338663654585
#随机整数<br><br><font color="#f68b1f">random.randint(1,5)</font> # 大于等于1且小于等于5之间的整数<br><br><font color="#f68b1f">random.randrange(1,10,2)</font> # 大于等于1且小于10之间的奇数
#随机选择一个返回<br><br><font color="#f68b1f">random.choice([1,'23',[4,5]])</font> # #1或者23或者[4,5]<br><br>#随机选择多个返回,返回的个数为函数的第二个参数<br><br><font color="#f68b1f">random.sample([1,'23',[4,5]],2)</font> # #列表元素任意2个组合<br><br>[[4, 5], '23']
#打乱列表顺序<br><font color="#f68b1f">item=[1,3,5,7,9]<br>random.shuffle(item)</font> # 打乱次序<br>item<br>[5, 1, 3, 7, 9]<br>random.shuffle(item)<br>item<br>[5, 9, 7, 1, 3]
生成随机验证码
import random
<br>def func(n = 6):
<br> a = ''
<br> for i in range(n):
<br> num = str(random.randint(0,9))
<br> alpha = chr(random.randint(97,122))
<br> alpha_A = chr(random.randint(65,90))
<br> ret = random.choice([num,alpha,alpha_A])
<br> a += ret
<br> return a
<br>print(func())
sys模块
模块名称:sys<br>导入方法:<font color="#f68b1f">import sys</font>
常用方法
sys.argv
命令行参数List,第一个元素是程序本身路径
sys.exit(n)
退出程序,正常退出时exit(0),错误退出sys.exit(1)
sys.version
获取Python解释程序的版本信息
sys.path
返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform
返回操作系统平台名称
sys.modules
子主题
序列化模块
json模块
模块名称:json<br>导入方法:<font color="#f68b1f">import json</font>
常用方法
json.dumps()
序列化:将一个字典转换成一个字符串
import json
<br>dic = {'k1':'v1','k2':'v2','k3':'v3'}
<br>str_dic = json.dumps(dic) #序列化:将一个字典转换成一个字符串
<br>print(type(str_dic),str_dic) #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
<br>#注意,json转换完的字符串类型的字典中的字符串是由""表示的
json.loads()
反序列化:将一个字符串格式的字典转换成一个字典
dic2 = json.loads(str_dic) #反序列化:将一个字符串格式的字典转换成一个字典
<br>#注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
<br>print(type(dic2),dic2) #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
json.dump()
dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
import json
<br>f = open('json_file','w')
<br>dic = {'k1':'v1','k2':'v2','k3':'v3'}
<br>json.dump(dic,f) #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
<br>f.close()
json.load()
load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
f = open('json_file')
<br>dic2 = json.load(f) #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
<br>f.close()
<br>print(type(dic2),dic2)
ensure_ascii=False关键字参数
import json
<br>f = open('file','w')
<br>json.dump({'国籍':'中国'},f)
<br>ret = json.dumps({'国籍':'中国'})
<br>f.write(ret+'\n')
<br>json.dump({'国籍':'美国'},f,ensure_ascii=False)
<br>ret = json.dumps({'国籍':'美国'},ensure_ascii=False)
<br>f.write(ret+'\n')
<br>f.close()
pickle模块
pickle.dumps()
序列化:将一个字典转换成一串二进制内容
import pickle
<br>dic = {'k1':'v1','k2':'v2','k3':'v3'}
<br>str_dic = pickle.dumps(dic)
<br>print(str_dic) #一串二进制内容
pickle.loads()
反序列化:将一个二进制格式的字典转换成一个字典
dic2 = pickle.loads(str_dic)
<br>print(dic2)
time模块
模块名称:time<br>导入方法:<font color="#f68b1f">import time</font>
常用方法
time.sleep(secs)<br>(线程)推迟制定的时间运行.单位为秒
time.time()<br>获取当前时间戳
<b>表示时间的三种方</b><br>在Python中,通常有这<br>三种方式来表示时间:<br><font color="#f68b1f">时间戳、元组(struct_time)、<br>格式化的时间字符串</font><br>
<font color="#f68b1f">时间戳(timestamp):</font><br>通常来说,时间戳表示的是从1970年1月1日 00:00:00<br>开始按秒计算的偏移量.我们运行"type(time.time())",<br>返回的是float类型.
time.time()
<br>1500875844.800804
<font color="#f68b1f">格式化的时间字符串(Format String):</font><br>%y 两位数的年份表示(00-99)<br><br>%Y 四位数的年份表示(000-9999)<br><br>%m 月份(01-12)<br><br>%d 月内中的一天(0-31)<br><br>%H 24小时制小时数(0-23)<br><br>%I 12小时制小时数(01-12)<br><br>%M 分钟数(00=59)<br><br>%S 秒(00-59)<br><br>%a 本地简化星期名称<br><br>%A 本地完整星期名称<br><br>%b 本地简化的月份名称<br><br>%B 本地完整的月份名称<br><br>%c 本地相应的日期表示和时间表示<br><br>%j 年内的一天(001-366)<br><br>%p 本地A.M.或P.M.的等价符<br><br>%U 一年中的星期数(00-53)星期天为星期的开始<br><br>%w 星期(0-6),星期天为星期的开始<br><br>%W 一年中的星期数(00-53)星期一为星期的开始<br><br>%x 本地相应的日期表示<br><br>%X 本地相应的时间表示<br><br>%Z 当前时区的名称<br><br>%% %号本身<br>
time.strftime("%Y-%m-%d %X")
<br>'2017-07-24 13:54:37'
<br>>>>time.strftime("%Y-%m-%d %H-%M-%S")
<br>'2017-07-24 13-55-04'
<font color="#f68b1f">元组(struct_time):</font><br>struct_time元组共有9个元素:(<br>年,月.日,分,秒,一年中第几周,一<br>年中第几天等)
#时间元组:localtime将一个时间戳转换为当前时区的struct_time<br><br>time.localtime()<br><br>time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24,<br><br> tm_hour=13, tm_min=59, tm_sec=37, <br><br> tm_wday=0, tm_yday=205, tm_isdst=0)
三种格式之间的转换
#时间戳-->结构化时间
<br>#time.gmtime(时间戳) #UTC时间,与英国伦敦当地时间一致
<br>#time.localtime(时间戳) #当地时间。例如我们现在在北京执行这个方法:与UTC时间相差8小时,UTC时间+8小时 = 北京时间
<br>>>>time.gmtime(1500000000)
<br>time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=2, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0)
<br>>>>time.localtime(1500000000)
<br>time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=10, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0) <br>
#结构化时间-->时间戳
<br>#time.mktime(结构化时间)
<br>>>>time_tuple = time.localtime(1500000000)
<br>>>>time.mktime(time_tuple)
<br>1500000000.0
#结构化时间-->字符串时间
<br>#time.strftime("格式定义","结构化时间") 结构化时间参数若不传,则显示当前时间
<br>>>>time.strftime("%Y-%m-%d %X")
<br>'2017-07-24 14:55:36'
<br>>>>time.strftime("%Y-%m-%d",time.localtime(1500000000))
<br>'2017-07-14'
#字符串时间-->结构化时间
<br>#time.strptime(时间字符串,字符串对应格式)
<br>>>>time.strptime("2017-03-16","%Y-%m-%d")
<br>time.struct_time(tm_year=2017, tm_mon=3, tm_mday=16, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=75, tm_isdst=-1)
<br>>>>time.strptime("07/24/2017","%m/%d/%Y")
<br>time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=0, tm_yday=205, tm_isdst=-1)
#结构化时间 --> %a %b %d %H:%M:%S %Y串
<br>#time.asctime(结构化时间) 如果不传参数,直接返回当前时间的格式化串
<br>>>>time.asctime(time.localtime(1500000000))
<br>'Fri Jul 14 10:40:00 2017'
<br>>>>time.asctime()
<br>'Mon Jul 24 15:18:33 2017' <br>
#时间戳 --> %a %b %d %H:%M:%S %Y串
<br>#time.ctime(时间戳) 如果不传参数,直接返回当前时间的格式化串
<br>>>>time.ctime()
<br>'Mon Jul 24 15:19:07 2017'
<br>>>>time.ctime(1500000000)
<br>'Fri Jul 14 10:40:00 2017'
os模块
模块名称:os<br>导入方法:<font color="#f68b1f">import os</font>
文件操作
可生成多层递归目录
os.makedirs('dirname1/dirname2'
若目录为空,则删除,<br>并递归到上一级目录,<br>如若也为空,则删除,<br>依此类推
os.removedirs('dirname1')
生成单级目录
os.mkdir('dirname')
删除单级空目录,若目录不为空则无法删除,报错
os.rmdir('dirname')
列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.listdir('dirname')
删除一个文件
os.remove()
重命名文件/目录
os.rename("oldname","newname")
获取文件/目录信息
os.stat('path/filename')
os.path
返回path规范化的绝对路径 os.path.split(path) <br>将path分割成目录和文件名二元组返回
os.path.abspath(path)
返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.dirname(path)
返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。<br>即os.path.split(path)的第二个元素
os.path.basename(path)
如果path存在,返回True;如果path不存在,返回False
os.path.exists(path)
如果path是绝对路径,返回True
os.path.isabs(path)
如果path是一个存在的文件,返回True。否则返回False
os.path.isfile(path)
如果path是一个存在的目录,则返回True。否则返回False
os.path.isdir(path)
将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.join(path1[, path2[, ...]])
返回path所指向的文件或者目录的最后访问时间
os.path.getatime(path)
返回path所指向的文件或者目录的最后修改时间
os.path.getmtime(path)
返回path的大小
os.path.getsize(path)
统计文件夹大小
递归版
import os<br>def func(path): # r'D:\sylar\s15'<br><br> size_sum = 0<br><br> name_lst = os.listdir(path)<br><br> for name in name_lst:<br><br> path_abs = os.path.join(path,name)<br><br> if os.path.isdir(path_abs):<br><br> size = func(path_abs)<br><br> size_sum += size<br><br> else:<br><br> size_sum += os.path.getsize(path_abs)<br><br> return size_sum<br><br><br><br>ret = func(r'D:\sylar\s15')<br><br>print(ret)
for循环版
import os<br>lst = [r'D:\sylar\s15',] # 列表的第一个目录就是我要统计的目录<br><br>size_sum = 0<br><br>while lst: # [r'D:\sylar\s15',] lst = ['D:\sylar\s15\day01','D:\sylar\s15\day01'..]<br><br> path = lst.pop() # path = 'D:\sylar\s15' lst = []<br><br> path_list = os.listdir(path) # path_list = ['day01',day02',aaa,day15.py]<br><br> for name in path_list: # name = day01<br><br> abs_path = os.path.join(path,name)<br><br> if os.path.isdir(abs_path): # 文件夹的逻辑<br><br> lst.append(abs_path) # lst.append('D:\sylar\s15\day01') lst = ['D:\sylar\s15\day01']<br><br> else:<br><br> size_sum += os.path.getsize(abs_path)<br><br>print(size_sum) <br>
执行doc命令
执行字符串数据类型的操作系统命令
os.system()
执行字符串数据类型的操作系统命令,并返回结果
os.popen()
re模块
模块名称:re<br>导入方法:<font color="#f68b1f">import re</font>
常用方法
findall
匹配所有 每一项都是列表中的一个元素
import re
<br>ret = re.findall('\d+','sjkhk172按实际花费928') # 正则表达式,带匹配的字符串,flag
<br>ret = re.findall('\d','sjkhk172按实际花费928') # 正则表达式,带匹配的字符串,flag
<br>print(ret)
search
只匹配从左到右的第一个,得到的不是直接的结果,<br>而是一个变量,通过这个变量的group方法来获取结果<br>如果没有匹配到,会返回None,使用group会报错
import re
<br>ret = re.search('\d+','sjkhk172按实际花费928')
<br>print(ret) # 内存地址,这是一个正则匹配的结果
<br>print(ret.group()) # 通过ret.group()获取真正的结果
match
从头开始匹配,相当于search中的正则表达式加上一个^
import re
<br>ret = re.match('\d+$','172sjkhk按实际花费928')
<br>print(ret)
split
切割
s = 'alex83taibai40egon25'
<br>ret = re.split('\d+',s)
<br>print(ret)
sub/subn
替换
import re
<br># sub # 谁 旧的 新的 替换次数
<br>ret = re.sub('\d+','H','alex83taibai40egon25')
<br>print(ret)
<br>
<br>ret = re.sub('\d+','H','alex83taibai40egon25',1)
<br>print(ret)
<br>
<br># subn 返回一个元组,第二个元素是替换的次数
<br>ret = re.subn('\d+','H','alex83taibai40egon25')
<br>print(ret)
正则表达式
元字符:
匹配所有的数字
\d
匹配数字,字母,下划线
/w
匹配所有的空白符 回车/换行符 制表符 空格
/s
匹配换行符
/n
匹配制表符
/t
表示单词的边界
/b
匹配除了数字,字母,下划线以外的所有字符
/W
匹配除了数字以外的所有字符
\D
匹配除了空白符 回车 换行符 制表符 空格以外的所有内容
\S
匹配一个字符串的开始
^
匹配一个字符串的结束
$
匹配除换行符之外的所有字符
.
出现在中括号内的内容都可以被匹配
[]
只要不出现在中括号中的内容都可以被匹配
[^]
"或" 符合a规则或者符合b规则的都可以被匹配 <br>(ps:将更复杂的/更长的规则写在最前面)
a|b
分组 表示给几个字符加上量词约束的需求的时候,就给这些量词分在一个组
()
量词:
表示这个量词之前的字符出现n次
{n}
表示这个量词之前的字符至少出现n次
{n,}
表示这个量词之前的字符出现n-m次
{n,m}
表示匹配量词之前的字符出现 0次 或者 1次
?
表示匹配量词之前的字符出现 1次 或者 多次
+
表示匹配量词之前的字符出现 0次 或者 多次<br>
*
进阶:节省时间/空间
节省时间:compile
ret = re.compile('\d+') # 已经完成编译了
<br>print(ret)
<br>res = ret.findall('alex83taibai40egon25')
<br>print(res)
<br>res = ret.search('sjkhk172按实际花费928')
<br>print(res.group())
节省空间:finditer
import re
<br>ret = re.finditer('\d+','alex83taibai40egon25')
<br>for i in ret:
<br> print(i.group())
博客园
0 条评论
下一页