<u><font color="#ff0000">>> Python <<</font></u>
<b>.split( ) </b>分割,( ) 中的符号进行分割 <b>.strip( )</b> 头尾删除()中的字符
<b>.shape </b> 输出数组的行和列数 <b>.shape[0] </b>输出行数 <b> .shape[1] </b>输出列数
字典
修改 | 新增
dict1 = {'text': '玻璃糖醛酸酶', 'normalized_result': '透明质酸酶'}<br># key存在则修改<br>dict1['text'] = '玻璃糖醛酸酶A'<br>>>dict1 = {'text': '玻璃糖醛酸酶A', 'normalized_result': '透明质酸酶'}<br><br># key不存在则新增<br>dict1['id'] = 1010<br>>>dict1 = {'text': '玻璃糖醛酸酶A', 'normalized_result': '透明质酸酶', 'id': 1010}<br><br>易错处,看备注!!<br>
字典转元组
list(zip(data.keys(),data.values())) # 字典data{'a':1, 'b':2}转化为元组[('a':1), ('b':2)]
json文件新增数据
新建list列表,append添加字典数据
a_list = [] a_list.append(a_dict)
读写数据
读取数据
data = json.load(open(path, 'r', encoding='utf-8'))
1、对数据进行序列化 2、writer函数写入
json_data = json.dumps(data, ensure_ascii=False, indent=2) f.write(json_data)
文件复制
shutil.copy(src, dst, *, follow_symlinks=True)
shutil.copy2(src, dst, *, follow_symlinks=True)
shutil.copytree(src, dst, symlinks=False, ignore=None, copy_function=copy2, ignore_dangling_symlinks=False):
shutil.rmtree(path, ignore_errors=False, onerror=None)
shutil.make_archive(base_name, format, root_dir, base_dir=None, verbose=0, dry_run=0, owner=None, group=None, logger=None)
文件读写
读取
file = open('filename.txt', mode = 'r')
读取str类型的list数据,可使用import ast data = ast.literal_eval( ) 进行数据转化为list
写入
file = open('filename.txt', mode = 'w')<br>file.writable(data)
列表list
字符串类型的列表,转化为列表
from ast import literal_eval<br>literal_eval(a)
import re <br>re.findall("",)
<b>指定位置添加元素</b>
list.insert(index,obj)
<b>删除指定元素</b>
.remove(str) # 指定元素删除
.pop(int) # 指定索引位置删除
取除空值
test = [i for i in test if i != '']
列表list重复项
删除重复
data = [i for n, i in enumerate(data) if i not in data[:n]]<br>
查看重复及重复次数
from collections import Counter<br>b = dict(Counter(data))<br>print ({key:value for key,value in b.items()}) #展现重复元素和重复次数<br>
对字典依据值进行排序
dict_sort = sorted(date.items(), key=lambda x: x[1], reverse=True)
<b>对字典的所有值进行求和</b>
sum(dict(dict_sort).values())
字符串str
查询某字符串在另一字符串的位置
find()
rfind() # 倒序查询