Pandas
2016-08-11 17:26:44 0 举报
AI智能生成
Pandas是一个开源的Python数据分析库,提供了大量的数据结构和函数,用于处理和分析结构化数据。它的核心数据结构是DataFrame,类似于Excel或SQL表,可以存储和操作多种类型的数据。Pandas提供了丰富的功能,如数据清洗、数据转换、数据聚合、时间序列分析等,使得数据分析变得更加高效和便捷。此外,Pandas还支持对数据的可视化,可以轻松地生成各种图表和图形。总之,Pandas是Python数据分析领域的重要工具,广泛应用于金融、科研、工程等领域。
作者其他创作
大纲/内容
panda的引入P127
Series
提供一个索引 P127
DataFrame
P130
导入等长数组,且会自动排序
可以做数据的增、删、改、查,相当于操作excel表P131
嵌套字典,相当于excel里面的交叉表,并且可以转置P133,excel里面的转置好复杂,但对于python只需要一句话
交叉表也可以通过指定索引的方式进行,更清楚P134
索引对象
Index对象P137
reindex P138
ffill向前填充
相当于excel里面的定位空值
算数运算和数据对齐
P144
P145可以用reshape函数进行一个交叉表的定义及计算
在算数方法中填充特殊值P146
dataframe和series之间的运算,会把series拓展到和dataframe相同的维度P148
排序和排名P149
带有重复值的索引P153,
和正常的一样
汇总和计算描述统计P155
相关系数及协方差P156
去重,计数及成员资格
P157
处理缺失数据P159
层次化索引,用多个索引,好像字典里的偏旁部首
P164
在数据透析表中有重要应用
重新排序分级P167
根据级别分类汇总统计P168
相当于group by
set_index,把咧转化成行P168
其他P169
基于位置的索引
0 条评论
下一页