seaborn
2023-06-12 16:29:54 0 举报
AI智能生成
登录查看完整内容
seaborn机器学习
作者其他创作
大纲/内容
pip3 install seaborn
安装
import seaborn as sns
导入
(1)a:表示要观察的数据,可以是 Series、一维数组或列表。
(2) bins:用于控制条形的数量。
(3) hist:接收布尔类型,表示是否绘制(标注)直方图。
(4) kde:接收布尔类型,表示是否绘制高斯核密度估计曲线。
(5) rug:接收布尔类型,表示是否在支持的轴方向上绘制rugplot
绘制单变量分布
(1) kind:表示绘制图形的类型。
(2) stat_func:用于计算有关关系的统计量并标注图。
(3) color:表示绘图元素的颜色。
(4) size:用于设置图的大小(正方形)。
(5) ratio:表示中心图与侧边图的比例。该参数的值越大,则中心图的占比会越大。
(6) space:用于设置中心图与侧边图的间隔大小
绘制散点图
二维直方图类似于“六边形”图,主要是因为它显示了落在六角形区域内的观察值的计数,适用于较大的数据集
绘制二维直方图
绘制核密度估计图形
绘制图像
绘制双变量分布
sns.pairplot(dataset)
绘制成对的双变量分布
seaborn绘制统计图形
(1) x,y,hue:用于绘制数据的输入。
(2) data:用于绘制的数据集。
(3) jitter:表示抖动的程度(仅沿类別轴)。当很多数据点重叠时,可以指定抖动的数量或者设为True使用默认值
swarmplot0函数绘制散点图
类别散点图
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名
它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。
分支主题
(2) saturation:用于设置数据显示的颜色饱和度。---- 使用小数表示
API
箱形图
用于显示数据分布及其概率密度
这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。
中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表 95% 置信区间,而白点则为中位数。
箱形图在数据显示方面受到限制,简单的设计往往隐藏了有关数据分布的重要细节
小提琴图
类别内的数据分布
绘制条形图
绘制点图
类别内的统计估计
用分类数据绘图
获取数据
数据相关性
基本数据排名分析
单变量
双变量
多变量
seaborn可视化方法
衍生变量可视化
球员数据分析
球队薪资排行
球队综合实力排名
利用箱线图和小提琴图进行数据分析
球队数据分析
思路
案例:NBA球员数据分析
(1)统计每个区域的房源总数量,并使用热力图分析房源位置分布情况。
(2)使用条形图分析哪种户型的数量最多、更受欢迎。
(3)统计每个区域的平均租金,并结合柱状图和折线图分析各区域的房源数量和租金情况。
(4)统计面积区间的市场占有率,并使用饼图绘制各区间所占的比例
数据基本介绍
数据读取
重复值和空值处理
数据转换类型
数据预处理
房源数量、位置分布分析
户型数量分析
平均租金分析
面积区间分析
图标分析
分析的流程
北京租房数据统计分析
seaborn
0 条评论
回复 删除
下一页