机器学习总结基础-1
2024-06-20 16:31:17 0 举报
AI智能生成
机器学习总结基础-1是一份详细的概述,涵盖了机器学习的核心概念、算法和应用。这份资料以易于理解的语言阐述了各种基础算法,如线性回归、逻辑回归、决策树、支持向量机等,并介绍了它们在实际问题中的实现。此外,文档还包括了数据预处理、特征工程、模型评估等关键步骤,以及如何利用Python等编程语言进行机器学习实践。无论是对初学者还是有一定基础的学习者,这份资料都是理解和掌握机器学习的宝贵资源。
作者其他创作
大纲/内容
genfromtxt(\"world_alcohol.txt\
numpy.genfromtxt
arr.shape[0]
arr.shape[1]
arr.ndim
arr.size
arr.reshape(-1)
score[score >= 95]
score[score <= 85]
3维矩阵,2条 3行,4列
指向位置不同,数据相同
arr.view()
指向位置不同,数据不同
arr.copy()
对a进行扩展, 行扩充3倍, 列扩充5倍
按列进行排序
对索引进行排序,按照从小到大排序
排序后的数据
a[i]
i = np.argsort(a)
创建
索引从0开始,第二行,第5列
第3行,第3列
第1行,前3列的值
world[0 : 3]
所有行,第2列
所有行,前2列
第2行和第3行,前2列
选择
min
max
行相加, axis =1 列相加
sum(axis = 0)
e 的 B次幂
np.exp(B)
B次方跟
np.sqrt(B)
向下取整
np.floor
矩阵转换为向量
a.rabel()
求均值
求方差
X = (X - mu) / sigma
特征归一化
计算
创建15个数据
np.arange(15)
转换成矩阵
类型转换
astype(float)
转换
拼接
按行,切分成3份
按行,第4行,第5列切分
按列,切分成3份
分割
ndarray
numpy
Series
子主题
DataFrame
pd.read_excel
pd.read_csv
加载
显式前5条数据
dt.head()
dt.head(10)
显式后5条数据
dt.tail()
dt.tail(10)
dt.columns
dt.shape
摘要
df[1:3]
显式前3行
显示特定的行、列
df[[\"star\
df['star'] == '力荐'
df [ df['star'] == '力荐' ]
显式指定列
过滤数据
显式第1行,第1个数据
df.loc[0]
第一行,3-6列数据
df.loc[3:6]
查看83行, Age列的数据
loc
获取列名为ID的列
df['ID']
df[\"ID\
按列获取
显式空数据
a_is_null = pd.isnull(a,type=int32)
显式个数
len(a)
数据执行func函数
df.apply(func)
iloc
筛选
df.fillna(axis = 1)
df.dropna()
按Age 升序排序
df.sort_values(\"Age\
排序
重置索引
df.reset_index(drop = True)
时间转换
pd.to_datetime(a)
处理
df['EK'].max()
min()
mean()
df.sort_values(\"X\
np.sin(a)
增加列名
删除空数据
删除
df.groupby('star').sum()
数据聚合
df['new_star'] = df['star'].map(star_to_number)
创建新列
显式
自定义区间离散化(分箱、分组)
等宽离散化
等深离散化
分组
散点图
# 性别分布train_src[\"Sex\"].value_counts().plot(kind = \"bar\")
柱状图
画图
classes = [\"03020\
填充
合并
pandas
import matplotlib.pyplot as plt
x轴, y轴数据
展现图表
plt.show()
指定x轴数据显式角度
plt.xticks(rotation=45)
plt.xlabel('xxxx')
plt.xlabel('yyyy')
plt.title(\"标题\")
基本设置
2行, 2列,第一个图
2行, 2列,第二个图
2行, 2列,第四个图
ax.plot(df)
label = xxxx
plt.legend(loc = 'best')
plt.legend(loc = 'upper left')
显式摘要
默认纵向
横向
range 指定区间, bins 20个柱
指定区间
箱线图
子图
plt.hist(user_id_itemcnt.values)
直方图
折线图
密度图
手肘图
绘制分类矩阵
绘制验证曲线(validation curve)
matplotlib
初始化默认参数
sns.set()
darkgrid
whitegrid
dark
white
ticks
sns.set_style(\"dark\")
能传入任何matplotlib所支持的颜色不写参数则默认颜色
color_palette()
设置所有图的颜色
set_palette()
亮度和饱和度
亮度
lightness
饱和度
saturation
sns.palplot(sns.color_palette(\"Paired\
hls_palette()
sns.palplot(sns.color_palette(\"Blues\"))
反转渐变,增加_r
sns.palplot(sns.color_palette(\"BuGn_r\"))
sns.palplot(sns.color_palette(\"cubehelix\
连续色板
色调线性变换
cubehelix_palette()
sns.palplot(sns.light_palette(\"green\
light_palette()
dark_palette()
定制连续调色板
调色板
palette = sns.color_palette()sns.palplot(palette)
deep
muted
pastel
bright
colorblind
6种颜色循环主题
分类色板
pal = sns.palplot(sns.color_palette(\"hls\
圆形画板
主题风格
sns.despine(offset = 30)
画图与轴线距离
sns.despine(left = True)
保留的坐标轴
notebook
poster
talk
paper
其他风格
设置风格
palette = {\"male\": \"g\
设置颜色
markers = [\"^\
设置图形
linestyles = [\"-\
设置线
orient = \"h\"
方向
alpha=0.7
设置透明度
样式
fit 显式分布曲线
bdistplot
sns.jointplot(x = \"X\
jointplot
绘画单特征分布,及2个特征之间的关系图
sns.pairplot(iris)
小提琴图
sns.regplot(x = \"total_bill\
sns.lmplot(x = \"total_bill\
# x_jitter 增加随机浮动sns.regplot(x=\"size\
regplot()
sns.stripplot(x = \"day\
# jitter 偏移数据,防止聚堆sns.stripplot(x = \"day\
stripplot()
sns.swarmplt(x = \"day\
swarmplot()
sns.boxplot(x = \"day\
boxplot
sns.barplot(x=\"sex\
barplot
sns.pointplot(x=\"sex\
点图,比较差异性
pointplot
sns.factorplot(kind = \"bar\
参数
factorplot
add_legend()
添加说明项
size = 4
长宽比
aspect = .5
指定顺序
row_order = Categorical([\"x\
row_order
点的大小
s = 50
s
线宽
linewidth = .5
linewidth
颜色
edgecolor = \"white\"
edgecolor
显式坐标轴标签
g.set_axis_labels(\"x\
set_axis_labels
指定绘画的数据
vars = [\"sex\
vars
FacetGrid
sns.violinplot(x = \"day\
组合
正态分布
设置以0为中心
center = 0
热力图
count_classes.plot(kind = 'bar')
seaborn
qq图
谱系聚类图
scipy
scaler = StandardScaler()X_standardized = scaler.fit_transform(X)
标准化压缩
参数优化
sklearn
XGBoost
SVM
K近邻
kmeans = KMeans(n_clusters = 3)kmeans.fit(features)kmeans.cluster_centers_kmeans.labels_kmeans.fit_predict(features)cluster_label = kmeans.predict(features)
Kmeans
GBDT
AdaBoost
一元线性回归
普通线性回归
Ridge回归(L2正则)
Lasso回归(L1正则)
预测
多元线性回归
多项式回归
非线性回归
线性回归
随机森林
多分类
逻辑回归
决策树
回归树
GaussianNB
MultinomialNB
BernoulliNB
朴素贝叶斯
算法
conda list
conda install numpy
anaconda search -t conda tensorflow
anaconda show jjhelmus/tensorflow
anacoda
机器学习
0 条评论
回复 删除
下一页