登录免费注册

首页  思维导图  详情



 



走进AI(二) | 机器如何学习？

走进AI(二) | 机器如何学习？

2024-01-04 16:11:40   0  举报





AI智能生成

机器如何学习？

AI

模板推荐

作者其他创作

大纲/内容

学习算法

解构算法：y、X、f(X,p)、loss、g(p)

算法演进：统计类算法 -> 深度学习算法

统计类算法：轻模型，重特征

经典机器学习方法

线性模型扩展-Lasso：保留了传统线性模型，但限制了参数大小，从而达到限制特征数量的目的。

树模型：梯度增强决策树>随机森林>决策树

决策树：按照<b>分组规则</b>(特征和阈值)将数据集分组，分组目标：组内差异小，组间差异大。 - 简单高效的非线性学习器<br>

随机森林：同一个数据集<b>重复采样</b>获取多个样本，并行训练多个(过拟合的)模型，取<b>平均结果</b>降低方差。- 并行的种大树

梯度增强决策树(GBDT)：大量弱模型，串行地<b>缓慢地修正</b>(学习速度一般越小越好)，彼此叠加为最终模型。 - 串行的种很多小树

神经网络：在线性模型基础上增加<b>隐藏层</b>(节点中包含非线性的<b>激活函数</b>)，从而引入非线性。

深度学习：重模型，轻特征

PyTorch 深度学习框架 

算法开发

机器学习框架

面对挑战

可预测性：数据噪音越大越不可学习；数据量越小越不可学习

过拟合：在拟合过程中掺入了过多的数据噪声

规律

模型复杂度：越复杂，越容易过拟合；

数据量：越小，越容易过拟合；

3种过拟合的情况

增加特征 - 变量选择正则化解决

增加模型结构复杂度 - 随机森林、梯度增强决策树等模型解决

增加模型数量 - 交叉验证解决

联系现实：迷信、赌场、成功秘诀...

时间稳定性：是否随时间变化

数据范围&颗粒度划分：个性 vs 共性，目前尝试通过“预训练+微调”的架构来解决

特征时效性：往后看和往前看的区别

总结

数据是算法效果的上限

深度学习自动感知梯度，进而帮助寻求问题最优解。梯度就是没做好的地方

AI、机器学习、深度学习、大模型的关系图

 Collect

Get Started

AI、机器学习、深度学习、大模型的关系图

 Collect

Get Started

机器学习算法整理

 Collect

Get Started

机器学习

AI、机器学习、深度学习的关系

 Collect

Get Started

AI、机器学习、深度学习的关系













评论

0 条评论

下一页



图形选择

思维导图

主题

补充说明

AI生成





修改AI描述

去编辑

重新生成

提示 

关闭后当前内容将不会保存，是否继续？

取消

确定

Document