机器学习
2018-11-13 15:32:49 53 举报
AI智能生成
机器学习
作者其他创作
大纲/内容
问题建模
评估指标
分类指标
精确率和召回率
ROC和AUC
对数损失Logistic Loss
回归指标
平均绝对误差
平均绝对百分误差
均方根误差
排序指标
平均准确率均值
NDCG归一化贴现累计收益
样本选择
数据去噪
采样
无放回简单随机抽样
有放回简单抽样
平衡采样
整群采样
分层采样
原型选择和训练集选择
增量法
递减法
批量法
混合法
固定法
包装器
过滤器
Condensation
Edition
Hybrid
交叉验证
留出法
K折交叉验证
自助法
特征工程
特征抽取
探索性数据分析
数值特征
截断
二值化
分桶
缩放
缺失值处理
特征交叉
非线性编码
行统计量
类别特征
自然数编码
独热编码
分层编码
散列编码
计数编码
计数排名编码
目标编码
类别特征之间交叉组合
类别特征和数值特征之间交叉组合
时间特征
转换成类别特征
空间特征
转换成类别特征
转换成距离的数值特征
文本特征
语料构建
文本清洗
分词
词性标注
词形还原和词干提取
文本统计特征
N-Gram模型
Skip_Gram模型
词挤模型
词袋模型
TF-IDF
余弦相似度
Jaccard相似度
Levenshtein编辑距离
隐形语义分析
Word2Vec
特征选择
- 简化模型,是模型更易于研究人员和用户理解
- 改善性能
- 改善通用性、降低过拟合风险
过滤方法
覆盖率
皮尔逊相关系数
Fisher得分
假设检验
互信息
最小冗余最大相关性
相关特征选择
封装方法
完全搜索
启发式搜索
随机搜索
嵌入方法
LASSo
树模型
模型选择
逻辑回归
场感知因子分解机
梯度提升树
XGBoost
LightGBM
模型融合
理论分析
融合收益
模型误差-分歧分解
模型多样性度量
多样性增强
数据样本扰动
输入属性扰动
输出表示扰动
算法参数扰动
融合方法
平均法
投票法
分类标记
分类标记
分类概率
绝对多数投票法
相对多数投票法
加权投票法
软投票法
Bagging
Stacking
0 条评论
下一页