机器学习流程
2023-04-23 17:35:00   0  举报             
     
         
 AI智能生成
  流程
    作者其他创作
 大纲/内容
  数据探索    
     可视化展示    
     通过matplotlib中的绘图工具进行可视化    
     热力图  
     分箱图  
     等等。。  
     数据质量检测    
     缺失值  
     异常值  
     数据特征分析    
     数据的分布探索    
     如:正态分布、指数分布等  
     常用统计量分析    
     如:均值、方差、最值(describe())  
     相关性分析  
     特征处理    
     数据清洗    
     缺失值处理    
     插补法    
     简单插补  
     插值插补/热平台插补  
     拟合插补  
     多重插补  
     异常值处理    
     异常值处理可参考缺失值处理  
     重复/错误值处理    
     参考缺失值插补  
     数据预处理    
     数据归一化/标准化    
     z标准化/min_max标准化  
     行归一化/范数归一化  
     对数变换/平滑处理    
     log:  
     smooth:  
     模型训练    
     由易到难  
     由独立到依存  
     重点构建集成算法  
     模型验证    
     评价指标  
     交叉验证  
     超参数调整    
     网格搜索(最常用)  
     贝叶斯调参  
     贪心调参  
     特征衍生&选择    
     合成适合模型的特征    
     类似CNN处理的特征?  
     特征组成  
     过滤/嵌入    
     方差选择法/相关系数法  
     正则化特征选取/树模型特征选取  
     降维    
     PCA  
     LDA  
     模型融合    
     Bagging  
     Boosting  
     Stacking    
     Stacking过程的周报总结  
    
 
 
 
 
  0 条评论
 下一页