机器学习流程设计
2016-09-28 00:01:35 0 举报
机器学习流程设计主要包括数据收集、数据预处理、特征选择、模型训练和模型评估五个步骤。首先,从不同来源收集大量数据;然后进行数据清洗,处理缺失值、异常值等问题;接着选择与目标变量相关的特征,减少无关特征以提高模型性能;之后选择合适的算法对模型进行训练,不断调整参数以优化模型;最后通过交叉验证等方法评估模型的准确性和泛化能力。在整个过程中,需要不断迭代优化,以提高模型的预测能力和稳定性。
作者其他创作
大纲/内容
按天计算锁单量
锁定日期自然周数
周内每日锁单占每周锁单权重
锁定日期所在周周一
Start
汇总数据
锁定日期
Spark-Shell
周内分天锁单权重比例
前端页面
返回开始执行
特征处理
日期处理
线索表
展示ApplicationId日志的URL
线索创建日期
按自然天分组处理
按自然周分组
End
分周转化率移除大雨1.5倍四分位间距
时间权重
TrainData
数据清洗
车辆订单表
近12周锁单数量比例权重
执行代码
异常值检测
生成Scala
解析生成Scala代码
分月转化率移除大于1.5倍四分位间距
运行结束
前端展示正在运行
埋点线索配置表
按天计算线索量
0 条评论
下一页