量化平台(多因子)开发总流程图
2018-08-19 18:02:26 16 举报
量化平台(多因子)开发总流程图主要包括以下几个步骤:首先,进行数据收集和预处理,包括获取历史交易数据、财务数据等;其次,进行特征工程,通过统计分析、机器学习等方法提取有用的因子;然后,进行因子筛选,通过相关性分析、因子稳定性检验等方法筛选出有效因子;接着,进行模型构建,如线性回归、逻辑回归、支持向量机等;之后,进行模型评估,通过回测、交叉验证等方法评估模型的预测能力;最后,进行模型优化和实盘交易。整个过程需要不断迭代和优化,以提高模型的预测准确性和稳定性。
作者其他创作
大纲/内容
输出最终数据:因子数据 facs,三个维度:股票s,因子f,日期d收益率数据 rets,两个维度:股票s,日期d
1) IC信息系数输入: 因子数据facs、收益率数据rets输出: 伪代码:fa
1. 数据准备与处理
输出两组数据:数据1:每一调仓日所有股票的因子数据数据2: 每一调仓日所有股票的下期收益率
2. 有效性评价算法伪代码
0. 创建指数历史成份股记录表
数据获取:如果输入的是指数代码,每个调仓日只能获取当期的成份股的相关因子数据如果输入的是股票代码,每个调仓日只能获取当期正常交易的股票的相关因子数据
通过Wind导出的成份股CSV文件,生成指数历史成份股记录,主要指数有:1) 沪深300指数 2) 中证500指数 3) 中证800指数 4) 上证180指数 5) 深证100指数
相关表:mongo:财务因子数据表技术因子数据表宏观因子数据表 指数历史成份股记录表mysql:hq_price
def_mad5. MAD算法输入: A输出:mad
**附录. 涉及到的常用算法
def_corr1.相关性与P值计算:输入: A、B输出:两列数据相关性及相应的p-value
1.1 数据准备相关算法
数据处理:对因子数据进行以下处理1. 极值处理2. 标准化处理3. 低频数据映射
收藏
0 条评论
下一页