R
2016-06-03 10:45:28 0 举报
R是一种广泛使用的编程语言和自由软件环境,用于统计计算和绘图。它提供了大量的统计和图形技术,包括线性和非线性建模、经典的统计测试、丰富的数据可视化功能、数组操作、以及各种数据导入和导出工具。R语言是开源的,这意味着其源代码可以被任何人查看、修改和分发,这使得R社区能够快速响应新的需求和问题。此外,R语言还具有强大的数据处理能力,可以处理大量的数据,并生成详细的报告和图表。总的来说,R语言是一个强大而灵活的工具,适用于数据分析、数据挖掘、机器学习等多种应用。
作者其他创作
大纲/内容
PN_usage(消耗量)的预处理:筛选PN_usage为pn的数据,如果不是所有相邻日期都相隔7天,代表日期有丢失,就在最小和最大日期之间以7天分隔填满补0
计算lag(延时),即PN_IB得平移几个月才能和PN_usage的趋势相似
开始
对PN_usage进行异常点检测、替换,把卡尔曼滤波后的值用黑圈标出来
smoothed_baseline=lowess(PN_usage的trend)因为PN_usage和PN_IB的趋势不相似,所以解出的斜率和偏差实际没有用,但是返回值要返回,所以还是要求
判断PN_usage和PN_IB的趋势是否相同,衡量相似度是否某阈值
N
把PN_IB插值成PN_usage一样多的点
Y
指定要考察的部件pn的值,比如04Y1830
baseline=k*PN_IB+bbaseline就是用PN_IB拟合PN_usage的数据
对data进行ESD算法,检测异常点
形成要考察异常点的数据集data:data=PN_usage-PN_usage分解出来的季节性趋势-smoothed_baseline
PN_IB(在保量)的预处理)PN_IB=筛选PN_IB为pn且ib不为空的数据
进行长期预测,调用long_term_pred()
形成要考察异常点的数据集data:data=PN_usage-PN_usage分解出来的季节性趋势-baseline
0 条评论
下一页