异常点检测
2016-01-01 21:02:26 0 举报
AI智能生成
异常点检测,又称离群值检测或奇异值检测,是一种在数据挖掘和统计学中用于识别数据集中的异常或罕见观测值的技术。这些观测值通常偏离了数据的一般模式或期望值,可能由于测量错误、数据损坏或真正的异常情况而产生。异常点检测的方法包括基于统计的方法(如Z得分、箱线图等)、基于距离的方法(如K近邻、LOF等)和基于密度的方法(如DBSCAN、OPTICS等)。通过识别和处理异常点,可以帮助我们更好地理解数据的特点,提高数据分析的准确性和可靠性。
作者其他创作
大纲/内容
指不遵从预计pattern的事物/观察
检测异常点轨迹
全集距离矩阵明显不同的轨迹或一部分轨迹
来源
司机恶意绕路
不预计的道路改变(交通事故/建设)
用处
提醒人们形式在错误路上
方法
利用现存的轨迹聚类 or 频率模型挖掘方法
若轨迹(或是轨迹段)不符合任何模型,则他可能是outlier
确认异常点事物
交通异常
来源
事故
控制
保护
运动
庆祝
灾害
其他
方法一
用主路将city分成不连贯的区域
根据2个区域车辆行走轨迹在区域之间搜索异常links
将一天分成时间bins
确定特征
在时间bins上车辆行走一个link的数量
进入目的地的车辆比例
从原始地出发比例
对比之前,计算每个特征的最小变化
用3D空间表示
用Mahalanobis distance计算异常点
方法二
根据司机路由行为在城市网络确定交通异常点
方法三
可能性比例测试
city分成统一的grids
一个grid内数时间段内车数量
统计最偏离预计行为的区域,落在卡方分布尾部为outlier
0 条评论
下一页