四种主要数据挖掘任务
2017-03-10 19:13:38 0 举报
数据挖掘的四种主要任务包括:分类、聚类、关联规则学习和异常检测。分类是预测已知类别的数据项的新类别;聚类是将相似数据项分组在一起,而不需要预先定义组结构;关联规则学习是从大型数据库中发现有趣关系;异常检测是识别不符合预期模式或数据的实例。这些任务有助于从大量数据中提取有价值的信息,为决策提供支持。
作者其他创作
大纲/内容
涉及说明变量函数的方式为目标建立模型。有两类预测建模:分类,用于预测离散的目标变量;回归,用于预测连续的变量目标
关联分析
聚类分析
预测建模
关联分析用来发现描述数据中强关联特征的模式。所发现的模式通常蕴含规则或特征子集的形式表示。由于搜索空间是指数规模的,关联分析的目标是以有效的方式提取最有趣的模式。
聚类分析旨在发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。
异常检测的任务是识别其特征显著不同于其他数据的观测值。这样的观测值称为异常点或离群点。异常检测算法的目标是发现真正的异常点,而避免错误地将正常的对象标注为异常点
异常检测
数据
0 条评论
下一页