频繁项集挖掘
2016-07-24 17:37:59 0 举报
FREQUENT ITEMSET
作者其他创作
大纲/内容
使用垂直数据格式挖掘
频繁模式增长(FP-growth)
基于散列的技术事务压缩划分抽样......
搜索给定数据集中反复出现的联系典型例子:购物篮分析
关联规则
add
computer=software [support=2%;confidence=60%]
when I 的support满足最小支持度阈值
满足最小支持度阈值&最小置信度阈值
2
method
频繁模式挖掘
强关联规则
support(A=B)=P(AUB)所有事务的2%com和sof同时被买confidence(A=B)=P(B|A)买com的60%也买了sof
方法:
Apriori ALG(1.连接;2.剪枝)
频繁项集 frequent itemset( L :频繁k项集)
相关性度量
是有趣的:
how to find them
提高效率:
兴趣度的度量方法
有趣的
项:computer
k
模式表示
0 条评论
下一页