Apriori
2016-11-03 20:56:17 0 举报
Apriori算法是一种用于关联规则挖掘的经典算法。它通过迭代地找出频繁项集来发现数据中的关联规则。该算法的基本思想是:如果一个项集是频繁的,那么它的所有子集也是频繁的。通过不断压缩候选项集的规模,最终找到满足最小支持度阈值的所有频繁项集。然后,利用这些频繁项集生成关联规则,并根据最小置信度阈值筛选出有意义的规则。Apriori算法简单、易于实现,但可能存在大量的候选集生成和重复计算的问题,导致效率较低。为了提高效率,可以采用一些优化策略,如使用哈希技术减少重复计算、引入垂直数据分割等。