分群和ldaasdf
2017-03-23 15:17:33 0 举报
分群(Clustering)是一种无监督学习方法,它将相似的对象归为同一类别。这种方法在数据分析、市场细分、社交网络分析等领域具有广泛应用。LDA(Latent Dirichlet Allocation)是一种主题模型,它可以将大量文档自动归类到不同主题中。LDA通过分析文档中单词的共现概率来挖掘文档的主题结构。 总之,分群和LDA都是无监督学习的重要方法,它们在不同领域都有着广泛的应用。分群可以将相似对象归为一类,而LDA则可以挖掘文档的主题结构。这两种方法都为我们提供了从数据中提取有用信息的有效途径。
作者其他创作
大纲/内容
doc`1
群N
doc`5
doc`4
DCache
用户:topic,权重
doc`3
spark数据格式化
K-MEANS分群
内容根据所属群进行曝光和点击计算
用户数据
topic2
doc`2
LDA
用户画像[群id1、群id2]
LDA计算服务
doc`9
文章/群id
群1
用户:群
topiN
写入Profile
doc`7
文章/topic
用户tag词权重任务【LDA算法】
内容根据topic进行曝光和点击计算
用户,tag词,pv
K-MEANS
LDA计算任务主控节点
离线服务
TAF框架实现
。。。
群2
topic1
topic3
Hadoop日志
群3
0 条评论
下一页