TopicLDA
2017-04-12 20:07:29 0 举报
TopicLDA是一种用于文本挖掘和主题建模的无监督学习算法。它基于概率图模型,通过分析文档中单词的出现频率来自动识别主题。与传统的LDA相比,TopicLDA具有更高的效率和更好的可解释性,因为它可以处理大规模的数据集并且生成更具信息量的主题。此外,TopicLDA还可以应用于多个领域,如自然语言处理、信息检索、社交媒体分析等。总之,TopicLDA是一种强大的工具,可以帮助我们从大量的文本数据中提取有用的信息并发现隐藏在背后的主题结构。
作者其他创作
大纲/内容
用户LDA计算top权重矩阵
doc`1
群N
doc`5
doc`4
用户:topic,权重
写入用户画像
排序结果DCache
doc`3
spark数据格式化
文章和用户/群/topic权重关联
K-MEANS分群
计算文章在不同群下的曝光和点击
用户数据
DB
topic2
说明:紫色:spark任务绿色:大数据服务褐色:用户画像浅蓝色:taf服务
doc`2
用户画像[群id1、群id2]
LDA计算服务
主题1
用户/文章
doc`9
用户群计算以及同步用户群/topic权重矩阵到用户画像
群1
用户:群
topicN
主题2
doc`7
离线群/topic列表ctr排序
DCache
用户tag词权重任务【LDA算法】
LDA模型训练【大数据】
计算文章在不同topic下的曝光、点击和CTR
离线用户数据规整
主题N
用户,tag词,pv
文章候选池
LDA计算任务主控节点
排序服务
TAF框架实现
。。。
群2
lda.module
topic1
topic3
Hadoop日志
群3
0 条评论
下一页
为你推荐
查看更多