LDA

2016-10-12 11:56:53 0 举报
仅支持查看
LDA(Latent Dirichlet Allocation)是一种主题模型,它可以将文档集中的每篇文档的主题以概率分布的形式给出。同时,它是一种三层贝叶斯概率模型,包含词、主题和文档三层结构。 LDA的基本思想是:每篇文档可以看作由多个主题混合而成,而每个主题又可以看作由多个词混合而成。因此,给定一个文档集合,我们的目标是推断出每个文档的主题分布以及每个主题的词分布。 为了实现这一目标,LDA采用了一种迭代的方法,即先随机给每个文档分配一些主题,然后根据这些主题重新估计每个词所属的主题,最后再根据新的词主题分布重新估计每个文档的主题分布。这个过程会不断重复进行,直到收敛为止。
作者其他创作
大纲/内容
评论
0 条评论
下一页