lexranker流程
2016-06-05 20:06:00 0 举报
Lexranker是一种基于图排序的关键词提取算法,它通过构建共现网络和语义网络来提取关键词。其流程如下: 1. 预处理文本数据,包括分词、去停用词等。 2. 构建共现网络,计算词语之间的相似度。 3. 构建语义网络,利用WordNet等词典资源计算词语之间的语义相似度。 4. 将共现网络和语义网络融合,得到综合网络。 5. 对综合网络进行PageRank算法排序,得到每个节点的重要性得分。 6. 根据得分筛选出关键词。 Lexranker算法具有较好的效果,能够有效地提取文本中的关键词。但是,由于其需要构建复杂的网络结构,计算量较大,因此在实际应用中可能会受到一定的限制。