纯Doc2vec模型文本处理
2016-11-15 17:13:34 0 举报
Doc2vec是一种用于处理文本的模型,它能够将文档转化为向量表示。这种模型可以用于文本分类、聚类和相似性计算等任务。在纯Doc2vec模型中,文本首先被分词,然后通过训练得到每个词的向量表示。这些向量可以通过平均、加权等方式组合成文档的向量表示。最后,可以使用这些向量进行各种文本处理任务。总之,Doc2vec是一种强大的文本处理工具,能够帮助我们更好地理解和利用文本数据。