倒排索引
2017-01-16 17:00:55   0  举报             
     
         
 倒排索引是一种常用于全文搜索和信息检索的技术。它通过记录每个单词在文档中出现的位置,构建了一个从单词到文档的映射关系。当用户输入一个查询词时,系统可以快速定位到包含该词的所有文档,从而提高搜索效率。倒排索引的核心思想是将文档集合中的每个单词都作为独立的“实体”进行处理,为每个单词维护一个倒排列表,记录该单词出现在哪些文档中以及出现的位置。这种结构使得在处理大量文本数据时,可以快速地执行模糊查询、同义词查询等高级功能。倒排索引在搜索引擎、自然语言处理等领域具有广泛的应用价值。
    作者其他创作
 大纲/内容
 field2
  docId/freq/pos
  idf/norm/value
  field0
  doc
  field1
  term
   
 
 
 
 
  0 条评论
 下一页
  
   
   
   
   
  
 ![[ES]Elasticsearch学习笔记之倒排索引](https://www.processon.com/chart_image/template/thumb/616785680791290cc789c724.png?tid=616785680791290cc789c722) 
  
  
  
  
 ![[ES]倒排索引 - FOR/RBM压缩算法](https://www.processon.com/chart_image/template/thumb/615dcac307912929804aaf81.png?tid=615dcac307912929804aaf7f) 
  
 