在索引种查询并给出备选docids
scd
A构建进程
挖掘索引
A.3挖掘索引
B.5 返回结果
B.4文档内容
documents每个document都有属性和属性值
B.1查询
topk docids从document manager 中获取文档内容
A.2构建索引
A.1scd解析
索引
document
将用户的查询标记为条件标记方法:1.最小权匹配2.最大权匹配3.CRF-条件随机域
通过属性值来构建挖掘索引;挖掘过程是在索引阶段后,它直接从文档管理器获取原始数据,并根据配置将它们分派到不同的挖掘组件中
B查询进程
解析成document保存在基于文档点分关系型数据库中
如果查询请求包含特征或者挖掘信息, 基于挖掘索引给出结果
两个进程协同完成
需要查询的属性 需要构建查询索引3种查询索引:1一般索引,基于磁盘的索引2后缀索引,基于内存的快速模糊查询3zambezi索引,基于内存的bool检索
给出查询并标记
结果返回给用户
scd解析
B.2 topk docids
user
构建索引indexing
B.3 挖掘结果
挖掘groupby,attrby
searcher