Elasticsearch
2021-10-19 15:26:15 41 举报
AI智能生成
Elasticsearch
作者其他创作
大纲/内容
2.Lucene倒排索引
2.1倒排索引含义
1.需要根据属性的值来查找记录
2.索引表中的每一项都包含一个属性值和该属性值的各记录地址
2.索引表中的每一项都包含一个属性值和该属性值的各记录地址
2.2获取关键词
分词:默认通过空格进行分词
过滤一些没有概念的词比如英文中的 in once等
单词统一大小写
Lucene Analyzer类完成
2.3建立倒排索引
词典文件(保存关键字信息,保留指向频率文件和位置文件的指针)
频率文件
位置文件
2.4压缩算法
关键词做压缩
数字做压缩
4.API约定
多索引参数
日期筛选
通用参数
文档管理
多文档查询
索引词频率
查询更新接口
1.Elasticsearch是什么
1.1基于Lucene构建的开源,分布式,RESTFUL接口的全文搜索引擎
1.2分布式文档数据库,可拓展至数以百计服务器和PB级的数据
1.2分布式文档数据库,可拓展至数以百计服务器和PB级的数据
1.2优点
1.2.1横向可扩展性
1.2.2分片机制(一个索引分成多个分片)
1.2.3高可用(提供replica机制,一个分片设置多个复制)
1.2.4使用简单(只需要一条命令就可以下载文件)
1.2.5垂直扩展/向上扩展:购置性能更强的服务器
水平扩展/向外扩展:增加更多的服务器
水平扩展/向外扩展:增加更多的服务器
1.3使用场景
1.31电商商品和库存
1.32收集日志
1.33大数据量分析
3.术语以及基本概念
3.1索引词(term)
3.2文本(text)
3.3分析(analysis)
3.4集群(cluster)
3.5节点(node)
3.6路由(routing)
3.7分片(shard)
3.8主分片(primary shard)
3.9副本分片(replica shard)
4.0复制(replica)
4.1索引(index)
4.2类型(type)
4.3文档(document)
4.4映射(mapping)
4.5字段(field)
4.6来源字段(source field)
4.7主键(ID)
索引
创建索引
删除索引
获取索引
打开/关闭索引
索引映射管理
索引别名
索引配置
索引监控
状态管理
5映射
概念
映射类型
字段数据类型
核心数据
字符串数据类型
数字型
日期型
布尔型
二进制
复杂数据
数组
对象
嵌套
地理数据
经纬点
多边形
专门数据
IPV4
完成数据类型
单词计数数据类型
动态映射
显式映射
更新当前映射
映射类型之间共享字段
0 条评论
下一页