ES常用命令
2023-10-08 21:30:34 0 举报
AI智能生成
登录查看完整内容
ES常用命令及基础概念
作者其他创作
大纲/内容
面向文档的
面向运维
高可用
水平扩容
可扩展
分布式
本质上就是一个JAVA进程
一个ES实例
默认就是 master-eligible
master
可以保存ES数据的
data node
分发请求,收集响应
coordinating node
默认的节点类型
节点
主分片
主分片的拷贝
读取的吞吐
提高可用
副本分片
分片规划
分片设定
查看集群的健康状况
GET _cluster/health
GET _cat/nodes
GET _cat/shards
API
查看集群状态
cerebro
分片
节点、分片和集群
面向开发
JSON文档
通用属性
文档元数据
文档
相似文档的集合
逻辑空间的概念
index
物理空间的概念
shard
定义文档字段类型
mapping
定义不同的数据分布
settings
保存一个文档到ES的过程也叫索引(indexing)
动词
7.0之后只能创建 _doc
Type
索引
索引和文档
查看所有索引
GET _cat/indices
查看索引相关信息 mapping settings 等
GET index_name/_mapping
GET movies/_settings
GET index_name
查看索引文档数
GET index_name/_count
索引相关API
目录 - 正排
B+树 或 哈希拉链法
单词词典
文档ID
词频
位置
高亮显示
偏移
倒排列表
指定对某些字段不做索引
倒排索引
Analysis
字符处理 例如:去掉HTML标签
character filter
单词切分 例如:特殊字符分隔
tokenizer
切分后的词的处理 例如:lowercase
token filters
三个组件
测试分词器怎么工作
测试文档的某个字段使用的什么分词, 什么效果
自定义分词器各个步骤进行分词实验
_analyzer API
standard
simple
whitespace
stop
keyword
默认 \\W+
pattern
切分成一个一个词
不同的上下文
ICU
支持自定义词库
IK
THULAC
中文分词器
中文分词
分词器
Analyzer
分词
index -- table
doc -- row
field -- column
mapping -- schema
DSL -- SQL
与关系型数据库的类比
介绍
指定ID ,已有报错
不指定ID
POST index_name/_create/1
create
与create的区别,如果文档不存在就创建, 否则删除现有文档,新的文档被索引, 版本 +1
PUT index_name/_doc/1
payload 包含在 doc 中
POST index_name/_update/1
update
GET index_name/_doc/1
get
单个操作
一次调用,对不同索引进行不同操作
bulk API
mget API
msearch API
不要一次发送过多的数据
批量操作
常见错误
文档API
/index_name/_search
/index*/_search
索引搜索
GET 查询参数
/index_name/_search?q=fieldName:fieldValue
q=title:2012
指定字段 vs 泛查询
Phrase 是 AND,词有顺序关系,可以设置间隔长度
Term vs Phrase
AND
OR
NOT
MUST
+(%2B)
MUST NOT
-
> 和 <
通配符
正则
多个Term逻辑关系
URI Search
QueryDSL
from、size 分页
sort 排序
设置只返回部分字段
source filter
painless 脚本生成新的字段
脚本字段
Match
Match Phrase
match query
query_string
simple_query_string
Request Body Search
结果的可信度
google page rank
尽可能少的返回不相关的
precision
recall
查准率
衡量相关性
搜索相关性 relevance
搜索
定义名称和类型
几种类型
Dynamic Mapping 创建文档时没有指定类型
类型更改 reindex
dynamic 值设置
PUT
定义mapping
set index false
null_able
设置默认空值
合并查询
copy_to
数组
多字段类型
精确值 vs 全文本
Mapping AND dynamic Mapping
帮助你设定 mapping 和 settings
多个模板按照 order 排序,大的后应用, 后应用的覆盖先应用的
最后应用创建索引时的设置
Index Template
Dynamic Template
自定义分词器
HTML strip
Mapping
Character filters
Tokenizer
Token Filters
分片配置
配置
group
高档、中档、抵挡
Bucket
Mstric
Pipeline
Matrix
#### 1_group_by_name 按 term 分组#### 1_1_group_by_name_stats_age 按term分组下,嵌套属性统计#### 2_avg_age 按 field 取平均#### 3_stats_age 属性统计GET mydoc/_search{ \"size\
#### 限定数据范围后聚合GET mydoc/_search{ \"query\":{ \"match\": { \"name\": \"wzl\
实例
Aggregation
数据分析
ES
0 条评论
回复 删除
下一页