概述
MySQL官方对索引的定义
索引(index)是帮助MySQL高效获取数据的数据结构(有序)
解释
在数据之外,数据库系统还维护着满足特定查找算法的数据结构
这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法
这种数据结构就是索引
左边是数据表,一共有两列七条记录
最左边的是数据记录的物理地址
注意逻辑上相邻的节点在磁盘上也并不是一定物理相邻的
为了加快Col2的查找,可以维护一个右边所示的二叉查找树
每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针
这样就可以运用二叉查找快速获取到相应数据
一般来说索引本身也很大
不可能全部存储在内存中
因此索引往往以索引文件的形式存储在磁盘上
索引是数据库中用来提高性能的最常用的工具
优势
1)类似于书籍的目录索引,提高数据检索的效率,降低数据库的IO成本
2)通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗
劣势
1)实际上索引也是一张表,该表中保存了主键与索引字段,并指向实体类的记录,所以索引列也是要占用空间的
2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE
3)因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息
存储引擎对索引的支持
平常所说的索引
其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用B+Tree索引,统称为索引。
B树
一棵m叉的BTree特性
1)每个节点最多有m-1个关键字<br>
2)根节点最少可以只有一个关键字<br>
3)非根节点至少有Math.ceil(m/2)-1个关键字<br>
4)每个节点中的关键字都按照从小到大的顺序排列
每个关键字的左子树中所有的关键字都小于他
而右子树中所有的关键字都大于他
5)所有叶子节点都位于同一层<br>
或者说根节点到每个叶子节点的长度都相同
以5叉BTree为例
key的数量
2<=n<=4(非根结点最多有4个key,最少有2个key)
公式推导[ceil(m/2)-1]<=n<=m-1
当n>4时,中间节点分裂到父节点,两边节点分裂
插入C N G A H E K Q M F W L T Z D P R X Y S 数据为例
语法
示例:为 city 表中的 city_name 字段创建索引<br>
创建
create index idx_city_name on city(city_name);<br>
查看
show index from city;<br>
删除
drop index idx_city_name on city;
设计原则
1)对查询频次较高,且数据量比较大的表建立索引
如果只有 insert/update,不需要索引
2)索引字段的选择,最佳候选列应当从where子句的条件中提取
如果where子句中的组合比较多,那么应当挑选最常用、过滤效果最好的列的组合
3)使用唯一索引,区分度越高,使用索引的效率越高<br>
4)索引可以有效的提升查询数据的效率
另外索引过多的话
MySQL也会犯选择困难病
虽然最终仍然会找到一个可用的索引
但无疑提高了选择的代价
5)使用短索引
索引创建之后也是使用硬盘来存储的
因此提升索引访问的I/O效率
也可以提升总体的访问效率
假如构成索引的字段总长度比较短
那么在给定大小的存储块内
可以存储更多的索引值
相应的可以有效的提升MySQL访问索引的I/O效率
6)利用最左前缀
N个列组合而成的组合索引
如果查询时where子句中使用了组成该索引的前几个字段
那么这条查询SQL可以利用组合索引来提升查询效率