当前位置：首页 > java >正文

MySQL学习记录-索引

java 2025/9/8 14:25:18

概述

介绍
索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用(指向)数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引——可以类比二叉搜索树
优缺点
- 优势
  - 提高数据检索的效率，降低数据库查询数据的成本
  - 通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗
- 劣势
  - 索引列也是要占用空间的（硬盘价格低，可忽略）
  - 降低更新表的速度，如对表进行insert、update、delete时索引也需要同时发生变化所以降低了效率（增删改占的比例小，可忽略）

MySOL的索引是在存储引擎层实现的，不同的存储引警有不同的结构，主要包含以下几种:

索引结构	描述
B+Tree索引	最常见的索引类型，大部分引擎都支持 B+树索引
Hash索引	底层数据结构是用哈希表实现的,只有精确匹配索引列的查询才有效, 不支持范围查询
R-tree(空间索引)	空间索引是MVISAM引擎的一个特殊索引类型，主要用于地理空间数据类型，通常使用较少
Full-text(全文索引)	是一种通过建立倒排索引,快速匹配文档的方式。类似于Lucene,Solr,FS

注：一般说索引都是默认B+Tree索引

1.在不使用索引时查询数据是进行全表扫描，即每一条数据都需要进行确认。

以下图为例：

2.使用二叉树作为索引时，顺序插入导致索引变成了一个链表。如果要查询数据17，依旧需要一个一个查，时间复杂度降低为O(n)。并且大数据量的情况下，二叉树的层级比较大，检索速度会降低。

3.使用红黑树(自平衡的二叉查找树)：顺序插入时不会变成链表。在使用红黑树的情况下查找17只需要4次，时间复杂度为O(log(n))。但是红黑树还是二叉树，每个节点下只有两个叶子节点，大数据量的情况下，二叉树的层级比较大，检索速度会降低。

4.使用B树(多路平衡查找树)：一个节点下可以有多个子节点，减少层级提高查询效率。但是B树的非叶子节点会存储数据，不便于进行范围查询。B树遍历所有数据时也需要把整棵树都遍历一遍效率比较低。

5. 使用B+树(B+树是B树的变体):非叶子节点只存放索引数据，所有数据都存放在叶子节点，叶子节点形成了一个单向链表，只需要遍历所有叶子节点就可以遍历到所有数据。

6.对B+树进行优化，将所有叶子节点优化为双向链表便于范围查询和遍历数据。

哈希索引就是采用一定的hash算法，将键值换算成新的hash值，映射到对应的槽位上，然后存储在hash表中。
如果两个(或多个)键值，映射到一个相同的槽位上，他们就产生了hash冲突(也称为hash碰撞)，可以通过链表来解决
Hash索引特点
1. Hash索引只能用于对等比较(=，in)，不支持范围查询(between，>，<，…)
2. 无法利用索引完成排序操作
3. 查询效率高，通常（不发生哈希碰撞）只需要一次检索就可以了，效率通常（不发生哈希碰撞）要高于B+tree索引
存储引擎支持
在MySQL中，支持hash索引的是Memory引擎，而InnoDB中具有自适应hash功能，hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的。

分类	含义	特点	关键字
主键索引	针对于表中主键创建的索引	默认自动创建,只能有一个	primary
唯一索引	避免同一个表中某数据列中的值重复	可以有多个
常规索引	快速定位特定数据	可以有多个	unique
全文索引（少用）	全文索引查找的是文本中的关键词，而不是比较索引中的值	可以有多个	fulltext

在InnoDB存储引擎中，根据索引的存储形式，又可以分为以下两种:

分类	含义	特点
聚集索引(ClusteredIndex)	将数据存储与索引放到了一块，索引结构的叶子节点保存了整行数据	必须有,而且只有一个
二级索引(SecondaryIndex)	将数据与索引分开存储，索引结构的叶子节点关联的是对应的主键和建立索引的字段	可以存在多个

聚集索引选取规则: