当前位置: 首页 > ops >正文

MSQL-聚簇索引与非聚簇索引的比较

聚簇索引详解

InnoDB 的聚簇索引特性

  1. 表数据本身就是聚簇索引

    • 数据行实际存储在聚簇索引的叶子节点中
    • "表就是索引,索引就是表"的结构
    • 每个InnoDB表有且只有一个聚簇索引

         聚簇索引的叶子节点存储的是:真实数据

  1. 主键作为聚簇索引

    CREATE TABLE users (id INT PRIMARY KEY,  -- 此主键自动成为聚簇索引name VARCHAR(100),email VARCHAR(100)
    );
    
  2. 无显式主键时的处理

    • 如果表没有定义主键,InnoDB会选择一个唯一的非空索引代替
    • 如果没有这样的索引,InnoDB会隐式创建一个6字节的ROWID作为聚簇索引

聚簇索引的优势

  • 高效的主键查询:直接通过B+树定位到数据行
  • 范围查询高效:连续的主键值物理存储也相邻
  • 覆盖索引优势:需要的数据都在索引中时可避免二次查找

聚簇索引的缺点

  • 插入速度依赖插入顺序:最好按主键顺序插入
  • 更新主键代价高:可能导致行移动
  • 全表扫描可能较慢:当主键不连续时

非聚簇索引(二级索引)

非聚簇索引结构

  1. 索引结构与数据分离

    • 索引B+树的叶子节点不包含完整行数据
    • 只存储主键值(或ROWID)
  2. 查找过程需要回表

    二级索引查找 -> 找到主键 -> 通过主键到聚簇索引中查找完整数据

非聚簇索引示例

CREATE INDEX idx_name ON users(name);  -- 创建非聚簇索引

非聚簇索引的特点

  • 支持多个:一个表可以有多个非聚簇索引
  • 存储内容:索引列值 + 主键值
  • 覆盖索引优化:如果查询的列都在索引中,可避免回表

         非聚簇索引的叶子节点存储的是:索引列值 + 主键值

MyISAM 的非聚簇索引

MyISAM 存储引擎使用的是纯非聚簇索引结构:

  • 数据.MYD文件:存储实际数据行
  • 索引.MYI文件:存储所有索引
  • 索引叶子节点存储的是数据行指针(物理地址)

对比总结

特性InnoDB聚簇索引InnoDB非聚簇索引MyISAM非聚簇索引
数据存储位置索引叶子节点单独存储,引用主键单独.MYD文件
索引数量每表1个多个多个
叶子节点内容完整数据行主键值数据文件指针
查找过程直接获取数据需要回表直接通过指针访问数据
主键查询性能最优(O(1)~O(logN))需要两次查找需一次索引查找
范围查询性能优秀(顺序I/O)一般一般

MyISAM 的非聚簇索引:叶子节点存储的数据文件指针(相对于InnoDB非聚簇索引,避免了回表)

实际应用建议

  1. 合理设计主键:短、有序(如自增INT),利用好聚簇索引特性

  2. 避免随机主键:如UUID会导致大量页分裂和碎片

  3. 覆盖索引优化:使查询只需访问索引避免回表

思考:

  1. 多实例应用从分布式ID服务获取ID后,由于网络延迟、处理速度差异等原因,后获取到的ID可能先提交事务,导致数据库中ID不是严格递增的,而是呈现"插入"形式(即小ID的记录可能出现在大ID之后)

(其实业务能容忍小范围的不一致)

方案1:业务逻辑的提交操作,尽量靠后,避免提前获取id?

http://www.xdnf.cn/news/16880.html

相关文章:

  • Python编程基础与实践:Python文件处理入门
  • SpringBoot 信用卡检测、OpenAI gym、OCR结合、DICOM图形处理、知识图谱、农业害虫识别实战
  • 【7.5 Unity AssetPostprocessor】
  • 【自动化运维神器Ansible】YAML支持的数据类型详解:构建高效Playbook的基石
  • linux ext4缩容home,扩容根目录
  • Trae + Notion MCP:将你的Notion数据库升级为智能对话机器人
  • 元宇宙重构未来交通新图景
  • 无人机光伏巡检漏检率↓78%!陌讯多模态融合算法实战解析
  • 机试备考笔记 2/31
  • Agentic RAG:自主检索增强生成的范式演进与技术突破
  • 深入 Go 底层原理(二):Channel 的实现剖析
  • 深入 Go 底层原理(十四):timer 的实现与高性能定时器
  • cuda编程笔记(12)--学习cuFFT的简单使用
  • 【机器学习】非线性分类算法(上):KNN(基于距离相似度)与朴素(特征独立)贝叶斯(基于概率统计)
  • Lock 接口及实现类详解:从 ReentrantLock 到并发场景实践
  • Node.js 操作 MongoDB
  • 【LeetCode 热题 100】739. 每日温度——(解法一)单调栈+从右到左
  • 最新Windows11系统镜像,23H2 64位ISO镜像
  • 拉格朗日插值法
  • 【软考中级网络工程师】知识点之堆叠
  • MySQL PostgreSQL JDBC URL 配置允许批量操作
  • 系统思考:超越线性分析
  • openwrt下安装istore(基于pve)
  • Linux网络编程【基于UDP网络通信的字典翻译服务】
  • Effective C++ 条款17:以独立语句将newed对象置入智能指针
  • 农田通量计算方法与应用;高精度感热/潜热通量反演与绘图等;农田蒸散发与能量平衡
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | QuizApp(交互式在线测验应用组件)
  • Mujoco(MuJoCo,全称Multi - Joint dynamics with Contact)一种高性能的物理引擎
  • 基于Postman进行http的请求和响应
  • linux基本系统服务——DNS服务