回表是数据库概念,还是mysql的概念?
主键索引没有列,根据耳机索引去查主键索引,又没有查表,为啥叫回表呢?
“回表”这个词,其实算是数据库里的一个通用概念,不过它最常见的应用场景是在 MySQL 的 InnoDB 引擎里,所以很多人一提起回表就直接联想到 MySQL。其实别的使用聚簇索引的数据库里也有类似的操作,只是可能说法不太一样。
在 InnoDB 里,表的数据是按照主键顺序存储的,也就是说,主键索引就是表本身。像我们平常建的二级索引(辅助索引),它只会存储索引列的值以及对应的主键值。它并不会把整行数据都放进去。
所以如果你用二级索引去查一个值,但你查的字段不在这个索引里,那数据库只能先通过二级索引定位到主键值,然后再根据主键值去主键索引(也就是表)里把完整数据查出来。这一步“兜一圈回去查表”的动作,就叫做回表。
也就是说,虽然你在用索引查数据,但最终还是得回到“表”(主键索引)里拿你想要的字段。回表这个词的本质,其实就是在告诉你:你没法只靠索引解决问题,还得“回头”去把完整的行捞出来。
听起来像是多了一步,其实确实多了一步,这也是为什么我们经常说“覆盖索引”更高效——因为它能直接在索引里拿到所有需要的字段,就不用回表了。
举个例子,
我们假设有张用户表,里边有字段像 id、name、age、email 这些。主键是 id,然后我们给 name 建了个二级索引。你现在写了个 SQL,想查 name 为 'Tom' 的人的 email。数据库看到你用 name 来过滤,就会优先走你建好的二级索引 idx_name,查到 name = 'Tom' 对应的主键 id,比如是 123。
可问题是,email 这个字段不在 idx_name 这个索引里啊,索引里只有 name 和 id。所以数据库拿到了主键 id 后,还得再“回头”去主键索引里,根据 id 找到整行数据,然后再把 email 拿出来。这一步从二级索引跳回主键索引的过程,就叫“回表”。
你可以简单理解成:我们一开始查的是“索引小抄”,但这小抄信息不全,还得回去翻“整本书”(也就是主键索引)来拿完整数据。其实这就是回表的本质:查索引不够,还得回主表。
但如果你换个查询,比如 SELECT name FROM user WHERE name = 'Tom',那 email 根本不参与查询,数据库在 idx_name 里就能直接查出结果了,这种就叫覆盖索引,连表都不用回,性能自然更好。
所以说,回表本质上就是出现在我们查询字段不在二级索引里、又必须获取的时候,数据库自动补的一步。平时优化 SQL 的时候,也经常得留意是不是有不必要的回表,能覆盖的就尽量覆盖掉。这样性能会更稳一些。