当前位置：首页 > news >正文

分库分表之实战-sharding-JDBC分库分表执行流程原理剖析

news 2025/9/5 2:39:24

大家好，我是工藤学编程 🦉	一个正在努力学习的小博主，期待你的关注
实战代码系列最新文章😉	C++实现图书管理系统（Qt C++ GUI界面版）
SpringBoot实战系列🐷	【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战
环境搭建大集合	环境搭建大集合(持续更新）
分库分表	分库分表之实战-sharding-JDBC水平分库+分表后：查询与删除操作实战

前情摘要：

1、数据库性能优化
2、分库分表之优缺点分析
3、分库分表之数据库分片分类
4、分库分表之策略
5、分库分表技术栈讲解-Sharding-JDBC
6、分库分表下的 ID 冲突问题与雪花算法讲解
7、分库分表之实战-sharding-JDBC
8、分库分表之实战-sharding-JDBC广播表
9、分库分表之实战-sharding-JDBC水平分库+水平分表配置实战
10、分库分表之实战-sharding-JDBC绑定表配置实战
11、分库分表之实战-sharding-JDBC水平分库+分表后：查询与删除操作实战

【亲测宝藏】发现一个让 AI 学习秒变轻松的神站！不用啃高数、不用怕编程，高中生都能看懂的人工智能教程来啦！

👉点击跳转，和 thousands of 小伙伴一起用快乐学习法征服 AI，说不定下一个开发出爆款 AI 程序的就是你！

本文章目录

深入Sharding-Jdbc分库分表执行流程：从SQL解析到结果归并的原理剖析
- 一、Sharding-Jdbc的架构定位：应用层的“智能代理”
- 二、分库分表执行流程全解析：五步拆解核心逻辑
- - 1. SQL解析
  - 2. SQL路由
  - - （1）分片路由（带分片键）
    - （2）广播路由（不带分片键）
  - 3. SQL改写
  - 4. SQL执行
  - - （1）内存限制模式（OLAP场景）
    - （2）连接限制模式（OLTP场景）
  - 5. 结果归并：多节点结果的“统一聚合”
  - - （1）流式归并
    - （2）内存归并
- 三、流程串联：从请求到响应的完整链路
- 结语：Sharding-Jdbc的价值与未来

深入Sharding-Jdbc分库分表执行流程：从SQL解析到结果归并的原理剖析

在数据量爆炸的时代，单库单表的性能瓶颈日益凸显，分库分表成为突破瓶颈的核心手段。Sharding-Jdbc作为轻量级分库分表框架，以“嵌入式”设计深度集成应用，通过拦截JDBC操作实现数据分片的透明化处理。本文结合架构图与执行流程，拆解其核心逻辑：SQL解析→路由→改写→执行→结果归并，带你看透分库分表的底层运行机制。

一、Sharding-Jdbc的架构定位：应用层的“智能代理”

在这里插入图片描述
从上图可见，微服务通过引入sharding-jdbc.jar，将分库分表逻辑内置于应用层。它的核心角色是 “中间代理”：

对应用：屏蔽多库复杂度，只需操作逻辑表（如t_order）。
对数据库：自动将逻辑表操作映射到真实数据节点（如db0.t_order_0、db1.t_order_1）。

这种“客户端分片”模式无需独立中间件，减少网络开销，但需应用承担分片逻辑的开发与维护成本。

二、分库分表执行流程全解析：五步拆解核心逻辑

在这里插入图片描述

Sharding-Jdbc的执行流程可归纳为 “解析→路由→改写→执行→归并”，每一步都暗藏精妙设计（上图为流程全景）。

1. SQL解析

目标：理解SQL意图，提取分片上下文（如分片键、表名）。

词法解析：将SQL拆分为不可再分的Token（如关键字、表名、字段、值）。
例：SELECT * FROM t_order WHERE user_id=100 → 拆分为SELECT、*、FROM、t_order、WHERE、user_id、=、100。
语法解析：基于Token生成抽象语法树（AST），提炼分片关键信息（如逻辑表t_order、分片键user_id），并标记需改写的部分。

核心价值：为后续路由、改写提供“语义理解”基础。

2. SQL路由

目标：决定SQL该发往哪些数据库/表（即“数据节点路由”）。
Sharding-Jdbc提供 两类路由策略：

（1）分片路由（带分片键）

适用于含分片键的SQL（如user_id），又细分为：

直接路由：分片键值明确，直接定位节点（如user_id=100→db0.t_order_0）。
标准路由：通过分片规则匹配（如user_id%2=0→db0.t_order_0，user_id%2=1→db1.t_order_1）。
笛卡尔积路由：多表关联时的复杂路由（需谨慎，易引发性能问题）。

（2）广播路由（不带分片键）

适用于全局查询（如字典表、配置表），包括：

全库表路由：操作所有库的所有表（如SELECT * FROM dict）。
全库路由：操作某库下所有表（如SELECT * FROM db0.t_*）。
全实例路由：操作所有数据库实例的表。

核心价值：通过路由策略，将逻辑表映射到真实物理节点，避免无效查询。

3. SQL改写

核心矛盾：应用写的是逻辑SQL（操作逻辑表，如t_order），但真实数据库中只有物理表（如t_order_0、t_order_1）。

改写逻辑：将逻辑表替换为物理表，补充分片键等上下文，生成可执行的 实际SQL（Actual SQL）。
例：逻辑SQL SELECT * FROM t_order WHERE user_id=100 → 改写为 SELECT * FROM t_order_0 WHERE user_id=100（假设user_id=100对应t_order_0）。