MySQL中隔离级别那点事
引言
在MySQL中,事务隔离级别和二进制日志(binlog)的格式密切相关,直接影响数据的一致性和复制的正确性。尤其是在“已提交读”(Read Committed)隔离级别下,由于没有使用间隙锁,某些并发操作在执行过程中不会产生阻塞,但在采用基于语句(statement-based)的binlog格式时,可能导致主从复制中数据顺序和一致性的问题。例如,某些事务虽然在执行顺序上先后提交,但在binlog中记录的顺序未必反映真实执行顺序,进而引发数据异常删除等情况。本文将围绕已提交读隔离级别与statement格式binlog的兼容性问题展开探讨,揭示其潜在风险及影响,帮助读者更好地理解MySQL事务隔离与复制机制的细节。
undo log的作用
- 事务发生错误时回滚rollback,数据更新之前,会把原始数据保存在undo log中,保证事务出错回滚或者我们手动回滚的时候,能够在undo log中找到最初的数据。
- 提供了MVCC的非锁定读(快照读),依赖undo log实现。
MVCC的实现有以下几个重要因素
- 数据行的两个隐藏字段,db_trx_id(事务id)、db_roll_ptr(回滚指针),回滚指针指向拷贝的undo log副本记录。
- 活跃事务数组,针对可重复读隔离级别,活跃事务列表是在事务启动瞬间,当前正在“活跃”的所有事务 ID,也即事务启动瞬间未提交的事务。
- 活跃事务数组最小值为低水位,活跃事务数组最大值加1为高水位。
例如:活跃事务数组:【20,23,31】,低水位:20,高水位:32。
如何根据这些因素判断数据值?
已数据行的db_trx_id为起始点,延着回滚链取出db_trx_id按照下面规则判断是否可见,直到找到可见的数据才停止查找:
- db_trx_id <= 低水位,表示当前事务早已经提交,可见。
- db_trx_id >= 高水位,表示当前事务还未提交,不可见。
- db_trx_id能在活跃事务列表找到,表示当前事务还未提交,不可见。
- db_trx_id不能在活跃事务列表找到,表示当前事务已提交,可见。
可重复读和已提交读区别?
可重复读是在事务启动时创建视图,已提交读是在每条查询SQL执行时创建视图。视图主要是用于记录活跃(未提交)的事务ID列表。
串行化隔离级别的实现
读的时候加共享锁,也就是其他事务可以并发读,写的时候加排它锁,其他事务不能并发写也不能并发读。
幻读和可重复读的区别?
都是在一个事务内用相同的条件查询两次,但两次的结果不一样。差异在于,对不可重复读来说,第二次的结果集相对第一次,有些记录被修改(Update)或删除(Delete)了。而幻读是第二次结果集里出现了第一次结果集没有的记录(Insert)。一个更加形象的说法,幻读是在第一次结果集的记录“间隙”中增加了新的记录。所以,MySQL将防止出现幻读在可重复读隔离级别下新增了间隙锁(GapLock)。
为什么已提交读隔离级别不能和statement格式binlog一起使用?
由于已提交读隔离级别没有间隙锁,下面SQL不会存在阻塞。
tx1 begin;
tx1 delete id>5 and id<10;
tx2 begin;
tx2 insert into values(6)(7);
tx2 commit;
tx1 commit;
tx2先提交到binlog,tx1后提交到binlog,binlog按照顺序执行日志时,会把[6, 7]两行数据也删除掉。
感谢您的阅读!如果文章中有任何问题或不足之处,欢迎及时指出,您的反馈将帮助我不断改进与完善。期待与您共同探讨技术,共同进步!