当前位置：首页 > news >正文

深入解析达梦数据库核心技术：检查点、redo、undo、MVCC与内存缓存刷盘

news 2025/9/7 12:31:48

- 一、达梦数据库检查点（Checkpoint）
- - （一）检查点的概念与作用
  - （二）检查点的工作流程
  - （三）检查点的触发方式
- 二、达梦数据库 redo 日志
- - （一）redo 日志的概念与作用
  - （二）redo 日志的工作机制
  - （三）redo 日志的相关配置与管理
- 三、达梦数据库 undo 日志
- - （一）undo 日志的概念与作用
  - （二）undo 日志的工作机制
  - （三）undo 表空间的管理
- 四、达梦数据库多版本并发控制（MVCC）
- - （一）MVCC 的概念与作用
  - （二）MVCC 的实现原理
  - （三）MVCC 与事务隔离级别的适配
- 五、达梦数据库内存缓存刷盘
- - （一）内存缓存的核心组件：数据库缓冲池
  - （二）内存缓存刷盘的触发机制
  - - 1. 检查点触发刷盘（批量刷盘）
    - 2. 后台进程异步刷盘（增量刷盘）
    - 3. 主动触发刷盘（按需刷盘）
  - （三）刷盘策略与性能优化
  - - 1. 按 “数据页热度” 分级刷盘
    - 2. 异步 I/O 与预读结合
    - 3. 刷盘水位控制
  - （四）内存缓存刷盘与 redo/undo 日志的协同
- 六、五大核心技术的协同关系总结

在数据库领域，达梦数据库作为国产数据库的佼佼者，其内部的诸多核心技术支撑着数据库的高效、稳定运行。其中，检查点、redo 日志、undo 日志、多版本并发控制（MVCC）以及内存缓存刷盘这几项技术尤为关键，它们相互配合，共同保障了数据的一致性、完整性和系统的高性能。本文将带大家深入了解这些技术，通过图文结合的方式，让复杂的概念变得清晰易懂。

一、达梦数据库检查点（Checkpoint）

（一）检查点的概念与作用

检查点是达梦数据库中一个重要的后台进程或操作，它的核心作用是将数据库缓冲池中已修改的数据页（脏页）刷新到磁盘上，并更新控制文件和数据文件头中的相关信息，记录检查点发生的位置。

通过执行检查点，数据库可以实现以下几个关键目标：

缩短数据库恢复时间：当数据库发生故障需要恢复时，只需要从最后一个检查点的位置开始，根据 redo 日志进行数据恢复，而无需从数据库启动之初开始，大大减少了恢复所需的时间。
保证数据一致性：确保缓冲池中已提交事务修改的数据能够及时持久化到磁盘，避免因系统崩溃等意外情况导致数据丢失，维护数据的一致性。
释放 redo 日志空间：当检查点完成后，在检查点之前生成的 redo 日志所对应的脏页已经写入磁盘，这些 redo 日志就可以被覆盖重用，从而释放 redo 日志文件的空间。

（二）检查点的工作流程

达梦数据库的检查点工作流程可以用以下流程图来表示：

从流程图中可以清晰地看到，检查点的执行过程是一个有序的操作序列，从触发开始，经过一系列步骤，最终完成脏页刷新和相关信息更新，为数据库的稳定运行提供保障。

（三）检查点的触发方式

在达梦数据库中，检查点的触发主要有以下几种方式：

自动触发：数据库系统会根据预设的参数和运行情况自动触发检查点。例如，当数据库缓冲池中脏页的数量达到一定阈值时，为了避免脏页过多影响系统性能和数据安全性，系统会自动启动检查点操作，将部分脏页刷新到磁盘。另外，在数据库的日志文件即将写满时，也会触发检查点，以便释放旧的日志空间。
手动触发：数据库管理员可以根据实际需求，通过执行特定的 SQL 命令手动触发检查点。例如，在进行数据库备份之前，手动触发检查点可以确保所有已提交事务的数据都已持久化到磁盘，从而保证备份数据的一致性和完整性。在达梦数据库中，可以使用ALTER SYSTEM CHECKPOINT;命令手动触发检查点。
特定事件触发：在一些特定的数据库事件发生时，也会触发检查点。比如，当数据库执行 shutdown 命令正常关闭时，会触发一个完整的检查点，将所有脏页刷新到磁盘，确保数据的完整性，然后再关闭数据库。此外，在进行数据库恢复操作完成后，也可能会触发检查点来更新相关的系统信息。

二、达梦数据库 redo 日志

（一）redo 日志的概念与作用

redo 日志，也称为重做日志，是达梦数据库中用于记录数据库事务对数据所做修改的日志文件。它详细记录了每个事务对数据页的修改操作，包括修改前的数据值、修改后的数据值以及修改的位置等信息。

redo 日志在数据库中起着至关重要的作用，主要体现在以下几个方面：

数据恢复：当数据库发生故障（如系统崩溃、断电等）导致数据丢失或不一致时，数据库可以通过 redo 日志进行恢复。系统会重新执行 redo 日志中记录的事务操作，将数据恢复到故障发生前的状态，确保数据的完整性。
支持事务的持久性：根据事务的 ACID 特性（原子性、一致性、隔离性、持久性），事务一旦提交，其对数据的修改就应该永久保存。redo 日志正是实现事务持久性的关键，即使事务提交后数据还未及时刷新到磁盘，只要 redo 日志已经写入，数据库在恢复时就可以通过 redo 日志重新执行事务操作，保证事务的持久性。
减少磁盘 I/O 开销：在数据库运行过程中，事务对数据的修改首先会在数据库缓冲池中进行，而不是直接写入磁盘数据文件。只有当满足一定条件时，才会将缓冲池中的脏页刷新到磁盘。而 redo 日志会及时记录这些修改操作，这样可以减少直接写入磁盘数据文件的次数，降低磁盘 I/O 开销，提高数据库的性能。

（二）redo 日志的工作机制

redo 日志的工作机制可以概括为以下几个步骤，配合流程图更易理解：

在这里插入图片描述

具体来说，当一个事务开始执行修改数据的操作时，首先会在数据库缓冲池中对相应的数据页进行修改。在修改的同时，会生成对应的 redo 日志记录，这些记录包含了足够的信息来重新执行该修改操作。生成的 redo 日志记录会先被写入到 redo 日志缓冲区中，redo 日志缓冲区是内存中的一块区域，用于临时存放待写入磁盘的 redo 日志。然后，根据数据库设置的日志写入策略（例如，在事务提交时将 redo 日志写入磁盘），redo 日志会从缓冲区被写入到磁盘上的 redo 日志文件中。一旦事务提交并且对应的 redo 日志成功写入磁盘，就意味着该事务的修改操作已经被永久记录，即使后续发生系统故障，数据库在重新启动时，也可以通过读取 redo 日志文件，重新执行其中记录的修改操作，将数据恢复到故障发生前的正确状态。

（三）redo 日志的相关配置与管理

在达梦数据库中，对 redo 日志的合理配置和管理对于数据库的性能和可靠性有着重要影响。以下是一些常见的 redo 日志配置和管理方面的内容：

redo 日志文件的数量和大小：达梦数据库允许配置多个 redo 日志文件，这些文件通常以循环的方式被使用。合理设置 redo 日志文件的数量和大小非常重要。如果 redo 日志文件过小，可能会导致日志文件频繁切换，增加磁盘 I/O 开销，影响数据库性能；如果日志文件过大，虽然可以减少切换频率，但在数据库恢复时，可能会增加恢复所需的时间。管理员需要根据数据库的业务量、事务强度等因素，综合考虑设置合适的 redo 日志文件数量和大小。在达梦数据库中，可以通过CREATE LOGFILE GROUP和ALTER LOGFILE GROUP等命令来创建和修改 redo 日志文件组及其中的日志文件。
redo 日志的写入模式：达梦数据库提供了不同的 redo 日志写入模式，以适应不同的业务需求和性能要求。常见的写入模式包括异步写入和同步写入。在异步写入模式下，数据库将 redo 日志写入缓冲区后，不会等待其真正写入磁盘就继续执行后续操作，这种方式可以提高数据库的并发性能，但在发生系统故障时，可能会存在少量已提交事务的 redo 日志未写入磁盘，导致数据丢失的风险。而在同步写入模式下，只有当 redo 日志成功写入磁盘后，事务才能提交完成，这种方式可以确保数据的安全性和一致性，但会在一定程度上降低数据库的并发性能。管理员可以根据业务对数据安全性和性能的要求，选择合适的 redo 日志写入模式，可通过修改数据库参数进行配置。
redo 日志的归档：为了防止 redo 日志文件被循环覆盖后，无法进行数据库的时间点恢复等操作，达梦数据库提供了 redo 日志归档功能。开启归档功能后，当 redo 日志文件被写满并需要切换到下一个日志文件时，数据库会将当前已满的 redo 日志文件复制到指定的归档目录中进行保存。这些归档日志文件可以用于数据库的恢复操作，例如，当数据库发生数据损坏等严重故障时，可以使用归档日志和在线 redo 日志，将数据库恢复到故障发生前的任意一个时间点。在达梦数据库中，可以通过ALTER DATABASE ARCHIVELOG命令开启归档模式，并通过相关参数设置归档目录等信息。

三、达梦数据库 undo 日志

（一）undo 日志的概念与作用

undo 日志，即回滚日志，是达梦数据库中用于记录事务修改数据之前的原始数据信息的日志。它与 redo 日志记录事务修改后的新数据不同，undo 日志主要记录事务开始修改数据前的数据状态，以便在需要时能够撤销事务对数据所做的修改，将数据恢复到事务执行前的状态。

undo 日志在达梦数据库中具有以下重要作用：

事务回滚：当一个事务由于某种原因（如应用程序出错、用户主动取消等）需要回滚时，数据库可以利用 undo 日志中记录的原始数据信息，撤销该事务对数据所做的所有修改操作，将数据恢复到事务开始执行前的状态，从而保证事务的原子性。例如，一个事务执行了一系列的更新操作，但在提交前发现存在错误，此时就可以通过 undo 日志进行回滚，取消所有的更新操作。
支持多版本并发控制（MVCC）：在达梦数据库采用的 MVCC 机制中，undo 日志起着关键作用。当多个事务同时访问数据库中的同一数据时，为了避免读写冲突，数据库会为每个事务提供该数据的一个快照版本。这些快照版本的数据就是通过 undo 日志来构建的。当一个事务需要读取数据时，如果该数据正在被其他未提交的事务修改，数据库可以通过 undo 日志，将被修改的数据恢复到之前的某个版本，提供给当前事务读取，从而实现事务的隔离性，提高数据库的并发性能。
事务恢复中的撤销操作：在数据库发生故障进行恢复的过程中，除了需要利用 redo 日志重做已提交事务的修改操作外，对于那些在故障发生时还未提交的事务，需要进行撤销操作，以确保数据的一致性。这时，就可以通过 undo 日志，撤销这些未提交事务对数据所做的修改，将数据恢复到事务开始前的状态。

（二）undo 日志的工作机制

undo 日志的工作机制相对复杂，下面结合流程图来详细说明：

在这里插入图片描述

具体而言，当一个事务开始后，在执行修改数据的操作之前，数据库会先将该数据修改前的原始信息记录到 undo 日志中。这些原始信息包括数据所在的数据页地址、数据的原始值等。生成的 undo 日志会首先被写入到内存中的 undo 日志缓冲区，undo 日志缓冲区是一块专门用于临时存放 undo 日志的内存区域。然后，根据数据库的相关配置策略（如 undo 日志缓冲区达到一定大小、事务提交等），undo 日志会从缓冲区被写入到磁盘上的 undo 表空间中。undo 表空间是达梦数据库中专门用于存储 undo 日志的表空间，它可以由一个或多个数据文件组成。

当事务继续执行其他操作时，只要涉及到数据修改，都会重复上述记录 undo 日志的过程。如果事务最终选择提交，那么该事务对应的 undo 日志并不会立即被删除，因为这些 undo 日志可能还需要用于支持其他事务的 MVCC 读取操作或者在后续的数据库恢复过程中使用。后续，数据库会有专门的后台清理进程（如 undo 清理进程），根据 undo 日志的使用情况和保留策略，定期清理那些不再需要的 undo 日志，释放 undo 表空间的存储空间。

如果事务在执行过程中需要回滚，数据库就会读取该事务对应的 undo 日志，根据其中记录的原始数据信息，反向执行事务的修改操作，将被修改的数据恢复到事务开始执行前的原始状态，从而完成事务的回滚。

（三）undo 表空间的管理

undo 表空间作为存储 undo 日志的关键区域，其管理对于数据库的稳定运行和性能至关重要。在达梦数据库中，对 undo 表空间的管理主要包括以下几个方面：

undo 表空间的创建与配置：在创建达梦数据库时，会默认创建一个 undo 表空间来存储 undo 日志。管理员也可以根据实际需求，创建额外的 undo 表空间。在创建 undo 表空间时，需要指定表空间的名称、所属的数据库实例、以及组成该表空间的数据文件的相关信息（如数据文件的路径、大小、是否自动扩展等）。合理配置 undo 表空间的数据文件大小和自动扩展属性非常重要。如果 undo 表空间过小，可能会导致 undo 日志无法存储，从而影响事务的正常执行；而过大的表空间则可能会浪费存储空间。可以使用CREATE TABLESPACE命令创建 undo 表空间，并通过相关参数进行配置。
undo 表空间的监控：管理员需要定期对 undo 表空间的使用情况进行监控，及时了解 undo 表空间的空间使用量、增长率等信息，以便及时发现潜在的问题并采取相应的措施。达梦数据库提供了一些系统视图和命令，可以用于查询 undo 表空间的相关信息。例如，通过查询V$TABLESPACE和V$DATAFILE系统视图，可以了解 undo 表空间的基本信息和数据文件的使用情况；通过查询V$UNDOSTAT系统视图，可以获取 undo 表空间的统计信息，如 undo 日志的生成量、undo 表空间的使用率等。
undo 表空间的扩展与收缩：当 undo 表空间的空间不足时，管理员需要及时对其进行扩展。可以通过增加 undo 表空间的数据文件数量或者扩大现有数据文件的大小来实现表空间的扩展。在达梦数据库中，可以使用ALTER TABLESPACE命令来添加数据文件或修改数据文件的大小。相反，如果 undo 表空间存在大量空闲空间，并且预计未来一段时间内不会有大量的 undo 日志生成，为了节省存储空间，管理员也可以考虑对 undo 表空间进行收缩。不过，在收缩 undo 表空间时需要谨慎操作，确保不会影响正在运行的事务和数据库的正常功能。
undo 日志的保留策略：达梦数据库允许管理员设置 undo 日志的保留策略，以控制 undo 日志在 undo 表空间中的保留时间。不同的保留策略会影响 undo 日志的清理时机和表空间的空间使用情况。例如，设置较长的 undo 日志保留时间，可以为需要进行长时间查询或数据恢复的操作提供足够的 undo 日志支持，但会增加 undo 表空间的空间占用；而设置较短的保留时间，则可以更快地释放 undo 表空间的空间，但可能会导致一些需要访问旧版本数据的操作失败。管理员可以根据数据库的业务需求和表空间的空间情况，通过修改相关数据库参数来设置合适的 undo 日志保留策略。

四、达梦数据库多版本并发控制（MVCC）

（一）MVCC 的概念与作用

多版本并发控制（MVCC，Multi-Version Concurrency Control）是达梦数据库中用于实现事务隔离性的一种重要机制。它的核心思想是为数据库中的每个数据项维护多个版本的快照，当多个事务同时对数据进行读写操作时，每个事务都可以看到数据的一个特定版本，从而避免了传统锁机制下可能出现的读写冲突和性能瓶颈。

MVCC 在达梦数据库中主要有以下作用：

提高并发性能：在传统的锁机制中，当一个事务对数据进行修改时，会对数据加锁，其他事务如果需要读取该数据，就必须等待锁释放，这会导致读写操作之间的相互阻塞，降低数据库的并发性能。而在 MVCC 机制下，读事务可以访问数据的快照版本，不需要等待写事务释放锁；同时，写事务也不会阻塞读事务，只有当多个事务同时修改同一数据时，才会通过锁机制进行协调。这样就大大提高了数据库的并发处理能力，尤其是在读操作频繁的业务场景中，效果更为明显。
实现事务隔离级别：MVCC 机制是达梦数据库实现不同事务隔离级别的基础。根据 ANSI/ISO SQL 标准，事务隔离级别分为未提交读（Read Uncommitted）、提交读（Read Committed）、可重复读（Repeatable Read）和串行化（Serializable）四个级别。达梦数据库通过 MVCC 机制，为不同的隔离级别提供了不同的数据版本可见性规则，使得事务能够在不同程度上隔离其他事务的修改操作，# 深入解析达梦数据库核心技术（续）：MVCC实现与内存缓存刷盘，避免了不同事务之间的相互干扰，满足不同业务场景对数据一致性和并发性能的需求。例如，在提交读隔离级别下，事务每次读取数据时都会获取最新的已提交数据版本；而在可重复读隔离级别下，事务在整个执行过程中只会看到同一个数据版本，避免了不可重复读的问题。
减少锁竞争：由于 MVCC 机制允许读事务和写事务并行执行，只有在多个写事务修改同一数据时才会产生锁竞争，这相比传统锁机制中读写操作都可能产生锁竞争的情况，大大减少了锁的使用频率和竞争程度，降低了死锁发生的概率，提高了数据库的整体运行效率。

（二）MVCC 的实现原理

达梦数据库的 MVCC 机制主要通过事务 ID（TXID） 、数据版本号 和 undo 日志 三大核心组件实现，其具体实现流程可通过以下流程图展示：
在这里插入图片描述

具体实现逻辑可拆解为以下 4 个关键步骤：

事务 ID 与版本标记：每个事务启动时，数据库会为其分配一个全局唯一且递增的事务 ID（TXID）。同时，数据页中的每条记录会维护两个隐藏字段：

创建 TXID：记录生成该数据版本的事务 ID；
删除 TXID：记录删除或修改该数据版本的事务 ID（初始为 NULL）。

此外，每条记录还会维护一个版本号，用于标识数据的更新次数，版本号随数据修改递增。

版本链构建：当事务对数据进行修改（UPDATE/DELETE）时，不会直接覆盖原始数据，而是生成一个新的数据版本，并通过指针将新老版本串联成版本链。例如，事务 1 修改一条原始记录（版本号 5）时，会生成版本号 6 的新记录，原始记录通过指针指向新记录，形成 “版本 5→版本 6” 的版本链；同时，原始记录的删除 TXID 会被更新为事务 1 的 TXID，新记录的创建 TXID 设为事务 1 的 TXID。
可见性判断规则：当读事务查询数据时，会遍历数据的版本链，根据以下规则判断版本是否可见：

若版本的创建 TXID ≤ 读事务 TXID，且删除 TXID 为 NULL 或删除 TXID > 读事务 TXID，则该版本可见；
若版本的创建 TXID > 读事务 TXID（属于未来事务创建的版本），或删除 TXID ≤ 读事务 TXID（属于已被其他事务删除的版本），则该版本不可见，需通过 undo 日志回滚到上一个版本继续判断，直到找到可见版本或版本链尽头（返回空）。

undo 日志的支撑作用：当读事务遇到不可见的新版本时，会通过版本链中的指针找到对应的 undo 日志，根据 undo 日志中记录的原始数据，将数据 “回滚” 到上一个版本，直到找到符合可见性规则的版本。这也是 MVCC 能够实现 “读不加锁” 的核心 —— 通过 undo 日志构建历史版本，而非等待写事务释放锁。

（三）MVCC 与事务隔离级别的适配

达梦数据库通过调整 MVCC 的版本快照获取时机和可见性判断范围，实现了不同的事务隔离级别，具体适配规则如下表所示：

隔离级别	版本快照获取时机	可见性规则特点	解决的问题	未解决的问题
未提交读（RU）	无固定快照，实时读取最新版本	允许读取未提交事务生成的版本（创建 TXID 可大于读 TXID）	-	脏读、不可重复读、幻读
提交读（RC）	每次 SELECT 时重新获取快照	仅读取已提交事务的版本（删除 TXID 需≤读 TXID）	脏读	不可重复读、幻读
可重复读（RR）	事务启动时获取一次快照，全程复用	仅读取事务启动前已提交的版本（创建 TXID≤事务启动 TXID）	脏读、不可重复读	幻读（达梦通过间隙锁优化）
串行化（Serializable）	禁用 MVCC，采用表级锁	读写操作互斥，事务串行执行	脏读、不可重复读、幻读	并发性能低

例如，在 “可重复读” 隔离级别下，事务 2（TXID=1002）启动后，无论事务 1（TXID=1001）后续是否提交修改，事务 2 始终只能看到事务启动前已存在的版本（版本 5），直到事务 2 结束后，新启动的事务 3（TXID=1003）才能看到事务 1 提交的版本 6，这就避免了 “不可重复读” 问题。

五、达梦数据库内存缓存刷盘

（一）内存缓存的核心组件：数据库缓冲池

达梦数据库的内存缓存核心是数据库缓冲池（Buffer Pool），它是一块用于临时存储磁盘数据页的内存区域，大小通过BUFFER_SIZE参数配置（默认通常为物理内存的 20%-40%）。缓冲池的结构可分为以下 3 个关键部分：
在这里插入图片描述

缓冲池的核心作用是减少磁盘 I/O：由于内存读写速度（微秒级）远快于磁盘（毫秒级），通过将高频访问的数据页缓存到内存中，事务可直接操作内存数据，无需每次都访问磁盘，大幅提升数据库性能。例如，一个频繁执行的查询语句，第一次执行时从磁盘加载数据页到缓冲池，后续执行可直接从缓冲池读取，响应时间可从毫秒级降至微秒级。