PostgreSQL 灾备核心详解:基于日志文件传输的物理复制(流复制)
PostgreSQL 灾备核心详解:基于日志文件传输的物理复制(流复制)
在 PostgreSQL 的众多高可用与灾备方案中,基于日志文件传输的物理复制(Physical Streaming Replication, PSR) 无疑是最为核心、应用最广泛的基石技术。它高效、稳定且原生集成,能够为大多数生产系统提供可靠的数据保护和服务连续性保障。
本文将深入解析流复制的工作原理、核心配置、同步模式以及最佳实践。
一、核心思想:字节级完美复制
流复制的根本目标是创建一个与主库(Primary)在物理层面上完全一致的备用库(Standby/Replica)。这意味着备库的磁盘数据块内容与主库几乎是逐字节匹配的。
其实现依赖 PostgreSQL 的核心机制:预写式日志(Write-Ahead Logging, WAL)。任何对数据库的修改都必须首先被记录到 WAL 日志中,然后再写入数据文件。流复制正是通过传输和重放这些 WAL 记录来实现数据同步的。
二、工作原理与流程
流复制的工作流程可以清晰地分为以下几步:
-
WAL 记录生成(主库):
- 当用户提交一个事务(如
INSERT
,UPDATE
)时,主库首先将变更以数据页的变化形式写入 WAL 日志缓冲区。 - WAL 缓冲区定期或根据策略(如事务提交时)被刷入磁盘,生成连续的 WAL 段文件(如
0000000100000001000000A5
)。
- 当用户提交一个事务(如
-
WAL 记录传输(主库