当前位置: 首页 > news >正文

PostgreSQL 的 pg_start_backup 函数

PostgreSQL 的 pg_start_backup 函数

pg_start_backup 是 PostgreSQL 中用于执行物理备份的关键函数,它通过创建备份模式为数据库文件的一致性备份做准备。以下是该函数的全面解析:

一、函数基础

1. 函数语法

pg_start_backup(label text [, fast boolean [, exclusive boolean ]])text

2. 参数说明

  • label:备份标识(必填),会记录在备份历史文件中
  • fast:是否快速启动备份(可选,默认false)
    • true:跳过强制检查点,加快备份开始速度
    • false:执行常规检查点,保证恢复时启动更快
  • exclusive:是否独占模式(可选,默认true)
    • PostgreSQL 9.6+ 推荐使用非独占模式(exclusive => false

3. 返回值

返回备份的起始WAL(预写式日志)位置,格式为LSN(日志序列号)

二、备份操作流程

1. 标准备份流程

-- 1. 开始备份(非独占模式)
SELECT pg_start_backup('nightly_backup_20230815', false, false);-- 2. 使用文件系统工具备份数据目录(示例命令)
-- $ rsync -avz /var/lib/postgresql/15/main/ /backup/pg_backup/-- 3. 结束备份
SELECT pg_stop_backup(false, true);

2. 独占模式 vs 非独占模式

特性独占模式非独占模式
并发性阻止其他备份允许多个并发备份
推荐版本PostgreSQL <9.6PostgreSQL ≥9.6
WAL保留需要手动管理自动跟踪备份状态
使用复杂度简单需要更多协调

三、关键实现细节

1. 内部执行过程

  1. 记录备份开始标记到backup_label文件
  2. 必要时执行检查点(除非fast=true
  3. 强制切换到新的WAL段文件
  4. 返回开始备份时的LSN位置

2. 生成的备份标签文件

备份期间会在数据目录创建backup_label文件,包含:

START WAL LOCATION: 0/2000028 (file 000000010000000000000002)
CHECKPOINT LOCATION: 0/2000060
BACKUP METHOD: pg_start_backup
BACKUP FROM: master
START TIME: 2023-08-15 14:05:23 UTC
LABEL: nightly_backup_20230815

四、实际应用示例

1. 自动化备份脚本

#!/bin/bash
# 备份脚本示例
BACKUP_LABEL="weekly_full_$(date +%Y%m%d)"
PG_DATA="/var/lib/postgresql/15/main"
BACKUP_DIR="/backup/pg_full_$(date +%Y%m%d)"# 开始备份
LSN=$(psql -U postgres -d postgres -t -c "SELECT pg_start_backup('$BACKUP_LABEL', false, false);")# 执行文件系统备份
rsync -a --exclude=pg_wal $PG_DATA/ $BACKUP_DIR/# 确保WAL文件也备份(从LSN开始)
pg_basebackup -D $BACKUP_DIR/wal_segments --wal-method=fetch --startpoint=$LSN# 结束备份
psql -U postgres -d postgres -c "SELECT pg_stop_backup(false, true);"

2. 备份验证方法

-- 检查备份历史(需要启用wal_log_hints)
SELECT * FROM pg_switch_wal();  -- 确保所有更改已写入
SELECT * FROM pg_backup_stop(); -- 如果备份异常终止-- 验证备份文件完整性
$ pg_checksums -D /backup/pg_full_20230815

五、注意事项

1. 关键配置要求

# postgresql.conf 必须配置
wal_level = replica             # 或更高
archive_mode = on               # 如果使用PITR
max_wal_senders = 3             # 足够用于备份

2. 常见问题处理

问题1:备份期间WAL文件被清理

-- 解决方案:设置足够的wal_keep_size
ALTER SYSTEM SET wal_keep_size = '1GB';
SELECT pg_reload_conf();

问题2:长时间运行备份导致WAL堆积

-- 监控WAL文件增长
SELECT name, size/1024/1024 AS size_mb 
FROM pg_ls_waldir() 
ORDER BY modification DESC;

问题3:备份冲突错误

-- 如果出现"a backup is already in progress"错误
SELECT pg_is_in_backup();  -- 检查是否有活动备份
SELECT * FROM pg_stop_backup();  -- 清理异常状态

六、高级用法

1. 使用pg_basebackup整合

# 结合pg_start_backup和pg_basebackup
pg_basebackup -D /backup/pg_data \--label="$(date +%Y%m%d_%H%M%S)" \--checkpoint=fast \--wal-method=stream

2. 多阶段备份控制

-- 阶段1:开始备份并获取LSN
DO $$
DECLAREbackup_lsn text;
BEGINbackup_lsn := pg_start_backup('multistage_backup', true, false);INSERT INTO backup_log VALUES (now(), backup_lsn, 'started');
END $$;-- 阶段2:执行增量文件备份
-- ...-- 阶段3:确保所有WAL归档
SELECT pg_switch_wal();

3. 云环境适配

-- AWS RDS等托管服务替代方案:
-- 使用其提供的快照功能,而非直接调用pg_start_backup
-- 例如AWS RDS创建数据库快照:
$ aws rds create-db-snapshot \--db-instance-identifier my-postgres \--db-snapshot-identifier my-snapshot

pg_start_backup 是 PostgreSQL 物理备份的核心组件,正确使用可以确保获得一致性的数据库备份。对于生产环境,建议:

  1. 定期测试备份恢复流程
  2. 监控备份持续时间
  3. 结合归档和PITR能力
  4. 考虑使用Barman等专业备份工具封装这些底层操作
http://www.xdnf.cn/news/335413.html

相关文章:

  • VR博物馆,足不出户云逛展
  • SpringBoot+Dubbo+Zookeeper实现分布式系统步骤
  • 面向小型企业顶点项目的网络安全咨询人机协作框架
  • 自然语言到 SQL 转换:开启智能数据库交互新时代
  • C++入门小馆 :多态
  • 裸辞8年前端的面试笔记——JavaScript篇(一)
  • uniapp-文件查找失败:‘@dcloudio/uni-ui/lib/uni-icons/uni-icons.vue‘
  • Docker部署常见应用之Superset
  • Linux 网络管理 的实战代码示例
  • C27-简单选择排序法
  • Matlab B级路面激励下集中驱动、轮边驱动和主动减振车辆
  • 人工智能可信度新突破:MIT改进共形分类助力高风险医学诊断
  • 【今日三题】ISBN号码(模拟) / kotori和迷宫(BFS最短路) / 矩阵最长递增路径(dfs)
  • vite 初始化react项目
  • UV使用官网
  • C++GO语言微服务和服务发现
  • mac连接lniux服务器教学笔记
  • c++中的引用
  • C# 方法(输出参数)
  • x64dbg技巧
  • 如何在Vue-Cli中使用Element-UI和Echarts和swiper插件(低版本)
  • 视频编解码学习7之视频编码简介
  • 红黑树详解初版
  • Java数据结构——Queue
  • 使用Deployment部署运行Nginx和Apache服务
  • Java复习笔记-基础
  • Spark缓存--cache方法
  • leetcode 3342. 到达最后一个房间的最少时间 II 中等
  • ​无线手持吸尘器无刷BLDC驱动方案功能介绍---【其利天下】
  • Crawl4AI:高效的开源 Python 网页爬取与数据提取库