当前位置: 首页 > backend >正文

python集成inotify-rsync实现跨服务器文件同步

1、实现功能

        通过结合 Python 的 watchdog 库(类似 Linux 的 inotify 机制)和 rsync 命令,实现了文件系统变化的实时监控和增量同步。下面详细解释其工作原理和运行方式:

2、核心工作原理

2.1、文件监控

        使用watchdog库监控源目录的文件变化(创建、修改、删除、移动)。

        1)监听事件类型:modified、created、deleted、moved;

        2)所有变更会被收集到pending_changes集合中,避免重复处理。

2.2、增量同步

        通过rsync命令将变化的文件同步到远程服务器:

        1)使用--delete参数确保目标目录与源目录完全一致。

        2)通过--exclude参数支持忽略特定文件或目录(如临时文件、日志)。

2.3、事件合并

        设置 1 秒的延迟(sync_delay),将短时间内的多次变更合并为一次同步操作,减少不必要的网络传输。

3、环境准备

Step1、python环境

# 1. 安装 rsync 
sudo apt update -y 
sudo apt install rsync -y # 2. 验证安装 
rsync --version

Step2、python环境

pip install watchdog # 用于文件监控

Step3、主机环境

SSH相关操作:

        将本机公钥内容添加到被连接的目标主机 ~/.ssh/authorized_keys 文件中。其中,authorized_keys文件权限要可读写;

# SSH秘钥对生成
ssh-keygen -t rsa -b 4096 -C "your_name" # 生成ssh-key# 如何实现ssh免密登录
方案1:
ssh-copy-id -i id_rsa_linux.pub name@ip # 将本机公钥内容就添加到服务器authorized_keys文件中了,name@ip为远程主机用户名、IP方案2:
将本机公钥id_rsa.pub拷贝到远程目标主机
cat id_rsa.pub >> ~/.ssh/authorized_keys # 将公钥添加到authorized_keys
chmod -R 600 ~/.ssh/authorized_keys # 添加权限# SSH秘钥连接测试是否成功
ssh name@ip 

4、示例代码

#!/usr/bin/env python3
# coding: utf-8
"""
pip install watchdog  # 用于文件监控
sudo apt install rsync -y
"""import os
import time
import subprocess
import logging
import argparse
from pathlib import Path
from watchdog.observers import Observer
from watchdog.events import FileSystemEventHandler, FileSystemMovedEvent, EVENT_TYPE_MODIFIED, EVENT_TYPE_CREATED, \EVENT_TYPE_DELETED, EVENT_TYPE_MOVED# 配置日志
logging.basicConfig(level=logging.INFO,format='%(asctime)s - %(levelname)s - %(message)s',handlers=[logging.FileHandler("sync_monitor.log"),logging.StreamHandler()]
)class RsyncHandler(FileSystemEventHandler):def __init__(self, source_dir, target_host, target_dir, exclude_patterns=None, ssh_key=None):self.source_dir = os.path.abspath(source_dir)self.target_host = target_hostself.target_dir = target_dirself.exclude_patterns = exclude_patterns or []self.ssh_key = ssh_keyself.last_sync_time = time.time()self.pending_changes = set()self.sync_delay = 1  # 合并1秒内的变更def enqueue_change(self, event):"""将变更加入待处理队列"""path = event.src_pathif isinstance(event, FileSystemMovedEvent):path = event.dest_pathrel_path = os.path.relpath(path, self.source_dir)self.pending_changes.add(rel_path)# 安排延迟同步,合并短时间内的多次变更if time.time() - self.last_sync_time > self.sync_delay:self.perform_sync()def on_modified(self, event):if not event.is_directory:logging.info(f"修改: {event.src_path}")self.enqueue_change(event)def on_created(self, event):logging.info(f"创建: {event.src_path}")self.enqueue_change(event)def on_deleted(self, event):logging.info(f"删除: {event.src_path}")self.enqueue_change(event)def on_moved(self, event):logging.info(f"移动: {event.src_path} -> {event.dest_path}")self.enqueue_change(event)def build_rsync_command(self):"""构建rsync命令"""cmd = ["rsync", "-avz", "--delete"]# 添加排除模式for pattern in self.exclude_patterns:cmd.extend(["--exclude", pattern])# 添加SSH密钥选项if self.ssh_key:cmd.extend(["-e", f"ssh -i {self.ssh_key}"])# 添加源目录和目标cmd.extend([f"{self.source_dir}/", f"{self.target_host}:{self.target_dir}/"])return cmddef perform_sync(self):"""执行rsync同步"""if not self.pending_changes:returnlogging.info(f"同步变更: {', '.join(self.pending_changes)}")self.pending_changes.clear()try:cmd = self.build_rsync_command()logging.debug(f"执行命令: {' '.join(cmd)}")result = subprocess.run(cmd,capture_output=True,text=True,check=True)logging.info(f"同步成功: {result.stdout.strip()}")self.last_sync_time = time.time()except subprocess.CalledProcessError as e:logging.error(f"同步失败: {e.stderr.strip()}")except Exception as e:logging.error(f"发生错误: {str(e)}")def main():parser = argparse.ArgumentParser(description="文件同步监控工具 (Inotify + Rsync)")parser.add_argument("source", help="源目录路径")parser.add_argument("target_host", help="目标主机 (user@host)")parser.add_argument("target_dir", help="目标目录路径")parser.add_argument("-e", "--exclude", action="append", help="排除模式 (可重复使用)")parser.add_argument("-k", "--ssh-key", help="SSH私钥路径")parser.add_argument("-i", "--initial-sync", action="store_true", help="启动时执行初始同步")args = parser.parse_args()# 验证源目录存在source_dir = os.path.abspath(args.source)if not os.path.isdir(source_dir):logging.error(f"源目录不存在: {source_dir}")returnlogging.info(f"开始监控目录: {source_dir}")logging.info(f"目标服务器: {args.target_host}:{args.target_dir}")# 创建事件处理器event_handler = RsyncHandler(source_dir,args.target_host,args.target_dir,args.exclude,args.ssh_key)# 执行初始同步if args.initial_sync:logging.info("执行初始同步...")event_handler.perform_sync()# 创建观察者observer = Observer()observer.schedule(event_handler, path=source_dir, recursive=True)observer.start()try:while True:time.sleep(1)except KeyboardInterrupt:observer.stop()observer.join()if __name__ == "__main__":main()
http://www.xdnf.cn/news/10405.html

相关文章:

  • GO+RabbitMQ+Gin+Gorm+docker 部署 demo
  • Qwen2.5-VL 视觉编码器的 RMSNorm
  • MQTT入门实战宝典:从零起步掌握物联网核心通信协议
  • Android Stdio 编译 文件生成,以及Gradle
  • 科研学习|科研软件——激活后的Origin导出图时突然出现了demo水印
  • TDenigne 集群可视化管理
  • UVa1457/LA4746 Decrypt Messages
  • 卫生间改造翻新怎么选品牌?智能健康、适老有爱,我选瑞尔特
  • windows+APP PDFgear 免费工具
  • 属性映射框架-MapStruct
  • 产品规格书写作结构、规范(编写指南)
  • 【MLLM】多模态LLM 2025上半年技术发展(Better、Faster、Stronger)
  • 使用MCP和Ollama本地创建AI代理:实操教程
  • 定制一款国密浏览器(13):预置国密根证书到浏览器
  • |从零开始的Pyside2界面编程|绘图、布局及页面切换
  • 【算法】递归与分治策略
  • C++11 语法特性一文详解
  • MySQL中count(1)和count(*)的区别及细节
  • Redis持久化机制详解
  • atapi!IdeReadWrite函数分析下之Send read command
  • uv:现代化的 Python 包和项目管理工具
  • 论爱情《态度》
  • 在 ABP VNext 中集成 Serilog:打造可观测、结构化日志系统
  • Java 文件操作 和 IO(4)-- Java文件内容操作(2)-- 字符流操作
  • threejsPBR材质与纹理贴图
  • 跑步前热身动作
  • redis核心知识点
  • PCIE硬件管脚顺序问题解决方案
  • C# 如何获取当前成员函数的函数名
  • C语言:字符函数和字符串函数