当前位置: 首页 > news >正文

使用docker——10分钟内 完成一个高可用的 MongoDB 副本集部署

实验目的

  1. 掌握 Docker 容器化部署 MongoDB 副本集 的方法

  2. 理解 主从同步、故障转移、数据一致性 等核心机制

  3. 熟悉 MongoDB 集群管理命令 和 运维监控技巧


🔧 实验环境

  • 操作系统: Rocky Linux 9 / CentOS 7+

  • 软件依赖:

    • Docker 20.10+

    • docker-compose 1.29+

  • 硬件要求:

    • 最低配置: 2核CPU / 4GB内存 / 20GB磁盘

    • 推荐配置: 4核CPU / 8GB内存 (用于模拟多节点)

1. 环境准备

# 创建目录结构
mkdir -p mongo-com/{data/primary,data/secondary,data/arbiter,keys}
cd mongo-com# 生成密钥文件(容器内外权限一致)
openssl rand -base64 756 > keys/mongodb-keyfile
chmod 400 keys/mongodb-keyfile
chown 999:999 keys/mongodb-keyfile  # MongoDB容器默认用户

2. 编写 docker-compose.yaml

version: '3.8'services:mongo-primary:image: mongo:6.0container_name: mongo-primarycommand: mongod --auth --keyFile /keys/mongodb-keyfile --replSet rs2 --bind_ip_all --oplogSize 1024ports:- "27017:27017"volumes:- ./data/primary:/data/db- ./keys:/keysenvironment:MONGO_INITDB_ROOT_USERNAME: adminMONGO_INITDB_ROOT_PASSWORD: admin123user: "999:999"healthcheck:test: mongosh -u admin -p admin123 --eval "db.adminCommand('ping')"interval: 10stimeout: 5smongo-secondary:image: mongo:6.0container_name: mongo-secondarycommand: mongod --auth --keyFile /keys/mongodb-keyfile --replSet rs2 --bind_ip_allports:- "27018:27017"volumes:- ./data/secondary:/data/db- ./keys:/keysenvironment:MONGO_INITDB_ROOT_USERNAME: adminMONGO_INITDB_ROOT_PASSWORD: admin123user: "999:999"depends_on:mongo-primary:condition: service_healthymongo-arbiter:image: mongo:6.0container_name: mongo-arbitercommand: mongod --auth --keyFile /keys/mongodb-keyfile --replSet rs2 --bind_ip_allvolumes:- ./keys:/keys- ./data/arbiter:/data/dbuser: "999:999"depends_on:mongo-primary:condition: service_healthy

3. 启动容器集群

# 启动服务(自动等待主节点健康)
docker-compose up -d
若报错如下,可从以下问题排除

(1)查看错误详情(关键步骤)

docker logs mongo-primary  # 查看具体错误原因

(2)常见原因及解决方案

🔴 问题1:密钥文件权限错误

# 在宿主机检查密钥文件权限
ls -l keys/mongodb-keyfile
# 必须显示: -r-------- 1 999 999

修复命令:

chmod 400 keys/mongodb-keyfile
chown 999:999 keys/mongodb-keyfile

🔴 问题2:数据目录权限问题

# 检查数据目录所有权
ls -ld data/primary/
# 应显示: drwxr-xr-x 2 999 999

修复命令:

sudo chown -R 999:999 data/
sudo chmod -R 700 data/

🔴 问题3:端口冲突

# 检查27017端口占用
sudo netstat -tulnp | grep 27017

解决方案:

  • 停止占用进程:sudo systemctl stop mongod

  • 或修改 docker-compose.yaml 中的端口映射(如 27027:27017

3. 强制清理并重启

# 彻底清理旧容器
docker-compose down -v
sudo rm -rf data/primary/*

# 重新启动
docker-compose up -d

# 检查状态(所有容器应为healthy) watch -n 1 'docker-compose ps'


4. 初始化副本集(一键脚本)

docker exec mongo-primary mongosh -u admin -p admin123 --eval '
rs.initiate({_id: "rs2",members: [{ _id: 0, host: "mongo-primary:27017", priority: 2 },{ _id: 1, host: "mongo-secondary:27017", priority: 1 },{ _id: 2, host: "mongo-arbiter:27017", arbiterOnly: true }],settings: {heartbeatTimeoutSecs: 10,electionTimeoutMillis: 10000,chainingAllowed: false}
})'

# 等待10秒后检查状态
sleep 10 && docker exec mongo-primary mongosh -u admin -p admin123 --eval 'rs.status()'

5. 数据同步验证

# 主节点插入数据
docker exec mongo-primary mongosh -u admin -p admin123 --eval '
db.test.insertOne({_id: "cluster-test",message: "副本集同步验证",timestamp: new Date()
})'# 从节点查询(自动等待同步)
docker exec mongo-secondary mongosh -u admin -p admin123 --eval '
rs.secondaryOk();
db.test.find().readPref("secondary");'

6. 故障转移测试

# 模拟主节点宕机
docker pause mongo-primary# 观察选举(从节点窗口执行)
docker logs -f mongo-secondary | grep -E "ELECT|stepdown"

# 恢复原主节点
docker unpause mongo-primary# 验证角色切换
docker exec mongo-primary mongosh -u admin -p admin123 --eval 'rs.isMaster()'

✅ 验证要点

项目预期结果验证命令
副本集状态所有节点 health:1rs.status()
主从角色主节点 PRIMARY,从节点 SECONDARYrs.isMaster()
数据同步从节点能查询到主节点插入的数据db.test.find()
故障转移主节点宕机后从节点升主docker logs 观察选举日志

⚠️ 常见问题处理

  1. 容器启动失败

    # 检查日志
    docker-compose logs mongo-primary# 常见修复
    chown -R 999:999 data/ keys/
  2. 节点无法加入副本集

    # 强制重新配置
    docker exec mongo-primary mongosh -u admin -p admin123 --eval '
    rs.reconfig({_id:"rs2",members:[]},{force:true})'
  3. 认证失败

    # 确保密钥文件一致
    docker exec mongo-primary cat /keys/mongodb-keyfile | md5sum

通过以上流程,您将在 10分钟内 完成一个高可用的 MongoDB 副本集部署。所有步骤已在全新 CentOS/Rocky Linux 机器上验证通过。

http://www.xdnf.cn/news/528481.html

相关文章:

  • 代理IP高可用性与稳定性方案:负载均衡、节点健康监测与智能切换策略
  • python链接数据库
  • 线程调度与单例模式:wait、notify与懒汉模式解析
  • Excel
  • Vue 中 v-model 的三种使用方式对比与实践
  • B/S架构和C/S架构的介绍与分析
  • UE 材质几个输出向量节点
  • 嵌入式51单片机:C51
  • Qt—模态与非模态对话框
  • 板凳-------Mysql cookbook学习 (四)
  • 分布式天线系统 (DAS, Distributed Antenna System)
  • 机器学习第十六讲:K-means → 自动把超市顾客分成不同消费群体
  • 三维云展展示效果升级​
  • 5个开源MCP服务器:扩展AI助手能力,高效处理日常工作
  • 【11408学习记录】考研英语辞职信写作三步法:真题精讲+妙句活用+范文模板
  • 在linux平台下利用mingw64编译windows程序
  • UE5在Blueprint中判断不同平台
  • [架构之美]从PDMan一键生成数据库设计文档:Word导出全流程详解(二十)
  • C语言之 比特(bit)、字节(Byte)、字(Word)、整数(Int)
  • ABAP实战案例--获取当前数据由哪个用户锁住
  • 微前端记录
  • MFC 编程中 OnInitDialog 函数
  • YOLOV3 深度解析:目标检测的高效利器
  • vue3与springboot交互-前后分离【验证element-ui输入的内容】
  • w~自动驾驶~合集3
  • Linux内核深入学习(4)——内核常见的数据结构之链表
  • 超小多模态视觉语言模型MiniMind-V 训练
  • Java实现PDF加水印功能:技术解析与实践指南
  • leetcode239 滑动窗口最大值deque方式
  • 阿里云国际站与国内站:局势推进中的多维差异