当前位置: 首页 > news >正文

NoSQL之redis哨兵

一、哨兵的核心功能

  1. 监控(Monitoring)

    • 持续检查主节点和从节点的运行状态(是否存活、延迟等)。

  2. 自动故障转移(Automatic Failover)

    • 当主节点不可用时,自动选举一个从节点升级为主节点。

    • 更新其他从节点和客户端的配置指向新主节点。

  3. 配置提供(Configuration Provider)

    • 客户端通过哨兵获取当前的主节点地址(无需手动修改配置)。

  4. 通知(Notification)

    • 通过 API 或脚本发送集群状态变化的告警(如邮件、短信)。


二、哨兵的工作原理

1. 监控机制
  • 每个哨兵每秒向所有节点(主/从/其他哨兵)发送 PING 命令。

  • 若节点在 down-after-milliseconds 时间内未响应,哨兵将其标记为主观下线(Subjectively Down)

  • 多个哨兵(需达到 quorum 数量)都认为主节点主观下线,则主节点被标记为客观下线(Objectively Down)

2. 选举领导者哨兵
  • 主节点客观下线后,哨兵们通过 Raft 算法 选举一个领导者哨兵(Leader Sentinel)来执行故障转移。

3. 故障转移流程
  1. 领导者哨兵选择一个合适的从节点(如数据最新、优先级高)。

  2. 向该从节点发送 SLAVEOF NO ONE 命令,使其成为新主节点。

  3. 向其他从节点发送 SLAVEOF <new-master-ip> <new-master-port>,指向新主节点。

  4. 将旧主节点更新为从节点(若恢复则自动切换角色)。


三、部署建议

  1. 最少部署 3 个哨兵节点(避免脑裂,需奇数台)。

  2. 哨兵分散在不同物理服务器(防单点故障)。

  3. 配置参数示例:

    sentinel monitor mymaster 192.168.1.10 6379 2  # 监控主节点,2表示quorum
    sentinel down-after-milliseconds mymaster 5000 # 5秒无响应判为主观下线
    sentinel failover-timeout mymaster 60000       # 故障转移超时60秒

四、客户端如何配合哨兵?

客户端需通过哨兵获取主节点地址,而不是直连主节点。流程如下:

  1. 连接任意哨兵节点,发送命令:

    SENTINEL get-master-addr-by-name <master-name>
  2. 获取当前主节点 IP 和端口后建立连接。

  3. 订阅哨兵的 +switch-master 事件,及时感知主节点切换。


五、哨兵的优势与限制

优势限制
自动故障转移,服务高可用不解决数据分片(需配合 Redis Cluster)
配置集中管理,客户端透明故障转移期间可能有少量数据丢失
支持多哨兵部署,避免单点故障网络分区时可能出现脑裂(需合理配置)

六、常见命令

# 查看主节点信息
SENTINEL masters# 查看从节点信息
SENTINEL slaves <master-name># 手动触发故障转移(测试用)
SENTINEL failover <master-name>

七、注意事项

  1. 避免脑裂(Split-Brain):确保 quorum 值 > 哨兵总数/2(如 3 个哨兵设 quorum=2)。

  2. 合理设置超时down-after-milliseconds 根据网络延迟调整(通常 5-30 秒)。

  3. 版本一致性:所有节点使用相同 Redis 版本(避免兼容问题)。

http://www.xdnf.cn/news/906175.html

相关文章:

  • 《SQL基础教程》第五章 SQL进阶之路:掌握高级查询的核心技巧
  • 2.1 Windows编译环境介绍
  • Caliper 配置文件解析:config.yaml
  • 加密货币钱包开发指南:多链资产管理与非托管安全范式
  • 关于iview组件中使用 table , 绑定序号分页后序号从1开始的解决方案
  • Appium+python自动化(十一)- 元素定位- 下
  • 串:探索 KMP 算法的高效模式匹配之旅
  • Nestjs框架: nestjs-schedule模块注册流程,源码解析与定时备份数据库
  • 【通义万相 Wan2.1】在并行智算云上的部署教程
  • 跨分割信号的回流路径处理
  • 毫米波雷达基础理论(3D+4D)
  • 【Servo】信号激励;激励数据、采集数据、跟踪数据
  • 我爱学算法之—— 前缀和(中)
  • 进程的详解,命令行参数,程序的地址空间(Linux)
  • 学习日记-day23-6.6
  • C++11异常特性
  • 如何计算光伏工程造价预算表?
  • YUM仓库编译出现`conflicting requests`问题解决方案
  • [Java恶补day17] 41. 缺失的第一个正数
  • AirSim/Cosys-AirSim 游戏开发(三)打包可执行文件
  • spring获取注册的bean并注册到自定义工厂中管理
  • 【大模型】大模型数据训练格式
  • 光纤采集系统
  • grafana-mcp-analyzer:基于 MCP 的轻量 AI 分析监控图表的运维神器!
  • 【计算机网络】HTTP
  • 安徽省N1 叉车司机考试题及答案解析
  • webui无法注册如何配置
  • volka 25个短语动词
  • Android动态广播注册收发原理
  • (4-point Likert scale)4 点李克特量表是什么