当前位置: 首页 > news >正文

达梦数据守护集群监视器详解与应用指南

一、DM 数据守护系统概述

在这里插入图片描述
达梦数据守护系统是保障数据库高可用性的核心组件,其架构主要由以下部分组成:

  • 主库/备库:承担读写和只读服务的数据节点
  • Redo 日志:记录数据库变更的核心日志
  • Redo 日志传输:主备库间的日志同步机制
  • Redo 日志重演:备库重做日志的应用过程
  • 守护进程 (dmwatcher):实例级别的监控和管理组件
  • 监视器 (dmmonitor):集群级别的监控和管理工具

监视器作为数据守护系统的重要组成部分,提供了集群监控、故障管理和状态确认等关键功能。

二、监视器核心功能解析

1. 监控数据守护系统

监视器实时接收守护进程发送的状态消息,完整展示主备库状态变化和故障切换过程中数据库模式、状态的转换过程。

2. 管理数据守护系统

用户可通过监视器命令启停守护进程监控功能,执行主备库切换、备库故障接管等操作。

3. 确认状态信息

在故障自动切换场景下,监视器提供状态确认机制,避免因网络故障导致的脑裂问题。

4. 发起故障自动接管

当主库发生故障时,监视器自动选择符合条件的备库并通知其执行接管操作。

三、监视器常用命令详解

3.1 集群状态查看:show 命令

启动监视器:

/opt/dmdbms/bin/dmmonitor /opt/dmdbms/bin/dmmonitor.ini

查看集群状态:

show

关键字段解析:

组全局信息
  • GROUP:守护进程组名
  • OGUID:守护进程组唯一标识
  • MON_CONFIRM:确认模式标识(TRUE/FALSE)
  • MODE:切换模式(AUTO/MANUAL)
  • MPP_FLAG:MPP 环境标识
库全局信息
  • DW_IP:守护进程内网IP
  • MAL_DW_PORT:守护进程监听端口
  • INST_IP:数据库对外服务IP
  • INST_PORT:数据库对外服务端口
守护进程信息
  • WTIME:守护进程本地时间
  • WTYPE:守护类型(LOCAL/GLOBAL)
  • WSTATUS:守护进程状态
  • INAME:实例名称
  • ISTATUS:数据库状态(Open/Mount等)
  • IMODE:数据库模式(Primary/Standby)
实例信息
  • INST_OK:实例状态(OK/ERROR)
  • FSEQ/FLSN:已写入日志的序列号/LSN
  • CSEQ/CLSN:当前系统序列号/LSN

监控要点:

  • 确认所有实例 INST_OK 状态为 OK
  • 确认所有数据库 ISTATUS 为 OPEN
  • 确认主备模式 IMODE 为 Primary/Standby

3.2 其他常用命令

1. list 命令

查看守护进程配置信息:

list

输出内容包括守护类型、运行模式、超时时间、实例启动命令等关键配置参数。
在这里插入图片描述

2. show global info 命令

查看所有实例组的信息:

show global info

在这里插入图片描述

3. tip 命令

查看集群当前运行状态概要:

tip

该命令提供集群健康状态的简要评估,特别会提示监视器是否为确认模式。
在这里插入图片描述

4. choose switchover 命令

查看可切换为主库的实例列表:

choose switchover GRP1

在这里插入图片描述

5. switchover 命令

执行主备切换操作:

switchover GRP1.GRP1_RT_01

该命令会触发完整的切换流程,包括:

  • 守护进程状态切换
  • 数据库模式变更
  • 归档状态调整
  • 数据库重新打开

四、实战经验分享

1. 日常监控要点

建议定期检查以下关键指标:

  • 主备库同步状态(RSTAT 应为 VALID)
  • 日志应用延迟(FSEQ/CSEQ 差值)
  • 网络连通性(INST_OK 状态)

2. 故障处理流程

  1. 使用 show 命令确认当前状态
  2. 通过 tip 命令获取系统提示
  3. 根据情况选择手动切换或故障接管
  4. 监控切换过程,确认所有实例恢复正常

3. 注意事项

  • 非确认模式的监视器无法执行自动故障接管
  • 切换前确保备库数据同步状态正常
  • 网络分区时谨慎操作,避免脑裂

五、总结

达梦数据守护集群监视器是维护数据库高可用性的关键工具。通过熟练掌握 show、list、tip 等监控命令,以及 choose switchover、switchover 等管理命令,数据库管理员可以有效保障集群的稳定运行,及时处理各类故障场景。

在实际运维中,建议结合监控告警系统,对关键指标进行持续监控,并建立完善的应急预案,确保在故障发生时能够快速响应和处理,最大限度保障业务的连续性和数据的安全性。

http://www.xdnf.cn/news/1466371.html

相关文章:

  • vsan高可用:确保可访问性、全部数据迁移,两种类型权衡
  • 软件启动时加配置文件 vs 不加配置文件
  • Go 1.25.1基本包
  • 凌力尔特(LINEAR)滤波器LTC1068的二阶滤波器模块设计
  • STM32 USBx Device HID standalone 移植示例 LAT1466
  • 全球企业内容管理ECM市场规模增长趋势与未来机遇解析
  • (4)什么时候引入Seata‘‘
  • 黄金上门回收小程序开发
  • 多路转接介绍及代码实现
  • Rust 基础语法
  • 设计模式笔记
  • 从技术选型到现场配置:DDC 楼宇自控系统全流程落地方案(2025 版)
  • 织信低代码:用更聪明的方式,把想法变成现实!
  • 多语言Qt Linguist
  • 职场礼仪实训室:健康管理专业人才培养的核心支柱与创新实践
  • Springboot实现国际化(MessageSource)
  • AI Compass前沿速览:Kimi K2、InfinityHuman-AI数字人、3D-AI桌面伴侣、叠叠社–AI虚拟陪伴
  • 查询语言的进化:SQL之后,为什么是GQL?数据世界正在改变
  • 生态 | 华院计算与深至科技达成战略合作,携手推动AI+医学影像算法升级迭代
  • 代码随想录70期day3
  • 算法(keep learning)
  • 外包干了3年,技术退步太明显了。。。。。
  • 计算机网络1 第一章 概述——以寄邮件比喻整个流程
  • threeJS 实现开花的效果
  • 概率论第三讲——多维随机变量及其分布
  • 要搞清楚你为什么上班
  • 大型语言模型SEO(LLM SEO)完全手册:驾驭搜索新范式
  • 深入剖析 ThreadLocal 及其生态系统:从基础用法到源码实现,从设计思想到工程实践
  • Android14 init启动Zygote详解
  • 必知!机器人的分类与应用:RPA、人形与工业机器人