当前位置: 首页 > java >正文

Ceph集群OSD运维手册:基础操作与节点扩缩容实战

#作者:stackofumbrella

文章目录

  • 一、Ceph集群的OSD基础操作
      • 查看osd的ID编号
      • 查看OSD的详细信息
      • 查看OSD的状态信息
      • 查看OSD的统计信息
      • 查看OSD在主机上的存储信息
      • 查看OSD延迟的统计信息
      • 查看各个OSD使用率
      • 集群暂停接收数据
      • 集群取消暂停
    • OSD写入权重操作
      • 查看默认OSD操作权重值
      • 修改OSD数据操作权重值
    • OSD上下线
      • 临时关闭OSD会自动被拉起
      • 永久关闭
      • 驱逐OSD设备
      • 将驱逐的OSD设备加入到集群
  • 二、Ceph集群的OSD节点缩容
    • OSD缩容实战案例
      • 查看集群OSD状态
      • 停止需要下线节点的所有OSD守护进程
      • 清理OSD数据和配置
      • 移除所有OSD后从CRUSH map中删除主机
      • 自动驱逐被下线节点的服务组件
      • OSD设备无法清除,只能通过手动删除
      • 删除节点
      • 解除ceph对磁盘的占用(在OSD节点上执行)
    • OSD扩容实战案例
      • 将上面剔除的节点添加到集群
      • 擦除磁盘的原有数据
      • 出现此报错需要到ceph03节点上执行擦除命令
      • 在管理节点上再次擦除磁盘
      • 查看设备
      • 添加OSD到集群

一、Ceph集群的OSD基础操作

查看osd的ID编号

$ sudo ceph osd ls
在这里插入图片描述

查看OSD的详细信息

$ sudo ceph osd dump
在这里插入图片描述

查看OSD的状态信息

$ sudo ceph osd status
在这里插入图片描述

查看OSD的统计信息

$ sudo ceph osd stat
在这里插入图片描述

查看OSD在主机上的存储信息

$ sudo ceph osd stat
在这里插入图片描述

查看OSD延迟的统计信息

$ sudo ceph osd perf
在这里插入图片描述

查看各个OSD使用率

$ sudo ceph osd df
在这里插入图片描述

集群暂停接收数据

$ sudo ceph osd pause
在这里插入图片描述

集群取消暂停

$ sudo ceph osd unpause
在这里插入图片描述

OSD写入权重操作

查看默认OSD操作权重值

$ sudo ceph osd crush tree
在这里插入图片描述

修改OSD数据操作权重值

$ sudo ceph osd crush reweight osd.2 0
在这里插入图片描述

OSD上下线

由于OSD有专门的管理服务器ceph-osd控制,一旦发现被下线会尝试启动它。
如果真的想要永久关闭,则需要关闭对应的ceph-osd进程即可。

临时关闭OSD会自动被拉起

$ sudo ceph osd down 2;sudo ceph osd tree
在这里插入图片描述

然后会自动重启
在这里插入图片描述

永久关闭

$ sudo ceph orch daemon stop osd.2;sudo ceph osd tree
在这里插入图片描述

驱逐OSD设备

驱逐关掉的osd.2,驱逐的本质是对ceph集群数据操作的权重值REWEIGHT重新调整
$ sudo ceph osd out 2
$ sudo ceph osd tree
在这里插入图片描述

将驱逐的OSD设备加入到集群

$ sudo ceph osd in 2
在这里插入图片描述

$ sudo ceph orch daemon start osd.2;sudo ceph osd tree

在这里插入图片描述

二、Ceph集群的OSD节点缩容

OSD缩容实战案例

查看集群OSD状态

$ sudo ceph osd tree
在这里插入图片描述

停止需要下线节点的所有OSD守护进程

$ sudo ceph orch daemon stop osd.2
$ sudo ceph osd tree
在这里插入图片描述

清理OSD数据和配置

$ sudo ceph osd purge 2 --force
$ sudo ceph osd tree
在这里插入图片描述

移除所有OSD后从CRUSH map中删除主机

$ sudo ceph osd crush rm ceph03
$ sudo ceph osd tree
在这里插入图片描述

自动驱逐被下线节点的服务组件

$ sudo ceph orch host drain ceph03
在这里插入图片描述

OSD设备无法清除,只能通过手动删除

$ sudo ceph orch daemon rm osd.2 --force
$ sudo ceph orch host drain ceph03

在这里插入图片描述

删除节点

$ sudo ceph orch host rm ceph03

$ sudo ceph orch host ls
在这里插入图片描述

解除ceph对磁盘的占用(在OSD节点上执行)

$ lsblk
$ sudo dmsetup remove ceph–e16939c6–b24f–4e87–b6bd–ca4ddd1dffee-osd–block–b995ab08–d360–4a51–b750–fb193edcba4e
在这里插入图片描述

$ lsblk
在这里插入图片描述

OSD扩容实战案例

将上面剔除的节点添加到集群

$ sudo ceph orch host add ceph03

擦除磁盘的原有数据

$ sudo ceph orch device zap --force ceph03 /dev/vdb
在这里插入图片描述

出现此报错需要到ceph03节点上执行擦除命令

$ sudo wipefs -af /dev/vdb
在这里插入图片描述

在管理节点上再次擦除磁盘

$ sudo ceph orch device zap --force ceph03 /dev/vdb

在这里插入图片描述

查看设备

$ sudo ceph orch device ls
在这里插入图片描述

添加OSD到集群

$ sudo ceph orch daemon add osd ceph03:/dev/vdb
$ sudo ceph osd tree

在这里插入图片描述

http://www.xdnf.cn/news/4531.html

相关文章:

  • MSTP 实验拓扑配置(ENSP)
  • 自动化创业机器人:现状、挑战与Y Combinator的启示
  • hadoop中的序列化和反序列化(3)
  • React学习路线-Deepseek版
  • 搭建spark伪分布集群
  • windows10 环境下通过huggingface_hub下载huggingface社区模型
  • 子集树算法文档
  • 驱动开发硬核特训 · 专题篇:Vivante GPU 与 DRM 图形显示体系全解析(i.MX8MP 平台实战)
  • 机器学习在信用卡欺诈检测中的应用思考
  • 4.9/Q1,GBD数据库最新文章解读
  • Admyral - 可扩展的GRC工程自动化平台
  • 【MCP】function call与mcp若干问题整理
  • 汽车加气站操作工考试知识点总结
  • 云渲染农场:让复杂渲染变得简单高效
  • OpenCV计算机视觉实战(3)——计算机图像处理基础
  • OpenCV 中用于背景分割的一个类cv::bgsegm::BackgroundSubtractorGMG
  • DeepSeek智能时空数据分析(八):NL2SQL绘制河流-轨迹缓冲区如何生成
  • 如何在自己的服务器上部署静态网页并通过IP地址进行访问
  • 使用 Celery + Redis + Eventlet 实现 Python 异步编程(Windows 环境)
  • STM32--TIM--函数
  • 卢dns免费二级域名分发
  • 【Python os模块完全指南】从基础到高效文件操作
  • 智算中心基础设施0-1建设全流程及投产后的运维
  • 物业设备管理的“多系统协同”模式:ERP、IoT与工单系统如何联动?
  • 202505扫描主机:升级Tomcat解决Tomcat 安全漏洞(CVE-2025-24813)【为了同一个tomcat版本安装多个服务】
  • 什么是Blender?怎么获取下载Blender格式文件模型
  • Pinecone向量库 VS Redis
  • DeepSeek的100个应用场景
  • 什么是TCC?什么是二阶段提交?三阶段提交?
  • 格雷狼优化算法`GWO 通过模拟和优化一个信号处理问题来最大化特定频率下的功率