当前位置: 首页 > news >正文

GPU状态监控

GPU 状态监控
对比:

GPU项目名称项目名称
单机多 GPUGPU状态监控以时间为横轴展示GPU被占用的动态过程,但不显示具体时间
单机多 GPUGPU 实时监控服务多卡GPU统一展示,数据简洁清晰
多机多 GPU服务器集群监控面板可以同时监控多个服务器上的GPU

一、GPU状态监控 gpu-monitor

1、代码地址:https://github.com/haowang02/gpu-monitor?tab=readme-ov-file
2、快速搭建:

步骤操作
克隆仓库git clone https://github.com/haowang02/gpu-monitor.git
创建虚拟环境并安装依赖cd gpu-monitor
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
启动服务gunicorn gm:app
浏览器访问http://localhost:8888/index.html

3、浏览器监控页面

  • 状态监控可看见:显存占用、显卡占用、显卡温度、显卡功耗
    ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/2c51c31cb4fd426a9459d3f4bda66299.png
    在这里插入图片描述
  • 进程监控,可以看见进程详细信息
    在这里插入图片描述

二、GPU 实时监控服务

1、代码地址:https://github.com/hczs/gpu-monitor?tab=readme-ov-file
2、快速搭建:

步骤操作
克隆仓库或下载代码git clone https://github.com/hczs/gpu-monitor?tab=readme-ov-file
创建并激活虚拟环境python -m venv venv
source venv/bin/activate
cd gpu-monitor/api
安装依赖pip install -r requirements.txt
运行服务器sh start.sh
浏览器监控页面http://localhost:9999

3、浏览器页面展示
在这里插入图片描述

三、服务器集群监控面板server-monitor-panel

1、代码地址:https://github.com/zibingo/server-monitor-panel/tree/main
2、快速搭建:

步骤操作
克隆仓库或下载代码git clone https://github.com/zibingo/server-monitor-panel.git
创建并激活虚拟环境python -m venv venv
source venv/bin/activate
安装依赖pip install -r requirements.txt
运行服务器python app.py
浏览器监控页面http://localhost:60000

4、部署多服务器监控
修改app.py中的node_list添加服务器信息,并运行:

node_list =  [{'id': 1, 'name': '服务器A', 'ip': '192.168.1.100', 'port': 60000},# 添加更多服务器...]

5、浏览器页面展示
在这里插入图片描述

http://www.xdnf.cn/news/537211.html

相关文章:

  • MPCount: 人群计数的单域泛化
  • 【成品设计】基于 STM32 的智能鞋柜系统
  • TransmittableThreadLocal实现上下文传递-笔记
  • 「HHT(希尔伯特黄变换)——ECG信号处理-第十三课」2025年5月19日
  • 院校机试刷题第七天:1828西交-矩阵相加、1822计算圆周率、1823学生成绩排序
  • 基于PetaLinux的Zynq PS应用自启动全攻略
  • 开发指南116-font-size: 0的使用
  • 深入解析 Oracle session_cached_cursors 参数及性能对比实验
  • python动漫论坛管理系统
  • ubuntu open shh9.9安装
  • W3电力线载波通信技术
  • 物流项目第一期(登录业务)
  • 40亿非负整数中找到出现两次的数和所有数的中位数
  • 技术决策缺乏团队参与,如何增强执行力?
  • 修改样式还能影响功能?是的!
  • 掌握Python编程:从C++/C#/Java开发者到AI与医学影像开发专家
  • C#编写软件添加菜单栏
  • 2 sys库
  • 陀螺匠部门默认角色怎么用
  • Java日志记录教程:log4j 1.2.11配置与使用详解(附示例代码)
  • 基于poetry管理python项目学术版gurobipy WSL安装方式
  • Linux架构篇、第五章_06Jenkins 触发器全面解析与实战指南
  • 智能门锁为什么需要做EN 18031欧盟检测认证
  • 成功案例|单细胞与空间转录组学:解锁前列腺癌微环境密码
  • 没有公网ip怎么端口映射外网访问?使用内网穿透可以解决
  • 实验-使用递归计算阶乘-RISC-V(计算机组成原理)
  • 异步委托执行管理器:更新
  • 机器学习教程简介:从基础概念到实践应用的全面指南
  • Windows逆向工程提升之二进制分析工具:HEX查看与对比技术
  • 高性能锁机制 CAS:Java 并发编程中的深度剖析