当前位置: 首页 > web >正文

服务器查看 GPU 占用情况的方法

在 Linux 系统中查看 GPU 占用情况,主要取决于你的 GPU 类型(NVIDIA/AMD),以下是常用方法:

一、NVIDIA GPU(最常用,如 RTX 系列、Tesla 系列)

使用 NVIDIA 官方工具 nvidia-smi(需安装 NVIDIA 驱动):

1. 基本查看

直接在终端运行:

nvidia-smi

输出内容包含:

  • GPU 编号、名称、驱动版本
  • 显存使用情况(Total/Used/Free)
  • GPU 利用率(GPU-Util)
  • 温度(Temperature)
  • 占用 GPU 的进程(PID、进程名、显存占用)
2. 实时监控(每秒刷新)
watch -n 1 nvidia-smi  # 1秒刷新一次,按Ctrl+C退出
3. 更简洁的输出
nvidia-smi --query-gpu=name,memory.total,memory.used,memory.free,temperature.gpu,utilization.gpu --format=csv

自定义需要的参数(更多参数可通过 nvidia-smi --help-query-gpu 查看)。

二、AMD GPU

使用 ROCm 工具链中的 rocm-smi(需安装 ROCm 驱动):

1. 基本查看
rocm-smi

输出包含 GPU 型号、温度、显存使用、利用率等信息。

2. 实时监控
watch -n 1 rocm-smi

三、通用工具(支持多品牌)

1. gpustat(更友好的命令行工具)
  • 安装:pip install gpustat(需要 Python 环境)
  • 使用:
gpustat  # 简洁显示GPU状态gpustat -i  # 显示进程详情(如PID和进程名)watch -n 1 gpustat  # 实时监控
2. glances(系统监控工具,支持 GPU)
  • 安装:sudo apt install glances(Ubuntu/Debian)
  • 使用:运行 glances,在界面中找到 GPU 相关指标(需系统支持)。

四、注意事项

  1. nvidia-smi 提示命令不存在,说明未安装 NVIDIA 驱动,需先安装对应版本的驱动。
  2. 对于服务器级 GPU(如 Tesla),输出内容可能包含更多功耗、性能状态等信息。
  3. 若需查看特定进程占用的 GPU 资源,可结合 ps 命令进一步分析,例如:
ps -p \<PID> -o %cpu,%mem,cmd  # 查看某个PID的CPU/内存占用

根据你的 GPU 类型选择对应工具即可快速掌握 GPU 的占用情况。

http://www.xdnf.cn/news/17870.html

相关文章:

  • 室外 3DVG 基准
  • C# 多线程:并发编程的原理与实践
  • 对线面试官之幂等和去重
  • Python图像处理基础(十三)
  • Ubuntu 20.04 虚拟机安装完整教程:从 VMware 到 VMware Tools
  • 【前端八股文面试题】【JavaScript篇8】作用域链介绍?
  • VMD+皮尔逊+降噪+重构(送报告+PPT)Matlab程序
  • 自动曝光算法参考
  • Datawhale AI夏令营 「2025全球AI攻防挑战赛-赛道一:图片全要素交互认证-生成赛」的赛事项目实践
  • python自学笔记7 可视化初步
  • 使用 Simple Floating Menu 插件轻松实现浮动联系表单
  • GPU 选型指南(一):AI 训练巅峰之选 H100、H200与MI300X/MI325X深度对比
  • 【C++ STL】list详解和模拟
  • 如何用外部电脑访问本地网页?
  • 蒙以CourseMaker里面的录屏功能真的是完全免费的吗?
  • RC4算法实现
  • C# xml UI格式化字符串
  • RxJava 在 Android 中的深入解析:使用、原理与最佳实践
  • 一个接口多个实现类,如何动态调用
  • 【SpringBoot】统一功能处理
  • PCIe Base Specification解析(十)
  • GNN: 配送路径最短 GNN 类型方案对比
  • 内容索引之word转md工具 - markitdown
  • Java Record 类 — 简化不可变对象的写法
  • JavaWeb(05)
  • transforms的使用 小土堆pytorch记录
  • 15-docker的企业级私有仓库之docker-harbor
  • 三极管的基极为什么需要下拉电阻
  • docker network 与host的区别
  • GO学习记录四——读取excel完成数据库建表