当前位置: 首页 > backend >正文

nputop:昇腾 NPU 交互式监控工具

nputop:昇腾 NPU 交互式监控工具

nputop 是一个专为监控和管理运行在华为昇腾(Ascend)NPU 上的进程而设计的交互式命令行工具。受到 NVIDIA 生态中流行的 nvitop 项目的启发,nputop 为昇腾 NPU 平台带来了类似的可视化交互体验,让开发者可以直观地查看设备利用率、显存使用、温度和功耗等实时指标。相比仅靠命令行的 npu-smi 等工具,nputop 将多条指标整合在终端界面中,让我们无需记忆多条命令就能全方位掌握 NPU 状态。

nvitop昇腾版,欢迎前往项目主页(GitHub – youyve/nputop)了解更多细节,并点击 ⭐ Star 支持这个开源项目,共同推动昇腾 NPU 生态的发展!🚀

运行效果

nputop0514_2.png

w_nputop3.png

主要功能

  • 实时监控:跟踪 NPU 使用率、显存占用、温度和功耗等关键指标。
  • 交互式界面:支持键盘和鼠标操作,可方便地切换视图、排序和筛选进程。
  • 进程管理:直接查看并操作运行中的 NPU 进程(例如选中进程并结束任务)。
  • 多 NPU 支持:同时监控和管理多块昇腾 NPU 的状态。
  • 轻量命令行工具:安装配置简单,可无缝集成到开发或运维流程中。

此外,昇腾官方的 npu-smi 工具也可以查询 NPU 的各种监控数据,例如功耗(Pwr)、温度(Temp)、AI 核利用率、AI CPU 利用率、控制 CPU 利用率、内存占用率、内存带宽等。nputop 通过终端图形化界面整合了这些数据,让我们不必多次输入命令就能一览所有信息,使用体验更加友好。

安装与使用

在使用 nputop 之前,请确保已安装 Python(需 ≥3.10)以及华为昇腾 NPU 的驱动和运行时环境 (CANN)。安装命令非常简单:只需在终端执行以下命令即可安装最新版本的 nputop:

pip install ascend-nputop

安装完成后,直接在终端输入 nputop 即可启动监控界面。若系统中有多块 NPU,可通过设置环境变量 ASCEND_RT_VISIBLE_DEVICES 来限制可见设备,例如:

export ASCEND_RT_VISIBLE_DEVICES=0,1
nputop

快捷操作

nputop 的监控界面中,可以使用以下快捷键来快速操作:

  • ←/→/TAB:选择不同的进程
  • S:对当前列进行排序
  • C:切换紧凑显示模式(Compact Mode)
  • K:选中进程并按 K 键结束该进程
  • R:手动刷新当前数据
  • QCtrl+C:退出 nputop

适用对象

  • 昇腾 NPU 开发者:开发和调试 AI 模型时,实时监控 NPU 运行状态,助力性能调优。
  • AI 研究人员:在科研场景下快速了解算力利用率,优化深度学习训练过程。
  • 高校师生学习:在学习和实验中,直观掌握昇腾 NPU 的工作情况。
  • AI 服务器运维:运维工程师监控机房中昇腾 NPU 状态,及时发现并解决问题。

总之,只要你的项目中使用了昇腾 NPU,nputop 都能提供很好的可视化监控支持,让你像使用 nvitop 一样便捷地管理 Ascend 设备。🔥

立即行动! 如果你觉得 nputop 有用,欢迎前往项目主页(GitHub – youyve/nputop)了解更多细节,并点击 ⭐ Star 支持这个开源项目,共同推动昇腾 NPU 生态的发展!🚀

http://www.xdnf.cn/news/6187.html

相关文章:

  • 基于 NanoDet 的工厂巡检机器人目标识别系统研究与实现​
  • Fluent Bit持久化配置:保障数据可靠传输的关键
  • MVCC:数据库并发控制的利器
  • 【计算机哲学故事1-5】版本更新:拒绝停滞,成长是最好的修复
  • 部署GraphRAG配置Neo4j实现知识图谱可视化【踩坑经历】
  • 【SSL证书系列】https双向认证中客户端认证的原理
  • 边缘计算网关工业物联网应用:空压机远程运维监控管理
  • 自动化 NuGet 包打包与上传:完整批处理脚本详解(含 SVN 支持)
  • MySQL基础原理
  • python之Pandas合并数据终极指南:pd.concat参数详解
  • IDEA 新建 SpringBoot 项目时,没有高版本 SpringBoot 可选
  • Android逆向学习(十) IDA逆向编辑Android so文件
  • 为什么要选择七彩喜数字康养平台?加盟后有何优势?
  • 计算机网络:手机和基站之间的通信原理是什么?
  • 高德地图在Vue3中的使用方法
  • ACM算法
  • ubuntu清除缓存
  • rhel8.1 无法安装应用(提示需要注册系统)
  • 【Ansys 2023 R2 Icepak】 风扇位置优化
  • 作业帮Android面试题及参考答案
  • 第5章 运算符、表达式和语句
  • 下载的旧版的jenkins,为什么没有旧版的插件
  • 【面试 · 四】vue2、vue3、react区别
  • 高防ip支持哪些网络协议
  • 【 Java开发枚举值规范】
  • 打卡DAY25
  • whonix系统详解
  • select、poll、epoll
  • GPUGeek携手ComfyUI :低成本文生图的高效解决方案
  • linux下conda环境的完全导出与导入,主要讲离线模式