当前位置: 首页 > ds >正文

Aladdin显卡多任务运行教程

Aladdin显卡多任务运行

  • 任务场景
  • 操作步骤
  • 其他说明

任务场景

当我运行我的代码后发现80G的显存仅占用了46G左右,还有很大空间没有被使用,于是想着能不能把剩下的空间也利用起来,于是有了接下来的工作。
在这里插入图片描述

操作步骤

当我们使用GPU run/debug/Task,我这里使用的GPU run,如果你的代码正常运行且需要一定的时间才会结束,那么将会有一个session,如下图:
在这里插入图片描述
右键这个session后,可以看见terminal选项,点击这个选项即可打开终端,该终端是与session对应的。
在这里插入图片描述
打开终端后,使用nvidia-smi,可以看见你这张卡的占用情况。
在这里插入图片描述
同时你的root目录中的项目文件都在此处。
在这里插入图片描述

于是,我们可以在这个终端运行别的训练任务,比如我这里开始了我的第二个训练任务,大致如下,此处注意如果你自己有conda环境,注意切换conda环境:
在这里插入图片描述
可以看见上述任务是成功跑起来了的,再次查看显存占用情况,可以发现显存即将拉满。
在这里插入图片描述
另外的,如果第二个任务显存爆满,与第一个任务加起来超过总显存了,也不会影响第一个主任务的运行。

其他说明

1.此处通过session右键打开的终端不够稳定,经常卡死,需要重新打开终端。
2.要注意第一个任务也就是你创建session的任务是主任务,如果主任务结束了,第二个任务会被立即释放,所以第二个任务最好是先于第一个任务完成。
3.这种在一个session中同时运行多个任务,可以节省算力。

http://www.xdnf.cn/news/272.html

相关文章:

  • TVM计算图分割--Collage
  • 红黑树insert笔记
  • 2025年03月中国电子学会青少年软件编程(Python)等级考试试卷(六级)真题
  • 使用Service发布应用程序
  • std::set (C++)
  • #手动控制windows更新时间(非常安全,可随时恢复)
  • C++ 网络层接口设计与实现:基于 Socket 编程
  • L2-018 多项式A除以B
  • SQL-exists和in核心区别​、 性能对比​、适用场景​
  • 2.1 数据处理
  • 【 解决Cline插件无法激活及DeepSeek模型请求卡顿或者无法加载问题】
  • CMake使用教程
  • IO流(二)
  • 从 Transformer 到文本生成 (From Transformer to Text Generation)
  • STM32---GPIO
  • Linux——进程通信
  • Spring MVC 初体验~~
  • 自定义 el-menu
  • 【jenkins】首次配置jenkins
  • 合成数据中的对抗样本生成与应用:让AI模型更强、更稳、更安全
  • 代码学习总结(五)
  • cmake 语法大纲
  • 研究生面试常见问题
  • 1.Linux基础指令
  • 卷积神经网络(CNN)与VGG16在图像识别中的实验设计与思路
  • docker镜像被覆盖了怎么办?通过sha256重新上传镜像
  • VueRouter笔记
  • 6. 实战(二):用Spring AI+OpenAI构建企业级智能客服
  • LeetCode19.删除链表的倒数第N个节点
  • OpenCV图像加密和解密