当前位置: 首页 > ds >正文

安装deepspeed时出现了以下的错误,如何解决CUDA_HOME does not exist

踩坑系列恢复更新

安装deepspeed时,主服务器装机时没有装cuda的编译器等一系列工具,导致pip时无法编译deepspeed包以及一系列依赖

具体错误:

$pip3 install deepspeed -i "http://yum.tbsite.net/pypi/simple/" --trusted-host "yum.tbsite.net" Looking in indexes: http://yum.tbsite.net/pypi/simple/ Collecting deepspeed Downloading http://yum.tbsite.net/pypi/packages/06/b3/a3903de5c5b707170c5c27e1a40f4ef613f14d241bd84d8b151a2a8786f6/deepspeed-0.16.7.tar.gz (1.5 MB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 1.5/1.5 MB 14.6 MB/s eta 0:00:00 Preparing metadata (setup.py) ... error error: subprocess-exited-with-error × python setup.py egg_info did not run successfully. │ exit code: 1 ╰─> [8 lines of output] Traceback (most recent call last): File "<string>", line 2, in <module> File "<pip-setuptools-caller>", line 35, in <module> File "/tmp/pip-install-bqu9rp8j/deepspeed_a2abcc73fa3f4d49b5d3a3d2862d6342/setup.py", line 110, in <module> cuda_major_ver, cuda_minor_ver = installed_cuda_version() File "/tmp/pip-install-bqu9rp8j/deepspeed_a2abcc73fa3f4d49b5d3a3d2862d6342/op_builder/builder.py", line 51, in installed_cuda_version raise MissingCUDAException("CUDA_HOME does not exist, unable to compile CUDA op(s)") op_builder.builder.MissingCUDAException: CUDA_HOME does not exist, unable to compile CUDA op(s) [end of output] note: This error originates from a subprocess, and is likely not a problem with pip. error: metadata-generation-failed × Encountered error while generating package metadata. ╰─> See above for output. note: This is an issue with the package mentioned above, not pip. hint: See above for details. (geocoding)

分析问题:

无nvcc这个cuda的编译工具,如何在不动root的全局环境下解决:

很简单,nvidia-smi查看cuda版本号,使用conda install安装一个cuda-toolkit即可解决

之后,可以正常pip deepspeed

http://www.xdnf.cn/news/3182.html

相关文章:

  • vue3+flex动态的绘制蛇形时间轴
  • 远程桌面导致Quartus 破解失效
  • Silvaco仿真中的victory mesh
  • 【MySQL数据库】--1.安装教程
  • HHsuite同源序列搜索数据库构建
  • 如何在Windows中更改文档默认打开方式
  • 【保姆级教程-Centos7环境下部署Prometheus并设置开机自启】
  • 【Yolo精读+实践+魔改系列】Yolov2论文超详细精讲(翻译+笔记)
  • temu,shein采购测评避坑指南:如何避免砍单封号,实现长效运营?
  • Harbor默认Redis与Notary组件弱口令漏洞分析与修复指南
  • ​【空间数据分析】缓冲区分析--泰森多边形(Voronoi Diagram)-arcgis操作
  • labview项目文件架构
  • WSL2下Docker desktop的Cadvisor容器监控
  • Spring Security 的 CSRF 防护机制
  • 时态--09--动词过去式、过去分词
  • 搜索——哈希优化策略
  • MTK Genio500 移植GMS及youtube问题处理的解决办法
  • docker拉取国内镜像
  • Javascript 中的继承?如何实现继承?
  • 解密Cloak斗篷技术:FP独立站推广利器
  • [论文阅读]Adversarial Semantic Collisions
  • 为什么要学习《易经》?
  • 大模型核心技术及架构解析
  • Android Q允许低内存启用系统弹窗
  • 蓝桥杯算法开发企业级实战指导:从0到1的C/C++全攻略
  • kubelet 清理资源以缓解磁盘压力
  • 考OCM证书前需要有OCP证书
  • 再谈cookie和session(结合表白墙具体案例)
  • 第一讲 | 算法复杂度
  • Jmeter接口自动化测试读取用例