当前位置: 首页 > news >正文

配置 NVIDIA RTX 5090 + sm_120 + flashattention,已跑通一个大模型 ~~

我的配置:
系统版本 ubuntu 22.04
显卡驱动版本 CUDA Version: 13.0
cudatoolkit: 12.9
pytorch:2.9.0.dev20250815+cu129

1. 显卡驱动安装:CUDA驱动+CUDA Toolkit

强烈建议全程参照这个教程安装:50系显卡在Ubuntu22.04环境下安装nvidia驱动+CUDA+cuDNN,anaconda下配置pytorch环境一站式解决方案(2025年7月版本)已完结!!!

几个注意事项:

1.1 CUDA驱动相关

1. nvidia显卡驱动安装有多种途径:

比如可以使用ubuntu 系统自带的“软件和更新”程序-附加驱动更新进行驱动安装,或使用apt命令指定版本安装;

2. 注意禁用系统自带驱动,防止与新驱动发生冲突

查看 nouveau是否禁用成功,终端输入:

  lsmod | grep nouveau

如果没有返回值,则说明禁用成功。 否则参考教程完成禁用系统自带驱动。

3. 验证驱动是否已经成功安装,

终端输入:

nvidia-smi

如果成功安装会出现以下界面,50系显卡目前支持CUDA最低版本为12.8,且为了适配RTX5090的sm_120算力,本文安装版本选择 CUDA驱动≥12.9。在这里插入图片描述

1.2. CUDA Toolkit相关

1. CUDA Toolkit 版本12.9,不然运行大模型时,flashattention报错

网址: CUDA Toolkit 12.9 Downloads

两步:CUDA Toolkit Installer 和 Driver Installer 两部分都要装哦~
在这里插入图片描述

2. 记得配置环境变量,否则nvcc -V还是显示没有nvcc指令,

打开bashrc文件:

sudo gedit ~/.bashrc

在末尾添加如下语句:

export PATH="/usr/local/cuda-12.9/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-12.9/lib64:$LD_LIBRARY_PATH"

添加后退出并保存,更新环境变量:

source ~/.bashrc

关于上面的一个知识点:众所周知,打开新的终端才会自动配置~/.bashrc中的环境变量,所以,为了使修改后的~/.bashrc生效,要么重新打开一个终端使~/.bashrc自动生效,要么在当前终端source 一下~/.bashrcsource ~/.bashrc是后者。
输入nvcc -V验证
在这里插入图片描述
至此CUDA安装完成。

1.3. 安装成功验证

```bash
(base) xj@xj:~$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Wed_Apr__9_19:24:57_PDT_2025
Cuda compilation tools, release 12.9, V12.9.41
Build cuda_12.9.r12.9/compiler.35813241_0
(base) xj@xj:~$ nvidia-smi
Sun Aug 17 13:55:18 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.65.06              Driver Version: 580.65.06      CUDA Version: 13.0     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 5090        On  |   00000000:01:00.0  On |                  N/A |
| 53%   71C    P1            536W /  600W |   20005MiB /  32607MiB |     94%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
```

2. Pytorch环境配置(重点!!)

这一部分我会基于anaconda进行环境配置,anaconda安装教程较多,且不会踩坑,请自行找教程安装。

2.1. 背景

这一部分要重点注意就是官方wheel(比如pip install https://github.com/Dao-AILab/flash-attention/releases/download/v2.5.8/flash_attn-2.5.8+cu122torch2.3cxx11abiFALSE-cp310-cp310-linux_x86_64.whl这种pip一键安装方式)安装pytorch后报错:

(vlm) xj@xj:~$ python 
Python 3.10.14 (main, May 6 2
http://www.xdnf.cn/news/1318969.html

相关文章:

  • C语言(12)——进阶函数
  • Day3--滑动窗口与双指针--2461. 长度为 K 子数组中的最大和,1423. 可获得的最大点数,1052. 爱生气的书店老板
  • 数字货币的法律属性与监管完善路径探析
  • 实变函数中集合E的边界与其补集的边界是否相等
  • Android中使用Compose实现各种样式Dialog
  • Dify 从入门到精通(第 40/100 篇):Dify 的企业级权限管理
  • Mutually aided uncertainty
  • Windchill 11.0使用枚举类型自定义实用程序实现生命周期状态管理
  • Makefile介绍(Makefile教程)(C/C++编译构建、自动化构建工具)
  • 计算机网络 TCP、UDP 区别
  • 从需求到部署全套方案:餐饮服务许可证数据可视化分析系统的大数据技术实战
  • Bee1.17.25更新Bug,完善功能.不支持NOSQL,分库分表Sharding(2.X版有)
  • C语言网络编程TCP通信实战:客户端↔服务器双向键盘互动全流程解析
  • 模拟实现 useEffect 功能
  • 【R语言】R 语言中打印含有双引号的字符串时会出现 “\” 的原因解析
  • 基于STM32单片机智能RFID刷卡汽车位锁桩设计
  • 基于51单片机汽车自动照明灯超声波光敏远近光灯设计
  • 自由学习记录(85)
  • TensorRT-LLM.V1.1.0rc0:在无 GitHub 访问权限的服务器上编译 TensorRT-LLM 的完整实践
  • 计算机网络 TCP time_wait 状态 详解
  • Java开发MCP服务器
  • thingsboard 服务器在2核CPU、2G内存资源配置下如何调优提速,适合开发/演示
  • vue封装请求拦截器 响应拦截器
  • 计算机网络 Session 劫持 原理和防御措施
  • 给纯小白的Python操作 PDF 笔记
  • 【算法】模拟专题
  • nertctl使用了解
  • B站 韩顺平 笔记 (Day 21)
  • Windows平台Frida逆向分析环境完整搭建指南
  • 机器学习05-朴素贝叶斯算法