当前位置: 首页 > news >正文

windows安装flash-attn记录

1. 确保torch的cuda环境与本地cuda大版本一致

检查命令

nvcc -V
nvidia-smi

import torch
print(torch.version.cuda) # 11.8
print(torch.cuda.is_available()) # True

2.官网提供flash-attn需要本地编译才可以通过,且是linux版本,会遇到报错

https://github.com/Dao-AILab/flash-attention/releases

exmy_base.h(404): error: type name is not allowedstatic_assert(cutlass::platform::is_unsigned_v<Storage>, "Use an unsigned integer for StorageType");

3.最好直接下载符合本机的torch/python/cuda版本的windows版本

,附上链接
https://github.com/bdashore3/flash-attention/releases
直接安装对于的whl安装包,一键安装,解决了我困惑很久的问题,很有用。

4.附一张安装成功的截图


在这里插入图片描述
希望对大家有用!

http://www.xdnf.cn/news/1463743.html

相关文章:

  • 在 Java Web 项目中优雅地实现验证码拦截与校验
  • 新闻丨重庆两江新区党工委副书记、管委会主任许宏球一行莅临华院计算考察指导
  • Java 内存模型与垃圾回收机制详解
  • 迅为RK3568开发板OpenHarmonyv3.2-Beta4版本测试-命令终端
  • AI在目前会议直播系统中应用
  • CSS 选择器的优先级/层叠性
  • watchEffect 与 watch的区别
  • 双轴倾角传感器厂家与物联网角度传感器应用全解析
  • MySQL】从零开始了解数据库开发 --- 表的操作
  • 盘点完今年CoRL最火的VLA论文,发现最强的机器人,竟是用“假数据”喂大的
  • 前端视觉交互设计全解析:从悬停高亮到多维交互体系(含代码 + 图表)
  • “我店”模式:热潮中的商机还是泡沫陷阱?深度解析当前入局可行性
  • 阿里云vs腾讯云按量付费服务器
  • 腾讯云大模型训练平台
  • BigDecimal的使用
  • 【AndroidStudio】官网下载免安装版,AndroidStudio压缩版的配置和使用
  • 华为网路设备学习-32(BGP协议 七)路由反射器与联邦
  • 中小企业数字化转型卡在哪?选对AI工具+用好企业微信,人力成本直降70%
  • SQLalachemy 错误 - Lost connection to MySQL server during query
  • 功能强大的多线程端口扫描工具,支持批量 IP 扫描、多种端口格式输入、扫描结果美化导出,适用于网络安全检测与端口监控场景
  • 基于SpringBoot的旅游管理系统的设计与实现(代码+数据库+LW)
  • 零基础直奔HCIE?先打好基础,后续才更轻松!
  • Redis 深度解析:数据结构、持久化与集群
  • 【Linux手册】动静态库:从原理到制作
  • mcp_clickhouse代码学习
  • 大彩串口屏-烧录与调试
  • 解决微信小程序开发初始化npm install包失败
  • uniapp阿里云验证码使用
  • Java观察者模式
  • 【Linux游记】基础指令篇