当前位置: 首页 > news >正文

Qwen3-8B Dify RAG环境搭建

一、环境配置
属性    值
CUDA Driver Version    555.42.02
CUDA Version    12.5
OS    Ubuntu 20.04.6 LTS
Docker version    24.0.5, build 24.0.5-0ubuntu1~20.04.1
GPU    NVIDIA GeForce RTX 3090 24GB显存
二、操作步骤
1、创建容器
docker run --runtime nvidia --gpus all -ti \
-v $PWD:/home -w /home \
-p 8000:8000 --ipc=host nvcr.io/nvidia/pytorch:24.03-py3 bash
AI写代码

2、下载Qwen3-8B和embedding模型
cd /home
pip install modelscope
modelscope download --model Qwen/Qwen3-8B  --local_dir Qwen3-8B
modelscope download --model maidalun/bce-embedding-base_v1 --local_dir bce-embedding-base_v1
AI写代码

3、安装transformers
cd /home
git clone https://github.com/huggingface/transformers.git
cd transformers
git checkout v4.51.0
pip install tokenizers==0.21
python3 setup.py install
AI写代码

4、安装vllm
pip install vllm
pip install flashinfer-python==v0.2.2
python3 -m pip install --upgrade 'optree>=0.13.0'
pip install bitsandbytes>=0.45.3 -i https://pypi.tuna.tsinghua.edu.cn/simple


5、安装flash-attention
git clone https://github.com/Dao-AILab/flash-attention.git
cd flash-attention/
git checkout fd2fc9d85c8e54e5c20436465bca709bc1a6c5a1
python setup.py build_ext
python setup.py bdist_wheel
pip install dist/flash_attn-*.whl
————————————————
版权声明:本文为CSDN博主「Hi20240217」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/m0_61864577/article/details/147704158

http://www.xdnf.cn/news/1135567.html

相关文章:

  • 2D视觉系统标定流程与关键要求
  • 高光谱相机(Hyperspectral Camera)
  • 【后端】Linux系统发布.NetCore项目
  • 尺寸标注识别3 实例分割 roboflow
  • NumPy, SciPy 之间的区别
  • 大语言模型任务分解与汇总:从认知瓶颈到系统化解决方案
  • AutoMQ 与 Lightstreamer 达成战略合作:NASA也在用的 Kafka 数据实时分享新架构
  • 【C# in .NET】16. 探秘类成员-索引器:通过索引访问对象
  • 使用Pytorch进行数字手写体识别
  • OpenCV中常用特征提取算法(SURF、ORB、SIFT和AKAZE)用法示例(C++和Python)
  • 手撕Spring底层系列之:后置处理器“PostProcessor”
  • 学习OpenCV---显示图片
  • 代码随想录算法训练营十八天|二叉树part08
  • 算法竞赛备赛——【图论】求最短路径——Floyd算法
  • 深度学习之反向传播
  • Electron实现“仅首次运行时创建SQLite数据库”
  • 数据集相关类代码回顾理解 | utils.make_grid\list comprehension\np.transpose
  • HDFS基本操作训练(创建、上传、下载、删除)
  • 【LeetCode刷题指南特别篇】--移除链表元素,调试技巧,链表分割
  • Python第八章作业(初级)
  • HTML 入门教程:从零开始学习网页开发基础
  • ES组合使用must与should时的注意事项
  • 深入理解-Java-线程池:原理、动态调整与监控实践
  • Web3.0与元宇宙:重构数字文明的技术范式与社会变革
  • 李宏毅2025《机器学习》第七讲-推理模型:从原理、流派到未来挑战
  • GESP2025年6月认证C++四级( 第三部分编程题(2)排序)
  • C#.NET BackgroundService 详解
  • 一个项目的完整一生 --- 一 窗口大小设置
  • watermark的作用
  • 使用YOLOv11实现水果类别检测:从数据到模型训练的全过程