当前位置: 首页 > backend >正文

LLaMA-Factory微调大模型Qwen2.5

1、开始ModelScope社区GPU环境

训练或微调模型都是非常耗费算力的。如果电脑的配置不高,可使用一些云服务器来做这项工作。如ModelScope(魔搭)社区的GPU环境,目前提供36小时免费运算,足够微调一个大模型了。

注册ModelScope(魔搭)社区账号(可能还要注册或认证阿里云账号),进入“我的NoteBook”:

我的Notebook · 魔搭社区

启动大概需要2分钟,等GPU环境启动好以后点击"查看NoteBook"进入。

开启后,会提示永久性数据只保存在/mnt/workspace/目录下。

魔塔社区内置了JupyterLab的功能,进入之后,可以找到 Notebook 标签,新建一个Notebook(当然你在terminal 里执行也没问题)。

如下箭头所示,点击即可创建一个新的 Notebook 页面。

2、克隆LLaMA-Factory

(如果使用本地电脑进行微调,以下步骤都可参考)

打开NoteBook的终端,在默认目录(/mnt/workspace/)下执行命令:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

建议使用--depth 1参数,将data及一些示例的训练数据下载下来,以便修改微调。

3、配置环境

3.1、创建虚拟环境

进入LLaMA-Factory目录:

cd LLaMA-Factory/

创建虚拟环境:

python -m venv env  # env为虚拟环境文件夹名称,可自定义,如llama-factory-env

激活虚拟环境:NoteBook终端是linux系统,激活虚拟环境命令如下(同macOS):

source env/bin/activate # env为创建的虚拟环境名称

如果是windows系统,使用如下命令激活虚拟环境:

env\Scripts\activate

注意:重启NoteBook后,记得先激活虚拟环境!

3.2、安装依赖

安装必要的依赖,如:

pip install --upgrade pip     # 更新pip
pip install bitsandbytes>=0.39.0 

3.3、安装LLaMA-Factory

使用以下命令安装:

pip3 install -e ".[torch,metrics]"

4、模型下载测试

4.1、下载模型

首先下载LLM大语言模型,这里使用QWen2.5-0.5B,参数5亿个,微调时间短,在低配置电脑上也能运行。

模型在魔搭社区上有,地址是:

http://www.xdnf.cn/news/6604.html

相关文章:

  • 【设计模式】- 行为型模式1
  • 利用 Amazon Bedrock Data Automation(BDA)对视频数据进行自动化处理与检索
  • 2025年PMP 学习十六 第11章 项目风险管理 (总章)
  • IDEA中springboot项目中连接docker
  • upload-labs通关笔记-第7关 文件上传之空格绕过
  • Qwen3技术报告解读
  • 基于springboot+vue的机场乘客服务系统
  • 基于“岗课赛证”融通的中职“综合布线技术”课程解决方案
  • Pywinauto:轻松实现Windows桌面自动化实战
  • Python模块化编程进阶指南:从基础到工程化实践
  • Acronis True Image 2025 中文版深度评测:全能系统备份与灾难恢复解决方案
  • HTML常用标签用法全解析:构建语义化网页的核心指南
  • 大模型在数据分析领域的研究综述
  • Detected for tasks ‘compileDebugJavaWithJavac‘ (17) and ‘kspDebugKotlin‘ (21).
  • 0x08.Redis 支持事务吗?如何实现?
  • asp.net IHttpHandler 对分块传输编码的支持,IIs web服务器后端技术
  • C#进阶(2)stack(栈)
  • linux环境下 安装svn并且创建svn版本库详细教程
  • 自媒体工作室如何矩阵?自媒体矩阵养号策略
  • 嵌入式学习笔记 - STM32 ADC 模块工作模式总结
  • 【解决分辨数字】2021-12-16
  • React学习———CSS Modules(样式模块化)
  • Go语言处理HTTP下载中EOFFailed
  • Spring WebFlux与Quarkus实战:云原生微服务开发的两大主流框架深度解析
  • STM32CubeMX使用SG90舵机角度0-180°
  • Rust 学习笔记:关于 String 的练习题
  • python中集合的操作
  • MySQL 与 FastAPI 交互教程
  • 在 Ubuntu 系统中,将 JAR 包安装为服务
  • LongRefiner:解决长文档检索增强生成的新思路