当前位置: 首页 > ds >正文

llama_factory 安装以及大模型微调

1、安装虚拟环境

        conda create -n llamafactory python==3.12

        source activate llamafactory

2、安装llama_factory

       下载: git clone https://github.com/hiyouga/LLaMA-Factory.git 

        到 LLaMA-Factory 目录运行安装命令

                cd LLaMA-Factory

                pip install -e .

         打开LLaMA-Factory UI页面:

             llamafactory-cli webui

3、数据集准备

        在下载 的 LLaMA-factory 目录中,data中新增或修改数据集、dataset_info.json中配置数据集

      

4、模型的微调和验证

       我使用的 vscode 的 Remote - SSH 插件,打开 webui 页面后自动打开页面,在页面进行微调、无需写代码

       

            

    点 开始后就开始训练,当损失不再降低时即可中断训练,中断后点 开始 可继续训练

5、模型效果验证

      在训练模型时设置的保存间隔是100,所以每100个批次就会就会生成一个检查点。

      点 chat 进入聊天页面,粘贴一个检查点的绝对路径,然后再下面的聊天窗口中检查训练效果。

  

6、模型的导出

      检验检查点没问题后将 原模型和训练的检查点 导出成一个新的模型,新的模型就包含了训练的检查点功能

7、验证导出的新模型

      在chat 中,选择新模型、清空检查点,可以看到模型是微调后的效果

http://www.xdnf.cn/news/20619.html

相关文章:

  • 当没办法实现从win复制东西到Linux虚拟机时的解决办法
  • 嵌入式软件兼容性设计要点​实践
  • 基于STM32单片机智能手表手环GSM短信上报GPS定位校时
  • 【秋招笔试】2025.0906美团秋招算法研发二合一
  • ZYNQ UART中断
  • Dify工作流(三)
  • 【系统分析师】第11章-关键技术:软件需求工程(核心总结)
  • 力扣hot100:相交链表与反转链表详细思路讲解(160,206)
  • 【LLIE专题】LYT-Net:一种轻量级 YUV Transformer 低光图像增强网络
  • 消息队列的可靠性、顺序性怎么保证?
  • PaddlePaddle——飞桨深度学习实现手写数字识别任务
  • 从0到1学习Vue框架Day01
  • PNG和JPEG和BMP文件格式转换
  • Ansible题目全解析与答案
  • 棱镜的技术加持:线扫相机如何同时拍RGB和SWIR?
  • 【开题答辩全过程】以 校园二手货物交易平台为例,包含答辩的问题和答案
  • Spring AI Tool 实现自然语言操作MySql数据库操作详解
  • postman接口功能测试
  • 技术演进中的开发沉思-93 Linux系列:启动流程
  • 开放式LLM的崛起:未来已至
  • JavaScript笔记之JS 和 HTML5 的关系
  • 跨域解决方案——CORS学习了解
  • B.20.10.06-高并发系统设计电商应用
  • 五.贪心算法
  • linux内核 - 获取内核日志时间戳的方法
  • 联邦学习常见模型
  • ChatGPT 协作排查:Node.js 内存泄漏的定位与修复
  • JavaScript 结构型模式详解
  • stl--保研机试极限复习
  • 网易UU远程,免费电脑远程控制软件