当前位置: 首页 > web >正文

基于deepseek的LORA微调

LORA微调:

核心是:低秩转换,减少参数。冻结大部分,调节部分模块(注意力模块的Wq,Wk,Wv)。

调整过后得到一个lora.safetensors, 内部记录了(detail W: 即部分修改的W)。推理使用原权重和lora权重。

具体操作:
1,先进行工具,与库的下载

source /etc/network_turbo #先设置镜像 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git # 下载工具库代码 cd LLaMA-Factory # 进入文件夹 pip install -e ".[torch,metrics]" # 下载环境 llamafactory-cli version #查看版本安装成功会有对应的版本

2,LLaMA-Factory运行网页管理页面

export GRADIO_SERVER_PORT=6006 # 设置临时端口 echo $GRADIO_SERVER_PORT # 查看是否设置成功 llamafactory-cli webui # 设置成功可以开启webui网页

成功的话是这个页面

3,用电脑ssh连接算力云端口

4,进入微调页面

浏览器打开:http://localhost:6006/

5,数据处理与传输.

将你要微调的提示词文件放入/root/LLaMA-Factory/data/目录下。

打开/root/LLaMA-Factory/data/dataset_info.json然后内部加上你的数据的josn格式

"law_sft_dataset": { "file_name": "law_sft_dataset_output.json" }, #等于是你要注册才能在网页上找到

6,调整参数开始训练.

注意点:

7,训练过程:

8,训练结果

9,微调与原模型合并

最终就得到了进行特殊提示词微调后的模型了。

http://www.xdnf.cn/news/16017.html

相关文章:

  • 【设计模式C#】简单工厂模式(用于简化获取对象实例化的复杂性)
  • 个人中心产品设计指南:从信息展示到用户体验的细节把控
  • mongodb源代码分析createCollection命令由create.idl变成create_gen.cpp过程
  • 在.NET Core API 微服务中使用 gRPC:从通信模式到场景选型
  • uniapp使用uni-ui怎么修改默认的css样式比如多选框及样式覆盖小程序/安卓/ios兼容问题
  • taro微信小程序的tsconfig.json文件说明
  • Hyperledger Fabric V2.5 生产环境部署及安装Java智能合约
  • 从env到mm_struct:环境变量与虚拟内存的底层实现
  • 来伊份养馋记社区零售 4.0 上海首店落沪:重构 “家门口” 的生活服务生态
  • Django实战:基于Django和openpyxl实现Excel导入导出功能
  • AWS IoT Core CloudWatch监控完整指南
  • 前端包管理工具深度对比:npm、yarn、pnpm 全方位解析
  • 【React】npm install报错npm : 无法加载文件 D:\APP\nodejs\npm.ps1,因为在此系统上禁止运行脚本。
  • 宝塔面板Nginx报错: IP+端口可以直接从访问,反向代理之后就504了 Gateway Time-out
  • 使用 Strands Agents 开发并部署生产级架构通用型个人助手
  • 第三章自定义检视面板_创建自定义编辑器类_编扩展默认组件的显示面板(本章进度3/9)
  • 前端开发者快速理解Spring Boot项目指南
  • 解决mac chrome无法打开本地网络中的内网网址的问题
  • 电科金仓2025发布会,国产数据库的AI融合进化与智领未来
  • PPT科研画图插件
  • MCP协议解析:如何通过Model Context Protocol 实现高效的AI客户端与服务端交互
  • C++STL之stack和queue
  • Valgrind Memcheck 全解析教程:6个程序说明基础内存错误
  • SpringBoot的介绍和项目搭建
  • 基于有监督学习的主动攻击检测系统
  • Vision Transformer (ViT) 介绍
  • 以“融合进化 智领未来”之名,金仓Kingbase FlySync:国产数据库技术的突破与创新
  • Redis 概率型数据结构实战指南
  • C++ STL中迭代器学习笔记
  • Docker实践:使用Docker部署WhoDB开源轻量级数据库管理工具