当前位置：首页 > web >正文

基于deepseek的LORA微调

web 2025/7/22 7:53:06

LORA微调：

核心是：低秩转换，减少参数。冻结大部分，调节部分模块(注意力模块的Wq，Wk，Wv)。

调整过后得到一个lora.safetensors, 内部记录了(detail W: 即部分修改的W)。推理使用原权重和lora权重。

具体操作：

1,先进行工具，与库的下载

source /etc/network_turbo #先设置镜像 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git # 下载工具库代码 cd LLaMA-Factory # 进入文件夹 pip install -e ".[torch,metrics]" # 下载环境 llamafactory-cli version #查看版本安装成功会有对应的版本

2,LLaMA-Factory运行网页管理页面

export GRADIO_SERVER_PORT=6006 # 设置临时端口 echo $GRADIO_SERVER_PORT # 查看是否设置成功 llamafactory-cli webui # 设置成功可以开启webui网页

成功的话是这个页面

3,用电脑ssh连接算力云端口

4,进入微调页面

浏览器打开:http://localhost:6006/

5，数据处理与传输.

将你要微调的提示词文件放入/root/LLaMA-Factory/data/目录下。

打开/root/LLaMA-Factory/data/dataset_info.json然后内部加上你的数据的josn格式

"law_sft_dataset": { "file_name": "law_sft_dataset_output.json" }, #等于是你要注册才能在网页上找到

6，调整参数开始训练.

注意点：

7,训练过程:

8,训练结果

9,微调与原模型合并

最终就得到了进行特殊提示词微调后的模型了。

http://www.xdnf.cn/news/16017.html

相关文章：

【设计模式C#】简单工厂模式（用于简化获取对象实例化的复杂性）

个人中心产品设计指南：从信息展示到用户体验的细节把控

mongodb源代码分析createCollection命令由create.idl变成create_gen.cpp过程

在.NET Core API 微服务中使用 gRPC：从通信模式到场景选型

uniapp使用uni-ui怎么修改默认的css样式比如多选框及样式覆盖小程序/安卓/ios兼容问题

taro微信小程序的tsconfig.json文件说明

Hyperledger Fabric V2.5 生产环境部署及安装Java智能合约

从env到mm_struct：环境变量与虚拟内存的底层实现

来伊份养馋记社区零售 4.0 上海首店落沪：重构 “家门口” 的生活服务生态

Django实战：基于Django和openpyxl实现Excel导入导出功能

AWS IoT Core CloudWatch监控完整指南

前端包管理工具深度对比：npm、yarn、pnpm 全方位解析

【React】npm install报错npm : 无法加载文件 D:\APP\nodejs\npm.ps1，因为在此系统上禁止运行脚本。

宝塔面板Nginx报错： IP+端口可以直接从访问，反向代理之后就504了 Gateway Time-out

使用 Strands Agents 开发并部署生产级架构通用型个人助手

第三章自定义检视面板_创建自定义编辑器类_编扩展默认组件的显示面板(本章进度3/9）

前端开发者快速理解Spring Boot项目指南

解决mac chrome无法打开本地网络中的内网网址的问题

电科金仓2025发布会，国产数据库的AI融合进化与智领未来

PPT科研画图插件

MCP协议解析：如何通过Model Context Protocol 实现高效的AI客户端与服务端交互

C++STL之stack和queue

Valgrind Memcheck 全解析教程：6个程序说明基础内存错误

SpringBoot的介绍和项目搭建

基于有监督学习的主动攻击检测系统

Vision Transformer (ViT) 介绍

以“融合进化智领未来”之名，金仓Kingbase FlySync：国产数据库技术的突破与创新

Redis 概率型数据结构实战指南

C++ STL中迭代器学习笔记

Docker实践：使用Docker部署WhoDB开源轻量级数据库管理工具