当前位置: 首页 > web >正文

LlaMA_Factory实战微调VL大模型

VL微调数据格式文件样例如下
在这里插入图片描述
一:微调数据集准备
1、制作微调数据集
在这里插入图片描述

首先找到data文件夹下方的mllm_demo.json,确认微调VL模型时的数据格式模板,然后按照模板,制作对应的指令微调数据集。
2、确认微调模型认知
在这里插入图片描述

打开identity.json文件,修改模型初步认知,确认微调后模型的名称和开发者,如下。
3、进入dataset_info.json,添加数据集,修改文件夹名称和对应标注json文件名即可
在这里插入图片描述

"****_vl_data(图片文件夹名称)": {"file_name": "****_vl_data.json(对应的json文件名称)","formatting": "sharegpt","columns": {"messages": "messages","images": "images"},"tags": {"role_tag": "role","content_tag": "content","user_tag": "user","assistant_tag": "assistant"}}

二:启动训练
1、先下载模型文件

2、web端启动命令

llamafactory-cli webui

配置参数
在这里插入图片描述
在这里插入图片描述
启动训练后使用显存大小:50924MiB(这个有大佬知道正常吗,7B参数按照这个训练要这么大的显存?),143条数据,15Epoch所用时间为:40min
训练曲线如下所示
在这里插入图片描述
但是感觉没怎么收敛啊,准备在加几轮训练一下
修改参数:参数部分可参照该链接,说的很详细

https://blog.csdn.net/qq_62223405/article/details/149500255?fromshare=blogdetail&sharetype=blogdetail&sharerId=149500255&sharerefer=PC&sharesource=weixin_42225889&sharefrom=from_link

在这里插入图片描述
在15个epoch时模型训练稳定
在这里插入图片描述
中断训练,然后导出模型文件进行测试,完成训练

http://www.xdnf.cn/news/17250.html

相关文章:

  • o2o 商城系统数据分析管理系统模块设计
  • SpringMVC基础
  • Linux部署tp5.1,nginx服务器不管访问那个方法,一直访问index/index问题解决方法
  • 【YOLOv8改进 - C2f融合】C2f融合EBlock(Encoder Block):低光增强编码器块,利用傅里叶信息增强图像的低光条件
  • 环保监测新范式:边缘计算网关如何为河长制赋能增效?
  • Java面试宝典:Java内存模型与对象可达性判定原理
  • NWinfo(硬件信息检测工具)v1.4.20绿色免费版,U盘随走随检,结果即刻导出
  • ⭐CVPR 文本到 3D 场景生成新突破:Prometheus 框架解析
  • 贪心算法学习 跳跃游戏
  • app-3
  • 实习文档背诵
  • 2.1.4 砌体材料的性能与应用
  • SG105 Pro 网管交换机的3种VLAN配置
  • 强化应急通信生命线:遨游三防平板、卫星电话破局极端灾害救援
  • 无人机图传的得力助手:5G 便携式多卡高清视频融合终端的协同应用
  • Tdesign-React 请求接口 415 问题借助 chatmaster 模型处理记录
  • 嵌入式学习的第四十四天-ARM
  • 图解 Claude Code 子智能体 Sub-agent
  • CGAL Kernel 和 Traits 类深度解析:从官方教程到实践应用
  • 爆炸粒子效果
  • 记一次ORACLE ORA-00600 [19004] 错误的分析与解决方法
  • python每日一题 贪心算法
  • 【第6话:相机模型2】相机标定在自动驾驶中的作用、相机标定方法详解及代码说明
  • Python虚拟环境完全指南:pyenv vs venv 在macOS上的使用详解
  • 【代码随想录day 12】 力扣 102.107.199. 二叉树的层序遍历
  • SQL Server 2000企业管理器不能执行查询
  • cygwin+php教程(swoole扩展+redis扩展)
  • 利用DeepSeek改写并增强测试Duckdb和sqlite的不同插入方法性能
  • 高可用改造之构建​​双活冗余的TDengine时序数据处理架构
  • LeetCode——2411. 按位或最大的最小子数组长度