当前位置：首页 > web >正文

qwen2.5vl(2):lora 微调训练及代码讲解

web 2025/8/24 8:17:36

文章目录

- 1. 环境配置及数据准备
- - 1.1 SwanLab 配置
  - 1.2 准备数据集
- 2. 训练
- - 2.1 数据处理
  - - 2.1.1 对input 进行tokenizer
    - 2.1.2 对ouput 进行tokenizer
    - 1.2.3 准备input 和labels
  - 2.2 Lora 训练
  - - 2.2.1 Lora 参数配置
    - 2.2.2 训练参数配置
    - 2.2.3 设置SwanLab回调
    - 2.2.4 Trainer 配置
  - 2.3 predict 讲解
  - - 2.3.1 推理模型加载
    - 2.3.2 输入数据处理
    - 2.3.3 推理及解码

本文我们将简要介绍基于 transformers、peft 等框架，使用 Qwen2.5VL-7B-Instruct 模型在COCO2014图像描述上进行Lora微调训练，同时使用 SwanLab 监控训练过程与评估模型效果。

在这里插入图片描述
Github：https://github.com/QwenLM/Qwen2.5-VL
数据集：coco_2014_caption
模型：Qwen2.5VL-7B-Instruc

1. 环境配置及数据准备

再 qwen2.5vl(1): 环境安装及运行，环境安装的基础上，还需要在安装如下

http://www.xdnf.cn/news/18689.html

相关文章：

Android Studio下载gradle文件很慢的捷径之路

个人禁食伴侣FastTrack

数据库类型与应用场景全解析：从传统关系型到新兴向量数据库

MySQL深分页的处理方案

React学习（十一）

深入理解 React useEffect

三、Bpmnjs 核心组件与架构介绍

【c++进阶系列】：万字详解多态

分库分表系列-基础内容

piecewise jerk算法介绍

密码实现安全基础篇 . KAT（已知答案测试）技术解析与实践

SpringBoot自动配置原理解析

Reactor 反应堆模式

游游的数组询问

SOC估算方法-蜣螂优化算法结合极限学习

NVIDIA Nsight Systems性能分析工具

【Linux系统】进程信号：信号的处理

【基础-判断】订阅dataReceiveProgress响应事件是用来接收HTTP流式响应数据。

基于LLM的跨架构物联网静态漏洞挖掘检测摘要

Ubuntu2204server系统安装postgresql14并配置密码远程连接

小程序备案话术

关于微服务下的不同服务之间配置不能通用的问题

pid自适应调节实战设计-基于输出电流的PI参数切换方案

React Hooks原理深潜：从「黑魔法」到「可观测」的蜕变之旅

Linux服务器Systemctl命令详细使用指南

DeepSeek V3.1 横空出世：重新定义大语言模型的边界与可能

水体反光 + 遮挡难题破解！陌讯多模态融合算法在智慧水务的实测优化

深入理解纹理与QtOpenGL的实现

深度集成Dify API：基于Vue 3的智能对话前端解决方案

GitHub 热榜项目 - 日榜(2025-08-23)