当前位置: 首页 > web >正文

qwen2.5vl(2):lora 微调训练及代码讲解

文章目录

    • 1. 环境配置及数据准备
      • 1.1 SwanLab 配置
      • 1.2 准备数据集
    • 2. 训练
      • 2.1 数据处理
        • 2.1.1 对input 进行tokenizer
        • 2.1.2 对ouput 进行tokenizer
        • 1.2.3 准备input 和labels
      • 2.2 Lora 训练
        • 2.2.1 Lora 参数配置
        • 2.2.2 训练参数配置
        • 2.2.3 设置SwanLab回调
        • 2.2.4 Trainer 配置
      • 2.3 predict 讲解
        • 2.3.1 推理模型加载
        • 2.3.2 输入数据处理
        • 2.3.3 推理及解码

本文我们将简要介绍基于 transformers、peft 等框架,使用 Qwen2.5VL-7B-Instruct 模型在COCO2014图像描述 上进行Lora微调训练,同时使用 SwanLab 监控训练过程与评估模型效果。

在这里插入图片描述
Github:https://github.com/QwenLM/Qwen2.5-VL
数据集:coco_2014_caption
模型:Qwen2.5VL-7B-Instruc

1. 环境配置及数据准备

再 qwen2.5vl(1): 环境安装及运行,环境安装的基础上,还需要在安装如下

http://www.xdnf.cn/news/18689.html

相关文章:

  • Android Studio下载gradle文件很慢的捷径之路
  • 个人禁食伴侣FastTrack
  • 数据库类型与应用场景全解析:从传统关系型到新兴向量数据库
  • MySQL深分页的处理方案
  • React学习(十一)
  • 深入理解 React useEffect
  • 三、Bpmnjs 核心组件与架构介绍
  • 【c++进阶系列】:万字详解多态
  • 分库分表系列-基础内容
  • piecewise jerk算法介绍
  • 密码实现安全基础篇 . KAT(已知答案测试)技术解析与实践
  • SpringBoot自动配置原理解析
  • Reactor 反应堆模式
  • 游游的数组询问
  • SOC估算方法-蜣螂优化算法结合极限学习
  • NVIDIA Nsight Systems性能分析工具
  • 【Linux系统】进程信号:信号的处理
  • 【基础-判断】订阅dataReceiveProgress响应事件是用来接收HTTP流式响应数据。
  • 基于LLM的跨架构物联网静态漏洞挖掘检测 摘要
  • Ubuntu2204server系统安装postgresql14并配置密码远程连接
  • 小程序备案话术
  • 关于微服务下的不同服务之间配置不能通用的问题
  • pid自适应调节实战设计-基于输出电流的PI参数切换方案
  • React Hooks原理深潜:从「黑魔法」到「可观测」的蜕变之旅
  • Linux服务器Systemctl命令详细使用指南
  • DeepSeek V3.1 横空出世:重新定义大语言模型的边界与可能
  • 水体反光 + 遮挡难题破解!陌讯多模态融合算法在智慧水务的实测优化
  • 深入理解纹理与QtOpenGL的实现
  • 深度集成Dify API:基于Vue 3的智能对话前端解决方案
  • GitHub 热榜项目 - 日榜(2025-08-23)