qwen2.5vl(2):lora 微调训练及代码讲解
文章目录
-
- 1. 环境配置及数据准备
-
- 1.1 SwanLab 配置
- 1.2 准备数据集
- 2. 训练
-
- 2.1 数据处理
-
- 2.1.1 对input 进行tokenizer
- 2.1.2 对ouput 进行tokenizer
- 1.2.3 准备input 和labels
- 2.2 Lora 训练
-
- 2.2.1 Lora 参数配置
- 2.2.2 训练参数配置
- 2.2.3 设置SwanLab回调
- 2.2.4 Trainer 配置
- 2.3 predict 讲解
-
- 2.3.1 推理模型加载
- 2.3.2 输入数据处理
- 2.3.3 推理及解码
本文我们将简要介绍基于 transformers、peft 等框架,使用 Qwen2.5VL-7B-Instruct 模型在COCO2014图像描述 上进行Lora微调训练,同时使用 SwanLab 监控训练过程与评估模型效果。
Github:https://github.com/QwenLM/Qwen2.5-VL
数据集:coco_2014_caption
模型:Qwen2.5VL-7B-Instruc
1. 环境配置及数据准备
再 qwen2.5vl(1): 环境安装及运行,环境安装的基础上,还需要在安装如下