当前位置: 首页 > news >正文

利用ms-swift微调和百炼平台微调大模型

文章目录

  • 案例1:自我认知(利用ms-swift微调)
    • MS-SWIFT简介
    • 打开百炼平台Notebook
    • 安装ms-swift
    • 输入“你是谁?”
  • 案例2:意图识别(利用百炼平台微调)
    • 背景:
    • 数据集:
    • 百炼数据集
      • 训练集
      • 测试集
    • 百炼微调
      • 部署模型
    • 测试

案例1:自我认知(利用ms-swift微调)

MS-SWIFT简介

🍲 ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架,现已支持500+大模型与200+多模态大模型的训练(预训练、微调、人类对齐)、推理、评测、量化与部署。其中大模型包括:Qwen3、Qwen3-MoE、Qwen2.5、InternLM3、GLM4.5、Mistral、DeepSeek-R1、Yi1.5、TeleChat2、Baichuan2、Gemma2等模型,多模态大模型包括:Qwen2.5-VL、Qwen2-Audio、Llama4、Llava、InternVL3、MiniCPM-V-4、Ovis2.5、GLM4v、Xcomposer2.5、Yi-VL、DeepSeek-VL2、Phi3.5-Vision、GOT-OCR2等模型。

🍔 除此之外,ms-swift汇集了最新的训练技术,包括LoRA、QLoRA、Llama-Pro、LongLoRA、GaLore、Q-GaLore、LoRA+、LISA、DoRA、FourierFt、ReFT、UnSloth、和Liger等轻量化训练技术,以及DPO、GRPO、RM、PPO、GKD、KTO、CPO、SimPO、ORPO等人类对齐训练方法。ms-swift支持使用vLLM、SGLang和LMDeploy对推理、评测和部署模块进行加速,并支持使用GPTQ、AWQ、BNB等技术对大模型进行量化。ms-swift还提供了基于Gradio的Web-UI界面及丰富的最佳实践。
打开魔塔社区,在左侧“我的Notebook”里面,选择方案2,然后按启动,新用户有35个小时给我们霍霍。
在这里插入图片描述

打开百炼平台Notebook

两分钟后点击“查看Notebook”在这里插入图片描述
左边右击,创建文件夹,命名“ft-selfrefresh”, 然后点击右边控制台“Terminal”
在这里插入图片描述

安装ms-swift

pip install ms-swift -U

在这里插入图片描述
进到“ft-selfrefresh”文件夹

cd ft-selfrefresh

10分钟在单卡3090上对Qwen2.5-7B-Instruct进行自我认知微调:

CUDA_VISIBLE_DEVICES=0 \
swift sft \--model Qwen/Qwen2.5-7B-Instruct \--train_type lora \--dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' \'AI-ModelScope/alpaca-gpt4-data-en#500' \'swift/self-cognition#500' \--torch_dtype bfloat16 \--num_train_epochs 1 \--per_device_train_batch_size 1 \--per_device_eval_batch_size 1 \--learning_rate 1e-4 \--lora_rank 8 \--lora_alpha 32 \--target_modules all-linear \--gradient_accumulation_steps 16 \--eval_steps 50 \--save_steps 50 \--save_total_limit 2 \--logging_steps 5 \--max_length 2048 \--output_dir output \--system 'You are a helpful assistant.' \--warmup_ratio 0.05 \--dataloader_num_workers 4 \--model_author MichaelGor \--model_name Michael-service-robot

其中model_author可以改成自己名字,model_name改成大模型要自我认知的名字
微调结束后可以看到ft-selfrefresh文件夹下面多了output文件夹
在这里插入图片描述
在这里插入图片描述
打开output文件夹,里面还有个v0-****的文件点击进入,打开logging.jsonl文件,首查“best”关键字,就可以看到我们这次最好的model保存到第94个checkpoint里面。
在这里插入图片描述
#使用交互式命令行进行推理

CUDA_VISIBLE_DEVICES=0 \
swift infer \--adapters output/v0-20250821-160318/checkpoint-94 \--stream true \--temperature 0 \--max_new_tokens 2048

在这里插入图片描述

输入“你是谁?”

在这里插入图片描述
然后它就是识别自己是叫“Michael-service-robot”,是由MichaelGor开发出来的

案例2:意图识别(利用百炼平台微调)

背景:

如果我用普通的大模型,想让它分析意图,是不能直接做到的,比如,用户问:星期五早上九点叫醒我。拿通义千问2.5-7B做例子,它就会有如下回复。但我想让它预测我们的意图呢?
在这里插入图片描述

数据集:

https://huggingface.co/datasets/SetFit/amazon_massive_intent_zh-CN
在这里插入图片描述
这是在huggingface的数据集,是智能音箱的意图识别,比如说用户问:星期五早上九点叫醒我。大模型应该反馈给我“报警器”,然后实现后续的功能。

百炼数据集

在这里插入图片描述

训练集

将huggingface下载到的训练集按照百炼的格式转换,如图所示
在这里插入图片描述
在这篇文章资源的“MyTrain.jsonl”
在这里插入图片描述

上传训练集到百炼
在这里插入图片描述

测试集

将huggingface下载到的测试集按照百炼的格式转换,如图所示
在这里插入图片描述
在这篇文章资源的“MyValidation.xlsx”
在这里插入图片描述

上传测试集到百炼
在这里插入图片描述

百炼微调

进入百炼平台,点击“模型调优”,点击“训练新模型”。
在这里插入图片描述
选择千问2.5, 7B的模型,高效训练,改个模型名字,选择之前的训练集,和测试集
在这里插入图片描述
在这里插入图片描述
我的数据比较多,费用可能贵了点,大家可以试试减少数据,效果一样。

训练数据:

在这里插入图片描述

部署模型

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

测试

在这里插入图片描述
在这里插入图片描述

http://www.xdnf.cn/news/1409059.html

相关文章:

  • FTP - 学习/实践
  • 【学习笔记】LLM Interview(Agent相关)
  • (附源码)基于Vue的教师档案管理系统的设计与实现
  • 安装Android Studio
  • centos 7 安装docker、docker-compose教程
  • SketchUp Pro 2024 Mac 3D建模 草图设计大师
  • Redis八股小记
  • 【了解下TJ、TC、TB、TT、TA、qJA、qJC、qJB、YJB、YJT】
  • Asible——将文件部署到受管主机和管理复杂的Play和Playbook
  • [linux仓库]解剖Linux内核:文件描述符(fd)的‘前世今生’与内核数据结构探秘
  • 编写一个用scala写的spark程序从本地读取数据,写到本地
  • 【ArcGIS微课1000例】0150:如何根据地名获取经纬度坐标
  • openssl使用SM2进行数据加密和数据解密
  • 科普:requirements.txt 和 environment.yml
  • Labview使用modbus或S7与PLC通信
  • Machine Learning HW3 report:图像分类(Hongyi Lee)
  • 《深入剖析Kafka分布式消息队列架构奥秘》之Springboot集成Kafka
  • 中级统计师-统计实务-第四章 专业统计
  • 嵌入式ARM程序高级调试技能:20.qemu arm ARM Linux 上 addr2line 的实际应用示例
  • 【重学MySQL】九十五、Linux 下 MySQL 大小写规则设置详解
  • CF每日3题(1500-1600)
  • 阿里云创建自己的博客,部署wordpress
  • 基于Matlab元胞自动机的强场电离过程模拟与ADK模型分析
  • Scikit-learn Python机器学习 - 数据集的划分
  • 网格图--Day03--网格图DFS--2658. 网格图中鱼的最大数目,1034. 边界着色,1020. 飞地的数量
  • Cartographer中的gflag与lua文件
  • 【开题答辩全过程】以 基于Java的城市公交查询系统设计与实现为例,包含答辩的问题和答案
  • 记录测试环境hertzbeat压测cpu高,oom问题排查。jvm,mat,visulavm
  • 浏览器和 node 操作文件的 api 以及区别
  • GEE 实战:Landsat 5 月度 NDVI 数据插值填补(以 8 月为例)_后附完整代码