当前位置: 首页 > ai >正文

启智平台调试 qwen3 4b ms-swift

以上设置完成后,我们点击新建任务。等待服务器创建和分配资源。 资源分配完成后我们看到如下列表,看到资源running状态,后面有一个调试按钮,后面就可以进入代码调试窗体界面了。

 点击任务名称   跳转 

 

访问github失败  加速器开启 

 

由于启智平台权限控制问题在/tmp/pretrainmodel/ 目录下是只读权限,我们在模型推理的时候需要读写模型文件,所以会到导致报错,所以我们把模型复制到/tmp/code/目录下,避免上述的错误,执行如下命令 

cp -r  /tmp/pretrainmodel/Qwen3-4B/ /tmp/code/

SFT(Supervised Fine-Tuning) 是
监督微调

 infer 推理

 

报错   ms-swift 版本不对

升级

ms-swift
pip install 'ms-swift[all]' -U

 SWIFT安装 — swift 3.5.0.dev0 文档

问题 
请介绍一下Qwen3系列模型?

 结果被保存到

cd result/Qwen3-4B/infer_result/20250508-151330.jsonl

模型微调

10分钟在单卡A100上对qwen3-4b进行自我认知微调

22.sh 

CUDA_VISIBLE_DEVICES=0 \
swift sft \--model /tmp/code/Qwen3-4B \--train_type lora \--dataset 'swift/self-cognition#500' \--torch_dtype bfloat16 \--num_train_epochs 5 \          #训练时间长短--per_device_train_batch_size 1 \--per_device_eval_batch_size 1 \--learning_rate 1e-4 \--lora_rank 8 \--lora_alpha 32 \--target_modules all-linear \--gradient_accumulation_steps 16 \--eval_steps 50 \--save_steps 50 \--save_total_limit 2 \--logging_steps 5 \--max_length 2048 \--output_dir output \--system '你是清研心启智能小助手' \--warmup_ratio 0.05 \--dataloader_num_workers 4 \--model_author zhouhui \--model_name 清心Robot

终端执行 

bash 22.sh

观测显存使用 大约最高43%    16G 

nvidia-smi

整个过程微慢 稍等 

 

 用时

omnimath 

2024-10-10,北京大学联合多个机构和企业创建了Omni-MATH数据集,是一个大型语言模型在奥林匹克数学竞赛级别的数学推理能力进行评估的综合基准 

快速开始 — swift 3.5.0.dev0 文档

# 22GB
CUDA_VISIBLE_DEVICES=0 \
swift sft \--model /tmp/code/Qwen3-4B \--train_type lora \--dataset '/tmp/code/Omni-MATH/test.jsonl' \  # 修改为本地路径--torch_dtype bfloat16 \--num_train_epochs 5 \--per_device_train_batch_size 1 \--per_device_eval_batch_size 1 \--learning_rate 1e-4 \--lora_rank 8 \--lora_alpha 32 \--target_modules all-linear \--gradient_accumulation_steps 16 \--eval_steps 50 \--save_steps 50 \--save_total_limit 2 \--logging_steps 5 \--max_length 2048 \--output_dir output \--system '你是清研心启智能小助手.' \--warmup_ratio 0.05 \--dataloader_num_workers 4 \--model_author swift \--model_name 清心-robot

 


Omni-MATH

小白必看!启智平台轻松搞定 Qwen3 模型推理与训练 - 哔哩哔哩

http://www.xdnf.cn/news/4582.html

相关文章:

  • 基于Kubernetes的Apache Pulsar云原生架构解析与集群部署指南(下)
  • IEEE出版|2025年通信网络与智能系统工程国际会议(CNSE2025)
  • uniapp中score-view中的文字无法换行问题。
  • 《spark》
  • 设计模式-策略模式
  • C++ 工具链与开发实践:构建安全、高效与创新的开发生态
  • C++之“继承”
  • C++面向对象编程入门:从类与对象说起(一)
  • 正则表达式实战指南:原理、口诀与高频场景案例
  • 如何在 C# 和 .NET 中打印 DataGrid
  • 【即插即用涨点模块】DSConv动态蛇形卷积:自适应聚焦细长弯曲的局部结构特征,助力分割高效提点【附源码+注释】
  • 【无标题】阿达萨达
  • 安卓基础(封装引用)
  • 视频编解码学习9之照相机历史
  • 【 Redis | 实战篇 短信登录 】
  • 区块链内容创作全攻略:海报、白皮书与视频的视觉化革命
  • idea出现tomcat不能正确部署的问题--解决方案
  • 用电信息采集中的天线种类
  • 链表的面试题4之合并有序链表
  • 大数据TopK问题
  • 什么是延迟队列?RabbitMQ 如何实现延迟队列?
  • 软件工程(五):设计模式
  • 【黑马程序员RabbitMQ高级】自用笔记
  • redis多路复用IO模型 以及 6.0引入的多线程模型
  • string[字符串中第一个的唯一字符][蓝桥杯]
  • 数据中台-常用工具组件:DataX、Flink、Dolphin Scheduler、TensorFlow和PyTorch等
  • Oracle 19c中的私有临时表
  • 不再踩坑!React.memo正确用法及性能优化实战
  • 【C++ Qt】多元素控件(ListWidget、TableWidget、TreeWidget)
  • 阿里云ddos云防护服务器有哪些功能?ddos防御手段有哪些??