当前位置: 首页 > ai >正文

LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B

1.数据准备

为了对比原生模型效果与微调后的效果,这里选择医疗诊断数据medical-o1-reasoning-SFT来进行微调实验,首先将数据转化为LLaMA-Factory支持的Alpaca数据格式,并划分数据集

{"instruction": "医疗问题示例","input": "上下文信息","output": "预期回答"
}

相关脚本如下:

from datasets import load_dataset
import json, osdataset = load_dataset('/workspace/luoshiyong/deepseek-ai/medical_sft/medical-o1-reasoning-SFT', 'zh')
dataset = {"train": dataset['train'][:2000], 'val': dataset['train'][-200:]}
root = '/workspace/luoshiyong/deepseek-ai/medical_sft/convert'
for key in ['train', 'val']:list_r = []for q, r 
http://www.xdnf.cn/news/4412.html

相关文章:

  • 2025年数字藏品行业DDoS攻防指南:技术升级与合规防御双轨制
  • 【C++】类和对象【下】
  • MySQL 中的 MVCC 是什么?
  • SRAM详解
  • vscode 安装插件
  • 软件开发模型介绍
  • MATLAB制作直方图
  • 【25软考网工】第五章(8)路由协议RIP、OSPF
  • QT聊天项目DAY09
  • 【神经网络与深度学习】VAE 中的先验分布指的是什么
  • 嵌入式音视频通话EasyRTC基于WebRTC技术驱动智能带屏音箱:开启智能交互新体验
  • MySQL从入门到精通(三):MySQL数据类型、SQL语言—DDL
  • 老年综合评估实训室虚拟仿真建设的关键技术与发展路径
  • 【论文阅读】Towards Stable Backdoor Purification through Feature Shift Tuning
  • C++ 完美转发
  • k8s部署OpenELB
  • vue3父组件调用子组件方法
  • AI大模型分类以及Prompt优化技巧
  • Microsoft Azure 在印度尼西亚区域正式上线
  • MDP相关内容
  • JVM中对象的存储
  • AI能否取代软件架构师?我将4个大语言模型进行了测试
  • win11下pip安装matplotlib超时的问题解决
  • PAT(最近)
  • spring cloud gateway 断言(Predicates)与过滤器(filters)
  • 基于vue框架的电子竞技赛事管理系统12t47(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • JVM中类加载过程是什么?
  • FPGA 不兼容故障及处理
  • SRS流媒体服务器(3)视频通话环境搭建和源码分析
  • 使用 Vue CLI 和 vuedraggable 实现拖拽排序功能