当前位置: 首页 > backend >正文

微调大模型的工具

1.LLaMA-Factory
LLaMA Factory是一个统一高效的大语言模型微调框架,支持100多种大语言模型的零代码微调。它提供命令行和Web UI两种使用方式,让用户能够轻松地对各种大模型进行训练和部署。该项目由hiyouga开发,旨在降低大模型微调的技术门槛。

项目地址
https://github.com/hiyouga/LLaMA-Factory

2.UnSloth
UnSloth是一个专注于加速大型语言模型(LLM)微调的开源项目。它能让Llama 4、Gemma 3、Phi-4、Qwen 2.5和Mistral等模型的微调速度提高2倍,同时减少80%的显存使用。该项目由Daniel Han和Michael Han领导开发,旨在使AI模型训练更加高效和经济。

项目地址https://github.com/unslothai/unsloth

3.PyTorch Lightning
PyTorch Lightning 是一个深度学习框架,用于预训练、微调和部署 AI 模型。它是对 PyTorch 的高级抽象,旨在简化研究和工程代码,使深度学习更加高效和可读。PyTorch Lightning 通过提供结构化的代码组织方式,让用户专注于研究而不是工程细节。

项目地址
https://github.com/Lightning-AI/pytorch-lightning

4.Self-LLM
"开源大模型食用指南"是一个围绕开源大模型的全流程教程项目,针对国内初学者提供从环境配置到部署使用再到模型微调的完整指导。该项目旨在简化开源大模型的使用流程,让更多普通学生和研究者能够轻松使用开源大模型。项目涵盖了国内外主流开源大语言模型(如LLaMA、ChatGLM、InternLM、Qwen等)的部署、应用和微调方法。

项目地址https://github.com/datawhalechina/self-llm

5.ms-swift
ms-swift(SWIFT)是魔搭社区提供的大模型与多模态大模型微调部署框架,支持450+大模型与150+多模态大模型的训练、推理、评测、量化与部署全流程。该项目集成了最新的训练技术,包括LoRA、QLoRA等轻量化训练技术和DPO、GRPO等人类对齐训练方法。SWIFT提供了基于Gradio的Web-UI界面,使得用户可以零门槛地进行大模型训练和部署。

项目地址https://github.com/modelscope/ms-swift

http://www.xdnf.cn/news/4404.html

相关文章:

  • 大语言模型中的“温度”参数到底是什么?如何正确设置?
  • 低空科技护航珞樱春色,技术引领助推广阔应用
  • 2025.05.07-华为机考第二题200分
  • uni-app 引入vconsole web端正常,安卓端报错 Cannot read property ‘sendBeacon‘ of undefined
  • 【论文阅读】Adversarial Training Towards Robust Multimedia Recommender System
  • 【神经网络与深度学习】VAE 和 GAN
  • Linux网络新手注意事项与配置指南
  • Dify平台下基于搜索引擎SearXNG 和文本转换工具Marp的PPT助手搭建
  • 电商双11美妆数据分析实验总结
  • sudo apt-get update 相关问题
  • React学习路线图-Gemini版
  • Vue从零开始创建一个vue项目
  • 【wpf】10 C#树形控件高效实现:递归构建与路径查找优化详解
  • 铁塔基站项目用电能表有哪些?
  • Kubernetes(k8s)学习笔记(八)--KubeSphere定制化安装
  • 制作一款打飞机游戏39:鼠标控制
  • 集群免密登录
  • OpenCV 中用于背景分割(背景建模)的一个类cv::bgsegm::BackgroundSubtractorGSOC
  • CentOS 7.9 安装详解:手动分区完全指南
  • C++从入门到实战(十二)详细讲解C++如何实现内存管理
  • 【数据结构】手撕二叉搜索树
  • 记录一个rabbitmq因为linux主机名服务无法启动的问题
  • 《Overlapping Experiment Infrastructure: More, Better, Faster》论文阅读笔记
  • linux下MySql的安装与配置
  • ZArchiver解压缩工具:高效解压,功能全面
  • Ros 发布者 有关publisher的编程实现
  • 5月6(信息差)
  • vue3使用轮播图组件swiper
  • PPO 算法
  • 航电系统之坐标轴模拟技术篇