微调大模型的工具
1.LLaMA-Factory
LLaMA Factory是一个统一高效的大语言模型微调框架,支持100多种大语言模型的零代码微调。它提供命令行和Web UI两种使用方式,让用户能够轻松地对各种大模型进行训练和部署。该项目由hiyouga开发,旨在降低大模型微调的技术门槛。
项目地址
https://github.com/hiyouga/LLaMA-Factory
2.UnSloth
UnSloth是一个专注于加速大型语言模型(LLM)微调的开源项目。它能让Llama 4、Gemma 3、Phi-4、Qwen 2.5和Mistral等模型的微调速度提高2倍,同时减少80%的显存使用。该项目由Daniel Han和Michael Han领导开发,旨在使AI模型训练更加高效和经济。
项目地址https://github.com/unslothai/unsloth
3.PyTorch Lightning
PyTorch Lightning 是一个深度学习框架,用于预训练、微调和部署 AI 模型。它是对 PyTorch 的高级抽象,旨在简化研究和工程代码,使深度学习更加高效和可读。PyTorch Lightning 通过提供结构化的代码组织方式,让用户专注于研究而不是工程细节。
项目地址
https://github.com/Lightning-AI/pytorch-lightning
4.Self-LLM
"开源大模型食用指南"是一个围绕开源大模型的全流程教程项目,针对国内初学者提供从环境配置到部署使用再到模型微调的完整指导。该项目旨在简化开源大模型的使用流程,让更多普通学生和研究者能够轻松使用开源大模型。项目涵盖了国内外主流开源大语言模型(如LLaMA、ChatGLM、InternLM、Qwen等)的部署、应用和微调方法。
项目地址https://github.com/datawhalechina/self-llm
5.ms-swift
ms-swift(SWIFT)是魔搭社区提供的大模型与多模态大模型微调部署框架,支持450+大模型与150+多模态大模型的训练、推理、评测、量化与部署全流程。该项目集成了最新的训练技术,包括LoRA、QLoRA等轻量化训练技术和DPO、GRPO等人类对齐训练方法。SWIFT提供了基于Gradio的Web-UI界面,使得用户可以零门槛地进行大模型训练和部署。
项目地址https://github.com/modelscope/ms-swift