当前位置: 首页 > news >正文

unsloth笔记:基本介绍

更快的速度、更省的内存训练、运行、评估大模型

1 支持的模型

All Our Models | Unsloth Documentation

1.1 Dynamic GGUF/instruct 4-bit

  • llama.cpp使用的新模型格式,专为高效、本地推理设计
  • 注:GGUF无法微调
    • 只保留推理所需的内容,如量化后的权重、推理元信息
    • 不包含训练所需的梯度结构、参数层名、优化器状态

    • 不支持反向传播

    • 通常是 4-bit 静态量化,已经丢失了训练精度所需的权重信息

  • Instruct 4-bit (safetensors)

    • Instruct:代表模型是指令微调(Instruction-Tuned)版本,即已经训练过能更好理解指令/对话任务

    • 4-bit:表示该模型已经被4-bit 量化(通常用于 QLoRA),显著降低了显存需求。

    • safetensors:是一种更安全的模型文件格式(相对 .bin),支持高效加载、避免执行恶意代码。

    • 可直接用于低成本推理或继续进行LoRA / QLoRA 微调

1.1.1 deepseek家族

1.1.2 llama家族

1.1.3 gemma家族

1.1.4 Qwen家族

1.1.5 mistral家族

1.1.6 Phi家族

1.1.7 其他

1.2 16-bit and 8-bit Instruct

基本上instruct 4-bit的有的这边都有

也可用于推理和微调,区别主要在于精度和资源消耗

1.3  Base 4 + 16-bit

未经过指令微调的模型的4-bit和16-bit量化版本

1.3.1 llama家族

1.3.2 qwen家族

1.3.3 gemma 家族

1.3.4 Mistral家族

1.4 unsloth版本模型命名后缀说明

unsloth-bnb-4bitUnsloth 的动态 4bit 量化模型,精度更高,占用略多显存
bnb-4bit普通 BitsAndBytes 4bit 量化模型
无后缀原始模型(16/8bit)

2 可调参数推荐

max_seq_length下文长度,Llama-3 支持到 8192,但建议先用 2048 测试
dtype 默认None,若使用新 GPU 可设为 torch.float16 或 bfloat16
load_in_4bit

启用 QLoRA,减少 4 倍显存消耗

QLoRA 的准确性如今已经接近甚至超过 LoRA,建议默认使用

full_finetuning若设为 True,则执行全参数微调(不推荐)

3 选择instruct模型还是base模型

数据量情况推荐选择说明
超过 1000 行Base 模型数据量充足,能充分训练出新行为
300–1000 行高质量数据Base 或 Instruct视任务而定,两者都可以
少于 300 行Instruct 模型小样本建议保留已有指令能力,仅做轻微定制
  • 任务明确 + 数据少 → 用 Instruct 模型做轻微定制即可

  • 任务复杂 / 数据多 → 从 Base 模型开始训练,得到效果更稳的定制模型

http://www.xdnf.cn/news/1469701.html

相关文章:

  • SAP官方授权供应商名单2025
  • 神经网络|(十九)概率论基础知识-伽马函数·下
  • JavaSE丨IO流全解:从基础概念到序列化实战
  • 树莓派传感器扩展板资料
  • VMWare上搭建大数据集群
  • 8. Mono与IL2Cpp简介
  • mysql中null值对in子查询的影响
  • B.50.10.03-Nginx核心原理与电商应用
  • 基于STM32单片机FM调频TEA5767功放收音机液晶显示设计
  • Zynq-7000 上 RT-Thread 的 MMU 与 SMP 优势分析
  • 七彩喜智慧养老:科技向善,让“养老”变“享老”的智慧之选
  • 23种设计模式——桥接模式 (Bridge Pattern)详解
  • 极大似然估计与概率图模型:统计建模的黄金组合
  • 洛谷 P1099 [NOIP 2007 提高组] 树网的核-普及+/提高
  • ShareX神操作:多区域截图+特效功能!
  • linux ubi文件系统
  • Linux 文件系统及磁盘相关知识总结
  • Webpack 有哪些特性?构建速度?如何优化?
  • 前端开发vscode插件 - live server
  • 【SuperSonic】:PluginParser 插件解析器
  • 雅菲奥朗SRE知识墙分享(六):『混沌工程的定义与实践』
  • 十二、软件系统分析与设计
  • Linux:进程信号理解
  • Day21_【机器学习—决策树(2)—ID3树 、C4.5树、CART树】
  • stm32——NVIC,EXIT
  • RHEL7.9、RHEL9.3——源码安装MySQL
  • 人工智能领域、图欧科技、IMYAI智能助手2025年8月更新月报
  • 辗转相除法(欧几里得算法)的证明
  • mysql进阶语法(视图)
  • 25高教社杯数模国赛【A题国奖核心成品论文+问题解析】第一弹