当前位置：首页 > news >正文

使用unsloth对Qwen3在本地进行微调

news 2025/7/5 6:18:38

Fine-tune Qwen3（100% locally）

使用unsloth进行微调，使用huggingface在本地运行model。

load model

from unsloth import  FastLanguageModel
import torchMODEL = "unsloth/Qwen3-14B"
model,tokenizer = FastLanguageModel.from_pretrained(model_name=MODEL,max_seq_length=2048,dtype=None,load_in_4bit=True,full_finetuening=False
)

LoRA的配置

使用LoRA进行微调，通过Unsloth的PEFT指定模型、LORA的低秩序矩阵（r），微调的层等等。

model = FastLanguageModel(model,targe_mod

查看全文

http://www.xdnf.cn/news/489799.html

一个批量文件Dos2Unix程序（Microsoft Store，开源）1.1.0 编码检测和预览

淘宝扭蛋机系统开发前景分析：解锁电商娱乐化新蓝海

HOW - React NextJS 的同构机制

Dify中使用插件LocalAI配置模型供应商报错

Spring Cloud深度实践：从服务发现到弹性智能API网关全景解析

Day29 -JS开发02 -两个实例：dom树（存在dom-xss）加密及基础的js逆向（明文加密）

SAP-ABAP：SAP DMS（文档管理系统）的详细说明，涵盖其核心功能、架构、配置及实际应用

spring学习-＞sprintboot

Room数据库

Matrix-Game：键鼠实时控制、实时生成的游戏生成模型（论文代码详细解读）

Java并发编程-线程池（四）

Reth（冗余以太网接口）和Bridge-Aggregation（链路聚合接口）区别

一个进程中可以有多个 WebView2 控件，它们各自有独立的用户数据目录,COOKIE共享

内存泄漏系列专题分析之十六：高通相机CamX内存泄漏内存占用分析--chi-cdk部分ION内存拆解方法

深入探索Java微服务架构：Spring Cloud与Kubernetes的整合实践

敏感数据加密和模糊匹配

使用CherryStudio +SiliconFlow 部署独立的deepseek+知识库

文本数据词汇级增强

Python 之类型注解

MCU开发学习记录16* - 看门狗学习与实践(HAL库) - IWDG与WWDG -STM32CubeMX

java加强 -IO流

基于React的高德地图api教程005：圆形标记的绘制、删除、修改

【AI学习】AI大模型技术发展研究月报的生成提示词

【Linux】序列化与反序列化、会话与进程组、守护进程

投影仪基础知识及选购方向小记③

曝光融合(Exposure Fusion)

Fine-tune Qwen3（100% locally）

load model

LoRA的配置

相关文章：