当前位置: 首页 > backend >正文

把llamafacoty微调后的模型导出ollama模型文件

按照llama.cpp.git

git clone https://github.com/ggml-org/llama.cpp.git

安装依赖

  • 根据自己情况,觉得是否需要创建虚拟环境
cd llama.cpp/gguf-pypip install --editable .

开始转换

python convert_hf_to_gguf.py xxxx(llamafacoty微调后模型地址) --outtype q8_0(量化为8)

等待转换完成即可

在ollama中使用

创建Modelfile

FROM /models/Lora-Q8-15B-Q8_0.ggufPARAMETER temperature 0.7
PARAMETER num_ctx 32768
PARAMETER num_predict 512TEMPLATE """<|im_start|>system
{{ .System }}<|im_end|>
<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""PARAMETER stop "<|im_start|>"
PARAMETER stop "<|im_end|>"
PARAMETER stop "<|endoftext|>"
PARAMETER stop "<|eot|>"PARAMETER seed 42
  • 每一种模型的模板文件都有差异,上面文件仅供参考,如果你发现ollama加载后的模型胡说八道极大可能是modelfile文件有问题

注册到ollama

ollama create qwen3:14b-ZB-Q8 -f Modelfile
  • qwen3:14b-ZB-Q8 模型的名字,可以自定义

运行模型

ollama run qwen3:14b-ZB-Q8 
http://www.xdnf.cn/news/18906.html

相关文章:

  • 【前端教程】JavaScript入门核心:使用方式、执行机制与核心语法全解析
  • Oracle 数据库权限管理的艺术:从入门到精通
  • 目标检测领域基本概念
  • 第6篇:链路追踪系统 - 分布式环境下的请求跟踪
  • JSP程序设计之JSP指令
  • 【Python】QT(PySide2、PyQt5):Qt Designer,VS Code使用designer,可能的报错
  • Java学习笔记之——通过分页查询样例感受JDBC、Mybatis以及MybatisPlus(一)
  • 上海控安:汽车API安全-风险与防护策略解析
  • Java 实现HTML转Word:从HTML文件与字符串到可编辑Word文档
  • Nginx + Certbot配置 HTTPS / SSL 证书(简化版已测试)
  • 机器视觉学习-day07-图像镜像旋转
  • 【Deepseek】Windows MFC/Win32 常用核心 API 汇总
  • 【PyTorch】基于YOLO的多目标检测项目(一)
  • 【Redis】数据分片机制和集群机制
  • 【Java SE】基于多态与接口实现图书管理系统:从设计到编码全解析
  • C/C++---前缀和(Prefix Sum)
  • 微服务的编程测评系统17-判题功能-代码沙箱
  • MQTT broker 安装与基础配置实战指南(一)
  • 题目—移除元素
  • PyTorch中的激活函数
  • AI需求优先级:数据价值密度×算法成熟度
  • HSA35NV001美光固态闪存NQ482NQ470
  • 达可替尼-
  • SpringBoot整合RabbitMQ:从消息队列基础到高可用架构实战指南
  • 浏览器网页路径扫描器(脚本)
  • 改造thinkphp6的命令行工具和分批次导出大量数据
  • MySQL 基础:DDL、DML、DQL、DCL 四大类 SQL 语句全解析
  • K8s 二次开发漫游录
  • 了解CDC(变更数据捕获)如何革新数据集成方式
  • Spring Security 深度学习(一): 基础入门与默认行为分析