当前位置: 首页 > ops >正文

DeepSeek-R1-0528-Qwen3-8B 本地ollama离线运行使用和llamafactory lora微调

参考:
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
在这里插入图片描述
量化版本:
https://huggingface.co/unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUF
https://docs.unsloth.ai/basics/deepseek-r1-0528-how-to-run-locally
在这里插入图片描述
在这里插入图片描述

1、ollama运行

升级ollama版本到0.9.0

支持直接下载:Ollama拉取huggingface社区或modelscope社区的GGUF模型并部署
https://blog.csdn.net/qq_39780701/article/details/144522063

http://www.xdnf.cn/news/10001.html

相关文章:

  • 从零打造算法题刷题助手:Agent搭建保姆级攻略
  • Shopify 主题开发:页脚信息架构搭建技巧
  • 什么是内网ip证书
  • 网络安全基础--第九天
  • 核心机制:确认应答和超时重传
  • 5G 核心网中 AMF 的 NAS SM 信令路由详解
  • 动态报表筛选多项时的优化处理
  • 大模型-attention汇总解析之-MQA
  • (11)-java+ selenium->元素定位之By_tag_name
  • 编译器优化和实例
  • Haproxy搭建Web集群
  • 常见跨域问题解决
  • Flask项目进管理后台之后自动跳回登录页面,后台接口报错422,权限问题
  • Docker Compose使用自定义用户名密码启动Redis
  • 通过实时动作捕捉加速人形机器人训练
  • 力扣HOT100之动态规划:198. 打家劫舍
  • 循环神经网络(RNN):为什么它能处理时序数据?它真的能减轻过拟合吗?
  • Go语言defer关键字:延迟执行的精妙设计
  • 通用的防御框架,用于抵御(多模态)大型语言模型的越狱攻击
  • MQTT协议,EMQX部署,MQTTX安装学习
  • golang连接sm3认证加密(app)
  • BioID技术在宿主-病原体相互作用领域的应用
  • 《操作系统真相还原》——大战MBR
  • 数据结构——图
  • 大语言模型 24 - MCP 自动操作 提高模型上下文能力 Cursor + Sequential Thinking Server Memory
  • 云游戏混合架构
  • 【机械视觉】Halcon—【六、交集并集差集和仿射变换】
  • AI Agent开发入门笔记(1)
  • C++ 实现 std::move_only_function
  • DeepSeek R1 模型小版本升级,DeepSeek-R1-0528都更新了哪些新特性?