当前位置: 首页 > news >正文

Ollama 安装 QWen3 及配置外网访问指南

一、Ollama 安装 QWen3

安装步骤

  1. 首先尝试运行 QWen3 模型:

    ollama run qwen3

  2. 如果遇到版本不兼容错误(Error 412),表示需要升级 Ollama:

    curl -fsSL https://ollama.com/install.sh | sh

  3. 验证版本:

    ollama -v

    确保为最新版本 0.6.6。

常见问题解决

问题:反复出现版本不兼容警告

解决方案

  1. 完全卸载旧版本:

    # 停止 Ollama 服务
    pkill -f ollama
    ​
    # 删除主程序
    sudo rm -f /usr/local/bin/ollama
    ​
    # 清除数据和模型(注意这会删除所有已下载模型)
    rm -rf ~/.ollama

  2. 重新安装最新版:

    curl -fsSL https://ollama.com/install.sh | sh

  3. 确认版本:

    ollama -v

二、配置外网访问

使用 ngrok 暴露服务

  1. 安装 ngrok:

    curl -sSL https://ngrok-agent.s3.amazonaws.com/ngrok.asc | \sudo tee /etc/apt/trusted.gpg.d/ngrok.asc >/dev/null && \echo "deb https://ngrok-agent.s3.amazonaws.com buster main" | \sudo tee /etc/apt/sources.list.d/ngrok.list && \sudo apt update && \sudo apt install ngrok

  2. 配置认证令牌(从 ngrok 官网获取):

    ngrok config add-authtoken <你的TOKEN>

  3. 启动端口转发:

    ngrok http 11434 --url https://xxxx.ngrok-free.app

正常会出现以下信息:

验证外网访问

使用获得的 ngrok URL(如 https://xxxx.ngrok-free.app)测试 API:

curl https://xxxx.ngrok-free.app/api/generate -d '{"model": "qwen3","prompt": "你好,你是谁?","stream": false
}'

注意事项

  1. 安全警告:直接暴露 Ollama 到公网存在风险,建议:

    • 添加身份验证

    • 限制访问IP

    • 仅在内网使用或通过VPN访问

  2. 性能考虑:通过 ngrok 的免费隧道有带宽限制,对于大模型响应可能较慢

  3. 备选方案:可以考虑使用 Cloudflare Tunnel 或其他内网穿透工具替代 ngrok

  4. 服务管理:对于生产环境,建议配置 ngrok 为系统服务:

    sudo systemctl enable ngrok
    sudo systemctl start ngrok

如需更长期稳定的域名,建议升级 ngrok 付费计划或使用自有域名配置。

http://www.xdnf.cn/news/239941.html

相关文章:

  • 近期汇报
  • springboot框架常用配置
  • 在柯希霍夫积分法偏移成像中,消除数据采集和地下构造(如深浅孔径差异)导致的叠加次数不均匀会引起成像剖面强度差异
  • 【STM32单片机】#11.5 I2C通信(硬件读写)
  • TM1668芯片学习心得三
  • Qwen3-32B的幻觉问题
  • Windows系统安装Docker(Win10系统升级,然后安装)
  • UE 像素和线框盒子 材质
  • 【AI图像创作变现】08 变现渠道—间接获客:让客户主动找上门
  • 广州创科——湖北房县汪家河水库除险加固信息化工程
  • 【Android】轻松实现实时FPS功能
  • [Survey] Image Segmentation in Foundation Model Era: A Survey
  • AI赋能烟草工艺革命:虫情监测步入智能化时代
  • MySQL中ROW_NUMBER() OVER的用法以及使用场景
  • 【Java函数式编程-58.1】深入理解Java中的Consumer函数式接口
  • 冠军之选,智启未来——解码威码逊的品牌传奇与冠军代言故事
  • 客户联络中心如何进行能力建设?
  • 【SAM2代码解析】数据集处理3--混合数据加载器(DataLoader)
  • 中国县级2m精度耕地分布数据(2020年)
  • 深度学习概述
  • Silo 科学数据工具库安装与使用指南
  • 【closerAI ComfyUI】开源社区炸锅!comfyUI原生支持Step1X-Edit 图像编辑!离简单免费高效又进一步
  • 关键词排名工具查到的位置和真实搜索差距大是什么原因?
  • SpringBoot优雅关机
  • MicroPython 开发ESP32应用教程 之 ADC及应用实例:电池电量检测并显示
  • HarmonyOS NEXT应用开发-Notification Kit(用户通知服务)notificationManager.cancelAll
  • ComfyUI
  • 国标GB28181平台EasyGBS未来研发方向在哪?
  • 数字中国开新篇,数智化为何需要新引擎
  • SLAM中的状态估计理论:从基础到前沿的完整解析