当前位置: 首页 > java >正文

ubuntu ollama /Dify/Docker部署大模型

电脑需要显卡:

执行下载并安装:

curl -fsSL https://ollama.com/install.sh | sh

安装完后到Ollama Search 中查看ollama 可以部署的模型有哪些:

我选择gemma3,所以执行:

ollma pull gemma3:latest  这样就把gemma3:latest 模型下载到了本地

可以查看已经下载安装的大模型:ollama list

运行模型:

ollama run gemma3 或者 ollama run gemma3:latest

再执行:ctrl + d 退出对话

安装Dify:

AGI之路-ubuntu24安装docker部署dify接入ollama deepseekr1:14b - 知乎

Ubuntu 24.04 LTS 安装Docker_ubuntu24.04安装docker-CSDN博客

Doker 安装记得添加官方秘钥 以及配置国内源

git clone https://gitee.com/dify_ai/dify.git #使用国内地址,避免超时

cd dify/docker

cp .env.example .env

#运行dify
sudo docker compose up -d
查看dify日志
sudo docker compose logs -f

三 dify接入ollama准备工作

通过 systemd 服务文件配置环境变量
如果 Ollama 是通过 systemd 管理的服务,可以通过修改其服务文件来设置环境变量。
步骤:
使用 vim 编辑 Ollama 的 systemd 服务文件:

sudo vim /etc/systemd/system/ollama.service


在 [Service] 部分添加以下内容:

[Service]
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_PORT=11434"
编辑完成后,文件内容可能类似以下:
[Unit]
Description=Ollama Service
After=network.target
[Service]
ExecStart=/usr/bin/ollama
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_PORT=11434"
Restart=always
[Install]
WantedBy=multi-user.target


保存并退出 vim:
按 ESC 键退出编辑模式。
输入 :wq 保存并退出。
重新加载 systemd 配置并重启 Ollama:

sudo systemctl daemon-reload
sudo systemctl restart ollama


3. 验证配置
检查 Ollama 是否正在监听指定的 IP 和端口:
sudo netstat -tuln | grep 11434
如果配置成功,应该会看到类似以下的输出:
tcp 0 0 0.0.0.0:11434 0.0.0.0:* LISTEN
4. 通过 IP 访问
现在可以通过服务器的 IP 地址访问 Ollama,例如:
curl http://:11434

http://www.xdnf.cn/news/8572.html

相关文章:

  • 在单片机中如何在断电前将数据保存至DataFlash?
  • [docker]更新容器中镜像版本
  • Reason-ModernColBERT论文速览:Sentence- bert-基于孪生bert网络的句子嵌入
  • 【Web前端】jQuery入门与基础(一)
  • 【GESP】C++三级真题 luogu-B4039 [GESP202409 三级] 回文拼接
  • Python中tqdm进度条工具和enumerate函数的使用详解
  • 关于读取CH584单片机的IO电平出现到的乌龙
  • 从零开始:Python语言进阶之异常处理
  • vscode | Trae【实用插件】Remove empty lines 保存文件时删除空行
  • 2942. 查找包含给定字符的单词
  • 【Excel 扩展正则的能力】工作中赋予处理单元格文本的强大正则表达提取能力
  • R基于逻辑回归模型实现心脏病检测及SHAP值解释项目实战
  • R语言科研编程-标准偏差柱状图
  • A-Teacher: Asymmetric Network for 3D Semi-Supervised Object Detection
  • 传统医疗系统文档集中标准化存储和AI智能化更新路径分析
  • 曲面造型画图技能(1)标准曲面创建与基本操作
  • 嵌入大模型与LLM技术全面解析与实战指南
  • 前端表单中 `readOnly` 和 `disabled` 属性的区别
  • 由数据范围反推目标算法
  • 云计算,大数据,人工智能
  • 三种常见脉冲神经网络编码方式解读
  • << C程序设计语言第2版 >> 练习1-14 打印输入中各个字符出现频度的直方图
  • redis哨兵服务
  • ES 面试题系列「三」
  • ABP VNext + Orleans:Actor 模型下的分布式状态管理最佳实践
  • 如何利用夜莺监控对Redis Cluster集群状态及集群中节点进行监控及告警?
  • 怎样把B站的视频保存到本地
  • python学习打卡day35
  • 操作系统与底层安全
  • 跨链风云:打破区块链孤岛,实现价值自由流转