当前位置：首页 > java >正文

在Window10 和 Ubuntu 24.04LTS 上 Ollama 在线或离线安装部署

java 2025/7/4 12:56:41

Ollama 是一个开源的大型语言模型（LLM）服务框架，旨在通过轻量化、跨平台的设计，简化大模型在本地环境中的部署与应用。其基于 Go 语言开发，通过 Docker 容器化技术封装模型运行环境，提供类似命令行工具的交互体验（如 pull、run 等指令），支持用户在 Windows、Linux、macOS 甚至树莓派等设备上快速启动 qwen3、deepseek 等主流开源模型。

官方网址：https://ollama.com/

开源仓库： https://github.com/ollama/ollama

离线安装包下载地址：https://github.com/ollama/ollama/releases

#  ollama 常用命令：
## 启动Ollama服务
ollama serve
## 从模型文件创建模型
ollama create
## 显示模型信息
ollama show
## 运行模型
ollama run 模型名称 ( ollama run --verbose <模型名称> )
## 从注册表中拉去模型
ollama pull 模型名称
## 将模型推送到注册表
ollama push
## 列出模型
ollama list
## 复制模型
ollama cp
## 删除模型
ollama rm 模型名称
## 获取有关Ollama任何命令的帮助信息
ollama help

一、Window10 安装 Ollama 并配置模型存放盘符

Windows版本下载地址：https://ollama.com/download/OllamaSetup.exe

Windows版本 Ollama 通常的 .exe 格式的安装程序，直接点击下载。然后，双击运行，根据提示一步一步安装即可。

1.1 修改模型安装位置（默认C盘）

默认位置：C:\Users\%username%\.ollama\models 。如果你的C盘磁盘容量不够，可以修改环境变量，在“新建系统变量”窗口中，输入变量名OLLAMA_MODELS，变量值为你希望的模型存储路径（例如F:\ollama\models）。重启电脑后即刻生效。

二、在 Ubuntu24.04 LTS 上 Ollama 在线安装部署

选择合适自己的主机的安装包，查看系统架构：lscpu ；如果是 x86_64 （Intel/AMD）：下载 ollama-linux-amd64.tgz ；如果你的系统是 ARM64 架构：ollama-linux-arm64.tgz 。

在线命令安装（需要机子能访问互联网）：

curl -fsSL https://ollama.com/install.sh | sh

# 启动ollamasystemctl start ollama
# 查询ollama状态systemctl status ollama
# 重启服务systemctl daemon-reloadsystemctl restart ollama# 启用开机自启动systemctl enable ollama

三、在 Ubuntu24.04 LTS 上 Ollama 离线安装部署

# 将下载好的安装包进行解压，解压到/usr，解压命令：
sudo tar -C /usr -xzf ollama-linux-amd64.tgz# 然后为解压的文件添加权限：
sudo chmod +x /usr/bin/ollama# 创建 ollama 用户组和用户：
sudo useradd -r -s /bin/false -m -d /data/ollama ollama

参数解释：
• -r：创建系统用户。
• -s /bin/false：禁止该用户登录。
• -d /data/ollama：指定用户主目录（存放模型文件）

# 创建系统文件并配置信息：
sudo vim /etc/systemd/system/ollama.service# 配置信息如下：[Unit]
Description=Ollama Service
After=network-online.target
[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
# 自定义端口
Environment="OLLAMA_HOST=0.0.0.0:11434"
#代表让ollama能识别到第几张显卡
Environment="CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7"
#这几张卡均衡使用
Environment="OLLAMA_SCHED_SPREAD=1" 
#模型一直加载, 不自动卸载
Environment="OLLAMA_KEEP_ALIVE=-1" 
#配置跨域请求
Environment="OLLAMA_ORIGINS=*"
#配置OLLAMA的模型存放路径，默认路径是/usr/share/ollama/.ollama/models/
Environment="OLLAMA_MODELS=/data/ollama/.ollama/models"
[Install]
WantedBy=default.target

完成之后，执行命令：

# 启动ollamasystemctl start ollama
# 查询ollama状态systemctl status ollama
# 重启服务systemctl daemon-reloadsystemctl restart ollama# 启用开机自启动systemctl enable ollama

查看 ollama 是否安装成功，查看版本：

ollama -version

四、利用 Docker 安装 ollama

# 拉取 ollama 的镜像，拉取命令：
docker pull ollama/ollama# 拉取完成后，需要创建容器来运行 ollama，如果你电脑没有 GPU，则使用cpu版本命令：docker run -dit --name ollama11434 -p 11434:11434 ollama/ollama
# 用 GPU 版本(需要显卡与容器驱动支持)，命令如下：docker run -dit --name ollama11434 --gpus all -p 11434:11434 ollama/ollama# 参数：-p 11436:11434 将容器的 11434 端口映射到宿主机的 11436 端口# 创建好容器后，需要进入 Docker 容器，进入容器后，执行ollama相关命令即可docker exec -it ollama11434 bash

--------------------------------------

没有自由的秩序和没有秩序的自由，同样具有破坏性。