当前位置：首页 > backend >正文

快速上手 Ollama：强大的开源语言模型框架

backend 2025/8/12 21:30:39

Ollama：打造本地化大语言模型体验

一、项目简介

Ollama 是一个开源框架，致力于帮助开发者快速上手并使用各种大型语言模型（Large Language Models）。通过 Ollama，用户不仅可以轻松运行不同版本的模型，还能实现模型的定制和扩展，适应多样化的需求和场景。

无论您是开发应用程序、进行自然语言处理研究，还是想要建立自己的 AI 聊天机器人，Ollama 都能为您提供强大且灵活的支持。

1.1 兼容平台

Ollama 支持多种操作系统的安装，包括 macOS、Windows 和 Linux。

macOS: 下载链接
Windows: 下载链接
Linux: 使用以下命令安装：
```
curl -fsSL https://ollama.com/install.sh | sh
```
手动安装说明
Docker: 官方的 Ollama Docker 镜像。

1.2 相关库

ollama-python
ollama-js

二、快速启动指南

以下命令用于运行并与 Gemma 3 模型进行对话：

ollama run gemma3

三、模型库

Ollama 提供丰富的模型库，支持多种大型语言模型，详细信息请访问：Ollama 模型库。

模型	参数	大小	下载命令
Gemma 3	1B	815MB	`ollama run gemma3:1b`
Gemma 3	4B	3.3GB	`ollama run gemma3`
Gemma 3	12B	8.1GB	`ollama run gemma3:12b`
QwQ	32B	20GB	`ollama run qwq`
DeepSeek-R1	7B	4.7GB	`ollama run deepseek-r1`

注意：运行 7B 模型至少需要 8GB 的 RAM，运行 13B 模型需要 16GB，运行 33B 模型需要 32GB。

四、模型定制

4.1 从 GGUF 导入模型

Ollama 支持从 GGUF 模型文件导入自定义模型。步骤如下：

创建文件 Modelfile，添加指向本地模型的路径：
```
FROM ./vicuna-33b.Q4_0.gguf
```
在 Ollama 中创建该模型：
```
ollama create example -f Modelfile
```
运行模型：
```
ollama run example
```

4.2 自定义提示

可以通过给模型自定义提示，来改变模型的行为。例如，针对 llama3.2 模型进行自定义：

ollama pull llama3.2

在 Modelfile 中设置参数和系统消息：

FROM llama3.2
PARAMETER temperature 1
SYSTEM """
You are Mario from Super Mario Bros. Answer as Mario, the assistant, only.
"""

创建并运行模型：

ollama create mario -f ./Modelfile
ollama run mario

五、命令行引用

5.1 创建模型

使用 ollama create 命令创建模型：

ollama create mymodel -f ./Modelfile

5.2 拉取模型

执行指令以拉取或更新本地图书馆中的模型：

ollama pull llama3.2

5.3 删除模型

要删除模型，可以使用命令：

ollama rm llama3.2

5.4 显示模型信息

查询特定模型的详细信息：

ollama show llama3.2

5.5 列出所有模型

查看计算机上已安装的所有模型：

ollama list

六、REST API

Ollama 提供 REST API 来运行和管理模型。可以通过 API 生成回答或与模型进行对话。

6.1 生成响应

curl http://localhost:11434/api/generate -d '{"model": "llama3.2","prompt":"Why is the sky blue?"
}'

6.2 与模型交谈

curl http://localhost:11434/api/chat -d '{"model": "llama3.2","messages": [{ "role": "user", "content": "why is the sky blue?" }]
}'

七、社区集成与应用场景

Ollama 通过丰富的社区集成工具，为用户提供了多种应用方案，包括：

Web & Desktop: 集成各种前端应用。
命令行工具: 使用 Ollama API 构建本地应用以及自定义的命令行工具。
Mobile: 在 iOS 和 Android 上构建适配的客人应用。
Extensions & Plugins: 提供多种浏览器插件和编辑器扩展使得 Ollama 跨场景应用更为便捷。

例如，您可以通过开源项目 Chatbot UI 构建聊天机器人，或使用 Ollama-SwiftUI 在 macOS 上构建原生应用。

八、同类项目介绍

除了 Ollama 之外，还有其他一些相关的开源项目值得关注：

Hugging Face Transformers: 提供多种预训练模型，支持任务包括文本分类、生成与翻译等。
Rasa: 开源的对话式 AI 项目，专注于构建聊天机器人。
LangChain: 用于构建基于大型语言模型的应用框架，通过可组合性满足多种需求。

Ollama 正在成为一个强大的工具，通过其开放性和灵活性，为开发者提供了丰富的可能性。如果您对大型语言模型应用感兴趣，Ollama 是一个不容错过的选择。

查看全文

http://www.xdnf.cn/news/17262.html

GitLab同步提交的用户设置

论文reading学习记录7 - daily - ViP3D

日本站群服务器与普通日本服务器对比

Spring AMQP 入门与实践：整合 RabbitMQ 构建可靠消息系统

【接口自动化测试】---requests模块

SpringBoot的profile加载

可编辑51页PPT | 某鞋服品牌集团数字化转型项目建议书

微服务如何保证系统高可用？

iOS 签名证书全流程详解，申请、管理与上架实战

腾讯iOA:数据安全的港湾

0_外设学习_ESP8266+云流转（no 0基础）

最新的GPT5效果如何，我试了一下（附加GPT5大模型免费使用方法）

力扣-189.轮转数组

秋招笔记-8.8

《Leetcode》-面试题-hot100-链表

django uwsgi启动报错failed to get the Python codec of the filesystem encoding

Android 系统的安全和三星安全的区别

C++信息学奥赛一本通-第一部分-基础一-第3章-第1节

RAG初步实战：从 PDF 到问答：我的第一个轻量级 RAG 系统（附详细项目代码内容与说明）

2025年渗透测试面试题总结-07（题目+回答）

系统网络端口安全扫描脚本及详解

Chrome与Firefox浏览器安全运维配置命令大全：从攻防到优化的专业实践

分治-快排-215.数组中的第k个最大元素-力扣(LeetCode)

【Linux】从零开始：RPM 打包全流程实战万字指南（含目录结构、spec 编写、分步调试）

Android 的CameraX的使用(配置，预览，拍照，图像分析，录视频)

使用Python提取PDF大纲（书签）完整指南

持中文的 TXT 合并 PDF 工具 —— GUI + ReportLab 实战

Emacs 折腾日记(二十九)—— 打造C++ IDE

使用 Grunt 替换 XML 文件中的属性值

亚马逊跨类目铺货广告运营：从粗放投放to智能提效的省力法则