当前位置: 首页 > ds >正文

基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API

前言

Spring AI Alibaba 开源项目基于 Spring AI 构建,是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践,提供高层次的 AI API 抽象与云原生基础设施集成方案,帮助开发者快速构建 AI 应用。

  1. 项目地址

gitcode平台:https://gitcode.com/Var_ya/springAI_ollama_chatInterfaceApi

  1. 核心技术官网地址

Spring AI Alibaba 官网地址:https://java2ai.com/

**knife4j官网地址: **https://doc.xiaominfo.com/

ollama官网地址:https://ollama.com/

一、技术选型说明

1. 核心组件

  • Spring Boot 3.4.5:后端服务基础框架
  • spring-ai-ollama-spring-boot-starte:alibaba官方AI集成框架(1.0.0-M6版本)
  • knife4j 4.5.0:可视化展示后端接口页面
  • Ollama:本地大模型运行环境(支持Llama2、Mistral等模型)

2. 环境要求

  • JDK 17+
  • 8GB+ 内存(运行大模型需要)
  • ollama version is 0.5.13

二、环境准备

1. 安装Ollama

  1. Ollama官网安装

官网地址:https://ollama.com/

官网下载window版本地址:https://ollama.com/download

  1. 百度网盘下载安装

百度网盘地址:https://pan.baidu.com/s/1mx_3R4NVjOSC9D8BaGdYHg?pwd=9eg7

  1. 运行OllamaSetup安装包
  • 双击OllamaSetup.exe
  • 安装包点击:Install

  • 安装成功
    (截图示例:终端执行ollama --version

2. 下载模型

本教程使用的模型:deepseek-r1:8b

模型运行下载命令:ollama run deepseek-r1:8b

ollama run deepseek-r1:8b

2. 模型运行效果


三、创建Spring Boot项目

注意 :类型修改为:Maven

1. 项目初始化

使用start.spring.io创建项目:

  • 添加依赖:
    • Spring Web
    • spring-ai-ollama-spring-boot-starter
    • knife4j-openapi3-jakarta-spring-boot-starter

2. 配置核心POM.xml

<dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency>
<!--		阿里巴巴ollama--><dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-ollama-spring-boot-starter</artifactId><version>1.0.0-M6</version></dependency><!-- Swagger3-knife4j依赖 --><dependency><groupId>com.github.xiaoymin</groupId><artifactId>knife4j-openapi3-jakarta-spring-boot-starter</artifactId><version>4.5.0</version></dependency></dependencies>

四、配置Ollama连接

application.yml

server:port: 9999
spring:ai:ollama:base-url: http://localhost:11434 # 哦llama地址chat:model: deepseek-r1:7b # 模型options:temperature: 0.8 # 温度越高,回答越有创意top-p: 0.9 # 数值越高,回答越多样top-k: 100 # 数值越高,回答越多样# knife4j的增强配置,不需要增强可以不配
knife4j:enable: true    # 开启knife4j,无需添加@EnableKnife4j注解setting:language: zh_cn   #中文#  swagger-model-name: 实体列表   #默认为: Swagger Modelsbasic: # 开启Swagger的Basic认证功能,默认是falseenable: falseusername: varyapassword: varya

五、编写AI对话接口

1. 创建Controller


package cn.varin.springai_ollama_chatinterfaceapi.controller;import io.swagger.v3.oas.annotations.Operation;
import io.swagger.v3.oas.annotations.tags.Tag;
import jakarta.servlet.http.HttpServletResponse;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.servlet.mvc.method.annotation.SseEmitter;
import reactor.core.publisher.Flux;import org.springframework.ai.chat.client.ChatClient;
import org.springframework.ai.chat.client.advisor.SimpleLoggerAdvisor;
import org.springframework.ai.chat.model.ChatModel;
import org.springframework.ai.ollama.api.OllamaOptions;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;import java.io.IOException;
import java.util.stream.Stream;@RestController
@Tag(name="客户端实例")@RequestMapping("/client")
public class OllamaChatClientController {private static final String DEFAULT_PROMPT = "你好,介绍下你自己!请用中文回答。";private final ChatClient ollamaiChatClient;public OllamaChatClientController(ChatModel chatModel) {// 构造时,可以设置 ChatClient 的参数this.ollamaiChatClient = ChatClient.builder(chatModel)// 实现 Logger 的 Advisor.defaultAdvisors(new SimpleLoggerAdvisor())// 设置 ChatClient 中 ChatModel 的 Options 参数.defaultOptions(OllamaOptions.builder().topP(0.7).model("deepseek-r1:1.5b").build()).build();}/*** ChatClient 简单调用*/@Operation(summary = "无参数调用")@GetMapping("/simple/chat")public String simpleChat() {return ollamaiChatClient.prompt(DEFAULT_PROMPT).call().content();}/*** ChatClient 流式调用*/@Operation(summary = "流式调用")@GetMapping("/stream/chat")public Flux<String> streamChat1(@RequestParam String message) {return ollamaiChatClient.prompt(message).stream().content();}@GetMapping("/stream")public SseEmitter streamChat2(@RequestParam String message) {SseEmitter emitter = new SseEmitter();Flux<String> content = ollamaiChatClient.prompt(message).stream().content();try {emitter.send(content);System.out.println(emitter.toString());} catch (IOException e) {throw new RuntimeException(e);}return emitter;}}

2. 支持流式响应(可选)

	/*** ChatClient 流式调用*/@Operation(summary = "流式调用")@GetMapping("/stream/chat")public Flux<String> streamChat1(@RequestParam String message) {return ollamaiChatClient.prompt(message).stream().content();}

六、knife4j测试接口

访问Url:http://localhost:9999/doc.html

1. 无参数接口测试

接口:/client/simple/chat

2. 流式调用接口测试

接口:/client/stream/chat


七、扩展功能建议

  1. 多模型切换:通过@RequestParam动态选择模型
  2. 对话历史管理:使用Redis存储上下文
  3. 速率限制:添加Bucket4j限流
  4. API鉴权:集成Spring Security

八、常见问题排查

问题现象解决方案
连接Ollama超时确认ollama serve正在运行
模型加载失败检查ollama list确认模型存在
内存不足尝试更小参数的模型版本

九、项目效果展示


十、总结

本文演示了如何通过:

  1. 本地部署Ollama服务
  2. Spring AI集成LLM能力
  3. 构建RESTful API接口

优势:数据隐私性强、无需API密钥、支持离线环境

完整代码示例:https://gitcode.com/Var_ya/springAI_ollama_chatInterfaceApi

http://www.xdnf.cn/news/2236.html

相关文章:

  • JAVA服务内存缓慢上涨,年轻代GC正常但Full GC频繁,如何定位?
  • IntelliJ IDEA修改实体类成员变量的名称(引入了该实体类的全部文件也会自动更新变量的名称)
  • 精益数据分析(25/126):关键指标驱动业务发展
  • GPT系列模型-20250426
  • Spring Boot 3.4 实战指南:从性能优化到云原生增强
  • 嵌入式C设计模式---策略模式
  • 跨境支付接口RT从300ms突增至2000ms,但CPU/Memory无异常,如何排查?
  • 测试模板x
  • 浏览器界面无显示,提示“代理服务器可能有问题”,这是怎么回事呢?
  • 在 Vue 3 setup() 函数中使用 TypeScript 处理 null 和 undefined 的最佳实践
  • Redis的两种持久化方式:RDB和AOF
  • WPF核心技术解析与使用示例
  • 【Redis】基础2:作为缓存
  • 力扣刷题Day 31:删除链表的倒数第N个结点(19)
  • Linux之netlink(2)libnl使用介绍(1)
  • 6.2 内容生成与营销:个性化内容创作与营销策略优化
  • WPF大数据展示与分析性能优化方向及代码示例
  • ASP.NET MVC​ 入门指南三
  • 【JavaEE】Spring AOP的注解实现
  • ApplicationRunner的run方法与@PostConstruct注解
  • RPCRT4!NdrConformantStructUnmarshall函数分析
  • 模拟地与数字地单点接地的原理
  • 深度解析APPSCAN漏洞扫描:从入门到实战的全流程指南
  • 如何使用URDF搭建双臂UR移动机器人,并在RViz中可视化
  • c++11 :智能指针
  • QCustomPlot QCPItemText文字框可拖动
  • 关于vant4的showImagePreview在使用时可能出现布局显示不正常、缩放后拖动失效问题的粗暴解决方案
  • Jetbrains和Webstorm中设置自定义指令右键快捷键(自定义外部工具)
  • 检测特权访问活动:一个新的 Kibana 集成
  • [C]基础13.深入理解指针(5)