当前位置: 首页 > backend >正文

Spring AI 1.0 GA 于 2025 年 5 月 20 日正式发布,都有哪些特性?

Spring AI 1.0 GA 于 2025 年 5 月 20 日正式发布,标志着 Spring 生态系统全面拥抱人工智能技术,
看看都有哪些更新


1. 统一的 ChatClient 接口

  • 多模型支持:通过 ChatClient 提供可移植的 API,支持调用 20 多个 AI 模型,包括 Anthropic、ZhiPu、DeepSeek、MiniMax 等,并兼容 OpenAI API 规范。用户可通过配置轻松切换不同模型。
  • 多模态与结构化输出:支持文本、图像、音频等多模态输入/输出(需底层模型支持),且响应可格式化为 JSON,便于程序处理。
  • 灵活配置:支持单模型全局配置或多模型按需调用(如通过 @Qualifier 注解指定模型)。

2. 检索增强生成(RAG)与向量存储

  • 向量数据库兼容性:提供可移植的向量存储抽象层,支持 Azure Cosmos DB、Weaviate、Pinecone、Redis 等 20 种向量数据库,并通过类 SQL 语法简化查询。
  • ETL 框架:内置轻量级 ETL 工具,支持从本地文件、S3、GitHub、Kafka 等来源提取数据,并自动分块、生成嵌入向量,简化 RAG 流程构建。
  • 模块化 RAG 管道:支持从简单的上下文注入(QuestionAnswerAdvisor)到复杂定制化流程(RetrievalAugmentationAdvisor)。

3. 对话记忆管理

  • 动态记忆存储:通过 ChatMemory 接口管理对话历史,支持滑动窗口(MessageWindowChatMemory)存储最近消息或向量搜索(VectorStoreChatMemoryAdvisor)从历史中检索语义相似内容。
  • 持久化支持:提供 JDBC、Cassandra、Neo4j 等存储实现,确保对话记录的长期保存与恢复。

4. 工具调用与扩展性

  • 自定义工具集成:通过 @Tool 注解定义工具函数(如查询天气、数据库操作),使 AI 模型能调用外部 API 或触发工作流,扩展应用场景。
  • 模型上下文协议(MCP):支持标准化工具交互协议,简化客户端与服务器的 MCP 集成,支持 OAuth 安全认证和 HTTP-SSE 端点。

5. 评估与可观测性

  • 内容质量评估:提供 RelevancyEvaluator(相关性验证)和 FactCheckingEvaluator(事实核查),结合小模型(如 Minicheck)降低验证成本。
  • 性能监控:集成 Micrometer 追踪模型延迟、Token 使用量、工具调用频率等指标,支持日志记录与分布式追踪(Micrometer Tracing)。

6. 其他关键改进

  • 工作流模式:支持路由(智能请求分发)、编排(动态任务分解)、并行化(批量调用聚合)等代理模式,简化复杂任务处理。
  • 云服务集成:与 AWS、Azure、Google Cloud 等云平台深度整合,提供企业级案例(如 Elasticsearch 向量存储、MongoDB RAG 应用)。
  • 移除千帆模型支持:因境外访问限制,移除了百度千帆模型的 SDK,仅保留 DeepSeek 和智普等国内模型。

总结

Spring AI 1.0 GA 通过标准化接口、模块化设计及丰富的生态集成,降低了企业构建 AI 应用的门槛。其核心优势在于可扩展性(多模型、多数据库支持)与生产就绪性(评估、监控、安全),为 Java 开发者提供了完整的 AI 开发生态。更多技术细节可参考官方文档及配套示例代码。

http://www.xdnf.cn/news/7949.html

相关文章:

  • 防火墙高可靠性
  • AI预测3D新模型百十个定位预测+胆码预测+去和尾2025年5月21日第84弹
  • nlohmann json:检查类型并取出数据
  • 【八股战神篇】Spring高频面试题汇总
  • 企业数字化转型是否已由信息化+自动化向智能化迈进?
  • YCKC【二分答案专题】题解
  • 关于C++使用位运算交换变量值的分析
  • Vue学习记录
  • docker面试题(5)
  • LeetCode 1004. 最大连续1的个数 III
  • PH热榜 | 2025-05-21
  • 影刀Fun叉鸟-打刀刀
  • PyTorch的基本操作
  • 5月21日星期三今日早报简报微语报早读
  • 架构的设计
  • WebGL2混合与雾
  • tshark的使用技巧(wireshark的命令行,类似tcpdump):转换格式,设置filter
  • ARM64虚拟地址到物理地址转换页表映射过程--基于crash
  • 系统工程与一般系统理论 | 技术 / 应用 / 跨领域认知融合
  • 《AI工程技术栈》:三层结构解析,AI工程如何区别于ML工程与全栈工程
  • 精益数据分析(75/126):用户反馈的科学解读与试验驱动迭代——Rally的双向验证方法论
  • PEFT库PromptTuningConfig 配置
  • HarmonyOS NEXT端云一体化工程目录结构
  • ping、tcpping、psping、paping、hping的区别
  • 堆排序的两种建堆方式
  • 各类时钟源对比
  • sqlalchemy常用的数据类型
  • 浅谈mRNA的量与蛋白表达量不线性相关的原因(二)
  • C语言接收数据、解析数据帧,解决丢包粘包问题
  • 深入理解用于中断控制的 NVIC 寄存器