当前位置: 首页 > java >正文

ReAct模式解读

1、概述

ReAct = Reasoning(思考)+ Acting(行动)

让AI像人类一样:先想一想(Reason),再做一件事(Act),做完事再想一想,循环往复,直到解决问题。

核心思想:

不要让AI直接猜答案,而是让它:

  • 思考(Reason):分析问题、制定计划、反思结果
  • 行动(Act):调用工具(如搜素、计算、数据库)
  • 循环:根据行动结果,再思考,再行动

2、ReAct vs 传统AI

对比项传统方式(直接回答)ReAct 模式
过程输入 → 直接输出答案输入 → 思考 → 行动 → 思考 → 行动 → 输出
可解释性黑箱,不知道怎么想的白箱,能看到每一步思考
准确性容易“幻觉”瞎猜基于事实行动,更准确
工具使用不会主动调用工具主动调用 API、搜索、计算等
错误恢复答错了就错了行动失败后会反思并调整

3、ReAct典型步骤

(1)核心循环

Think -> Act -> Observe -> Think ...

一个典型的ReAct交互流程:

1. 🤔 Reason (思考): "我需要查一下北京今天的天气"
2. 🛠  Act   (行动): 调用 weatherAPI.getWeather("北京")
3. 👁  Observe (观察): 返回 {"city": "北京", "temp": "25°C", "condition": "晴"}
4. 🤔 Reason: "北京今天晴,25度,适合户外"
5. 🛠  Act: 无(问题已解决)
6. ✅ Answer: "北京今天晴,25度,适合户外活动。"

这个循环可以多次执行,直到问题解决

(2)典型步骤

1)Step 1:Reasoning(推理)

AI开始思考:

  • “用户问了什么?”
  • “我需要哪些信息?”
  • “我可以调用什么工具?”
  • “下一步该做什么?”

示例输出:我需要查询北京的天气,可以调用天气 API。

2)Step 2:Acting(行动)

AI 决定调用一个工具:

  • 调用 search(query) 搜索网页
  • 调用 calculate(expr) 计算数学
  • 调用 database.query(sql) 查数据库
  • 调用 python(code) 执行代码

格式通常是结构化的,比如:

{"action": "weather_api","action_input": "北京"
}

3)Step 3:Observe(观察)

系统执行工具调用,拿到结果,返回给AI,比如:

{"observation": "北京,25°C,晴"
}

4)Step 4:继续Reasoning

AI看到结果后继续思考:"我拿到了天气数据,现在可以回答用户了。"

或者如果结果不完整:

”温度是25度,但用户可能想知道是否适合穿短袖,我需要补充穿衣建议。“

5)Step 5:Final Answer(最终回答)

当AI认为问题已解决,输出最终答案给用户

4、ReAct优势

优势说明
✅ 减少幻觉AI 不再瞎猜,而是基于真实工具返回的数据回答
✅ 可解释性强你能看到 AI 的“思考过程”,像看侦探破案
✅ 能解决复杂问题可以多步推理 + 多次调用工具(如先搜索,再计算)
✅ 可调试如果答案错了,可以看是哪一步出问题
✅ 支持工具扩展可以接入搜索、数据库、代码执行、API 等

5、ReAct所需的技术组件

组件说明
LLM(大模型)负责推理和决策(如 GPT、通义千问)
Tool Calling(工具调用)定义工具接口,让 LLM 知道能调用什么
Action Parser解析 LLM 输出的 action(如 JSON)
Observation Handler执行工具并返回结果
Loop Controller控制最大步数,防止无限循环
Prompt Engineering设计提示词,引导 LLM 按 ReAct 格式输出

6、ReAct的典型Prompt模板

你可以使用以下工具:- search(query): 搜索网页
- calculate(expr): 计算数学表达式
- get_weather(city): 获取天气使用格式:Thought: 你正在想什么
Action: 要执行的工具
Action Input: 工具参数
Observation: 工具返回结果
...(可以重复)
Thought: 我现在可以回答了
Final Answer: 最终答案

http://www.xdnf.cn/news/19985.html

相关文章:

  • Linux 编译 Android 版 QGroundControl 软件并运行到手机上
  • 东土正创AI交通服务器再获北京市批量应用订单
  • Agent Prompt工程:如何让智能体更“听话”?(实践指南)
  • 20250904 10:45_排查10.1.3.35新QMS系统RMAN备份失败问题(优化脚本里的环境配置,增加了check_oracle_env 函数)
  • openai-python v1.104.2版本发布:修复Web搜索工具类型别名问题
  • uni-app iOS 上架常见问题与解决方案,实战经验全解析
  • 2025数学建模国赛高教社杯C题思路代码文章助攻
  • Java对接Kafka的三国演义:三大主流客户端全景评测
  • 25高教社杯数模国赛【C题国一学长思路+问题分析】第二弹
  • 以数据与自动化驱动实验室变革:智能化管理整体规划
  • 救命!Shell用了100次还不懂底层?爆肝300行代码从0造“壳”,fork/exec/重定向全扒光,Linux系统编程直接开挂!
  • 【面试题】Prompt是如何生成的,优化目标是什么,任务是什么?
  • 服务器监控不用盯屏幕:Ward+Cpolar让异常告警主动找到你
  • Cursor 辅助开发:快速搭建 Flask + Vue 全栈 Demo 的实战记录
  • C4.5决策树(信息增益率)、CART决策树(基尼指数)、CART回归树、决策树剪枝
  • 《ConfigMap热更新失效的深度解剖与重构实践》
  • 题解 洛谷P13778 「o.OI R2」=+#-
  • STM32 - Embedded IDE - GCC - 如何将编译得到的.bin固件添加CRC32校验码
  • 数智管理学(四十八)
  • CodeBuddy+Lucene 探索与实践日志:记录我如何从零构建桌面搜索引擎
  • 前端开发的“三剑客”—— ​​HTML、CSS、JavaScript​​
  • LeetCode 524.通过删除字母匹配到字典里最长单词
  • More Effective C++ 条款25:将构造函数和非成员函数虚拟化
  • upload-labs通关笔记-第17关文件上传之二次渲染png格式(PHP脚本法)
  • 使用Java定时爬取CSDN博客并自动邮件推送
  • linux---------------网络基础概念
  • 不同数据类型for循环
  • 软件测试基础知识(数据库篇)
  • 轻松Linux-6.基础IO
  • redis中查询key是否存在的命令