当前位置: 首页 > news >正文

李宏毅《生成式人工智能导论》 | 第9讲 AI Agent

文章目录

    • 大模型未来趋势:以大型语言模型打造的Agent
      • AI Agent运行的可能原理
      • 有记忆的ChatGPT

大模型未来趋势:以大型语言模型打造的Agent

人类需要做多步骤的复杂任务,AI可以做到这件事吗?

如果可以我们将其称为AI Agent,这里指AI可以做多步骤复杂任务,可以做计划能够修改计划。

目前已有的AI Agent例子

2022年7月,在ChatGPT之前,就有研究由语言模型操控机器人。

23年12月有人研究用大型语言模型开自驾车。

AI Agent运行的可能原理

理想中AI Agent应该具备的能力

Agent有一个终极目标,可能有记忆,记忆里存储过去和环境互动时获得的经验。

1.Agent从外界环境中了解外界的状态(比如通过文字输入、看见的图片、音频、触觉等)

2.根据终极目标、记忆和状态,Agent产生一个计划(短期目标)-达到终极目标之前,需要采取的行动

3.根据计划,Agent执行行为

4.Agent行动后,会对外界环境产生影响,会改变当前外界环境的状态。- 可以根据外界环境的状态学习到新的经验修改Agent的记忆,有可能修改原来的计划 - 可以通过反思修改原来的计划或者获取到新的经验(参考论文ReAcr和Reflexion)

具体的例子可以看老师的视频:https://www.bilibili.com/video/BV1XS411w7qr

当外界环境发生变化时,Agent产生新的行动计划

Agent反思之后,得到一些经验,经验会影响行动的决策。

有记忆的ChatGPT

有短期记忆的ChatGPT,ChatGPT没有长期记忆,只能记忆发生在同一个对话里的内容。如果开启新对话,ChatGPT不会有之前对话的记忆。

ChatGPT尝试去做有长期记忆,目前(25年6月)以已经实现了持久记忆功能Memory。持久记忆允许在不同会话之间保留信息,该功能支持的模型主要版本时GPT-4 Turbo(及以后)。

老师课程里介绍有记忆的ChatGPT可能的原理

当用户和ChatGPT对话结束后,ChatGPT可能会对对话的关键信息进行摘要,存储在记忆中。

当开启新对话时,过去对话的内容虽然不知道,但是根据记忆里的摘要信息可以知道之前对话的主要内容。

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与大语言模型(LLM)生成能力的技术架构,旨在通过动态引入外部知识提升模型回答的准确性、时效性,并减少“幻觉”(即模型虚构信息)问题

http://www.xdnf.cn/news/1129681.html

相关文章:

  • AI问答-Token:在人工智能领域,Token 是模型处理文本的核心单元 / 最小可处理片段
  • cursor使用mcp连接mysql数据库,url方式
  • 基于Python的图像文字识别系统
  • Transformer是什么 - 李沐论文《Attention Is All You Need》精读
  • 数据怎么分层?从ODS、DW、ADS三大层一一拆解!
  • ESP32S3+VSCode+PlatformIO+Arduino+Freertos开发入门指南:基于Arduino框架的应用开发全流程
  • 基于按键开源MultiButton框架深入理解代码框架(一)(指针的深入理解与应用)
  • 137. 只出现一次的数字 II
  • python+selenium UI自动化初探
  • Linux操作系统之信号:保存与处理信号
  • 嵌入式Linux:进程间通信机制
  • URL 转静态 HTML 文件 API 数据接口
  • 算法入门:BFS与DFS详解(C++实现)
  • k8s之Attach 和 Mount
  • [AI8051U入门第三步]串口1使用-printf重定向(乱码解决办法)
  • 生产问题排查-数据库连接池耗尽
  • Linux 文件系统实现层详解:原理、结构与驱动衔接
  • 已知均数与标准差,如何生成一组正态分布数据?
  • 15.图像 模板轮廓检测
  • Unity音游开发全指南:模板与免费资源高效构建节奏游戏
  • Kafka——生产者消息分区机制原理剖析
  • 基于STM32与中航ZH-E3L字符卡通信在LED屏显示数据
  • 排序算法实战(上)
  • GitHub Pages+Jekyll 静态网站搭建(二)
  • 自增主键为什么不是连续的?
  • 华为敏态开发流程敏捷开发费用估算敏态IT财务分析模板
  • flutter下的webview适配rem问题
  • 详解低速容错CAN(附与高速CAN对比表)
  • 三种深度学习模型(LSTM、CNN-LSTM、贝叶斯优化的CNN-LSTM/BO-CNN-LSTM)对北半球光伏数据进行时间序列预测
  • 指数加权的公式推导