当前位置: 首页 > news >正文

大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

资料取自《大模型应用开发:动手做AI Agent 》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


Agent成熟度模型详解:从「智能客服」到「科幻管家」

手机进化史类比AI Agent发展路径,结合书中技术框架梳理阶段特征


一、成熟度分级表(先看全局)

级别名称能力类比典型特征案例参考
L1基础对话模型功能机(只能打电话)单轮问答,无上下文记忆早期客服机器人
L2ChatGPT级(初级Agent)智能手机(装App扩展能力)简单规划+调用单个工具GPT-4联网版
L3专业领域Agent智能手表(健康监测)多步骤决策+领域工具链协作医疗诊断Agent
L4自主Agent科幻管家(贾维斯)跨系统协作+动态学习+自我优化电影《钢铁侠》AI

二、逐级拆解(含技术原理与案例)

▶ L2级:会查资料的「实习生」

核心特征

  • 有限规划:拆解简单任务(如“查天气→推荐穿搭”)[2][5]
  • 单一工具:每次调用1个接口(如地图API)[5]
  • 线性执行:出错需人工修正(订单失败就卡住)[6]

生活案例:旅行清单助手

用户说:“下周末去杭州要带什么?”
1️⃣ 查杭州天气(调用天气API → 显示有雨)[5]
2️⃣ 生成清单:雨伞、薄外套 → 结束任务[6]

用户提问
调用天气API
是否下雨?
建议带伞
建议防晒用品

▲ 线性决策流程(第5章Function Calling示例)


▶ L3级:行业专家级的「部门主管」

技术突破

  • 多级规划:任务树分解(如看病→挂号→检查→开药)[1][6]
  • 工具链协作:连续调用多个系统(医保计算+药房库存查询)[6]
  • 异常处理:预算超支自动切换方案(如改用平价替代药)[6]

医疗Agent实战流程
1️⃣ 患者输入症状 → 拆解为[挂号科室→检查项目→取药] [1]
2️⃣ 调用医院HIS系统查号源 → 推荐最近三甲医院 [5][6]
3️⃣ 检查报告解读 → 自动对比历史病例库 [5]
4️⃣ 开药时检测医保余额 → 不足时触发短信提醒 [6]

症状描述
分解就诊步骤
工具1:挂号系统
工具2:检查项库
工具3:医保计算器
生成就诊方案
患者确认?
执行预约
重新规划

▲ 多工具协作流程(第6章ReAct框架)


▶ L4级:全能型的「CEO助理」

质变特征(相比L3):

  • 动态学习:从用户反馈优化策略(如记住用户常选航空公司)[4]
  • 跨系统协同:同时调度物流+支付+供应链系统 [6]
  • 自主纠错:航班取消时自动改签+重订酒店+通知客户 [4][6]

案例:情人节鲜花危机救援
1️⃣ 感知异常:物流系统报警 → 50%库存损毁[6]
2️⃣ 动态规划
▸ 查找备用供应商(调用3个鲜花平台API)
▸ 比价后锁定本地批发市场现货 [6]
3️⃣ 多线程执行
▸ 向批发商付款 → 调用企业支付接口
▸ 同步更新客户订单 → 发送延迟补偿券 [6]
4️⃣ 经验沉淀:将本次方案存入危机应对知识库 [2][4]

库存告警
自主启动应急预案
并行调用工具
供应商检索API
比价算法
物流调度系统
成本<预算?
全自动采购
发起人工审批

▲ L4自主决策流程(第6章Plan-and-Execute案例)


三、关键技术支撑(书中核心章节索引)

L2→L3跃迁关键

  • 任务分解技术:思维链(Chain of Thought) → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 工具调度能力:外部规划器(PDDL语言转换) → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 验证反馈机制:ReAct框架的思考-行动循环 → 《大模型应用开发:动手做AI Agent 》第6章[6]

L3→L4跃迁关键

  • 长期记忆系统:向量数据库存储历史经验 → 《大模型应用开发:动手做AI Agent 》第2章2.3节[5]
  • 动态学习架构: Reflexion框架的自我反思 → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 多Agent协同: 边缘计算节点分工协作 → 《大模型应用开发:动手做AI Agent 》附录A[4]

四、未来展望:L5级「数字生命」会远吗?

书中线索(《大模型应用开发:动手做AI Agent 》附录A方向):

  • 具身智能: Agent控制实体机器人维修设备 [4]
  • 人机共生: AI实时学习用户习惯 → 下班前自动调节家中空调[4]
  • 社会协作: 物流Agent与交通Agent协商最优配送路线 [4]

科幻照进现实的时间表

2024-01-01 2025-01-01 2026-01-01 2027-01-01 2028-01-01 2029-01-01 2030-01-01 L3医疗Agent L4供应链Agent L5具身Agent 城市级Agent网络 当前阶段 未来5年 Agent进化路线预测

关键引用

  • 多模态Agent方向 → 《大模型应用开发:动手做AI Agent 》附录A.3节[4]
  • 边缘系统部署技术 → 《大模型应用开发:动手做AI Agent 》附录A.2节[4]
  • 自主进化架构 → 《大模型应用开发:动手做AI Agent 》第6章ReAct扩展案例[6]

目录:总目录
上篇文章:大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(微调或Agent技术)


http://www.xdnf.cn/news/692371.html

相关文章:

  • 服务器开机自启动服务
  • css设置动态数值:clamp函数
  • Tailwind CSS 实战,基于 Kooboo 构建 AI 对话框页面(三):实现暗黑模式主题切换
  • kubernate解决 “cni0“ already has an IP address different from 10.244.0.1/24问题
  • FastAPI 依赖注入
  • c++第二章练习题
  • Java数值字符串相加
  • 英飞凌SBC芯片TLE9263QX for STM32的库函数与使用
  • ⭐️⭐️⭐️ 免费的AI Clouder认证 ⭐️⭐️⭐️ 第四弹【课时1:课程概览】for「大模型Clouder认证:基于通义灵码实现高效AI编码」
  • 企业信息管理系统的设计与实现(代码+数据库+LW)
  • 【多线程初阶】初识线程 创建线程
  • 线性回归中标准方程法求逆失败的解法:正则化
  • 三维点云深度学习代码torch-points3d-SiamKPConvVariants复现记录(持续更新中)
  • MAC程序签名遇到的问题
  • 用结构填充平面
  • GUI 编程——python
  • PortSwigger-02-XXE
  • Gerapy二次开发:在Ubuntu服务器中利用pyenv+supervisor实现项目部署
  • 为 MCP Server 提供 Auth 认证,及 Django 实现示例
  • 三、zookeeper 常用shell命令
  • Spring AI 代理模式(Agent Agentic Patterns)
  • 基于Vue3.0的【Vis.js】库基本使用教程(002):图片知识图谱的基本构建和设置
  • 机器学习-随机森林
  • 算法训练第一天
  • 深度解析 torch.mean 的替代方案
  • Web前端快速入门(Vue、Element、Nginx)
  • 通过海康萤石API控制家里相机的云台及抓图
  • PHP:从Web开发基石到现代应用引擎的进化之路
  • 青岛市长任刚与深兰科技董事长陈海波会谈,深兰青岛项目即将进入快车道!
  • Nacos注册中心原理