当前位置: 首页 > news >正文

什么是 MCP?与 AI Agent 的关系是什么?

首先先回答一下什么是MCP?

如果你经常使用像Claude这样的大语言模型,你可能已经注意到它们虽然强大,但有时候也有局限性,比如无法获取实时信息或访问特定工具。

模型上下文协议(Model Context Protocol,简称MCP)就是为了解决这个问题而诞生的!简单来说,它是一种让AI能够"伸出手"使用外部工具和服务的协议,让AI变得更加强大和实用。

想象一下,你正在和AI助手聊天,突然想让它帮你搜索最新的新闻,或者查看你的文件,甚至操作数据库——有了MCP,这些都成为可能!

MCP的工作原理:

服务器(Server):提供特定功能的工具,比如网页搜索、文件访问等

客户端(Client):在AI应用中与服务器保持连接

传输(Transport):客户端和服务器之间的通信方式

主机(Host):启动连接的应用程序,如Cherry Studio或Claude Desktop

那什么是AI Agent?

基本定义与核心特征

AI Agent(Artificial Intelligence Agent,人工智能代理)是一种能够自主感知环境、进行决策并执行任务的智能实体。其核心特征在于将大语言模型(LLM)作为“大脑”,结合规划、记忆、工具调用等能力,实现复杂任务的自动化处理。例如,用户只需输入“取消订阅服务”,AI Agent即可自主分解步骤、调用支付接口完成操作。

核心特征:

  1. 自主性:无需人工持续干预,可独立完成任务。
  2. 交互性:通过传感器、文本或语音与环境动态交互。
  3. 目的性:具备明确目标导向,如优化客户服务效率或实现自动驾驶。
  4. 适应性:通过机器学习调整策略,适应环境变化。
  5. 多模态能力:支持文本、语音、图像等多种输入输出形式。

目前AI Agent都是以智能体形式存在。

MCP与AI Agent的关系:从“智能体”到“行动者”

(1) 赋予AI Agent“动手能力”

  • 传统AI的局限:多数AI模型(如ChatGPT)只能生成文本或建议,无法直接操作外部系统(如发送邮件、控制无人机)。
  • MCP的突破
    通过MCP,AI Agent可调用工具链完成闭环任务。
    示例
    用户请求“通知团队明天下雨并推迟会议”:
    • Agent理解意图 → MCP调用get_weather接口确认天气 → MCP调用check_calendar读取日程 → MCP调用send_email发送通知。

(2) 扩展Agent的物理与数字边界

  • 脱离纯虚拟交互
    结合MCP,Agent可以通过IoT设备控制实体世界(例如通过MCP控制家庭灯光或工厂机器人)。
  • 多模态能力融合
    MCP可整合视觉、语音等工具(如调用图像识别API分析照片,再通过语音合成播报结果)。

(3) 动态上下文感知与长期记忆

  • 传统模型缺陷:大语言模型(LLM)的上下文窗口有限,且无法主动更新外部知识。
  • MCP的增强方式
    • 实时访问外部数据库(如用户订单记录)、传感器数据(如实时交通流量)。
    • 持久化存储交互历史,供Agent在后续任务中参考。

技术实现场景举例

场景1:智能医疗Agent

  • Agent角色:诊断助手。
  • MCP支持的调用链
    分析患者症状 → 调用医学知识库 → 推荐检查项目 → 调用医院系统的预约API → 生成报告 → 调用邮件服务发送给医生。

场景2:企业流程自动化Agent

  • Agent角色:财务审批助理。
  • MCP支持的调用链
    接收发票图片 → 调用OCR和验真API → 匹配合同条款 → 调用ERP系统发起付款 → 记录区块链存证

场景3:家庭服务Agent

  • Agent角色:生活管家。
  • MCP支持的调用链
    识别用户指令“打扫房间” → 调用扫地机器人API → 检测清扫进度(IoT传感器) → 异常时调用维修服务API。

总结

MCP与AI Agent的实质关系是“赋能层”与“执行体”的协同:

  • MCP作为协议层,将分散的工具和服务整合为AI可理解的“虚拟手脚”;
  • AI Agent通过MCP突破纯文本交互的限制,进化为能感知、决策、行动的“智能体-执行体”。
    未来,随着MCP的成熟,AI Agent可能像人类一样,通过工具链自由扩展能力边界,真正实现从“思考”到“行动”的闭环。

目前来说,Manus和扣子空间算是基于MCP协议做AI Agen。

MCP算是底层架构一种制作AI Agen的方式。

http://www.xdnf.cn/news/138277.html

相关文章:

  • 14.ArkUI Radio的介绍和使用
  • 实验4:列表与字典应用
  • 机器视觉的胶带模切应用
  • 含锡废水处理的经济效益
  • 【Test】单例模式❗
  • 支持Function Call的本地ollama模型对比评测-》开发代理agent
  • python21-循环小作业
  • 命名空间(C++)
  • 在Dify中创建自定义Drools工具
  • 泽众TestOne精准测试:助力软件开发质量新升级
  • NEGATIVE LABEL GUIDED OOD DETECTION WITH PRETRAINED VISION-LANGUAGE MODELS
  • LeetCode 每日一题 2845. 统计趣味子数组的数目
  • 70.评论日记
  • js数据结构之栈
  • C语言大写转小写2.0
  • 自回归模型的多级关系建模:从单一指向到指向性Token的范式革新
  • 线程函数库
  • 矩阵运营:抢占市场与流量的利器
  • c++头文件知识
  • 数字孪生:从概念到实践,重构未来产业的“虚拟镜像”
  • OpenCv高阶(十)——光流估计
  • Oracle_开启归档日志和重做日志
  • AXOP34062: 40V双通道运算放大器
  • C 语言内存分配方法及优缺点
  • 国内多层PCB供应商优选指南
  • 【每天一个知识点】IPv4(互联网协议版本4)和IPv6(互联网协议版本6)
  • vite+vue构建的网站项目localhost:5173打不开
  • ASP.NET MVC​ 入门指南二
  • [基础] Windows PCIe设备驱动框架与开发实践深度解析
  • 面向高性能运动控制的MCU:架构创新、算法优化与应用分析