当前位置: 首页 > news >正文

微软重磅发布Magentic UI,交互式AI Agent助手实测!

微软重磅发布Magentic UI,交互式AI Agent助手实测!

请添加图片描述


何为Magentic UI?

Magentic UI 是微软于5.19重磅发布的开源Agent助手,并于24日刚更新了第二个版本0.04版

请添加图片描述

从官方的介绍来看,目标是打造一款 以人为中心 的智能助手,其底层由多个不同的智能体系统驱动,能够实现网页浏览与操作、代码生成与执行、文件生成与分析等功能。

它区别于其他一些AI浏览器工具的主要区别在于其 透明可控的交互界面,支持高效的人机协同参与。该系统基于微软的Agent构建框架 AutoGen 构建,目前还处在原型研究阶段。

核心功能包括:

🧑‍🤝‍🧑 协同规划:用户和AI通过聊天和计划编辑器协作创建并修订分步执行计划。
🤝 协同任务:用户可直接通过网页浏览器或聊天界面实时介入并指导任务执行。Magentic-UI 能在需要时主动确认或要求协助。
🛡️ 操作防护:敏感操作需经用户明确批准后方可执行。
🧠 计划学习与检索:从过往任务中学习经验以优化未来自动化流程,并将优秀方案保存至计划库。在后续任务中可自动或手动调用已存储的计划。
🔀 并行任务执行:支持多任务并行运行,会话状态指示器会实时提示 Magentic-UI 何时需要您的输入或任务已完成。

设计架构

请添加图片描述

Magentic-UI 的底层系统是由一组从 AutoGen 的 Magentic-One 系统(如上图所示)改造而来的专业化 Agent 组构成,各Agent通过模块化协作实现不同功能:

Agent功能说明

总控代理(Orchestrator)
  • 功能定位:基于大语言模型(LLM)的主控智能体,负责与用户协同制定计划、决策何时请求用户反馈,并向其他智能体分配子任务。
  • 协作流程
    1. 与用户共同制定分步执行计划;
    2. 动态判断需用户介入的节点;
    3. 将子任务分派至其他智能体执行。
网页浏览代理(WebSurfer)
  • 功能定位:配备网页浏览器的 LLM 智能体,支持多轮次网页交互操作。
  • 核心能力
    • 根据总控代理的指令,执行点击、输入、滚动、页面跳转等操作;
    • 超越 AutoGen 多模态网页浏览器:新增标签管理、选项选择、文件上传及多模态查询支持。
代码执行代理(Coder)
  • 功能定位:配备 Docker 代码执行容器的 LLM 智能体。
  • 核心能力
    • 编写并执行 Python 和 Shell 命令;
    • 将执行结果反馈至总控代理。
文件处理代理(FileSurfer)
  • 功能定位:集成 Docker 容器与 MarkItDown 包文件转换工具的 LLM 智能体。
  • 核心能力
    • 定位 Magentic-UI 控制目录下的文件;
    • 将文件转换为 Markdown 格式并支持内容问答。
用户代理(UserProxy)
  • 功能定位:代表用户与系统交互的代理角色。
  • 协作模式:总控代理可将任务直接委派给用户(而非其他智能体)完成。

用户交互流程

用户利用 Magentic UI 的交互流程可以用下图表示:

具体步骤执行
http://www.xdnf.cn/news/861895.html

相关文章:

  • 使用Virtual Serial Port Driver+com2tcp(tcp2com)进行两台电脑的串口通讯
  • RT Thread平台下 基于N32G45x和N32L40x的drv_pwm驱动实现
  • PageHelper-分页插件
  • 【工具使用】STM32CubeMX-FreeRTOS操作系统-任务、延时、定时器篇
  • win11 连接共享打印机提示:错误0x00000709
  • Dify智能问数大模型Text2SQL流程编排从0到1完整过程
  • Python-正则表达式(re 模块)
  • 系统调试——ADB 工具
  • unix/linux,sudo,其内部结构机制
  • 几何绘图与三角函数计算应用
  • 五大主流大模型推理引擎深度解析:llama.cpp、vLLM、SGLang、DeepSpeed和Unsloth的终极选择指南
  • 多态(全)
  • 【动手学MCP从0到1】2.1 SDK介绍和第一个MCP创建的步骤详解
  • 蓝桥杯17114 残缺的数字
  • yaffs2目录搜索上下文数据结构struct yaffsfs_dirsearchcontext yaffsfs_dsc[] 详细解析
  • 数据结构(8)树-二叉树
  • Python 中 Django 中间件:原理、方法与实战应用
  • 一键 Ubuntu、Debian、Centos 换源(阿里源、腾讯源等)
  • centos 9/ubuntu 一次性的定时关机
  • IDEA集成JRebel插件,实现实时热部署
  • node 进程管理工具 pm2 的详细说明 —— 一步一步配置 Ubuntu Server 的 NodeJS 服务器详细实录 7
  • # Vue + OpenLayers 完整项目开发指南
  • 使用 Spring Boot 3.3 和 JdbcTemplate 操作 MySQL 数据库
  • 【p2p、分布式,区块链笔记 MESH】 论文阅读 Thread/OpenThread Low-Power Wireless Multihop Net
  • mac 设置cursor (像PyCharm一样展示效果)
  • qt的智能指针
  • 玩转Docker | 使用Docker部署Qwerty Learner英语单词学习网站
  • 雷达记录回放模拟平台 RS-100
  • 【开源工具】 黑客帝国系列系统监控工具:基于PyQt5的全方位资源监控系统
  • 水文流速监测中的雷达流速仪