当前位置: 首页 > backend >正文

智谱清言沉思智能体,天工智能体,agenticSeek等AI Agent测试记录

基本概念

AI Agent国内一般翻译为智能体,通常基于大语言模型,再加上规划、记忆和工具使用功能,形成一个完整的智能系统。比如,OpenAI提出的智能体公式“AI智能体 = LLM + 规划 + 记忆 + 工具”,这个公式说明,AI智能体不仅仅依赖于语言理解能力,还需要规划、记忆和工具调用能力来完成复杂任务。

智谱清言沉思智能体

https://chatglm.cn/main/autoglm?lang=zh
需要先安装浏览器插件才能用,这点增加了用户使用的难度,好处是用户可以控制并打断智能体对浏览器的操作。
比如下面,知乎需要登录才能访问,这时用户就可以介入,而下面其他的智能体由于在虚拟机中运行,访问zhihu专栏时就会报错;
在这里插入图片描述

天工智能体

https://www.tiangong.cn/

每天赠送1500积分,试了一下生成PPT

让用户进一步明确需求,这点相比上面的智谱清言较好:
在这里插入图片描述
侧边栏可以上传自己的文档,或者是自己已经获取的网页链接:
在这里插入图片描述

虚拟机中访问知乎专栏页面出错,很可能是因为没有登录造成的:
在这里插入图片描述
等了一个小时,生成是以html文件的格式进行的,最后可以导出pptx或pdf格式,导出限时免费,最后任务还没完成就让充值:
在这里插入图片描述
第二天又试了一次文档模式,,生成一个调研文档,跑了好长时间,最后积分耗光了也没完成。
在这里插入图片描述

agenticSeek安装测试

agenticSeek号称是本地版的Manus
测试主机使用的是Ubuntu系统,参考下文安装chrome和chromedriver
《ubuntu 安装 chrome 及 版本匹配的 chromedriver》来自 https://blog.csdn.net/u012561308/article/details/142301920

git clone https://github.com/Fosowl/agenticSeek.git
cd agenticSeek
mv .env.example .env
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv
./install.sh

准备好Ollama并拉取deepseek-r1:32b
修改config.ini文件
is_local = True
provider_name = ollama
provider_model = deepseek-r1:32b

source .venv/bin/activate
sudo ./start_services.sh
python3 api.py

在这里插入图片描述
在这里插入图片描述

开源的这个和智谱清言那个一样无法让用户进一步确认需求,browser view也是在虚拟机中,遇到需要登录,或者要校验是否机器人的网站,用户没法介入;

总结

以上AI智能体测试下来,整体的观感就是可以调用浏览器自动检索一些网页,对比一些基础大模型的联网搜素功能,就是把这个检索的过程可视化了,这样做是否有必要,目前来看并没有带来什么实际的好处,实际输出的结果只要标注好引用来源,那么用户应该并不关心这个检索过程的;这些AI智能体,这样一通操作,除了看起来有点炫酷:自动打开浏览器,自动搜素相关网站,查看内容,反而增加了耗时。

耗时对比

同样的任务,deepseek官网(chat.deepseek.com) < 智谱清言沉思智能体 <天工智能体 < agenticSeek

生成内容对比

同样的任务,智谱清言沉思智能体生成的内容(可导出pdf,带参考文献)长度 > deepseek官网(选择“深度思考”+“联网模式”) > agenticSeek(特别简短,无法导出文件) > 天工智能体(可生成ppt,word,excel,最终未生成结果,预测会比开源的长)

http://www.xdnf.cn/news/12499.html

相关文章:

  • 黄晓明新剧《潜渊》定档 失忆三面间谍开启谍战新维度
  • 一些免费的大A数据接口库
  • LLaMA-Factory的5种推理方式总结
  • 使用vtk8.2.0加载dicom图像
  • 界面开发框架DevExpress XAF实践:集成.NET Aspire后如何实现数据库依赖?
  • 【AUTOSAR COM】E2E的不同profiles的含义以及应用
  • 批量文件改名具体操作方案
  • USB扩展器与USB服务器的2个主要区别
  • 机器人编程界面
  • CMake 为 Debug 版本的库或可执行文件添加 d 后缀
  • 第五讲——一元函数微分学的几何应用
  • 飞马LiDAR500雷达数据预处理
  • LLMControlsArm开源程序是DeepSeek 控制熊猫机械臂
  • Python基础语法全解:从入门到精通的简明指南
  • 初始结构体,整型提升及操作符的属性
  • RockyLinux9.6搭建k8s集群
  • 一键编译包含多个独立模块和应用的工程(linux cmake)
  • 单片机0-10V电压输出电路分享
  • 微信小程序动态效果实战指南:从悬浮云朵到丝滑列表加载
  • JVM——打开JVM后门的钥匙:反射机制
  • 408第一季 - 数据结构 - 数组和特殊矩阵
  • 代码安全规范1.1
  • STM32标准库-TIM输出比较
  • table表格合并,循环渲染样式
  • git commit 执行报错 sh: -/: invalid option
  • SpringBoot+MySQL家政服务平台 设计开发
  • OpenAI对抗法庭命令:捍卫ChatGPT用户隐私之战
  • mybatis的if判断==‘1‘不生效,改成‘1‘.toString()才生效的原因
  • 浏览器后台服务 vs 在线教育:QPS、并发模型与架构剖析
  • 如何对Video视频进行SEO优化?