Genspark超级智能体调研
Genspark (https://www.genspark.ai/)是前百度小度高管推出的通用 AI 智能体,集成 AI 搜索、极速浏览器和强大智能代理功能,支持自动完成复杂任务。Genspark的核心产品Genspark Super Agent 是全能型 AI助手,能自主思考、规划和执行各种任务,如旅行规划、视频内容生成、数据可视化等。基于多智能体混合系统,结合自建的可靠工具集和数据集,确保高效、准确且可定制化的服务,用智能化解决方案提升用户日常生活的便利性和效率。
快速可靠的通用人工智能代理
- 快速:几乎即时获得结果(与常规搜索/聊天相当)
- 可靠:执行过程中的错误和幻觉明显减少
- 可操控:让您掌控一切,允许您引导和改进输出,直到它们完全符合您的要求。
gala基准测试的表现
1. 测试结果:
level1:Genspark得分为87.8%,高于manus的86.5%和 OpenAI Deep Research的74.3%,超过之前的最佳水平(SOTA)67.9%。
level2:Genspark得分为72.7%,领先于manus的70.1%和 OpenAI Deep Research的69.1%,及之前的超过之前的最佳水平(SOTA)67.4%。
level3:Genspark得分为58.8%,高于manus的57.7%和 OpenAI Deep Research的47.6%,超过之前的超过之前的最佳水平(SOTA)42.3%.
2. 表现分折:
多轮对话箭力:Genspark在多轮对活和复杂任务处理上表现出色,能更好地理解和执行用户的指令。
任务执行效率:Genspark在任务执行过程中措员和幻觉显替减少,表现出更高的可靠性和准确性。
综合性能优势:Genspark水在所有三个级别的测试中均取得最高得分,表明在处理真实世界语言场景时能更准确地反映用户需求。
调研使用
注册使用
注册支持Google 授权、邮箱两者方式。
付费方式
免费:每天 200 积分
付费(Plus $19.99/月 ):每月 10000 积分
场景及可用模型
聊天 | 图片生成 | 视频生成 | |
可用模型 | | | |
使用场景
场景一(聊天)
问题:今日人工智能新闻
输出结果:
结论:
1、输出人工智能相关新闻,满足要求
2、新闻发生时间不是当日,而是近期的新闻,不满足要求
场景二(聊天)
问题:今日纽约新闻。多智能体组合
输出结果:
1、 使用多个智能体输出结果,最后所有智能体输出结果做总结
1、思维导图呈现所有新闻,并按照类别进行区分,清晰可见
2、了解具体新闻详情,如“新增 1.4 万户住宅”,点击蓝色“+”,扩展思维导图,新思维导图如下
3、如果点击具体的新闻内容如“纽约州低收入家庭冷气补助申请”,同样会使用 3 个聚合智能体输出结果,并做聚合
结论
1、 新闻日期存在出入,部分新闻不是当日发生,日期问题依然存在
2、将整理结果与实际新闻内容做对比校验,生成结果与实际内容存在出入,存在缺失信息,分类错误的问题。如“纽约州低收入家庭冷气补助申请”新闻(https://access.nyc.gov/zh-hant/programs/cooling-assistance-benefit/#how-it-works)导图与内容不一致
场景三(聊天)
问题:制定1个详细的mcp说明文档,说明mcp协议出现的背景,mcp解决的问题,mcp协议架构,mcp核心原理,mcp相关服务及mcp的学习资源等。多智能体组合
输出结果:
1、三个模型都有输出
2、输出结果未完全匹配要求
3、输出内容存在很多差异,未做总结
结论
1、输出结果不满足要求
场景四(图片)
问题:创造出一张风景图片,有巍峨高山和瀑布,同时有参天大树。
输出结果:
结论
1、输出结果满足要求
2、FLUX.1 [dev]、FLUX.1 [schnell] 未输出图像
场景五(图片)
问题:暖黄色调的居家场景中,30 岁左右的女性倚坐在米白色布艺沙发扶手上,宽松白色衬衫下摆自然垂落,露出纤细脚踝。蓬松卷发随意披散,腕间缠绕复古皮质腕表,眼神直视镜头,唇角微扬,流露出毫不刻意的自信神态。沙发旁的木质小桌上摆放翻开的书籍与盛开的鲜花,整体画面传递出慵懒闲适又落落大方的生活美学。
输出结果:
结论
1、输出结果满足要求
场景六(视频)
问题:
0 - 1 秒 | 在纯色背景(如白色)下,一盒感冒灵颗粒稳稳地放置在画面中央,镜头聚焦在包装正面的品牌名称、药品名称上,包装色彩鲜明,吸引注意力。 | 轻松的背景音乐起,轻微的 “嗖” 声,引入画面 |
1 - 2 秒 | 镜头拉近,突出包装上的主要功效文字,如 “解热镇痛”“缓解感冒症状” 等字样,清晰展示。 | 背景音乐持续,旁白:“解热镇痛。” |
2 - 3 秒 | 镜头拉远,完整展示感冒灵颗粒的包装全貌,同时画面出现品牌 logo 的动态效果。 | 背景音乐稍加强,旁白:“感冒灵颗粒,家庭常备。” |
输出结果:
结论
1、画面只有左右视角的小幅度移动
2、视频结果不满足要求
3、第二次使用 vidu 生成失败
场景七(视频)
问题:
0 - 1 秒 | 在纯色背景(如白色)下,一盒感冒灵颗粒稳稳地放置在画面中央,镜头聚焦在包装正面的品牌名称、药品名称上,包装色彩鲜明,吸引注意力。 | 轻松的背景音乐起,轻微的 “嗖” 声,引入画面 |
1 - 2 秒 | 镜头拉近,突出包装上的主要功效文字,如 “解热镇痛”“缓解感冒症状” 等字样,清晰展示。 | 背景音乐持续,旁白:“解热镇痛。” |
2 - 3 秒 | 镜头拉远,完整展示感冒灵颗粒的包装全貌,同时画面出现品牌 logo 的动态效果。 | 背景音乐稍加强,旁白:“感冒灵颗粒,家庭常备。” |
输出结果:
结论
1、画面只有左右视角的小幅度移动
2、视频结果不满足要求
结论
1、免费可用次数较少
2、对话生成的结果结构清晰,但细节上存在问题,严谨不足
3、图像生成质量较高
4、视频生成质量无法满足商业要求,只能做图片的单纯动画拓展演出时间
总结:做完工作助手还存在不足,可满足简单的日常需求。