解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs- OpenAI AGI 五阶段
解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs- OpenAI AGI 五阶段
然后第三个阶段就是agent,注意这里面的agent和我们说应用程序开发的这个agent是一个不同的概念。AI just can take actions autonomously自动的去执行一些动作。但大家像今天我们看到的computer use for the browser use,其实这些都是reasoning和就thinking和action,他们都统一在大模型之下的一个很经典的一个表现。
我在这里就是要清晰化一点,注意我们这边说的是五个模型通用AG,这是从模型五个阶段AGI,这是从模型的角度,也就是说如果我们看Agent的话,它是既具有思考的能力,就thinking的这个过程或者这种能力。同时他又知道基于在思考或者说他的具体的分析,他知道下一步最好的这action是什么。所以它会变成一个什么样的呢?它就变成了thinking action,这显然是一种更高的一种发展水平了,高于这个reasoners或者reasoning models,后面就innovator和organizations。这些我们就暂时不多说。
为什么暂时不多说这些层面的东西?是因为大家应该知道这个innovation主要是invention venture和creativity,这些会面临很多未知的环境,或者说例如说一些现在看上去解决不了的数学问题等等之类的。在你获得可控灵活性以及具有自我学习能力之前,这应该是一件很难达到的一种状态。但有可能通过大模型的这种幻觉,可能意外的破解了一些问题。但是你想复制它也会很困难,所以这肯定还需要很长的时间去走。
那你有了这个innovator之后,在这之上构建的这个organizations级别就AI that can manage complex。行,所以这个是不是我们现在看见的一些做A进的框架说我们现在已经是organization级别的。我们现在谈的chatbot reasoners agent innovations organizations,我们都是从models的角度去谈的。而大家现在看见的agent或者说这个organization级别的这个agent,它都是用程序的级别或者是系统的级别,也就是工程engineering的级别,而不是说model s的级别。显然从model s的级别,是一个更根本的以及更具有通用价值的。因为你这个模型本身如果具有这个能力的话,你在之上构建的任何能力都会极大的增强。
所以我希望这个地方,关于这一点,从模型的视角,可从应用程序的视角,或者说从agentciaI的这个视角,大家要进行稍微思考,否则的话你可能是想,我们现在不是都是已经有这个Agent了吗?甚至有这个organization级别的这些agents等等之类的。 这个是跟大家分享的整个OpenAI它的AGI到5个基本的阶段。但在这里面其实有一个非常重要的点,就是你要通往AGI。你谈了五个阶段,那靠什么去实现AGI?
这个AGI就是artificial general intelligence,它怎么变成general intelligence?我相信大家多少会听到你要实现AGI,一般都会要借助强化学习。我觉得通过刚才分析,因为我们课程所有的内容都环环相扣的。就是说你谈到这个innovator,你谈到invention和creativity,他这个是什么意思?是你训练完模型的时候,你数据根本就没涉及到这什么样的内容你模型的数据都没有,
你在训练模型的时候,训练数据中没有这些相关的数据,或者说能力,或者说模式。然后你现在的模型要具备这种the innovators级别的这种capabilities。那这个时候我们就不能说简单的通过标注数据或者训练更多的数据来达到。这个时候我们就需要强化学习。为什么说强化学习能做到,我们称之为invention和creativity,或者是outdoor distribution等等之类,这些都将面临新的情况的novel scarious的能力。然后你这个能力你自己本身如果就reason capability,就第二阶段的reasoners,然后你这边还可以take actions,autonomy。那你本身显然已经进入了更高的这种境界,就是智能的这种境界。
好,现在我们的核心问题是有一些同学会知道要才能强化学习。为什么才能强化学习? 例如从这个其实你从第一阶段开始以后,就是chatbot,这个阶段开始以后,后续的这每个阶段的核心都是强化学习。为什么是这样?