AI知识点 | 大模型技术演变
互联网让我们能找到信息,大模型让信息主动帮我们干活。
互联网时代,想要获取信息,我们需要主动搜索内容,比如搜索"如何认识大模型"?
能够得到的信息很有限,可能好几个网页都不一定有我们要的内容,甚至穿插广告。、
大模型时代,想要获取信息,我们只需要向大模型提问,大模型会帮我们汇总我们需要的信息。
人工智能到大模型的演变
大模型是目前人工智能发展的重要里程碑。
人工智能要做的是研究如何将机器拟人化,包括:学习、推理、自我修正、感知、语言处理等。
大模型是在这研究过程中,诞生的一门技术,也是目前前沿代表的技术。
人工智能的研究,按照技术实现经历的几个演变,总结来说就两个大的范畴:机器学习和深度学习。从两个大的分支又额外衍生出各种技术。
机器学习(Marchine Learning,ML)
机器学习是一门研究计算机如何在没有明确编程的情况下,通过对数据进行分析、学习、自动改进其行为或做出预测的学科。它旨在使计算机系统具备从经验中学习的能力,以适应新情况、解决问题或完成特定任务。
机器学习可以分为:监督学习、无监督学习、强化学习。通过一个孩子学认动物的案例,简单描述以下这三种技术。
监督学习(Supervised Learning
场景:你给孩子一堆动物卡片,每张卡片都标有名称(如"猫""狗""鸟")。你指着卡片说:"这是猫,它有尖耳朵和胡须;这是狗,它会汪汪叫……"
关键点:
-
有明确答案:每个样本(动物图片)都有对应的标签(名称)。
-
目标:孩子通过观察带标签的样本,学会归纳特征(如猫的胡须、狗的耳朵形状),未来看到新动物时能正确分类。
类比机器学习:
-
算法通过大量带标签的数据(输入图片+输出名称)训练模型,最终预测新数据的类别。
-
典型任务:图像分类、垃圾邮件检测。
无监督学习(Unsupervised Learning)
场景:这次你只给孩子一堆未标注的动物图片,让孩子自己观察并说:"我觉得这些可以分成三组——有的有羽毛,有的有四条腿,有的生活在水里……"
关键点:
-
没有标准答案:孩子需要自行发现数据中的模式或分组(如按腿的数量、栖息地分类)。
-
目标:探索数据的内在结构,而非预测标签。
类比机器学习:
-
算法从无标签数据中寻找隐藏规律,比如聚类(将相似动物分组)或降维(用关键特征描述动物)。
-
典型任务:客户细分、异常检测。
强化学习(Reinforcement Learning)
场景:你让孩子玩一个动物分类游戏。每猜对一次(如正确指出"这是斑马"),就给一颗糖;猜错则扣一颗糖。孩子通过奖励/惩罚调整策略,最终学会快速准确分类。
关键点:
-
试错学习:没有直接教规则,而是通过环境反馈(奖励/惩罚)优化行为。
-
目标:最大化长期奖励(比如累积更多糖果)。
类比机器学习:
-
智能体(Agent)通过与环境交互(行动→反馈→调整)学习最优策略。
-
典型任务:机器人控制、游戏AI(如AlphaGo)。
深度学习(Deep Learning,DL)
深度学习是机器学习的一个子领域,通过多层次的神经网络结构(模仿人脑神经元连接)自动从海量数据中学习多层次的特征表示。它能够直接处理原始数据(如图像像素、文本字符),无需人工设计特征,逐步从低级特征(如边缘、纹理)抽象到高级特征(如物体、语义),最终实现高精度的识别、生成或决策任务。
目前最前沿的“生成式人工智能” 属于深度学习的一个子领域,在这一领域涌现很多热门模型和应用,如:DeepSeek、阿里千问、文心一言等等。