当前位置: 首页 > backend >正文

AI知识点 | 大模型技术演变

互联网让我们能找到信息,大模型让信息主动帮我们干活。

互联网时代,想要获取信息,我们需要主动搜索内容,比如搜索"如何认识大模型"?

能够得到的信息很有限,可能好几个网页都不一定有我们要的内容,甚至穿插广告。、

大模型时代,想要获取信息,我们只需要向大模型提问,大模型会帮我们汇总我们需要的信息。

人工智能到大模型的演变

大模型是目前人工智能发展的重要里程碑。

人工智能要做的是研究如何将机器拟人化,包括:学习、推理、自我修正、感知、语言处理等。

大模型是在这研究过程中,诞生的一门技术,也是目前前沿代表的技术。

人工智能的研究,按照技术实现经历的几个演变,总结来说就两个大的范畴:机器学习和深度学习。从两个大的分支又额外衍生出各种技术。

机器学习(Marchine Learning,ML)

机器学习是一门研究计算机如何在没有明确编程的情况下,通过对数据进行分析、学习、自动改进其行为或做出预测的学科。它旨在使计算机系统具备从经验中学习的能力,以适应新情况、解决问题或完成特定任务。

机器学习可以分为:监督学习、无监督学习、强化学习。通过一个孩子学认动物的案例,简单描述以下这三种技术。

监督学习(Supervised Learning

场景:你给孩子一堆动物卡片,每张卡片都标有名称(如"猫""狗""鸟")。你指着卡片说:"这是猫,它有尖耳朵和胡须;这是狗,它会汪汪叫……"

关键点

  • 有明确答案:每个样本(动物图片)都有对应的标签(名称)。

  • 目标:孩子通过观察带标签的样本,学会归纳特征(如猫的胡须、狗的耳朵形状),未来看到新动物时能正确分类。

类比机器学习

  • 算法通过大量带标签的数据(输入图片+输出名称)训练模型,最终预测新数据的类别。

  • 典型任务:图像分类、垃圾邮件检测。

无监督学习(Unsupervised Learning)

场景:这次你只给孩子一堆未标注的动物图片,让孩子自己观察并说:"我觉得这些可以分成三组——有的有羽毛,有的有四条腿,有的生活在水里……"

关键点

  • 没有标准答案:孩子需要自行发现数据中的模式或分组(如按腿的数量、栖息地分类)。

  • 目标:探索数据的内在结构,而非预测标签。

类比机器学习

  • 算法从无标签数据中寻找隐藏规律,比如聚类(将相似动物分组)或降维(用关键特征描述动物)。

  • 典型任务:客户细分、异常检测。

强化学习(Reinforcement Learning)

场景:你让孩子玩一个动物分类游戏。每猜对一次(如正确指出"这是斑马"),就给一颗糖;猜错则扣一颗糖。孩子通过奖励/惩罚调整策略,最终学会快速准确分类。

关键点

  • 试错学习:没有直接教规则,而是通过环境反馈(奖励/惩罚)优化行为。

  • 目标:最大化长期奖励(比如累积更多糖果)。

类比机器学习

  • 智能体(Agent)通过与环境交互(行动→反馈→调整)学习最优策略。

  • 典型任务:机器人控制、游戏AI(如AlphaGo)。

深度学习(Deep Learning,DL)

深度学习是机器学习的一个子领域,通过多层次的神经网络结构(模仿人脑神经元连接)自动从海量数据中学习多层次的特征表示。它能够直接处理原始数据(如图像像素、文本字符),无需人工设计特征,逐步从低级特征(如边缘、纹理)抽象到高级特征(如物体、语义),最终实现高精度的识别、生成或决策任务。

目前最前沿的“生成式人工智能” 属于深度学习的一个子领域,在这一领域涌现很多热门模型和应用,如:DeepSeek、阿里千问、文心一言等等。

http://www.xdnf.cn/news/5545.html

相关文章:

  • 细说getOutputStream()方法
  • 代码随想录笔记---回溯篇
  • libcurl简单使用
  • SpringBoot 整合 Langchain4j 构建AI智能体应用
  • 《异常链机制详解:如何优雅地传递Java中的错误信息?》
  • 【RP2350】香瓜树莓派RP2350之USB虚拟串口
  • windows下安装python软件
  • Linux计划任务与进程
  • 【RP2350】香瓜树莓派RP2350之LED
  • 数字孪生概念
  • 本机的驱动
  • RoPE(旋转位置编码,参考:DeepSeek-V2)
  • Linux进程9-无名管道:1.概述、创建、读写数据、2.进程间通信、3.读写规律、4.fcntl设置阻塞、5.文件描述符概述及复制函数dup,dup2
  • Robot之VideoMimic:《Visual Imitation Enables Contextual Humanoid Control》翻译与解读
  • 安卓系统APP:志愿填报(基于Android平台的志愿填报程序)
  • LVGL环形加载器
  • Linux开机后启动Oracle数据库
  • redis数据结构-06(LRANGE、LINDEX、LSET、LREM)
  • 数字化工厂中央控制室驾驶舱系统架构文档
  • Transformer LLM
  • Linux数据库篇、第零章_MySQL30周年庆典活动
  • 关于chatshare.xyz激活码使用说明和渠道指南!
  • 3D虚拟工厂vue3+three.js
  • Babel 深度解析:现代 JavaScript 开发的桥梁
  • @RequestParam @RequestHeader @RequestBody 三者详解
  • 【英语笔记(四)】诠释所有16种英语时态,介绍每种时态下的动词变形!!含有所有时态的的动词变形汇总表格
  • C语言学习记录——深入理解指针(4)
  • 单片机-STM32部分:13、PWM
  • MongoDB
  • wget、curl 命令使用场景与命令实践