当前位置: 首页 > web >正文

生成模型+两种机器学习范式

生成模型:从数据分布到样本创造

生成模型(Generative Model) 是机器学习中一类能够学习数据整体概率分布,并生成新样本的模型。其核心目标是建模输入数据 x 和标签 y 的联合概率分布 P(x,y),即回答 “数据是如何产生的”。

生成模型的核心能力
  1. 数据生成:通过学习数据分布,生成与训练集相似的新样本(如图像生成、文本生成)。
  2. 概率推断:计算数据的联合概率,用于异常检测、密度估计等任务。
  3. 因果建模:探索数据间的因果关系(如通过因果结构生成符合逻辑的样本)。
典型生成模型举例
  • 变分自编码器(VAE):通过隐变量建模数据分布,将样本编码为潜在向量后解码生成新样本。
  • 生成对抗网络(GAN):通过生成器与判别器的对抗训练,使生成样本接近真实数据分布。
  • 自回归模型(如 GPT 系列):基于序列数据的历史信息,预测下一个 token 的概率分布,逐步生成完整序列。

两种机器学习范式:生成式 vs. 判别式

机器学习的核心范式可分为生成式(Generative) 和判别式(Discriminative),二者在建模目标、应用场景上有本质区别:

一、生成式学习(Generative Learning)
  • 建模目标:学习联合概率分布 P(x,y),即 “输入 x 和标签 y 同时出现的概率”。
  • 核心逻辑:先理解数据如何生成,再通过生成过程进行预测。
  • 数学表达:P(y∣x)=P(x)P(x,y)​,通过联合概率和边缘概率推导条件概率。
  • 典型算法:隐马尔可夫模型(HMM)、朴素贝叶斯、VAE、GAN。
  • 应用场景
    • 样本生成(如图像、文本、语音合成);
    • 小样本学习(通过生成模型扩充数据);
    • 无监督 / 半监督学习(探索数据分布)。
二、判别式学习(Discriminative Learning)
  • 建模目标:直接学习条件概率分布 P(y∣x) 或决策函数 f(x),即 “给定输入 x,预测标签 y 的概率”。
  • 核心逻辑:不关心数据生成过程,只关注不同类别间的边界和区分特征。
  • 数学表达:直接建模输入到输出的映射关系,无需计算联合概率。
  • 典型算法:逻辑回归、支持向量机(SVM)、决策树、神经网络(如 CNN、RNN)。
  • 应用场景
    • 分类与回归(如图像分类、房价预测);
    • 目标检测、语义分割等需要精准判别边界的任务;
    • 实时预测(模型推理速度通常更快)。

http://www.xdnf.cn/news/10749.html

相关文章:

  • 使用大模型预测亚急性脊髓联合变性的技术方案大纲
  • react native webview加载本地HTML,解决iOS无法加载成功问题
  • 计算机网络通信技术与协议(八)----关于IS-IS的基础概念
  • HALCON 深度学习训练 3D 图像的几种方式优缺点
  • SpringBoot 系列之集成 RabbitMQ 实现高效流量控制
  • 使用Process Explorer、System Informer(Process Hacker)和Windbg工具排查软件高CPU占用问题
  • 基于51单片机和8X8点阵屏、独立按键的填充消除类小游戏
  • h5的aliplayer-min.js 加密视频会走到debugger
  • 计算A图片所有颜色占B图片红色区域的百分比
  • 第7章 :面向对象
  • 华为云Flexus+DeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建
  • 交叉验证集(Cross-Validation Set)和测试集(Test Set)
  • Delphi SetFileSecurity 设置安全描述符
  • 二叉树day1
  • C++和C#界面开发方式的全面对比
  • 初始化已有项目仓库,推送远程(Git)
  • git clone报错:SSL certificate problem: unable to get local issuer certificate
  • 用户管理页面(解决toggleRowSelection在dialog用不了的隐患,包含el-table的plus版本的组件)
  • Java程序员视角- NIO 到 Epoll:深度解析 IO 多路复用原理及 Select/Poll/Epoll 对
  • 立志成为一名优秀测试开发工程师(第十一天)—Postman动态参数/变量、文件上传、断言策略、批量执行及CSV/JSON数据驱动测试
  • 5.3.1_1二叉树的先中后序遍历
  • 操作系统学习(十一)——磁盘
  • 【agent开发】部署LLM(一)
  • 内容中台的实施基石是什么?
  • 简道云--第一个表单
  • 普中STM32F103ZET6开发攻略(二)
  • 人工智能工程技术专业 和 其他信息技术专业 有哪些关联性?
  • window/linux ollama部署模型
  • docker使用sh脚本创建容器,保持容器正常运行,异常关闭后马上重启
  • 【Unity】云渲染