当前位置: 首页 > news >正文

机器学习-贝叶斯函数(理解版)

明确一下符号含义

D 数据集

\theta 参数集合(例如在线性回归中,w和b是参数,参数集合\theta是{w,b})

联合概率密度函数和似然函数,表达式一样,但是侧重点不同

联合概密度函数 P(D |\theta) :给定参数,观察到特定数据集的概率

似然函数 L(\theta|D): 给定数据集,哪个参数更加拟合这些数据集合

实际上,从数学表达式来看,P(D|\theta) = L(\theta|D)

贝叶斯公式中用的是似然函数,但是似然函数表达式无法求出,所以用联合概率分布函数求出联合概率分布函数的表达式,这个表达式也是似然函数的表达式

在贝叶斯公式中,带入的是原始的似然函数而不是对数似然函数

所以我们实际上要求的是联合概率密度函数,怎么求呢

这里引出一个概念:单个点的概率密度函数

在独立同分布的条件下,联合概率密度函数 = 单个点的概率密度函数之积(理解:多个独立事件同时发生的概率等于他们各自发生的概率之积)

单个点的概率密度函数怎么求?什么时候算是满足独立同分布呢?

1.单个点的概率密度函数

先验概率P(\theta)中的参数\theta有分布,这个分布是我们假设的

先验概率是一个关于参数的分布,而不是一个单一的概率值。先验概率是我们对参数θ的不确定性建模。它表示:在看到任何数据之前,我们认为参数θ可能取什么值,取这些值的可能性有多大大。

如果参数集中有多个参数呢?

两种情况,参数之间有相关性,参数之间无相关性

参数之间相互独立:每个参数的先验概率之积

参数之间有关系:用多元分布建模,如多元正态分布

2.独立同分布

独立同分布是机器学习模型有效性的假设性前提:在满足独立同分布的前提下,学习到的机器学习模型才是有效的

独立:独立是针对样本来源而言的。如果样本集(训练集、测试集)中的任意两个样本之间,都是不相关的,则样本的获得或者生成满足独立性条件。

同分布:在表示样本的特征确定以后,训练样本集的分布是具体而确定的,称之为“基于训练样本集的分布”;样本全集(通常都是无法获取的,是个理论概念),如果能够获取的话,同样对应着一个具体而确定的分布,称之为“基于样本全集的分布(实际上无法获得)”;严格意义上的同分布,是指基于训练样本集的分布与基于样本全集的分布完全相同

http://www.xdnf.cn/news/1209385.html

相关文章:

  • B 站搜一搜关键词优化:精准触达用户的流量密码
  • 牛顿拉夫逊法PQ分解法计算潮流MATLAB程序计算模型。
  • Go语言新手村:轻松理解变量、常量和枚举用法
  • 从centos更换至ubuntu的安装、配置、操作记录
  • 【iOS】类扩展与关联对象
  • 嵌入式学习日志(十一)
  • Kafka——消费者组重平衡全流程解析
  • 数据库-索引
  • 13、select_points_object_model_3d解析
  • 安卓逆向2-安卓刷机和获取root权限和安装LSPosed框架
  • Linux安装ragflow(含一键安装脚本)
  • vue中使用wavesurfer.js绘制波形图和频谱图
  • sqli-labs通关笔记-第25关GET字符注入(过滤or和and 脚本法)
  • buuctf_crypto26-30
  • 基于变频与移相混合控制(PFM+PSM)的全桥LLC谐振变换器仿真模型
  • 车载诊断架构 --- 关于诊断时间参数P4的浅析
  • QML 3D曲面图(Surface3D)技术
  • K-近邻算法(KNN算法)的K值的选取--交叉验证+网格搜索
  • 【C++算法】72.队列+宽搜_二叉树的最大宽度
  • adb reboot 与 adb shell svc power reboot 的区别
  • 【C++】1. C++基础知识
  • 【HTML】浅谈 script 标签的 defer 和 async
  • 企业高性能web服务器
  • EnergyMath芯详科技 EMS4100/MES4000/MES3900
  • 如何保证DoIP的网络安全?
  • 基于 xlsx-js-style 的 Excel 导出工具实现导出excel
  • 40+个常用的Linux指令——下
  • haproxy应用详解
  • 从github同步新项目的两次挫折-2025.7.29
  • 【WRF工具】服务器中安装编译GrADS