当前位置: 首页 > ai >正文

贝叶斯分类器的相关理论学习

一、贝叶斯决策

  • 条件风险

    其中 N 是总的类别标记,\lambda_{ij} 是将样本 c_j 误分类成 c_i 所产生的损失,x 是样本。

  • 总体风险

    R(h)=\mathbb{E}_x[R(h(x)\mid x)]\space.

    其中 h 为最小化总体风险的判定准则。R(h(x)\mid x) 最小了的话,那么 R(h) 就最小了,即只需要选出每个样本上条件风险最小的类别标记

    h^*(x) = \operatorname*{arg\,min}_{c \in \mathcal{Y}} R(c \mid x) \,,

    该公式被称为贝叶斯最优分类器,对应的 R(h^*) 叫做贝叶斯风险1-R(h^*) 即为分类器的最好性能。

  • 最小化分类错误率的贝叶斯最优分类器为:

    h^*(x) = \operatorname*{arg\,max}_{c \in \mathcal{Y}} P(c \mid x) \,,

    就相当于选择后验率最大的类别标记。

二、极大似然估计(结合概率论理解)

  • 通俗来说就是条件概率的连乘。

    P(D_c\mid \theta_c)=\prod_{x\in D_c}\space P(x\mid \theta_c)\space.

    和概率论中一样,由于连乘容易下溢,一般都是取对数之后在继续求极大似然。

    要求 \theta_c 的极大似然估计,就相当于就上述函数的极值。

三、朴素贝叶斯分类器

  • 基本的理解就可以完全按照概率论中的贝叶斯公式来理解,分一下离散和连续两种情况的 P(x_i\mid c) 的计算方式:

    • 离散:目标样本数 / 总样本数;

    • 连续:

      \frac{1}{\sqrt{2\pi}\sigma_{c,i}}\exp\bigg(-\frac{(x_i-\mu_{c,i})^2}{2\sigma^2_{c,i}} \bigg)\space.

    其中的理解还是与数学概率论中相同;

四、半朴素贝叶斯分类器

  • 独依赖:每个属性在各自的类别外最多依赖一个其他属性。

  • 超父属性:假设所有属性都依赖于同一个属性。

  • \text{TAN} 属性依赖:

  • \text{AODE} :是将每个属性作为超父来构建 \text{SPODE} 。

五、贝叶斯网(信念网)

  • 贝叶斯网结构上就是一个有向无环图。

  • 在网络中每个属性都和它的非后裔属性独立,其联合概率分布为:

    P_B(x_1,x_2,...,x_d)=\prod^d_{i=1}P_B(x_i\mid \pi_i)=\prod^d_{i=1}\theta_{x_i|\pi_i}\space,

    其中 \pix 的父节点。

  • 道德图:即把有向图中的所有 \text{V} 型结构的两个父节点连上,再把所有的有向边改为无向边。

  • “最小描述长度”准则:一般通常情况下我们是通过评分函数来寻找最好的贝叶斯网络(基于信息论准则),找一个以最短编码长度描述训练数据的模型。

  • 评分函数

s(B\mid D)=f(\theta)|B|-LL(B\mid D)\space,

其中,|B| 是贝叶斯网的参数个数,f(\theta) 表示描述每个参数 \theta 所需要的字节数。

:贝叶斯网在推理的时候是按照马尔科夫链的原理来的。

http://www.xdnf.cn/news/15815.html

相关文章:

  • Qwen3-8B 的 TTFT 性能分析:16K 与 32K 输入 Prompt 的推算公式与底层原理详解
  • 乐观锁实现原理笔记
  • 【论文阅读笔记】RF-Diffusion: Radio Signal Generation via Time-Frequency Diffusion
  • 考研最高效的准备工作是什么
  • 力扣面试150(34/150)
  • 隧道无线调频广播与“群载波”全频插播技术在张石高速黑石岭隧道中的应用
  • 44.sentinel授权规则
  • 【Java多线程-----复习】
  • 04训练windows电脑低算力显卡如何部署pytorch实现GPU加速
  • 标准制修订管理系统:制造业高质量发展的关键支撑
  • 【Java学习|黑马笔记|Day18】Stream流|获取、中间方法、终结方法、收集方法
  • python 装饰器的类型提示讲解
  • 下载win10的方法
  • Hiredis 构建 Redis 命令实战指南
  • 操作系统总结
  • XSS GAME靶场
  • 网络原理——IP
  • 深度神经网络原理学习记录
  • 微服务雪崩防护最佳实践之sentinel
  • Django ORM系统
  • SearchService 该类只运行在数据节点
  • 【文件IO】认识文件描述符和内核缓冲区
  • SSH开启Socks5服务
  • C++ STL容器
  • 金融大前端中的 AI 应用:智能投资顾问与风险评估
  • 【Nature Communications】GaN外延层中位错辅助的电子和空穴输运
  • 0401聚类-机器学习-人工智能
  • nvm、npm、pnpm、cnpm、yarn
  • 《深入C++多态机制:从虚函数表到运行时类型识别》​
  • 数据并表技术全面指南:从基础JOIN到分布式数据融合