当前位置: 首页 > news >正文

Beta分布--贝叶斯建模概率或比例常用分布

Beta分布是一种定义在区间 ([0, 1]) 上的连续概率分布,常用于描述比例或概率的不确定性。它的形状由两个正参数 (\alpha)(alpha)和 (\beta)(beta)控制,能够呈现多种形态(如对称、偏态、U型等)。


1. 概率密度函数(PDF)

Beta分布的概率密度函数为:
f ( x ; α , β ) = x α − 1 ( 1 − x ) β − 1 B ( α , β ) , x ∈ [ 0 , 1 ] f(x; \alpha, \beta) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha, \beta)}, \quad x \in [0, 1] f(x;α,β)=B(α,β)xα1(1x)β1,x[0,1]
其中:

  • (B(\alpha, \beta)) 是Beta函数,用于归一化:
    B ( α , β ) = ∫ 0 1 t α − 1 ( 1 − t ) β − 1 d t = Γ ( α ) Γ ( β ) Γ ( α + β ) B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} dt = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)} B(α,β)=01tα1(1t)β1dt=Γ(α+β)Γ(α)Γ(β)
  • (\Gamma(\cdot)) 是伽马函数(Gamma function),满足 (\Gamma(n) = (n-1)!) 对正整数 (n)。

2. 分布的形状

Beta分布的形状由 (\alpha) 和 (\beta) 决定:

  • 对称分布:当 (\alpha = \beta) 时,分布对称(如 (\alpha=\beta=1) 时为均匀分布;(\alpha=\beta=2) 时为钟形)。
  • 偏态分布
    • (\alpha > \beta):左偏(峰值靠近1)。
    • (\alpha < \beta):右偏(峰值靠近0)。
  • 极端形态
    • (\alpha, \beta < 1):U型(集中在0和1附近)。
    • (\alpha = 1, \beta > 1):递减。
    • (\beta = 1, \alpha > 1):递增。
典型例子
参数 ((\alpha, \beta))形状描述示例场景
((1, 1))均匀分布(Flat)无先验信息时假设。
((2, 2))对称钟形(峰值在0.5)硬币公平性的温和先验。
((5, 1))极端右偏(峰值靠近1)成功概率很高的场景。
((0.5, 0.5))U型(双峰在0和1)两极分化强烈的比例(如点击率)。

3. 可视化示例

下图展示了不同参数组合下的Beta分布形状:
在这里插入图片描述

  • 红色曲线:((0.5, 0.5)) → U型。
  • 蓝色曲线:((5, 1)) → 左偏。
  • 绿色曲线:((2, 5)) → 右偏。
  • 黑色曲线:((1, 1)) → 均匀分布。

4. 统计性质

  • 期望(均值)
    E [ X ] = α α + β E[X] = \frac{\alpha}{\alpha + \beta} E[X]=α+βα
  • 方差
    Var ( X ) = α β ( α + β ) 2 ( α + β + 1 ) \text{Var}(X) = \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)} Var(X)=(α+β)2(α+β+1)αβ
  • 众数(峰值点)(当 (\alpha, \beta > 1)):
    Mode = α − 1 α + β − 2 \text{Mode} = \frac{\alpha - 1}{\alpha + \beta - 2} Mode=α+β2α1

5. 应用场景

Beta分布常用于:

  1. 贝叶斯统计:作为二项分布参数的共轭先验(如点击率、转化率)。
  2. A/B测试:建模两个版本的胜率。
  3. 概率建模:描述任何有界区间(如用户评分、完成率)。

6. 与其他分布的关系

  • 二项分布:Beta分布是二项分布参数 (p) 的共轭先验。
  • 均匀分布:当 (\alpha = \beta = 1) 时,Beta分布退化为均匀分布。

总结

Beta分布是一个灵活的概率分布,通过调整 (\alpha) 和 (\beta) 可以模拟从均匀分布到极端偏态的各种形态,特别适合建模比例或概率的不确定性。其数学性质良好,是贝叶斯分析中的核心工具之一。

http://www.xdnf.cn/news/397585.html

相关文章:

  • eNsp的使用
  • 数据结构【二叉树的遍历实现】
  • 免费公共DNS服务器推荐
  • 如何读论文【论文精读】
  • opencascade.js stp vite webpack 调试笔记
  • C++ STL编程 vector空间预留、vector高效删除、vector数据排序、vector代码练习
  • 风扇接口
  • 自制PowerPoint荧光笔插件指南
  • 集合(超详细)
  • 【人工智能】DeepSeek的崛起-下一代AI模型的秘密武器
  • 微调自qwen3的无审查大模型(需谨慎使用):Josiefied-Qwen3-8B-abliterated-v1
  • LeetCode 热题 100 101. 对称二叉树
  • 单链表C语言实现(付代码全)
  • 进程检测与控制
  • C++学习之STL学习
  • 联合类型的逻辑或关系与类型保护
  • 关于我在实现用户头像更换时遇到的图片上传和保存的问题
  • Colab使用_文件操作
  • C++.IP协议通信
  • 【C++进阶】第3课—二叉搜索树
  • C++猴子摘桃 2024年信息素养大赛复赛 C++小学/初中组 算法创意实践挑战赛 真题详细解析
  • [超详细,推荐!!!]前端性能优化策略详解
  • VC++ 获取CPU信息的两种方法
  • POSIX信号量
  • 【软件测试】基于项目驱动的功能测试报告(持续更新)
  • k8s中ingress-nginx介绍
  • Spring Boot 中的重试机制
  • 【Python】Python类型标注革命:Annotated类型深度解析与实战
  • 匈牙利算法
  • 信息系统项目管理师-软考高级(软考高项)​​​​​​​​​​​2025最新(十七)