当前位置: 首页 > ai >正文

Beta分布Dirichlet分布

目录

  • Beta分布
  • Dirichlet分布
  • Beta分布&Dirichlet分布
  • 从Dirichlet分布生成Beta样本
  • Beta分布&Dirichlet分布应用



Beta分布

Beta分布是定义在区间 [ 0 , 1 ] [0, 1] [0,1]上的连续概率分布,通常用于模拟概率或比例的随机变量。Beta分布的概率密度函数(PDF)如下:

f ( x ; α , β ) = Γ ( α + β ) Γ ( α ) Γ ( β ) x α − 1 ( 1 − x ) β − 1 f(x; \alpha, \beta) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha - 1}(1 - x)^{\beta - 1} f(x;α,β)=Γ(α)Γ(β)Γ(α+β)xα1(1x)β1其中:

  • x x x是随机变量,取值范围在 [ 0 , 1 ] [0, 1] [0,1] 之间。
  • α \alpha α β \beta β是形状参数,它们都是正实数 ( α > 0 , β > 0 ) ( \alpha > 0, \beta > 0 ) (α>0,β>0
  • Γ \Gamma Γ是伽马函数,它是阶乘函数在实数与复数域上的扩展。

Beta分布的概率密度函数可以进一步简化为:

f ( x ; α , β ) = x α − 1 ( 1 − x ) β − 1 B ( α , β ) f(x; \alpha, \beta) = \frac{x^{\alpha - 1}(1 - x)^{\beta - 1}}{B(\alpha, \beta)} f(x;α,β)=B(α,β)xα1(1x)β1

其中 ( B(\alpha, \beta) ) 是Beta函数,定义为:

B ( α , β ) = Γ ( α ) Γ ( β ) Γ ( α + β ) B(\alpha, \beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)} B(α,β)=Γ(α+β)Γ(α)Γ(β)

Beta函数是两个伽马函数的比值,它确保了概率密度函数的积分总和为1。


Dirichlet分布

Dirichlet分布是定义在K维实数向量上的多项分布的共轭先验,通常用于模拟多类别分布。Dirichlet分布的概率密度函数(PDF)如下:

f ( x ; α ) = Γ ( ∑ i = 1 K α i ) ∏ i = 1 K Γ ( α i ) ∏ i = 1 K x i α i − 1 f(\mathbf{x}; \boldsymbol{\alpha}) = \frac{\Gamma\left(\sum_{i=1}^K \alpha_i\right)}{\prod_{i=1}^K \Gamma(\alpha_i)} \prod_{i=1}^K x_i^{\alpha_i - 1} f(x;α)=i=1KΓ(αi)Γ(i=1Kαi)i=1Kxiαi1

其中:

  • x = ( x 1 , x 2 , … , x K ) \mathbf{x} = (x_1, x_2, \ldots, x_K) x=(x1,x2,,xK)是随机变量,每个 x i x_i xi取值范围在 [ 0 , 1 ] [0, 1] [0,1] 之间,并且 ∑ i = 1 K x i = 1 \sum_{i=1}^K x_i = 1 i=1Kxi=1
  • α = ( α 1 , α 2 , … , α K ) \boldsymbol{\alpha} = (\alpha_1, \alpha_2, \ldots, \alpha_K) α=(α1,α2,,αK)是形状参数,每个 α i \alpha_i αi都是正实数 ( α i > 0 ) ( \alpha_i > 0 ) (αi>0)
  • Γ \Gamma Γ是伽马函数。

Dirichlet分布的概率密度函数可以进一步简化为:

f ( x ; α ) = ∏ i = 1 K x i α i − 1 Dir ( α ) f(\mathbf{x}; \boldsymbol{\alpha}) = \frac{\prod_{i=1}^K x_i^{\alpha_i - 1}}{\text{Dir}(\boldsymbol{\alpha})} f(x;α)=Dir(α)i=1Kxiαi1

其中 ( \text{Dir}(\boldsymbol{\alpha}) ) 是Dirichlet函数,定义为:

Dir ( α ) = Γ ( ∑ i = 1 K α i ) ∏ i = 1 K Γ ( α i ) \text{Dir}(\boldsymbol{\alpha}) = \frac{\Gamma\left(\sum_{i=1}^K \alpha_i\right)}{\prod_{i=1}^K \Gamma(\alpha_i)} Dir(α)=i=1KΓ(αi)Γ(i=1Kαi)

Dirichlet函数确保了概率密度函数的积分总和为1。


Beta分布&Dirichlet分布

  • Beta分布和Dirichlet分布的概率密度函数都涉及到了伽马函数 ( Γ ) (\Gamma) (Γ)。这种函数在数学中非常重要,特别是在处理与概率和统计相关的问题时。

  • 两者的概率密度函数都具有幂函数的形式,其中Beta分布是一维的,而Dirichlet分布是多维的。Dirichlet分布可以看作是Beta分布的多维推广。


从Dirichlet分布生成Beta样本

  • Dirichlet分布的一个有趣性质是,它可以用于生成Beta分布的样本。具体来说,如果我们从Dirichlet分布 Dir ( α ) \text{Dir}(\boldsymbol{\alpha}) Dir(α) 中生成一个样本 x = ( x 1 , x 2 , … , x K ) \mathbf{x} = (x_1, x_2, \ldots, x_K) x=(x1,x2,,xK),那么对于任意 i i i j j j ( i ≠ j ) (i \neq j) (i=j),比值 x i x i + x j \frac{x_i}{x_i + x_j} xi+xjxi服从参数为 α i \alpha_i αi α j \alpha_j αj的Beta分布。



Beta分布&Dirichlet分布应用

  • Beta分布:常用于贝叶斯统计中,作为二项分布的共轭先验。它也可以用于建模概率或比例,例如在信用评分、市场研究等领域。
  • Dirichlet分布:常用于贝叶斯统计中,作为多项分布的共轭先验。它也可以用于建模多类别分布,例如在主题模型、聚类分析等领域。

这些分布的概率密度函数在贝叶斯统计和机器学习中非常重要,因为它们提供了一种自然的方式来表示和处理概率分布。



http://www.xdnf.cn/news/10400.html

相关文章:

  • [Python] Python中的多重继承
  • 飞牛fnNAS装机之迷你小主机的利旧
  • SolidWorks软件的安装与卸载
  • 12 Java GUI
  • Word双栏英文论文排版攻略
  • 【解决】【亲测下载obsidian可行】打不开github.com 或者 加速访问 github
  • Pull Request Integration 拉取请求集成
  • Python实现HPSO-TVAC优化算法优化支持向量机SVC分类模型项目实战
  • QT/c++航空返修数据智能分析系统
  • 重读《人件》Peopleware -(15)Ⅱ 办公环境 Ⅷ 撑伞之步:构建理想办公环境(上)
  • 数据中台(大数据平台)之数据安全管理
  • InternVL2.5-多模态大模型评估专业图片
  • Python爬虫:AutoScraper 库详细使用大全(一个智能、自动、轻量级的网络爬虫)
  • 从模式到架构:Java 工厂模式的设计哲学与工程化实践
  • 【办公类-22-05】20250601Python模拟点击鼠标上传CSDN12篇
  • 开始使用 Elastic AI Assistant for Observability 和 Amazon Bedrock
  • 接口自动化常用断言方式
  • 小明的Java面试奇遇之商城系统的技术挑战与实战
  • 考研系列—操作系统:第五章、输入输出(I/O)管理
  • Cesium快速入门到精通系列教程三
  • c++学习值---模版
  • 【计算机网络】第3章:传输层—可靠数据传输的原理
  • [蓝桥杯]外卖店优先级
  • 【极客日常】分享go开发中wire和interface配合的一些经验
  • C++ 之 多态 【虚函数表、多态的原理、动态绑定与静态绑定】
  • Scratch节日 | 六一儿童节射击游戏
  • ​​技术深度解析:《鸿蒙5.0+:全场景能效的产业革命》​
  • idea中springboot2.7(由于步入另一个线程,已跳过 xxx 处的断点)
  • Azure Devops 系列之三- vscode部署function app
  • 017搜索之深度优先搜索——算法备赛