当前位置: 首页 > backend >正文

[概率论基本概念1]什么是经验分布

一、说明

描述一个概率模型,有密度函数很好描述。如果写不出密度函数,退而用分布函数也能完整刻画,因此,分布函数表示比密度函数表示更加宽泛普适。本片讲述经验分布拟合分布函数的基础概念。

二、经验分布直观解释

在统计学中,经验分布函数(又称经验累积分布函数,eCDF )是与样本的经验测度相关的分布函数。该累积分布函数是一个阶跃函数,在n 个数据点处,其值在每个数据点上都以1/ n 的幅度跃升。对于任何指定的测量变量值,其值是该测量变量观测值中小于或等于该指定值的比率。
在这里插入图片描述
绿色曲线渐近地接近0和1的高度,但未达到这两个高度,它是标准正态分布的真实累积分布函数。
灰色线段表示从该分布中抽取的特定样本的观测值,蓝色阶跃函数的水平阶跃(包括每一步的最左侧点,但不包括最右侧点)构成了该样本的经验分布函数。(单击此处加载新图表。)

经验分布函数是生成样本点的累积分布函数的估计值。根据格利文科-坎泰利定理,它以概率 1 收敛到该基础分布。目前有许多结果可以量化经验分布函数向基础累积分布函数的 收敛速度。

三、经验分布解析表述

设( X 1 , …, X n )为独立同分布的实随机变量,具有共同的累积分布函数 F ( t )。则经验分布函数定义为[
在这里插入图片描述
在这里 1 A 1_A 1A是事件A的指标,对于给定的t,指标 1 X i ≤ t {\displaystyle \mathbf {1} _{X_{i}\leq t}} 1Xit是参数为 p = F ( t ) p = F ( t ) p=F(t)的伯努利随机变量;因此
n F ^ n ( t ) {\displaystyle n{\widehat {F}}_{n}(t)} nF n(t)是一个二项式随机变量,均值为 n F ( t ) nF ( t ) nF(t),方差为 n F ( t ) ( 1 − F ( t ) ) nF ( t )(1 − F ( t )) nF(t)(1F(t))。这意味着 F ^ n ( t ) {\displaystyle {\widehat {F}}_{n}(t)} F n(t)是F ( t )的无偏估计量。

然而,在一些教科书中,其定义如下
在这里插入图片描述

四、渐进性质

由于当 n n n趋向无穷大时,比率 ( n + 1 ) / n ( n + 1)/ n (n+1)/n趋近于 1 ,因此上面给出的两个定义的渐近性质是相同的。

根据强大数定律,估计量
F ^ n ( t ) {\displaystyle \scriptstyle {\widehat {F}}_{n}(t)} F n(t)对于t的每一个值,当n  → ∞时几乎肯定收敛于F ( t ):
在这里插入图片描述
因此估计量 F ^ n ( t ) {\displaystyle \scriptstyle {\widehat {F}}_{n}(t)} F n(t)是一致的。该表达式断言了经验分布函数逐点收敛于真实的累积分布函数。有一个更强的结论,称为格利文科-坎泰利定理,它指出收敛实际上在t上均匀发生:
在这里插入图片描述
这个表达式中的 sup-norm 称为Kolmogorov–Smirnov 统计量,用于检验经验分布之间的拟合优度
F ^ n ( t ) {\displaystyle \scriptstyle {\widehat {F}}_{n}(t)} F n(t)以及假设的真实累积分布函数F。这里可以合理地使用其他范数函数来代替 sup 范数。例如,L2范数可以推导出Cramér–von Mises 统计量。

渐近分布可以用几种不同的方式进一步刻画。首先, 中心极限定理指出,逐点 F ^ n ( t ) {\displaystyle \scriptstyle {\widehat {F}}_{n}(t)} F n(t)具有渐近正态分布,标准 n {\displaystyle {\sqrt {n}}} n 收敛速度:
在这里插入图片描述
这个结果由Donkser定理扩展。该定理断言经验过程 n ( F ^ n − F ) {\displaystyle \scriptstyle {\sqrt {n}}({\widehat {F}}_{n}-F)} n (F nF),被视为一个函数,索引为 t ∈ R {\displaystyle \scriptstyle t\in \mathbb {R} } tR,在Skorokhod 空间中分布收敛 D [ − ∞ , + ∞ ] {\displaystyle \scriptstyle D[-\infty ,+\infty ]} D[,+]均值零高斯过程格 G F = B ∘ F {\displaystyle \scriptstyle G_{F}=B\circ F} GF=BF其中B是标准布朗桥。

http://www.xdnf.cn/news/7644.html

相关文章:

  • 【NLP 76、Faiss 向量数据库】
  • Easylogging使用笔记
  • 【开源】一个基于 Vue3 和 Electron 开发的第三方网易云音乐客户端,具有与官方客户端相似的界面布局
  • pom.xml中的runtime
  • 关于汇编语言与接口技术——单片机串行口的学习心得
  • thread 的mutex优化
  • 基于FFT变换的雷达信号检测和参数估计matlab性能仿真
  • 每日两道leetcode(今天开始刷基础题模块——这次是之前的修改版)
  • ES 调优帖:关于索引合并参数 index.merge.policy.deletePctAllowed 的取值优化
  • 数字展厅是什么?怎样实现数字展厅的落地?
  • matlab编写的BM3D图像去噪方法
  • SpringBoot-4-Spring Boot项目配置文件和日志配置
  • 电子制造企业智能制造升级:MES系统应用深度解析
  • centos7安装mysql8.0
  • Android trace presentFence屏幕显示的帧
  • sgRNA的靶基因基因组如何获得? for 下游的 T7E1验证
  • 不同的二叉搜索树 II:动态规划与递归构造
  • JavaScript作用域和作用域链
  • web开发全过程总结
  • 创建一个使用 GPT-4o 和 SERP 数据的 RAG 聊天机器人
  • deepseek梳理java高级开发工程师es面试题
  • 1.3 C++之变量与数据类型
  • Vue百日学习计划Day43-45天详细计划-Gemini版
  • Jenkins+Docker+Harbor快速部署Spring Boot项目详解
  • sv数据格式转换
  • 【氮化镓】低剂量率对GaN HEMT栅极漏电的影响
  • 2025年第十一届传感器、机电一体化和自动化系统国际学术研讨会(ISSMAS 2025)
  • 景区卡机数据报表-跨服务查看数据教程——诸天万界相连—仙盟创梦IDE
  • docker容器知识
  • 宿州金博学校开展防震演练:夯实安全根基,守护校园平安