当前位置：首页 > ops >正文

概率论基础教程第六章随机变量的联合分布(一)

ops 2025/8/24 7:31:00

第6章随机变量的联合分布

6.1 联合分布函数

联合分布函数用于多个随机变量同时出现的概率特性。

定义

联合分布

设 $ X $ 和 $ Y $ 是两个随机变量，其联合累积分布函数定义为：

$P\{X \leq a, Y \leq b\}, \quad -\infty < a, b < \infty$

该函数描述了 $ X $ 和 $ Y $ 同时不超过某个值的概率。

边缘分布

从联合分布可以导出单个变量的分布，称为边缘分布。

对于 $ X $：
$F_X(a) = P\{X \leq a\} = \lim_{b \to \infty} F(a, b) \equiv F(a, \infty)$
对于 $ Y $：
$F_Y(b) = P\{Y \leq b\} = \lim_{a \to \infty} F(a, b) \equiv F(\infty, b)$

理论上，所有涉及 $ X $ 和 $ Y $ 的联合概率都可以通过 $ F(a,b) $ 求解。

例如，求 $ P{X > a, Y > b} $：

$\begin{array}{rcl} P\{X > a, Y > b\} & = & 1 - P\left(\{X > a, Y > b\}^c\right) \\ & = & 1 - P\left(\{X \leq a\} \cup \{Y \leq b\}\right) \\ & = & 1 - \left[P\{X \leq a\} + P\{Y \leq b\} - P\{X \leq a, Y \leq b\}\right] \\ & = & 1 - F_X(a) - F_Y(b) + F(a, b) \end{array} \tag{1.1}$

更一般地，对于区间概率：

$P\{a_1 \leq X \leq a_2, b_1 \leq Y \leq b_2\} = F(a_2, b_2) + F(a_1, b_1) - F(a_1, b_2) - F(a_2, b_1) \tag{1.2}$
其中 $ a_1 \leq a_2, b_1 \leq b_2 $。

联合分布列

当 $ X $ 和 $ Y $ 均为离散型时，定义其联合概率质量函数（joint PMF）为：

$p(x, y) = P\{X = x, Y = y\}$

边缘分布列由求和得到：

$ p_X(x) = P{X = x} = \sum_{y: p(x,y)>0} p(x,y) $
$ p_Y(y) = P{Y = y} = \sum_{x: p(x,y)>0} p(x,y) $

这些称为边缘分布列（marginal PMF），因其在联合分布表中位于“边缘”位置。

例 1a：抽球问题

坛中有 3 红球、4 白球、5 蓝球，从中随机抽取 3 个球。令 $ X $：红球数，$ Y $：白球数。

计算联合分布列 $ p(i,j) = P(X=i, Y=j) $，使用超几何模型：

$\frac{\binom{3}{i} \binom{4}{j} \binom{5}{3-i-j}}{\binom{12}{3}}, \quad \text{其中 } i+j \leq 3$

具体计算如下：

$ i \backslash j $	0	1	2	3	行和 $ = P(X=i) $
0	$ \frac{10}{220} $	$ \frac{40}{220} $	$ \frac{30}{220} $	$ \frac{4}{220} $	$ \frac{84}{220} $
1	$ \frac{30}{220} $	$ \frac{60}{220} $	$ \frac{18}{220} $	0	$ \frac{108}{220} $
2	$ \frac{15}{220} $	$ \frac{12}{220} $	0	0	$ \frac{27}{220} $
3	$ \frac{1}{220} $	0	0	0	$ \frac{1}{220} $
列和 $ = P(Y=j) $	$ \frac{56}{220} $	$ \frac{112}{220} $	$ \frac{48}{220} $	$ \frac{4}{220} $

例 1b：家庭孩子性别分布

某社区家庭子女分布：

无孩：15%
1孩：20%
2孩：35%
3孩：30%

每个孩子为男孩或女孩的概率均为 $ \frac{1}{2} $，且独立。

令 $ B $：男孩数，$ G $：女孩数。

计算联合分布列 $ P(B=i, G=j) $：

$ P(B=0, G=0) = P(\text{无孩}) = 0.15 $
$ P(B=0, G=1) = P(1\text{孩}) \cdot P(\text{女孩}) = 0.20 \times \frac{1}{2} = 0.10 $
$ P(B=0, G=2) = P(2\text{孩}) \cdot P(\text{两女}) = 0.35 \times \left(\frac{1}{2}\right)^2 = 0.0875 $
$ P(B=0, G=3) = 0.30 \times \left(\frac{1}{2}\right)^3 = 0.0375 $

其余类似（如 $ P(B=1,G=1) = 0.20 \times \frac{1}{2} = 0.10 $，$ P(B=2,G=0) = 0.35 \times \frac{1}{4} = 0.0875 $，等等）

结果见下表：

$ i \backslash j $	0	1	2	3	$ P(B=i) $
0	0.15	0.10	0.0875	0.0375	0.3750
1	0.10	0.175	0.1125	0	0.3875
2	0.0875	0.1125	0	0	0.2000
3	0.0375	0	0	0	0.0375
$ P(G=j) $	0.375	0.3875	0.2000	0.0375

联合密度函数

若存在非负函数 $ f(x,y) $，使得对任意二维区域 $ C $ 有：

$P\{(X,Y) \in C\} = \iint_{(x,y)\in C} f(x,y)\,dx\,dy \tag{1.3}$

则称 $ X,Y $ 为联合连续型随机变量，$ f(x,y) $ 为联合概率密度函数。

特别地，若 $ A,B $ 为实数集，则：

$P\{X \in A, Y \in B\} = \int_B \int_A f(x,y)\,dx\,dy \tag{1.4}$

由联合密度求联合分布函数
$P\{X \leq a, Y \leq b\} = \int_{-\infty}^b \int_{-\infty}^a f(x,y)\,dx\,dy$

若偏导数存在，则：

$\frac{\partial^2}{\partial a \partial b} F(a,b)$

直观理解密度函数

对于很小的 $ da, db $，有：

$P\{a < X < a+da, b < Y < b+db\} \approx f(a,b)\,da\,db$

即 $ f(a,b) $ 反映了 $ (X,Y) $ 在点 $ (a,b) $ 附近取值的“可能性密度”。

边缘密度函数

$ X $ 的边缘密度：
$f_X(x) = \int_{-\infty}^{\infty} f(x,y)\,dy$
$ Y $ 的边缘密度：
$f_Y(y) = \int_{-\infty}^{\infty} f(x,y)\,dx$

例 1c：指数型联合密度

设 $ X,Y $ 的联合密度为：

$\begin{cases} 2e^{-x}e^{-2y}, & x > 0, y > 0 \\ 0, & \text{否则} \end{cases}$

求：

(a) $ P(X > 1, Y < 1) $
$\begin{aligned} P(X > 1, Y < 1) &= \int_0^1 \int_1^\infty 2e^{-x}e^{-2y}\,dx\,dy \\ &= \int_0^1 2e^{-2y} \left[ -e^{-x} \right]_1^\infty dy = \int_0^1 2e^{-2y} e^{-1} dy \\ &= e^{-1} \int_0^1 2e^{-2y} dy = e^{-1}(1 - e^{-2}) \end{aligned}$

(b) $ P(X \leq Y) $

$\begin{aligned} P(X \leq Y) &= \iint_{x \leq y} 2e^{-x}e^{-2y} dx dy \\ &= \int_0^\infty \int_0^y 2e^{-x}e^{-2y} dx dy = \int_0^\infty 2e^{-2y}(1 - e^{-y}) dy \\ &= \int_0^\infty 2e^{-2y} dy - \int_0^\infty 2e^{-3y} dy = 1 - \frac{2}{3} = \frac{1}{3} \end{aligned}$

$\begin{aligned} P(X < a) &= \int_0^a \int_0^\infty 2e^{-x}e^{-2y} dy dx \\ &= \int_0^a e^{-x} \left( \int_0^\infty 2e^{-2y} dy \right) dx = \int_0^a e^{-x} \cdot 1\,dx = 1 - e^{-a} \end{aligned}$

例 1d：圆内均匀分布

在半径为 $ R $ 的圆内随机选一点，服从均匀分布。

设 $ (X,Y) $ 为坐标，则联合密度：

$\begin{cases} c, & x^2 + y^2 \leq R^2 \\ 0, & \text{否则} \end{cases}$

(a) 求常数 $ c $：

[!NOTE]

对于平面上的一个区域 $ D \subset \mathbb{R}^2 $，其面积可以用二重积分表示为：

$\text{Area}(D) = \iint_D 1 \, dx\,dy$

也就是说：在整个区域上对常数函数 1 积分，结果就是该区域的面积。

所以：

$\iint_{x^2 + y^2 \leq R^2} dx\,dy = \text{以原点为中心、半径为 } R \text{ 的圆的面积} = \pi R^2$

$\iint_{x^2+y^2 \leq R^2} c\,dx\,dy = c \cdot \pi R^2 = 1 \Rightarrow c = \frac{1}{\pi R^2}$

(b) 边缘密度 $ f_X(x) $：
$f_X(x) = \int_{-\sqrt{R^2 - x^2}}^{\sqrt{R^2 - x^2}} \frac{1}{\pi R^2} dy = \frac{2}{\pi R^2} \sqrt{R^2 - x^2}, \quad |x| \leq R$

同理，$ f_Y(y) = \frac{2}{\pi R^2} \sqrt{R^2 - y^2},\ |y| \leq R $

[!NOTE]

边缘密度 $ f_X(x) $ 是通过对联合密度 $ f(x,y) $ 关于 $ y $ 积分得到的：

$f_X(x) = \int_{-\infty}^{\infty} f(x, y)\, dy$

但由于 $ f(x,y) $ 只在圆 $ x^2 + y^2 \leq R^2 $ 内非零，所以我们只需要对满足这个条件的 $ y $ 积分。

对于一个固定的 $ x $，要使得 $ (x, y) $ 落在圆内，必须满足：

$x^2 + y^2 \leq R^2 \quad \Rightarrow \quad y^2 \leq R^2 - x^2 \quad \Rightarrow \quad |y| \leq \sqrt{R^2 - x^2}$

所以：

当 $ |x| > R $：没有 $ y $ 满足条件 → $ f_X(x) = 0 $
当 $ |x| \leq R $：$ y \in \left[ -\sqrt{R^2 - x^{2}, \sqrt{R}2 - x^2} \right] $

情况 1：当 $ |x| > R $ 时
$f_X(x) = 0$

因为联合密度在这些 $ x $ 处恒为 0。

情况 2：当 $ |x| \leq R $ 时
$\begin{aligned} f_X(x) &= \int_{-\infty}^{\infty} f(x, y)\, dy \\ &= \int_{y = -\sqrt{R^2 - x^2}}^{\sqrt{R^2 - x^2}} \frac{1}{\pi R^2}\, dy \quad \text{（因为在该区间内 } f(x,y) = \frac{1}{\pi R^2} \text{）} \\ &= \frac{1}{\pi R^2} \cdot \left[ y \right]_{y = -\sqrt{R^2 - x^2}}^{\sqrt{R^2 - x^2}} \\ &= \frac{1}{\pi R^2} \cdot \left( \sqrt{R^2 - x^2} - (-\sqrt{R^2 - x^2}) \right) \\ &= \frac{1}{\pi R^2} \cdot 2\sqrt{R^2 - x^2} \\ &= \frac{2}{\pi R^2} \sqrt{R^2 - x^2} \end{aligned}$

综上：
$f_X(x) = \begin{cases} \displaystyle \frac{2}{\pi R^2} \sqrt{R^2 - x^2}, & |x| \leq R \\ 0, & |x| > R \end{cases}$

© 原点距离 $ D = \sqrt{X^2 + Y^2} $ 的分布：
$F_D(a) = P(D \leq a) = P(X^2 + Y^2 \leq a^2) = \frac{\pi a^2}{\pi R^2} = \frac{a^2}{R^2},\quad 0 \leq a \leq R$

(d) $ E[D] $：

$f_D(a) = \frac{d}{da} F_D(a) = \frac{2a}{R^2},\quad 0 \leq a \leq R \Rightarrow E[D] = \int_0^R a \cdot \frac{2a}{R^2} da = \frac{2}{R^2} \int_0^R a^2 da = \frac{2R}{3}$

例 1e：比值分布

设 $ f(x,y) = e^{-(x+y)},\ x>0,y>0 $

求 $ Z = X/Y $ 的密度函数。

先求分布函数：

$\begin{aligned} F_Z(a) &= P\left(\frac{X}{Y} \leq a\right) = \iint_{x/y \leq a} e^{-(x+y)} dx dy \\ &= \int_0^\infty \int_0^{ay} e^{-(x+y)} dx dy = \int_0^\infty (1 - e^{-ay}) e^{-y} dy \\ &= \int_0^\infty e^{-y} dy - \int_0^\infty e^{-(a+1)y} dy = 1 - \frac{1}{a+1} \end{aligned}$

求导得密度：

$f_Z(a) = \frac{d}{da} F_Z(a) = \frac{1}{(a+1)^2},\quad a > 0$

n 维联合分布

推广到 $ n $ 个随机变量 $ X_1,\dots,X_n $：

联合分布函数：
$F(a_1,\dots,a_n) = P\{X_1 \leq a_1, \dots, X_n \leq a_n\}$
若存在函数 $ f(x_1,\dots,x_n) $，使得：
$KaTeX parse error: Undefined control sequence: \idotsint at position 30: …,X_n)\in C\} = \̲i̲d̲o̲t̲s̲i̲n̲t̲\limits_{(x_i)\…$
则称其为联合密度函数。
特别地：
$P\{X_1 \in A_1, \dots, X_n \in A_n\} = \int_{A_n} \cdots \int_{A_1} f(x_1,\dots,x_n) dx_1\cdots dx_n$

例 1f：多项分布（Multinomial Distribution）

进行 $ n $ 次独立试验，每次有 $ r $ 种结果，概率分别为 $ p_1,\dots,p_r $，且 $ \sum p_i = 1 $。

令 $ X_i $：第 $ i $ 种结果出现的次数。

则联合分布列为：

$P\{X_1=n_1,\dots,X_r=n_r\} = \frac{n!}{n_1!\cdots n_r!} p_1^{n_1} \cdots p_r^{n_r}, \quad \sum n_i = n \tag{1.5}$

证明思路：固定结果出现次数，共有 $ \frac{n!}{\prod n_i!} $ 种排列方式，每种概率为 $ \prod p_i^{n_i} $。

当 $ r=2 $ 时，退化为二项分布。

应用举例：掷骰子 9 次，求 1 出现 3 次，2、3 各 2 次，4、5 各 1 次，6 出现 0 次的概率：
$\frac{9!}{3!2!2!1!1!0!} \left(\frac{1}{6}\right)^9 = \frac{9!}{3!2!2!} \left(\frac{1}{6}\right)^9$

[!IMPORTANT]

这需要对之前曾经提到过的分组概率进行复习

6.2 独立随机变量

定义

随机变量 $ X $ 和 $ Y $ 独立，当且仅当对任意集合 $ A,B $：

$P\{X \in A, Y \in B\} = P\{X \in A\} P\{Y \in B\} \tag{2.1}$

等价地：

$F_X(a) F_Y(b),\quad \forall a,b$

离散情形下的独立性
$p_X(x) p_Y(y),\quad \forall x,y \tag{2.2}$

连续情形下的独立性
$f_X(x) f_Y(y),\quad \forall x,y$

独立性的等价条

$ X,Y $ 独立 $ \iff $ 联合密度（或分布列）可分解为：

$f_{X,Y}(x,y) = h(x) g(y)$

证明（连续情形）：

设 $ f(x,y) = h(x)g(y) $，则：

$\int\int h(x)g(y) dx dy = \left(\int h(x)dx\right)\left(\int g(y)dy\right) = C_1 C_2$

令：

$ f_X(x) = C_1 h(x) $
$ f_Y(y) = C_2 g(y) $

则 $ f(x,y) = f_X(x) f_Y(y) $，故独立。

例题

例 2a：二项试验的独立性

进行 $ n+m $ 次独立伯努利试验，$ X $：前 $ n $ 次成功次数，$ Y $：后 $ m $ 次成功次数。

由于试验独立，$ X,Y $ 独立。

验证：
$\binom{n}{x} p^x (1-p)^{n-x} \binom{m}{y} p^y (1-p)^{m-y} = P(X=x)P(Y=y)$

但 $ X $ 与总成功数 $ Z = X+Y $ 相关。

例 2b：泊松拆分

设进入邮局总人数为参数 $ \lambda $ 的泊松变量。每人是男性概率 $ p $，女性 $ 1-p $，且独立。

令 $ X $：男性人数，$ Y $：女性人数。

结论：$ X \sim \text{Poisson}(\lambda p) $，$ Y \sim \text{Poisson}(\lambda(1-p)) $，且 $ X,Y $ 独立。

证明：

$\begin{aligned} P(X=i,Y=j) &= P(X=i,Y=j \mid X+Y=i+j) P(X+Y=i+j) \\ &= \binom{i+j}{i} p^i (1-p)^j \cdot e^{-\lambda} \frac{\lambda^{i+j}}{(i+j)!} \\ &= e^{-\lambda} \frac{(\lambda p)^i}{i!} \frac{[\lambda(1-p)]^j}{j!} \\ &= \left[e^{-\lambda p} \frac{(\lambda p)^i}{i!}\right] \left[e^{-\lambda(1-p)} \frac{[\lambda(1-p)]^j}{j!}\right] \end{aligned}$

故 $ P(X=i,Y=j) = P(X=i)P(Y=j) $，独立得证。

例 2c：等待时间问题

两人约定 12:00–13:00 见面，到达时间独立且服从 $ (0,60) $ 上的均匀分布。

求先到者等待超过 10 分钟的概率。

设 $ X,Y \sim U(0,60) $，独立。

所求概率为：

[!NOTE]

观察这两个概率：

$ P(Y > X + 10) $：女士比男士晚到超过 10 分钟
$ P(X > Y + 10) $：男士比女士晚到超过 10 分钟

由于：

$ X $ 和 $ Y $ 都服从相同的分布：$ U(0,60) $
$ X $ 和 $ Y $ 相互独立
两人的行为完全对称（没有谁“优先”）

所以这两个事件的概率是相等的！

$P (∣ X - Y ∣ > 10) = P (X + 10 < Y) + P (Y + 10 < X) = 2 P (X + 10 < Y)$

$\begin{aligned} 2P(X+10 < Y) &= 2 \int_{10}^{60} \int_0^{y-10} \left(\frac{1}{60}\right)^2 dx dy \\ &= \frac{2}{3600} \int_{10}^{60} (y - 10) dy = \frac{2}{3600} \cdot \frac{(50)^2}{2} = \frac{2500}{3600} = \frac{25}{36} \end{aligned}$

例 2d：蒲丰投针问题

平行线间距 $ D $，针长 $ L \leq D $。随机投针，求与某线相交的概率。

设：

$ X $：针中点到最近线的距离，$ X \sim U(0, D/2) $
$ \theta $：针与垂线夹角，$ \theta \sim U(0, \pi/2) $
$ X,\theta $ 独立

相交条件：$ X < \frac{L}{2} \cos\theta $

$\begin{aligned} P(\text{相交}) &= \iint_{x < \frac{L}{2} \cos\theta} f_X(x) f_\theta(\theta) dx d\theta \\ &= \frac{4}{\pi D} \int_0^{\pi/2} \int_0^{\frac{L}{2} \cos\theta} dx d\theta = \frac{4}{\pi D} \int_0^{\pi/2} \frac{L}{2} \cos\theta d\theta = \frac{2L}{\pi D} \end{aligned}$