多维随机变量及其分布
二维随机变量
分布函数的定义 设 \((X, Y)\) 是二维随机变量,对于任意实数 \(x\),\(y\),二元函数:
\[ F(x, y) = P\{(X \leq x) \cap (Y \leq y)\} = P\{X \leq x, Y \leq y\} \]
称为二维随机变量 \((X, Y)\) 的分布函数,或称为随机变量 \(X\),\(Y\) 的联合分布函数。
我们称 \(P\{X = x_i, Y = y_i\} = p_{ij}, i, j = 1, 2, \cdots\) 为二维离散型随机变量 \((X, Y)\) 的分布律,或称为随机变量 \(X\) 和 \(Y\) 的联合分布律。 同样我们可以定义连续型随机变量的分布函数:对于二维变量 \((X, Y)\) 的分布函数 \(F(x, y)\),如果存在非负可积函数 \(f(x, y)\) 使对于任意 \(x\),\(y\) 有
\[ F(x, y) = \int_{-\infty}^{y} \int_{-\infty}^{x} f(u, v) \text{d}u \text{d}v \]
则称 \((X, Y)\) 是二维连续型随机变量,函数 \(f(x, y)\) 称为二维连续型随机变量 \((X, Y)\) 的概率密度函数,或称为随机变量 \(X\) 和 \(Y\) 的联合概率密度。
边缘分布
二维随机变量 \((X, Y)\) 作为一个整体,具有分布函数 \(F(x, y)\),而 \(X\) 和 \(Y\) 都是随机变量,各自也有分布函数,将它们分别记为 \(F_{X}(x)\),\(F_{Y}(y)\),依次称为二维随机变量 \((X, Y)\) 关于 \(X\) 和关于 \(Y\) 的边缘分布函数。边缘分布函数可以由 \((X, Y)\) 的分布函数 \(F(x, y)\) 所确定,事实上,
\[ F_{X}(x) = P\{X \leq x\} = P\{X \leq x, Y < \infty\} = F(x, \infty) \]
也就是说,只要在函数 \(F(x, y)\) 中令 \(y \to \infty\) 就能得到 \(F_{X}(x)\)。
对于离散型随机变量,已知 \(X\) 和 \(Y\) 的分布律为,则称
\[ \begin{aligned} P\{X = x_{i}\} &= \sum_{j = i}^{\infty} p_{ij}, \quad i = 1, 2, \cdots \\ P\{Y = y_{j}\} &= \sum_{i = i}^{\infty} p_{ij}, \quad j = 1, 2, \cdots \end{aligned} \]
分别为关于 \(X\) 和关于 \(Y\) 的边缘概率密度。
对于连续型随机变量,设它的概率密度为 \(f(x, y)\),称
\[ \begin{aligned} f_{X}(x) &= \int_{-\infty}^{\infty} f(x, y) \text{d}y \\ f_{Y}(y) &= \int_{-\infty}^{\infty} f(x, y) \text{d}x \end{aligned} \]
分别为关于 \(X\) 和关于 \(Y\) 的边缘概率密度。
条件分布
设 \((X, Y)\) 是二维离散型随机变量,对于固定的 \(j\),若 \(P\{Y = y_{j}\} > 0\),则称
\[ P\{X = x_{i} | Y = y_{j}\} = \frac{P\{X = x_{i}. Y = y_{j}\}}{P\{Y = y_{j}\}}, \quad i = 1, 2, \cdots \]
为在 \(Y = y_{j}\) 条件下随机变量 \(X\) 的条件分布律。
同样可以定义连续型随机变量的条件分布律。设二维随机变量 \((X, Y)\) 的概率密度为 \(f(x, y)\),\((X, Y)\) 关于 \(Y\) 的边缘概率密度为 \(f_{Y}(y)\)。若对于固定的 \(y\),\(f_{Y}(y) > 0\),则称 \(\frac{f(x, y)}{f_{Y}(y)}\) 为在 \(Y = y\) 的条件下的条件概率密度,记为
\[ f_{X | Y}(x \mid y) = \frac{f(x, y)}{f_{Y}(y)} \]
称 \(\int_{-\infty}^{x} f_{X | Y}(x \mid y) \text{d}x = \int_{-\infty}^{x} \frac{f(x, y)}{f_{Y}(y)} \text{d}x\) 为在 \(Y = y\) 的条件下 \(X\) 的条件分布函数,记为 \(P\{X \leq x | Y = y\}\) 或 \(F_{X | Y}(x \mid y)\),即
\[ F_{X | Y}(x \mid y) = P\{X \leq x | Y = y\} = \int_{-\infty}^{x} \frac{f(x, y)}{f_{Y}(y)} \text{d}x \]
相互独立的随机变量
设 \(F(x, y)\) 及 \(F_{X}(x)\),\(F_{Y}(y)\) 分别是二维随机变量 \((X, Y)\) 的分布函数及边缘分布函数,若对于所有 \(x\),\(y\) 有
\[ P\{X \leq x, Y \leq y\} = P\{X \leq x\} P\{Y \leq y\} \]
即
\[ F(x, y) = F_{X}(x) F_{Y}(y) \]
则称随机变量 \(X\) 和 \(Y\) 是相互独立的。
设 \((X, Y)\) 是连续型随机变量,\(f(x, y)\),\(f_{X}(x)\),\(f_{Y}(y)\) 分别为 \((X, Y)\) 的概率密度和边缘概率密度,则 \(X\) 和 \(Y\) 相互独立的条件等价于下式
\[ f(x, y) = f_{X}(x) f_{Y}(y) \]
在平面上几乎处处成立。
当 \((X, Y)\) 是离散型随机变量时,\(X\) 和 \(Y\) 相互独立的条件等价于:对于 \((X, Y)\) 的所有可能取的值 \((x_{i}, y_{j})\) 有
\[ P\{X = x_{i}, Y = y_{j}\} = P\{X = x_{i}\} P\{Y = y_{j}\} \]
Z = X + Y
若随机变量 \(Z = X + Y\),一般情况下,该随机变量的概率密度为
\[ \begin{aligned} f_{X + Y}(z) &= \int_{-\infty}^{\infty} f(z - y, y) \text{d}y \\ f_{X + Y}(z) &= \int_{-\infty}^{\infty} f(x, z - x) \text{d}x \end{aligned} \]
若 \(X\) 和 \(Y\) 相互独立,则概率密度可以写为
\[ \begin{aligned} f_{X + Y}(z) &= \int_{-\infty}^{\infty} f_{X}(z - y) f_{Y}(y) \text{d}y \\ f_{X + Y}(z) &= \int_{-\infty}^{\infty} f_{X}(x) f_{Y}(z - x) \text{d}x \end{aligned} \]
上面两个公式称为 \(f_{X}\) 和 \(f_{Y}\) 的卷积公式,记为 \(f_{X} * f_{Y}\)。
若 \(X_{i} \sim N(\mu_i, \sigma_{i}^2)(i = 1, 2, \cdots, n)\),且 \(X_{i}\) 之间相互独立,则 \(Z \sim N(\mu_{1} + \mu_{2} + \cdots + \mu_{n}, \sigma_{1}^2 + \sigma_{2}^2 + \cdots + \sigma_{n}^2)(Z = X_{1} + X_{2} + \cdots + X_{n})\),一般地,可以证明有限个相互独立的正态随机变量的线性组合仍然服从正态分布。 上述结论还能推广到 \(n\) 个相互独立的 \(\Gamma\) 分布变量之和的情况,即若 \(X_{i}\) 服从参数为 \(\alpha_{i}\),\(\beta(i = 1, 2, \cdots, n)\) 的 \(\Gamma\) 分布,则 \(\sum\limits_{i = 1}^{n} X_{i}\) 服从参数为 \(\sum\limits_{i = 1}^{n} \alpha_{i}\),\(\beta\) 的 \(\Gamma\) 分布。
\[ \int_{0}^{+\infty} x^{\alpha-1} e^{-x/\beta}\,dx = \Gamma(\alpha)\,\beta^{\alpha}. \]
Z = Y / X,Z = XY
一般概率密度
\[ \begin{aligned} f_{Y|X}(z) &= \int_{-\infty}^{\infty} |x| f(x, xz) \text{d}x \\ f_{XY}(z) &= \int_{-\infty}^{\infty} \frac{1}{|x|} f\bigg(x, \frac{z}{x}\bigg) \text{d}x \end{aligned} \]
同样地,若 \(X\) 和 \(Y\) 相互独立,则概率密度可以写为
\[ \begin{aligned} f_{Y|X}(z) &= \int_{-\infty}^{\infty} |x| f_{X}(x) f_{Y}(xz) \text{d}x \\ f_{XY}(z) &= \int_{-\infty}^{\infty} \frac{1}{|x|} f_{X}(x) f_{Y}\bigg(\frac{z}{x}\bigg) \text{d}x \end{aligned} \]
MAX,MIN
若 \(X\) 和 \(Y\) 相互独立,由于 \(M = \max \{X, Y\}\) 不大于 \(z\) 等价于 \(X\) 和 \(Y\) 都不大于 \(z\),故有
\[ \begin{aligned} P\{M \leq z\} &= P\{X \leq z, Y \leq z\} = P\{X \leq z\} P\{Y \leq z\} \end{aligned} \]
即
\[ F_{\max}(z) = F_{X}(z) F_{Y}(z) \]
类似地,可以得到
\[ \begin{aligned} F_{\min}(z) &= P\{N \leq z\} = 1 - P\{N > z\} \\ &= 1 - P\{X > z, Y > z\} = 1 - P\{X > z\} P\{Y > z\} \end{aligned} \]
即
\[ F_{\min}(z) = 1 - [1 - F_{X}(z)][1 - P_{Y}(z)] \]
以上结果容易推广到 \(n\) 个相互独立的随机变量的情况。