假设检验

假设

检验问题通常叙述成:在显著水平 \(\alpha\) 下,检验假设

\[ H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0 \]

也常说成“在显著性水平 \(\alpha\) 下,针对 \(H_1\) 检验 \(H_0\)“,\(H_0\) 称为原假设零假设\(H_1\) 称为备择假设,我们要进行的工作是,根据样本,按上述检验方法做出决策在 \(H_0\)\(H_1\) 两者之间接受其一。

当检验统计量取某个区域 \(C\) 中的值时,我们拒绝原假设 \(H_0\),则称区域 \(C\)拒绝域,拒绝域的边界点称为临界点

由于检验法则是根据样本作出的,总有可能做出错误的决策,在假设 \(H_0\) 实际上为真时,我们可能犯拒绝 \(H_0\) 的错误,称这类“弃真”的错误为第 I 类错误,又当 \(H_0\) 实际上不真时,我们也有可能接受 \(H_0\),称这类“取伪”的错误为第 II 类错误,犯第 II 类错误的概率记为

\[ P\{当 H_0 不真时接受 H_0\} \quad 或 \quad P_{p \in H_1}\{接受 H_0\} \]

显著性检验

为此,在确定检验法则时,我们应尽可能使犯两类错误的概率都较小,但是,进一步讨论可知,一般来说,当样本容量固定,若减小犯一类错误的概率,则犯另一类错的概率往往增大;若要使犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的情况下,一般来说,我们总是控制犯第 I 类错误的概率,使它不大于 \(\alpha\)\(\alpha\) 的大小视具体情况而定,这种只对犯第 I 类错误的概率加以控制,而不考虑犯第 II 类错误的概率的检验,称为显著性检验

正态总体均值的假设检验

单个总体均值

  1. \(\sigma^2\) 已知,关于 \(\mu\) 的检验

    利用统计量 \(Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}}\)

  2. \(\sigma^2\) 未知,关于 \(\mu\) 的检验

    \[ |t| = \bigg|\frac{\bar{x} - \mu_0}{s / \sqrt{n}}\bigg| \geq t_{\alpha / 2}(n - 1) \]

两个总体均值差

  1. 两总体方差相同,两样本独立

    \[ |t| = \frac{|(\bar{x} - \bar{y}) - \delta|}{s_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \geq t_{\alpha / 2}(n_1 + n_2 - 2) \]

基于成对数据的检验

一般,设有 \(n\) 对相互独立的观察结果:\((X_1,Y_1),(X_2,Y_2),\dots,(X_n,Y_n)\)。令

\[ D_i = X_i - Y_i, \quad i=1,2,\dots,n. \]

由成对样本的构造,\(D_1, D_2, \dots, D_n\) 相互独立;又由于它们由同一因素引起,通常可认为服从同一分布。今假设

\[ D_i \sim N(\mu_D,\, \sigma_D^2), \quad i=1,2,\dots,n, \]

其中 \(\mu_D,\sigma_D^2\) 未知。我们需要基于这一样本检验以下假设:

  1. \(H_0: \mu_D = 0,\; H_1: \mu_D \neq 0\)
  2. \(H_0: \mu_D \le 0,\; H_1: \mu_D > 0\)
  3. \(H_0: \mu_D \ge 0,\; H_1: \mu_D < 0\)

分别记 \(D_1, D_2, \dots, D_n\) 的样本均值与样本方差的观察值为 \(\bar d,\ s_d^2\)。按“单个正态总体均值的 \(t\) 检验”(方差未知)可得下列统计量与拒绝域(显著性水平为 \(\alpha\)):

\[ t = \frac{\bar d}{s_d/\sqrt{n}}, \qquad \text{在 } H_0 \text{ 下,} t \sim t(n-1). \]

对应三种备择假设,其拒绝域分别为:

\[ \left|t\right| = \left|\frac{\bar d}{s_d/\sqrt{n}}\right| \ge t_{\alpha/2}(n-1) \quad (\text{双侧}); \]

\[ t = \frac{\bar d}{s_d/\sqrt{n}} \ge t_{\alpha}(n-1) \quad (\text{右侧}); \]

\[ t = \frac{\bar d}{s_d/\sqrt{n}} \le -\, t_{\alpha}(n-1) \quad (\text{左侧}). \]

正态总体方差的假设检验

单个总体方差

设总体 \(X \sim N(\mu, \sigma^2)\),其中 \(\mu, \sigma^2\) 均未知,\(X_1, X_2, \dots, X_n\) 是来自 \(X\) 的样本。要求在显著性水平 \(\alpha\) 下检验假设:

\[ H_0: \sigma^2 = \sigma_0^2, \quad H_1: \sigma^2 \neq \sigma_0^2, \]

其中 \(\sigma_0^2\) 为已知常数。

由于 \(S^2\)\(\sigma^2\) 的无偏估计,当 \(H_0\) 为真时,观察值 \(s^2\)\(\sigma_0^2\) 的比值 \(\frac{s^2}{\sigma_0^2}\) 一般来说应在 1 附近摆动,而不应过分大于 1 或过分小于 1。根据抽样分布理论,当 \(H_0\) 为真时,有

\[ \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1). \]

我们取

\[ \chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \]

作为检验统计量。对于双侧检验问题,其拒绝域具有以下形式:

\[ \frac{(n-1)s^2}{\sigma_0^2} \le k_1 \quad \text{或} \quad \frac{(n-1)s^2}{\sigma_0^2} \ge k_2. \]

此处 \(k_1, k_2\) 的值由下式确定:

\[ P\{\text{当 } H_0 \text{ 为真时拒绝 } H_0\} = P_{\sigma_0^2}\left\{ \left(\frac{(n-1)S^2}{\sigma_0^2} \le k_1\right) \cup \left(\frac{(n-1)S^2}{\sigma_0^2} \ge k_2\right) \right\} = \alpha. \]

为计算方便起见,习惯上取

\[ P_{\sigma_0^2}\left\{ \frac{(n-1)S^2}{\sigma_0^2} \le k_1 \right\} = \frac{\alpha}{2}, \quad P_{\sigma_0^2}\left\{ \frac{(n-1)S^2}{\sigma_0^2} \ge k_2 \right\} = \frac{\alpha}{2}. \]

故得 \(k_1 = \chi_{1-\alpha/2}^2(n-1), k_2 = \chi_{\alpha/2}^2(n-1)\)。于是得到拒绝域为

\[ \frac{(n-1)s^2}{\sigma_0^2} \le \chi_{1-\alpha/2}^2(n-1) \quad \text{或} \quad \frac{(n-1)s^2}{\sigma_0^2} \ge \chi_{\alpha/2}^2(n-1). \]

下面来求单边检验问题(显著性水平为 \(\alpha\)

\[ H_0: \sigma^2 \le \sigma_0^2, \quad H_1: \sigma^2 > \sigma_0^2 \]

的拒绝域。因 \(H_0\) 中的全部 \(\sigma^2\) 都比 \(H_1\) 中的 \(\sigma^2\) 要小,当 \(H_1\) 为真时,\(S^2\) 的观察值 \(s^2\) 往往偏大,因此拒绝域的形式为 \(s^2 \ge k\)。要控制 \(P\{\text{当 } H_0 \text{ 为真时拒绝 } H_0\} \le \alpha\),只需令

\[ P_{\sigma^2 \le \sigma_0^2}\{S^2 \ge k\} = P_{\sigma^2 \le \sigma_0^2}\left\{ \frac{(n-1)S^2}{\sigma^2} \ge \frac{(n-1)k}{\sigma^2} \right\} \le P_{\sigma^2 \le \sigma_0^2}\left\{ \frac{(n-1)S^2}{\sigma^2} \ge \frac{(n-1)k}{\sigma_0^2} \right\} = \alpha. \]

\(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\),可得

\[ \frac{(n-1)k}{\sigma_0^2} = \chi_\alpha^2(n-1). \]

于是 \(k = \frac{\sigma_0^2}{n-1}\chi_\alpha^2(n-1)\),得检验问题的拒绝域为

\[ s^2 \ge \frac{\sigma_0^2}{n-1}\chi_\alpha^2(n-1), \]

\[ \chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \ge \chi_\alpha^2(n-1). \]

类似地,可得左边检验问题

\[ H_0: \sigma^2 \ge \sigma_0^2, \quad H_1: \sigma^2 < \sigma_0^2 \]

的拒绝域为

\[ \chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \le \chi_{1-\alpha}^2(n-1). \]

以上检验法称为 \(\chi^2\) 检验法

两个总体的方差差

\(X_1, X_2, \dots, X_{n_1}\) 来自正态总体 \(N(\mu_1, \sigma_1^2)\)\(Y_1, Y_2, \dots, Y_{n_2}\) 来自正态总体 \(N(\mu_2, \sigma_2^2)\),且两样本独立。记两样本的样本方差分别为 \(S_1^2, S_2^2\),并设 \(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2\) 均未知。现需在显著性水平 \(\alpha\) 下检验:

\[ H_0: \sigma_1^2 \le \sigma_2^2, \qquad H_1: \sigma_1^2 > \sigma_2^2. \]

\(H_0\) 为真时,有 \(E(S_1^2) = \sigma_1^2 \le \sigma_2^2 = E(S_2^2)\);当 \(H_1\) 为真时,\(\displaystyle \frac{S_1^2}{S_2^2}\) 往往偏大,故可取拒绝域形如

\[ \frac{S_1^2}{S_2^2} \ge k. \]

常数 \(k\) 的确定:要求 \(P\{\text{当 } H_0 \text{ 为真时拒绝 } H_0\} \le \alpha\),只需令

\[ P_{\sigma_1^2 \le \sigma_2^2}\!\left\{ \frac{S_1^2}{S_2^2} \ge k \right\} \;\le\; P_{\sigma_1^2/\sigma_2^2 \le 1}\!\left\{ \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \ge k \right\} = \alpha. \]

由抽样分布定理知

\[ \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1,\, n_2-1), \]

故取 \(k = F_{\alpha}(n_1-1,\, n_2-1)\)\(F_{\alpha}(\nu_1,\nu_2)\) 表示自由度 \(\nu_1,\nu_2\)\(F\) 分布上侧 \(\alpha\) 分位数)。于是检验的拒绝域为

\[ F = \frac{s_1^2}{s_2^2} \ge F_{\alpha}(n_1-1,\, n_2-1). \]


假设检验
https://ddccffq.github.io/2025/11/16/概率论与数理统计/假设检验/
作者
ddccffq
发布于
2025年11月16日
许可协议