统计学总结5

样本均值之差的假设检验

假设X和Y是两个完全独立的随机变量,假设我们已知:
$$
E(X) = \mu_X \quad E(Y) = \mu_Y \\
Var(X) = E((X - \mu_X)^2) = \sigma_X^2 \quad Var(Y) = E((Y - \mu_Y)^2) = \sigma_Y^2
$$
现在我们对这两个随机变量进行采样,得到采样均值$\bar{X}$和$ \bar{Y}$与采样方差:
$$
\sigma^2_{\bar{X}} = \frac{\sigma^2_{X}}{n} \qquad \sigma^2_{\bar{Y}} = \frac{\sigma^2_{Y}}{m}
$$
现在我们设新的变量Z为以上两个采样均值的差:
$$
Z = \bar{X} - \bar{Y}
$$
对于这个新的变量的分布,我们可以知道:
$$
\mu_{\bar{X} - \bar{Y}} = \mu_{\bar{X}} - \mu_{\bar{Y}} \\
\sigma^2_{\bar{X} - \bar{Y}} = \sigma^2_{\bar{X}} - \sigma^2_{\bar{Y}}
$$
再展开我们有:
$$
\sigma^2_{\bar{X} - \bar{Y}} = \frac{\sigma^2_X}{n} + \frac{\sigma^2_Y}{m} \\
\sigma_{\bar{X} - \bar{Y}} = \sqrt{\frac{\sigma^2_X}{n} + \frac{\sigma^2_Y}{m} }
$$