总体与样本
样本:n 个与总体同分布的随机变量。
简单随机样本:
- 代表性:样本中的每一个与所考查的总体有相同的分布;
- 独立性:样本中的每一个都是相互独立的随机变量。
统计量
定义:
- 设 $$X_1, X_2, …, X_n$$ 是来自总体 X 的一个样本,$$g(X_1, X_2, …, X_n)$$ 是 $$X_1, X_2, …, X_n$$ 的函数,若 g 中不含任何参数,则 $$g(X_1, X_2, …, X_n)$$ 称是一个统计量。
几个重要的统计量:
- 样本均值:$${\displaystyle \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i }$$
- 样本方差:$${\displaystyle S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2 = \frac{1}{n-1}\Big(\sum_{i=1}^nX_i^2 - n \overline{X}^2\Big)} $$
- $${\displaystyle E(S^2) = \frac{1}{n-1}\Big[\sum_{i=1}^n(\sigma^2 + \mu^2) - n(\frac{\sigma^2}{n} + \mu^2)\Big] = \sigma^2 }$$
- 样本 k 阶原点矩:$${\displaystyle A_k = \frac{1}{n}\sum_{i=1}^n X_i^k }$$
- 样本 k 阶中心矩:$${\displaystyle B_k = \frac{1}{n}\sum_{i=1}^n (X_i - \overline{X})^k }$$
经验分布函数
设 $$X_1, X_2, …, X_n$$ 是总体 $$F$$ 的样本,用 $$s(x), |x| < \infty$$ 表示 $$X_1, X_2, …, X_n$$ 中不大于 $$x$$ 的随机变量的个数。
定义经验分布函数为 $${\displaystyle F_n(x) = \frac{1}{n} s(x), -\infty < x < +\infty}$$
抽样分布
统计量是样本的函数,它是一个随机变量,统计量的分布称为抽样分布。
$\chi^2$ 分布
定义:
- 设 $$X_1, X_2, …, X_n$$ 相互独立,都服从正态分布 $$N(0,1)$$,则称随机变量:$$\chi^2 = X_1^2 + X_2^2 + … + X_n^2$$ 所服从的分布为自由度为 n 的 $$\chi^2$$ 分布。记作 $$\chi^2 \sim \chi^2(n)$$。
密度函数:
$$\displaystyle f(x) = \begin{cases} {\displaystyle \frac{1}{2^{n/2}\Gamma(n/2)} x^{\frac{n}{2} - 1}e^{- \frac{x}{2}} }&, x \ge 0 \ 0&, x < 0 \end{cases}$$
其中:$${\displaystyle \Gamma(x) = \int_0^{\infty} e^{-t} x^{x-1}dt, x < 0}$$
性质:
设 $$X_1 \sim \chi^2(n_1), X_2 \sim \chi^2(n_2)$$,且 $$X_1, X_2$$ 相互独立,则有:$$X_1 + X_2 \sim \chi^2(n_1 + n_2)$$,这个性质叫 $$\chi^2$$ 分布的可加性。
若 $$\chi^2 \sim \chi^2(n)$$,则当 n 充分大时,$${\displaystyle \frac{X-n}{\sqrt{2n}} \sim N(0, 1)}$$
若 $$\chi^2 \sim \chi^2(n)$$,则 $$E(X) = n, D(X) = 2n$$
$$\chi^2$$ 分布的分位点:
- 对于给定的正数 $$\alpha, 0 < \alpha < 1$$,称满足条件 $$\displaystyle P(\chi^2 > \chi^2_{\alpha}(n)) = \int_{\chi^2_{\alpha}(n)}^{\infty} f(y) dy = \alpha$$ 的点 $$\chi^2_{\alpha}(n)$$ 为 $$\chi^2(n)$$ 分布上的 $$\alpha$$ 分位点。
t 分布
定义:
- 设 $$X \sim N(0,1), Y \sim \chi^2(n)$$,且 X 与 Y 相互独立,则称变量:$$\displaystyle t = \frac{X}{\sqrt{Y/n}}$$ 所服从的分布为自由度为 n 的 t 分布。记为 $$t \sim t(n)$$,t 分布又被称为学生氏分布。
概率密度函数:
$${\displaystyle h(t) = \frac{\Gamma[(n+1)/2]}{\Gamma(n/2)\sqrt{n \pi}} (1 + \frac{t^2}{n})^{-\frac{n+1}{2}}}, -\infty < t < +\infty$$
性质:
若 $$t \sim t(n)$$,$$E(t) = 0, D(t) = n/(n-2), n > 2$$
当 n 充分大时,$$\displaystyle t \overset{similarly}{\sim} N(0,1)$$
t 分布的分位点:
- 对于给定的正数 $$\alpha, 0 < \alpha < 1$$,称满足条件 $$\displaystyle P(t > t_{\alpha}(n)) = \int_{t_{\alpha}(n)}^{\infty} h(t) dy = \alpha$$ 的点 $$t_{\alpha}(n)$$ 为 $$t(n)$$ 分布上的 $$\alpha$$ 分位点。
F 分布
定义:
- 设 $$U \sim \chi^2(n_1), V \sim \chi^2(n_2)$$,U 与 V 相互独立,则称随机变量 $$\displaystyle F = \frac{U/n_1}{V/n_2}$$ 服从自由度为 $$n_1$$ 及 $$n_2$$ 的 F 分布,$$n_1$$ 称为第一自由度,$$n_2$$ 称为第二自由度,记作 $$F \sim F(n_1, n_2)$$
概率密度函数:(懒得抄了,很复杂就对了)
性质:
- 数学期望为 $$\displaystyle E(F) = \frac{n_2}{n_2 - 2}, n_2 > 2$$
- 它的数学期望不依赖于第一自由度 $$n_1 $$
F 分布的分位数:
- 对于给定的正数 $$\alpha, 0 < \alpha < 1$$,称满足条件 $$\displaystyle P(F > F_{\alpha}(n_1,n_2)) = \int_{F_{\alpha}(n_1,n_2)}^{\infty} \varphi(y) dy = \alpha$$ 的点 $$F_{\alpha}(n_1, n_2)$$ 为 $$F_{\alpha}(n_1, n_2)$$ 分布上的 $$\alpha$$ 分位点。
- 有一个性质:$$\displaystyle F_{1 - \alpha}(n_1, n_2) = \frac{1}{F_{\alpha}(n_2, n_1)}$$
抽样分布定理
设总体 X 的均值为 $$\mu$$,方差为 $$\sigma^2$$,$$X_1, X_2, …, X_n$$ 是来自总体的一个样本,则样本均值 X 和样本方差 $$S^2$$ 有:
- $$\displaystyle E(\overline{X}) = \mu, D(\overline{X}) = \frac{\sigma^2}{n}, E(S^2) = \sigma^2$$
样本均值的分布
设 $$X_1, X_2, …, X_n$$ 是来自总体 $$N(\mu, \sigma^2)$$ 的一个样本,$$\overline{X}$$ 是样本均值,
则有:$$\displaystyle \overline{X} \sim N(\mu, \frac{\sigma^2}{n})$$
样本方差的分布
设 $$X_1, X_2, …, X_n$$ 是来自总体 $$N(\mu, \sigma^2)$$ 的一个样本,$$\overline{X}$$ 和 $$S^2$$ 分别是样本均值和样本方差,则有:
- $$\displaystyle \frac{(n-1) S^2}{\sigma^2} \sim \chi^2(n-1)$$
- $$\overline{X}$$ 与 $$S^2$$ 独立
(后面的懒得看了)