Skip to content

16.3.3 重要检验

数理统计学的一个根本问题就是从样本中推断关于总体的结论. 有两类最重要的问题如下.

(1) 分布类型已知,欲估计其参数. 分布的特征通常可由参数 μσ2 较好地表示 (此处, μ 是期望的精确值, σ2 是方差的精确值),因此,一个至关重要的问题是, 如何根据样本较好地估计参数?

(2) 关于参数的假设已知, 欲检验其是否正确. 最常出现的问题是:

a) 期望值是否等于一个已知数?

b) 两个总体的期望是否相等?

c) 能否用参数为 μσ2 的随机变量的分布拟合一个已知分布等?

正态分布在观察和测量中极其重要, 下面讨论对正态分布的拟合优度检验. 其基本思想也适用于其他分布.

16.3.3.1 对正态分布的拟合优度检验

在数理统计学中有不同的检验方法, 用于判断样本数据是否来自于正态分布. 此处讨论基于正态概率纸的图形检验和基于 χ2 分布的数值检验 (“ χ2 检验”).

1. 使用概率纸进行拟合优度检验

a) 概率纸的原理 在直角坐标系中, x 轴采用等距刻度, y 轴的刻度由下述方式得到: 对 z 等距分割,但刻度为

(16.130)y=Φ(z)=12πzet22dt.

若随机变量 X 服从期望为 μ 和方差为 σ2 的正态分布,则对于其分布函数 (参见第 1070 页 16.2.4.2), 有

(16.131a)F(x)=Φ(xμσ)=Φ(z),

(16.131b)z=xμσ

成立,故 xz 之间有线性关系,满足(16.131c)

zx0μ1μ+σ1μσ

b) 概率纸的应用 对于样本数据, 把根据 (16.125) 计算的累计相对频率作为点的纵坐标, 组上界作为横坐标, 并把对应点描绘到概率纸上. 若这些点大致落在一条直线上 (偏差很小), 则随机变量可视为正态随机变量 (图 16.14).

0193686d-91c3-7222-a100-f59d7e5e597d_88_583_490_468_372_0.jpg

正如从图 16.14 中所看到的, 表 16.3 中的数据对应正态分布. 进一步可得到 μ176,σ37.5 (由 Z 轴上 0 和 ±1 对应的 x 值得到).

注 如果关于 y 轴的刻度是等距的,则累计相对频率值 Fi 更容易描绘到概率纸上, 这也意味着对于纵坐标的非等距刻度.

2. χ2 拟合优度检验

欲检验随机变量 X 是否服从正态分布 (参见第 1070 页 16.2.4.2),可把 X 的范围分成 k 组,第 j(j=1,2,,k) 的上限用 ξj 表示. 令 pjX 落在第 j 组的 “理论” 概率, 即

(16.132a)pj=F(ξj)F(ξj1),

其中, F(x)X 的分布函数 (j=1,2,,k;ξ0是第一组的下限,且F(ξ0)=0) . 由于假定 X 是正态变量,则

(16.132b)F(ξj)=Φ(ξjμσ)

一定成立,其中 Φ(x) 是标准正态分布的分布函数 (参见第 1070 页 16.2.4.2). 总体的参数 μσ2 通常是未知的,故用 x¯s2 作为其近似值. 对 X 的范围进行分解,使每一组的期望频数大于 5,即若样本容量为 n ,则 npj5 . 对于容量为 n 的样本 (x1,x2,,xn) ,计算其相应的频数 hj (根据上述给定的分组),则随机变量

(16.132c)χS2=j=1k(hjnpj)2npj

近似服从 χ2 分布. 若 μσ2 已知,则 χ2 分布的自由度 m=k1 ; 若 μσ2 其中之一需要根据样本进行估计,则 m=k2 ; 若二者都需要根据 x¯s2 估计, 则 m=k3 .

如果随机变量 X 服从正态分布 (近似 χ2 检验),对于给定的统计量显著性水平 α 和自由度 m ,检验在于对样本的试验量 χS2 和 1460 页表 21.18 中相应的 χα;m2 进行比较.

若确定了显著性水平 α ,并由 1460 页表 21.18 中得到了对应 χ2 分布的分位数 χα;ki2 ( i 依赖于未知参数的个数),则 P(χS2χα;ki2)=α 成立. 比较(16.132c) 式的 χS2 值和上述分位数,若

(16.132d)χS2<χα;ki2

成立,则接受样本来自于正态分布的假设. 该检验也称为 χ2 拟合优度检验.

下述 χ2 检验基于第 1087 页 16.3.2.1 的实例. 样本容量 n=125 ,且均值 x¯=176.32 ,方差 s2=36.70 ,它们可作为总体未知参数 μσ2 的近似值. 根据 (16.132a) 和 (16.132b) 进行计算后,再根据 (16.132c) 确定检验统计量 χS2 ,所得到的数据见表 16.4.

16.4χ2 检验

ξj

hj

ξjμσ

Φ(ξjμσ)

pj

npj

(hjnpj)2 npj

70

-2.90

0.0019

0.0019

0.23750.93753.21258.5857}12.9750

0.00005

90

-2.35

0.0094

0.0075

110

-1.81

0.0351

0.0257

130

-1.26

0.1038

0.0687

150

-0.72

0.2358

0.1320

16.5000

0.1635

170

22

-0.17

0.4325

0.1967

24.5875

0.2723

190

30

0.37

0.6443

0.2118

26.4750

0.4693

210

27

0.92

0.8212

0.1769

22.1125

1.0803

230

9

1.46

0.9279

0.1067

13.3375

1.4106

250

2.01

0.9778

0.0499

0.0526

270

63}9

2.55

0.9946

0.0168

6.23752.1000}8.3375

χS2=3.4486

由最后一列可知 χS2=3.4486 . 因为要求 npj5 ,分组数量从 k=11 减少到 k=k4=7 . 为计算理论频率 npj ,用样本估计值 x¯s2 代替总体的 μσ2 , 故相应 χ2 分布的自由度个数减少 2,临界值为分位数 χα;k122 . 对于 α=0.05 , 根据 1460 页表 21.18 可得到 χ0.05;42=9.5 ,因此,由不等式 χS2<χ0.05;42 成立,假定样本来自于正态分布总体并无异议.

16.3.3.2 样本均值的分布

X 是连续随机变量. 假设可从相应总体中取出任意多组容量为 n 的样本, 则样本均值也是随机变量 X¯ ,并且也是连续的.

1. 样本均值的置信概率

如果 X 服从参数为 μσ2 的正态分布,则 X¯ 也是参数为 μσ2/n 的正态随机变量,即 X¯ 的密度函数 f¯(x) 比总体的密度函数 f(x) 更集中于 μ 附近. 对任意 ε>0 ,有

(16.133)P(|Xμ|ε)=2Φ(εσ)1,P(|X¯μ|ε)=2Φ(εnσ)1

成立. 因此,当样本容量 n 增加时,样本均值是 μ 的良好近似的概率也在增加.

ε=12σ 时,由 (16.133) 式得

P(|X¯μ|12σ)=2Φ(12n)1,

表 16.5 列出了 n 取不同值时所对应的概率值. 由表 16.5 可看出,比如,当样本容量 n=49 时,样本均值 x¯μ 之差小于 ±12σ 的概率是 99.95% .

n

P(|X¯μ|12σ)

1

38.29%

4

68.27%

16

95.45%

25

98.76%

49

99.96%

2. 总体服从任意分布时的样本均值分布

若总体服从期望为 μ ,方差为 σ2 的任意分布,则随机变量 X¯ 也近似服从参数为 μσ2/n 的正态分布. 该结论基于中心极限定理.

16.3.3.3 均值的置信限

1. 方差 σ2 已知时,均值的置信区间

如果 X 是参数为 μσ2 的随机变量,则根据 16.3.3.2,X¯ 近似为参数是 μσ2/n 的正态随机变量,则通过变量替换

(16.134)Z¯=X¯μσn

可生成近似服从标准正态分布的随机变量 Z¯ ,因此

(16.135)P(|Z¯|ε)=εφ(x)dx=2Φ(ε)1.

若给定显著性水平 α ,即

(16.136)P(|Z¯|ε)=1α

成立,则 ε=ε(α) 可由 (16.135) 确定,比如,对于标准正态分布,则可由 1458 页表 21.17 得到. 由 |Z¯|ε(α) 和 (16.134),可得关系式

(16.137)μ=x¯±σnε(α)

成立. (16.137) 中数值 x¯±σnε(α) 称为期望的置信限,二者之间的区间称为期望值 μ 的置信区间,其中方差 σ2 已知,给定显著性水平为 α . 换言之,期望值 μ 以概率 1α 位于 (16.137) 的置信限之间.

注 若样本容量足够大,则 s2 可用来代替 (16.137) 中的 σ2 . 当 n>100 时可视为大样本,但实际应用时,要视具体问题而定,当 n>30 时也可视为样本充分大. 若 n 不是足够大,则在正态总体分布情形下,运用 t 分布确定置信限,见(16.140).

2. 方差 σ2 未知时,期望的置信区间

若总体近似服从正态分布,且方差 σ2 未知,则在 (16.134) 中用样本方差 s2 代替 σ2 ,可得随机变量

(16.138)T=X¯μsn

该变量服从自由度为 m=n1t 分布 (参见第 1076 页 16.2.4.8),其中 n 是样本容量. 若 n 很大,比如 n>100 ,则 T 可视为正态随机变量,如同 (16.134) 中的 Z . 对于给定的显著性水平 α ,有

(16.139)P(|T|ε)=εεft(x)dx=P(|X¯μ|snε)=1α.

由 (16.139) 可得 ε=ε(α,n)=tα/2;n1 ,其中 tα/2;n1 是显著性水平为 αt 分布 (自由度为 n1 ) 的分位数 (参见第 1463 页表 21.20). 由 |T|=tα/2;n1 ,可推出

(16.140)μ=x¯±sntα/2;n1,

数值 x¯±sntα/2;n1 称为总体方差 σ2 未知、显著性水平为 α 时期望值的置信限, 位于置信限之间的区间称为置信区间.

一组样本包含下述 6 个测量数据:0.842,0.846,0.835,0.839,0.843,0.838,可得到 x¯=0.8405s=0.00394 .

若给定显著性水平 α5%1% ,那么,样本均值 x¯ 和总体分布期望 μ 的最大偏差是多少?

(1) α=0.05 : 查 1463 页表 21.20 可知 tα/2;5=2.57 ,因此 |X¯μ|2.57 . 0.00394/6=0.0042 . 故样本均值 x¯=0.8405 和期望值 μ 之差以 95% 的可能性小于 ±0.0042 .

(2) α=0.01:tα/2;5=4.03,|X¯μ|4.030.00394/6=0.0065 ,即样本均值 x¯μ 之差以 99% 的可能性小于 ±0.0065 .

16.3.3.4 方差的置信区间

若随机变量 X 服从参数为 μσ2 的正态分布,则随机变量

(16.141)χ2=(n1)s2σ2

服从自由度为 m=n1χ2 分布,其中 n 是样本容量, s2 是样本方差. fχ2(x) 表示 χ2 分布的密度函数,见图 16.15. 由图可知

(16.142)P(χ2<χu2)=P(χ2>χo2)=α2.

于是,由 χ2 分布的分位数表 (参见第 1460 页表 21.18) 可给出

(16.143)χu2=χ1α/2;n12,χo2=χα/2;n12.

根据 (16.141) 可推出,当显著性水平为 α 时,总体未知方差 σ2 的估计值:

(16.144)(n1)s2χα/2;n12σ2(n1)s2χ1α/2;n12.

对于小样本,(16.144) 所给出的 σ2 的置信区间相当大.

0193686d-91c3-7222-a100-f59d7e5e597d_92_581_1488_478_252_0.jpg

对于有 6 个测量数据的数值实例 (见上页),当 α=5% 时,由 1460 页表 21.18 可得到 χ0.025;52=0.831,χ0.975;52=12.8 ,故由(16.144)可推出 0.625sσ 2.453s ,且 s=0.00394 .

16.3.3.5 假设检验的结构

统计学上的假设检验具有下述结构:

(1) 首先,要对样本来自于具有某种特定性质的总体作出假设 H . 例如,

H : 总体服从参数为 μσ2 的正态分布 (或其他已知分布),或者

H : 对于未知的 μ ,可通过插入近似值 (估计值) μ0 来得到,比如通过样本均值 x¯ 四舍五入得到. 或者

H : 两个总体的期望相同,即 μ1μ2=0 等.

(2) 以假设 H 为基础,确定置信区间 B (通常用表格给出). 样本函数值应以给定概率落在该区间内,如当 α=0.01 时,以 99% 的概率落在该区间内.

(3) 计算样本函数值. 若函数值落在给定区间 B 内,则接受假设,否则,拒绝该假设.

  • 给定显著性水平 α ,检验假设 H:μ=μ0 .

根据第 1093 页 16.3.3.3,随机变量 T=X¯μ0sn 服从自由度为 m=n1t 分布,由此可推出,如果 x¯ 未落入 (16.140) 定义的置信区间,即若

(16.145)|X¯μ0|sntα/2;n1

成立, 则拒绝该假设. 此时可称存在显著性差异, 对假设检验的深入探讨参见 [16.24].

version 1.24.0