Skip to content

16.3.1 统计量函数或样本函数

16.3.1.1 总体、样本、随机向量

1. 总体

总体是某特定研究中所关注对象的全体. 从某种意义上讲, 可以考虑任何具有共同性质的事物全体, 比如, 某个生产过程中的任一物品或在可持续重复试验中产生的所有测量序列的数值. 总体的个体数量 N 可以很大,甚至实际上是无限的. 总体也常用来表示与个体对应的数值集合.

2. 样本

要考虑某种性质,为了不必检查整个总体,往往只从所谓容量为 n(nN) 的样本子集中搜集数据. 随机抽样即指总体的每个元素有同等机会被抽取. 从容量为 N 的有限总体中抽取容量为 n 的随机样本,是指每一组容量为 n 的可能样本被选取的概率相等. 从无限总体中抽取随机样本是指每个元素被独立抽取. 随机选取可通过混合、盲取或所谓随机数产生, 样本用来表示所选元素对应的数值集合.

3. 利用随机数进行随机选取

实际上, 经常会出现这种情形, 根本不可能在现场进行随机选取, 例如, 对于混凝土之类的堆积材料. 这时, 可利用随机数进行随机选取 (参见第 1464 页表 21.21).

多数计算器可生成均匀分布于区间 [0,1] 内的随机数. 按下 “RAN” 键可生成位于 0.0000.999 之间的数. 小数点后的数字形成随机数序列.

随机数经常取自于表格, 1464 页表 21.21 给出了两位随机数. 如果需要更大的随机数, 可通过相继写下两位随机数组合成多位随机数.

随机样本是待检查的 70 堆运输管道. 假设样本容量是 10. 首先, 把管道从 00 到 69 进行标号, 运用两位随机数表选取数字. 其次, 固定选取数字的方式, 如横向、纵向或对角线选取. 若选取过程中, 随机数重复出现或者大于 69 , 则直接放弃. 选取的随机数所对应的管道作为样本元素. 若有多位随机数表, 则分解成两位随机数.

4. 随机向量

随机变量 X 的特征可用分布函数、参数来描述,其中分布函数本身完全由总体的性质决定. 在统计调查之初, 总体的性质是未知的, 故希望借助于样本搜集尽可能多的信息. 通常并不仅限于调查一组样本, 而是使用更多的样本 (考虑实际原因, 如果有可能,则选取容量 n 相等的样本). 样本元素是随机选取的,故样本的实现也随机取值, 比如, 第一组样本的第一个值通常与第二组样本的第一个值不同. 因此, 样本的第一个值自身就是一个随机变量,用 X1 表示. 类似地,随机变量 X2,X3,,Xn 可作为第二个、第三个、 、第 n 个样本值,上述随机变量称为样本变量,样本变量合在一起构成随机向量

(16.119a)X=(X1,X2,,Xn).

容量为 n ,元素为 xi 的每一个样本可看作一个向量

(16.119b)x=(x1,x2,,xn),

它是随机向量的一个实现.

16.3.1.2 统计量函数或样本函数

由于样本互不相同,其算术平均值 x¯ 也不相同,它们可视为用 X¯ 表示的新随机变量的实现,该变量依赖于样本变量 X1,X2,,Xn .

第 1 组样本 x11,x12,,x1n 的平均值为 x¯1 .

第 2 组样本 x21,x22,,x2n 的平均值为 x¯2 .(16.120)

m 组样本 xm1,xm2,,xmn 的平均值为 x¯m .

i 组样本中第 j 个变量的实现用 xij(i=1,2,,m;j=1,2,,n) 表示.

随机向量 X=(X1,X2,,Xn) 的函数又是一个随机变量,称为统计量或样本函数. 最重要的样本函数是均值、方差、中位数和极差.

1. 均值

随机变量 Xi 的平均值 X¯

(16.121a)X¯=1ni=1nXi

样本 (x1,x2,,xn) 的平均值 x¯

(16.121b)x¯=1ni=1nxi.

在计算平均值时引入估计值 x0 通常很有用. 估计值可任意选取,但应尽可能接近平均值 x¯ . 比如,在一个较长的测量序列中,若 xi(i=1,2,) 是多位数,且只有最后几位数字不同, 则只使用较小的数

(16.121c)zi=xix0

进行计算更简单. 由此可得

(16.121d)x¯=x0+1ni=1nzi=x0+z¯.

2. 方差

随机变量 Xi 的均值为 X¯ ,其方差 S2 可定义为

(16.122a)S2=1n1i=1n(XiX¯)2.

借助于样本 (x1,x2,,xn) ,方差的实现是

(16.122b)s2=1n1i=1n(xix¯)2.

已证明,在估计初始总体的方差时,除以 n1 比除以 n 得到的估计值更精确. 使用估计值 x0 ,可得到

(16.122c)s2=i=1nzi2z¯i=1nzin1=i=1nzi2n(x¯x0)2n1.

x0=x¯ 时,由于 z¯=0 ,则 z¯i=1nzi=0 .

3. 中位数

令样本的 n 个元素按递增 (或递减) 次序排列. 若 n 是奇数,则中位数 X~ 是第 n+12 项的值; 若 n 是偶数,则第 n2 项和第 (n2+1) 项都位于中间,中位数是这两项的平均值.

对于元素按递增 (或递减) 次序排列的特殊样本 (x1,x2,,xn) ,中位数 x~

(16.123)x~={xm+1,n=2m+1,xm+1+xm2,n=2m.

4. 极差

(16.124a)R=maxiXiminiXi(i=1,2,,n).

特别地,样本 (x1,x2,,xn) 的极差 R

(16.124b)R=xmaxxmin.

除了极差 R ,样本函数的每一次个别实现用小写字母表示,即对于特定样本 (x1,x2,,xn) ,计算特定值 x¯,s2,x~R .

  • 从正在使用的产品中选取 15 个扬声器作为样本,关注的变量 X 是由 Tesla 度量的气隙感应 B . 由下表中的测量数据可得
x¯=1.0027x¯=1.0027x0=1.00;

s2=1.2095104s2=1.2076104x0=1.00;x~=1.00;R=0.04 .

i

xi

i

xi

i

xi

1

1.01

6

1.00

11

1.00

2

1.02

7

0.99

12

1.00

3

1.00

8

1.01

13

1.02

4

0.98

9

1.01

14

1.00

5

0.99

10

1.00

15

1.01

version 1.24.0