Skip to content

16.2.3 离散分布

1. 两阶段总体和瓮模型

设两阶段总体含有 N 个元素,即总体包括两类元素. 一类是具有性质 AM 个元素,另一类是不具有性质 ANM 个元素. 若对任意选取的元素研究概率 P(A)=pP(A¯)=1p ,则必须区分两种情形: 当依次选取 n 个元素,在选取下一个时,以前已选取的元素要么放回,要么不放回. 选取的 n 个元素,其中包含具有性质 Ak 个元素,称为样本, n 称为样本容量. 利用瓮模型对此进行解释.

2. 瓮模型

假设箱子里有一些黑球和白球,问题是: 随机摸 n 个球,其中有 k 个黑球的概率是多少? 若摸到的每个球记下颜色后,再放回箱子里,则在摸到的 n 个球中,黑球的数量 k 服从二项分布. 若摸到的球不再放回,且 nMnNM ,则黑球的数量服从超几何分布.

16.2.3.1 二项分布

假设试验只有两个可能事件: 事件 A 和事件 A¯ ,试验可重复 n 次,且每次试验的伴随概率是 P(A)=pP(A¯)=1p ,则事件 A 恰好发生 k 次的概率是

(16.62)Wpn(k)=(nk)pk(1p)nk(k=0,1,2,,n).

由于每次独立地从总体中选取元素, 其概率是

(16.63)P(A)=MN=p,P(A¯)=NMN=1p=q.

因为选取结果互相独立,则前 k 次选取具有性质 A 的元素,其余 nk 次选取具有性质 A¯ 的元素的概率是 pk(np)nk . 选取顺序无关紧要,因为组合事件有相同的概率, 与选取次序无关, 且事件互不相容, 故把

(16.64)(nk)=n!k!(nk)!

个相等的数相加得到所求概率.

满足 P(Xn=k)=Wpn(k) 的随机变量 Xn 称为参数是 np 的二项分布.

1. 期望和方差

(16.65a)E(Xn)=μ=np.(16.65b)D2(Xn)=σ2=np(1p).

2. 正态分布对二项分布的逼近

Xn 服从二项分布,则

(16.65c)limnP(XnE(Xn)D(Xn)λ)=12πtexp(t22)dt.

也就是说,如果 n 很大,且 p1p 不是太小,则二项分布可用参数为 μX=E(Xn)σ2=D2(Xn) 的正态分布较好地逼近 (参见第 1069 页 16.2.4.1). p 越接近于 0.5,n 越大,则近似程度越好,但仅当 np>4n(1p)>4 时成立. 当 p1p 很小时, 二项分布可由泊松分布逼近 (参见第 1068 页 16.2.3.3(16.68)).

3. 递推公式

对于二项分布的实际计算, 有下述递推公式:

(16.65d)Wpn(k+1)=nkk+1pqWpn(k).

4. 服从二项分布的随机变量之和

若随机变量 XnXm 分别服从参数为 n,pm,p 的二项分布,则随机变量 X=Xn+Xm 也服从参数为 n+m,p 的二项分布.

图 16.2(a),(b),(c) 给出了参数为 n=5,p=0.5,0.25 和 0.1 的三个二项分布图形. 由于二项系数是对称的,当 p=q=0.5 时,分布是对称的. P 偏离 0.5 越远, 分布的对称性越弱.

0193686d-91c3-7222-a100-f59d7e5e597d_64_387_1332_863_309_0.jpg

16.2.3.2 超几何分布

与二项分布相同,考虑含有 N 个元素的两阶段总体,即总体包括两类元素: 一类是具有性质 AM 个元素,另一类是不具有性质 ANM 个元素. 与二项分布相反, 在摸下一个球之前, 从瓮模型中已摸到的球不再放回.

在摸到的 n 个球中,有 k 个黑球的概率是

(16.66a)P(X=k)=WM,Nn(k)=(Mk)(NMnk)(Nn),

其中

(16.66b)0kn,kM,nkNM.

nMnNM 也成立,则分布式形如 (16.66a) 的随机变量 X 称为超几何分布.

1. 超几何分布的期望和方差

(16.67a)μ=E(X)=k=0nk(Mk)(NMnk)(Nk)=nMN,σ2=D2(X)=E(X2)[E(X)]2=k=0nk2(Mk)(NMnk)(Nk)(nMN)2(16.67b)=nMN(1MN)NnN1.

2. 递推公式

(16.67c)WM,Nn(k+1)=(nk)(Mk)(k+1)(NMn+k+1)WM,Nn(k).

图 16.3 (a),(b),(c) 给出了当 N=100,n=5 时, M=50,25 和 10 三种情形下的超几何分布,分别对应于图 16.2 (a),(b),(c) 中 p=0.5,0.25 和 0.1 的情形. 这些例子中二项分布和超几何分布之间无明显区别. 如果 MNM 也比 n 大很多, 则超几何分布可由二项分布很好地逼近, 二项分布的参数见 (16.63).

0193686d-91c3-7222-a100-f59d7e5e597d_65_384_1538_865_304_0.jpg

16.2.3.3 泊松分布

若随机变量 X 的可能取值是非负整数,且概率为

(16.68)P(X=k)=λkk!eλ(k=0,1,2,;λ>0),

则称 X 服从参数为 λ 的泊松分布.

1. 泊松分布的期望和方差

(16.69a)E(X)=λ,(16.69b)D2(X)=λ

2. 服从泊松分布的独立随机变量之和

若随机变量 X1X2 相互独立,且分别服从参数为 λ1λ2 的泊松分布,则随机变量 X=X1+X2 也服从参数为 λ=λ1+λ2 的泊松分布.

3. 递推公式

(16.69c)P(X=k+1)=λk+1P(X=k).

4. 泊松分布和二项分布的联系

对于参数为 n,p 的二项分布,当 n,p(p0) 随着 n 变化,使得 np=λ= 常数时,其极限即为泊松分布,即对满足 λ=np 的大的 n 和小的 p ,泊松分布是二项分布的良好逼近. 实际情况中,由于泊松分布更易于计算,当 p0.08n1500p 时, 即使用此公式. 第 1456 页表 21.16 列出了泊松分布值. 图 16.4 (a), (b), (c) 给出了参数为 λ=np=2.5,1.25 和 0.5 的三个泊松分布图,分别与图 16.2 和图 16.3 中的参数相对应.

0193686d-91c3-7222-a100-f59d7e5e597d_66_383_1538_867_304_0.jpg

5. 应用

连续情形下点状不连续事件独立发生的次数通常可用泊松分布来描述, 比如特定时间段内到商店的顾客人数, 一本书中出现印刷错误的个数, 放射性衰变率等.

version 1.24.0