Skip to content

16.2.6 随机过程和随机链

发生在自然界以及工程学和经济学领域研究的许多过程, 在现实中只能用时间相关随机变量进行确切描述.

一个城市在特定时刻 t 的用电量是随机波动的,它依赖于家庭和工业的实际需求. 用电量可视为连续随机变量 X . 当观察时间 t 变化时,用电量在任意时刻都是连续随机变量, 故它是时间的函数.

对时间相关随机变量的随机分析引出了随机过程的概念, 关于随机过程有丰富的文献 (例如可参见 [16.7], [16.14], [16.5], [16.8], [16.18], [16.16]). 下面给出一些介绍性概念.

16.2.6.1 基本概念、马尔可夫链

1. 随机过程

依赖于一个参数的随机变量集称为随机过程,一般情况下,我们将时间 t 取为参数,故随机变量用 Xt 表示,随机过程由集合

(16.103){XttT}

给出. 参数值的集合称为参数空间 T ,随机变量数值的集合称为状态空间 Z .

2. 随机链

如果参数空间和状态空间都是离散的,即状态变量 Xt 和参数 t 的取值为有限或无限可数时, 则称该随机过程为随机链. 这种情形下, 不同的状态值和参数值可记为

(16.104)Z={1,2,,i,i+1,},T={t0,t1,,tm,tm+1,},其中0t0<t1<<tm<tm+1<

(16.105)

时间 t0,t1, 未必是等间隔的.

3. 马尔可夫链、转移概率

如果随机过程中不同取值 Xtm+1 的概率只依赖于 tm 时刻的状态,则称该过程为马尔可夫链. 马尔可夫链的性质可由下述式子进行精确定义: 对任意 m {0,1,2,} 和任意 i0,i1,,imZ ,

P(Xtm+1=im+1Xt0=i0,Xt1=i1,,Xtm=im)=P(Xtm+1=im+1Xtm=im).

(16.106)

对于马尔可夫链和 tm,tm+1 时刻,条件概率

(16.107)P(Xtm+1=jXtm=i)=pij(tm,tm+1)

称为马尔可夫链的转移概率. 转移概率通过从 tm 时刻状态 Xtm=itm+1 时刻状态 Xtm+1=j 的系统变化来确定概率.

如果马尔可夫链的状态空间是有限的,即 Z={1,2,,N} ,则 t1t2 时刻状态之间的转移概率 pij(t1,t2) 可由二次矩阵 P(t1,t2) 表示,二次矩阵即所谓的转移矩阵:

(16.108)P(t1,t2)=(p11(t1,t2)p12(t1,t2)p1N(t1,t2)p21(t1,t2)p22(t1,t2)p2N(t1,t2)pN1(t1,t2)pN2(t1,t2)pNN(t1,t2)).

时间 t1,t2, 未必是相邻的.

4. 时齐的 (平稳) 马尔可夫链

如果马尔可夫链的转移概率 (16.107) 式不依赖于时间, 即

(16.109)pij(tm,tm+1)=pij,

则称该马尔可夫链为时齐的或平稳的. 具有有限状态空间 Z={1,2,,N} 的平稳马尔可夫链, 其转移矩阵为

(16.110a)P=(p11p12p1Np21p22p2NpN1pN2pNN)

其中

**a) pij0 对任意 i,j ,且(16.110b)

**b) j=1Npij=1 对任意 i .(16.110c)

pij 不依赖于时间,给出了单位时间内从状态 i 转移到状态 j 的转移概率.

电话交换中繁忙线路的数量可用平稳马尔可夫链来建模. 为简单起见, 设只有两条线路,因此,状态为 i=0,1,2 . 令时间单位比如为 1 分钟,设转移矩阵 (pij)

(pij)=(0.70.30.00.20.50.30.10.40.5)(i,j=0,1,2).

在矩阵 (pij) 中,第一行对应状态 i=0 . 矩阵元素 p12=0.3 (第 2 行第 3 列) 表示当已知 tm1 时刻一条线路繁忙时,在 tm 时刻两条线路都繁忙的概率.

注 满足性质 (16.110b) 和 (16.110c) 式的每一个 N×N 二次矩阵 P=(pij) , 称为随机矩阵. 其行向量称为随机向量.

虽然平稳马尔可夫链的转移概率不依赖于时间,但是在给定时刻随机变量 Xt 的分布由概率

(16.111a)P(Xt=i)=pi(t)(i=1,2,,N)

(16.111b)i=1Npi(t)=1

给出,因为该过程在任意时刻 t 以概率为 1 处于某个状态.

5. 概率向量、转移矩阵

概率表达式 (16.111a) 可记为概率向量

(16.112)p=(p1(t),p2(t),,pN(t))

的形式. 概率向量 p 是随机向量,它决定了 t 时期平稳马尔可夫链的状态分布. 设平稳马尔可夫链的转移矩阵 P 已给出 (根据 (16.110a),(16.110b),(16.110c)),可从 t 时段的概率分布出发来确定 t+1 时段的概率分布,即由 Pp(t) 计算 p(t+1) :

(16.113)p(t+1)=p(t)P.

进一步有

(16.114)p(t+k)=p(t)Pk.

注 (1) 当 t=0 时,由 (16.114) 式可推出

(16.115)p(k)=p(0)Pk,

即平稳马尔可夫链可由初始分布 p(0) 与转移矩阵 P 唯一确定.

(2) 若矩阵 AB 是随机矩阵,则 C=AB 也是随机矩阵. 因此,若 P 是随机矩阵,则幂 Pk 也是随机矩阵.

粒子依据下述规则在 t=1,2,3, 的时段沿直线改变其位置 (状态) Xt(1 x5) :

a) 如果粒子在 x=2,3,4 处,则下一个单位时间向右移动一个位置的概率是 p=0.6 ,向左移动一个位置的概率是 1p=0.4 .

b) 在 x=1x=5 处,粒子可吸收,即以概率 1 留在此处.

c) 在 t=0 时刻,粒子位于 x=2 处.

求在 t=3 的时段的概率分布 p(3) .

由 (16.115) 式,概率分布 p(3)=p(0)P3 成立,其中 p(0)=(0,1,0,0,0) ,且转移矩阵为

P=(100000.400.60000.400.60000.400.600001)

因此,

P3=(100000.49600.28800.2160.1600.19200.2880.3600.06400.19200.74400001),

从而, p(3)=(0.496,0,0.288,0,0.216) .

16.2.6.2 泊松过程

1. 泊松过程

在随机链的状态空间 Z 和参数空间 T 都是离散的情形下,即随机过程只在离散时间段 t0,t1,t2, 处取值. 如果用连续参数空间 T 研究该过程,则称之为泊松过程.

(1)泊松过程的数学表述 为了在数学上表述泊松过程, 我们作如下假设:

a) 令随机变量 Xt 为时间区间 [0,t) 内的信号数;

b) 令概率 pX(t)=P(Xt=x) 为时间区间 [0,t) 内信号数是 x 的概率.

此外, 在放射性衰变过程和许多其他随机过程中, 需要下述假设成立 (至少大概成立):

c) 在长度为 t 的时间区间内信号数是 x 的概率 P(Xt=x) 只依赖于 xt , 与区间在时间轴上的位置无关.

d) 在相邻时间区间内的信号数是独立随机变量.

e) 在长度为 Δt 的较短区间内至少得到一个信号的概率,与区间长度大致成比例. 比例因子用 λ(λ>0) 表示.

(2) 分布函数 由性质 a)-e) 可确定随机变量 Xt 的分布为

(16.116)P(Xt=x)=(λt)xx!eλt,

其中 μ=λt 是期望值, σ2=λt 是方差.

(3) 注 (a) 由 (16.116) 可知,泊松分布是泊松过程在 t=1 时的特殊情形 (参见第 1068 页 16.2.3.3).

(b) 为解释参数 λ 或根据观察数据估计 λ 的值,可利用下述性质: - λ 是单位时间内的平均信号数;

  • 1λ 是泊松过程中两个信号之间的平均距离 (从时间上讲).

(c) 泊松过程可解释为粒子在状态空间 Z={0,1,2,} 的随机运动. 粒子从状态 0 开始,在每个标志处从状态 i 跳到下一个状态 i+1 . 而且,对于一个小间隔 Δt ,从状态 i 跳到状态 i+1 的转移概率 pi,i+1 应该是

(16.117)pi,i+1λΔt

λ 称为转移率.

(4) 泊松过程举例

  • 放射性衰变是泊松过程的典型实例: 衰变 (信号) 数用计数器记录, 且标注到时轴上. 与辐射物质的半周期相比, 观察间隔应相对较小.

  • 在电话交换中,考虑到 t 时刻为止的呼叫次数,比如,假设单位时间内平均呼叫次数是 λ ,计算到 t 时刻为止最多记录 x 次呼叫的概率.

  • 在可靠性检验中, 使用周期内遇到的可修复系统的故障数.

排队论考虑到达商店柜台处、售票处或加油站的顾客人数.

2. 生灭过程

对泊松过程的一种推广是假设 (16.117) 中的转移率 λi 只依赖于状态 i . 另一种推广是允许从状态 i 转移到状态 i1 ,对应的转移率用 μi 表示. 比如,把状态 i 视为总体中的个体数量,从状态 i 到达状态 i+1 ,个体数增加 1,从状态 i 到达状态 i1 ,个体数减少 1 . 这些随机过程称为生灭过程. 令 P(Xt=i)=pi(t) 是随机过程在 t 时刻处于状态 i 的概率. 与泊松过程类似,转移概率满足

i1 到达 i:pi1,iλi1Δt ;

i+1 到达 i:pi+1,iμi+1Δt ;(16.118)

i 到达 i:pi,i1(λi+μi)Δt .

注 泊松过程是转移率为常数的纯生过程.

3. 排队论

简单的排队系统可视为根据顾客到达的先后顺序, 逐个为顾客服务的柜台. 等待室足够大, 故没有人由于房间满员而需要离开. 顾客的到达服从泊松过程, 即两个顾客的到达间隔时间服从参数为 λ 的指数分布,且到达间隔时间互相独立. 在很多情形下,服务时间也服从参数为 μ 的指数分布. 参数 λμ 的含义如下:

  • λ : 单位时间内到达的平均数;

  • 1λ : 平均到达间隔时间;

  • μ : 单位时间内所服务顾客的平均数量; - 1μ : 平均服务时间.

注 (1) 如果等待排队的顾客人数可视为随机过程的状态, 则上述简单排队模型是出生率 λ 和死亡率 μ 都为常数的生灭过程.

(2) 上述排队模型可以多种不同方式进行修订和推广, 例如, 有多个柜台为顾客服务, 或者是到达时间和服务时间服从不同分布 (参见 [16.14], [16.27]).

version 1.24.0