Skip to content

18.3.3 贝尔曼泛函方程

18.3.3.1 费用函数的性质

为了叙述贝尔曼泛函方程, 费用函数必须满足两个性质.

1. 可分性

函数 f(f1(x0,u1),,fn(xn1,un)) 称作可分的,是指它可以由双参函数 H1,,Hn1 以及函数 F1,,Fn 按如下方式给出:

f(f1(x0,u1),,fn(xn1,un))=F1(f1(x0,u1),,fn(xn1,un)),F1(f1(x0,u1),,fn(xn1,un))=H1(f1(x0,u1),F2(f2(x1,u2),fn(xn1,un))),

......

Fn1(fn1(xn2,un1),fn(xn1,un))=Hn1(fn1(xn2,un1),Fn(fn(xn1,un))),(18.130)Fn(fn(xn1,un))=fn(xn1,un).

2. 极小可交换性

函数 H(f~(a),F~(b)) 称作极小可交换的,是指它满足

(18.131)min(a,b)A×BH(f~(a),F~(b))=minaAH(f~(a),minbBF~(b)).

例如,如果 H 对于每个 aA 相对于第二变元是单调递增的,即若对于每个 aA ,

(18.132)H(f~(a),F~(b1))H(f~(a),F~(b2)), 若 F~(b1)F~(b2),

则上述可交换性就满足. 现在对于动态规划问题的费用函数,则要求满足 f 的可分性以及所有函数 Hj,j=1(1)n1 的极小可交换性. 以下经常出现的费用函数类型就满足这两种要求:

(18.133)fsum =j=1nfj(xj1,uj),或者 fmax=maxj=1(1)nfj(xj1,uj),

而函数 Hj 分别是

(18.134)Hjsum =fj(xj1,uj)+k=j+1nfk(xk1,uk),

以及

(18.135)Hjmax=max{fj(xj1,uj),maxk=j+1(1)nfk(xk1,uk)}.

18.3.3.2 列出泛函方程

首先定义如下函数:

ϕj(xj1)=minukUk(xk1)k=j(1)nFj(fj(xj1,uj),(18.136),fn(xn1,un)),j=1(1)n,(18.137)ϕn+1(xn)=0.

如果没有策略 (u1,,un) 能驱动状态 xj1 到末状态 xeXe ,则我们置 ϕj(xj1)= . 使用可分性以及对于 j=1(1)n 的极小可交换性和动态约束条件, 我们得到

ϕj(xj1)=minujUj(xj1)Hj(fj(xj1,uj),minukUk(xk1)k=j+1(1)nFj+1(fj+1(xj,uj+1),,fn(xn1,un))),=minujUj(xj1)Hj(fj(xj1,uj),ϕj+1(xj)),(18.138)ϕj(xj1)=minujUj(xj1)Hj(fj(xj1,uj),ϕj+1(gj(xj1,uj))).

方程 (18.138),(18.136) 和 (18.137) 称作贝尔曼泛函方程. ϕ1(x0) 是费用函数的最优值.

version 1.24.0