当前位置:首页 > 经典书库 > 方法大辞典

斯特哥尔堡对策反馈解

书籍:方法大辞典

出处:按学科分类—自然科学总论 山东人民出版社《方法大辞典》第503页(405字)

即离散时间两人动态有穷非零和对策。

设X(k)是状态变量,其演化方程为

X(k+1)=F(k;x(k),u1(k)u2(k))

k=0,1,2,…,N一1

式中,U1(k)、U2(k)分别为“领导”和“随从”在k时刻(或第k段对策)所采用的策略。他们在k时刻的策略集分别为U1(k)={U1(k)}和U2(k)={U2(k)}并且假定均为有穷集,k=0,1,2,…,N-1。

“领导”和“随从”的目标函数(损失函数)分别为

由于斯特哥尔堡对策本身的特点,利用动态规划方法不一定能求得对策的最优解,充其量只能认为是一种次优解。

为区分这一情况,通常把用动态规划方法求得的斯特哥尔堡对策解称为反馈解。

分享到: