最优纯策略

出处:按学科分类—经济 湖北人民出版社《企业管理公式辞典》第386页(731字)

对策问题局中人双方,如果都只能使用一种纯策略来进行对策,对策的结果是一个确定值的对策问题称确定型对策,也叫具有纯策略的对策问题。

确定型对策中,局中人只能矩阵对策,如果满足如下关系:

即在支付矩阵中,存在着一个元素,它同时是它所在行的最小元素和它所在列的最大元素,那么这个矩阵对策存在一个最优纯策略,这个元素称鞍点。

用寻鞍点的方法,求解具有最优纯策略的矩阵对策,称“鞍点判别法”。鞍点法步骤如下:

(1)对局中人A,在支付矩阵中选出m个策略中(即行)的最小值,并从这m个最小值中选出一个最大值,即最小最大者。

(2)对局中人B,在支付矩阵中选出n个策略中(即列)的最大值,并从这n个最大值中选出一个最小值,即最小最大值。

(3)如果A的最小最大值与B的最大最小值相等,则该对策为确定型对策。这个值为鞍点值,鞍点所对应的行与列策略即为局中人A,B应采用的最优纯策略,对策值等于鞍点值。

用“鞍点法”求最优纯策略可在支付矩阵上进行。

例:

最优纯策略(a1*,β1*)

对策值V=2

分享到: