最小最大定理

出处:按学科分类—经济 经济科学出版社《西方经济学大辞典》第238页(749字)

对于局中人P有m个可供选择的纯策略,Q有n个可供选择的纯策略,P的赢得矩阵是m行n列的矩阵B=(bij)(的二人零和对策),设P的混合策略是概率向量p=(p1,p2,…,pm),Q的混合策略是概率向量q=(q1,q2,…,qn),因为p1,p2,…,pm≥0,并且p1+p2+…+pm=1,所以p在m-1维标准单纯形Sm-1={x=(x1,…,xm)|x1,…,xm≥0,x1+…+xm=1}上,同样,q在n-1维标准单纯形Sn-1={y=(y1,…,yn)|y1,…,yn≥0,y1+…+yn=1}上。

如果P选用混合策略p∈Sm-1,可以预料P的赢得至少是:

P的目标是选择p∈Sm-1使得他的“最小赢得”数即上式达到最大,也就是

同样,Q的目标是选择q∈Sn-1使得P的“最大赢得”数

达到最小,也就是

冯·诺依曼(Von Neumann)证明,一定成立

这就是二人零和对策的基本的最小最大定理,亦称鞍点定理。

这条定理目前已推广到比矩阵对策更一般的情形。

分享到: