零和对策

出处：按学科分类—经济经济科学出版社《西方经济学大辞典》第88页（844字）

在有些对策中，对策双方形成完全的冲突，一个对策者的所得就是另一对策者的所失，反之亦然，这就是零和对策。

例如，在抛硬币的例子中，局中人P和Q同时各抛一硬币，硬币或者正面朝上，或背面朝上。如果两枚硬币落下后都是正面朝上，或背面朝上，则P给Q一美元，否则Q给P一美元。

零和对策通常可用2维的赢得矩阵来表示。

因为一方P之得即为另一方Q之失，所以不必是2个数的数组，只写P或Q的赢得即可。

下面的赢得矩阵B表示，P有m种纯策略抉择，Q有n种纯策略抉择(不由随机试验决定取舍的策略称纯策略)。如果P取第i种策略而Q取第j种策略进行一局对策，则P的赢得为b_ij，而Q的赢得为－b_ij。

Q₁Q₂… Q_n

P₁b₁₁b₁₂… b_1n

P₂b₂₁b₂₂… b_2n

·B=···

●●●●

P_mb_m1b_m2… b_mn

可见，零和对策可以由赢得矩阵表示。

为了使对方不知道自己将采取什么策略，每个人都不会固定采取某种纯策略，而是各采取一种所谓的混合策略。

对P来说是P=(p₁，…p_m)，即以概率p_i采取策略p_i，这里p₁，p₂…p_m≥0，p₁+…+p_m=1。如果p₅=0．17，就是表示P将随机地按照17%的几率采用他的第5个纯策略。

对于Q来说，则有q=(q₁，…q_n)，即以概率q_i采用策略Q_i。

分享到：

一周热点