对策论

出处：按学科分类—政治、法律经济科学出版社《政治经济学大辞典》第739页（4984字）

也称为博弈论，是“研究决策主体的行为发生直接相互作用时候的决策及其这种决策的均衡问题的，也就是说，当一个主体，好比说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题”(张维迎，1996，P．3～4)。

如果一个对策中存在着具有完全约束力的协议(Binding Agreement)，并且这种协议是可强制执行的，则该对策就是合作的(Harsanyi，J．，1966)；如果不存在这种协议，对策中的每一个参与人(Player)都从个人理性出发极大化其个人效用函数或极小化其支付函数，则该对策是非合作的(non－cooperative)。如果一个对策中的每个参与人必须同时选择自己的行动，或在行动之前不能确知其他参与人采取了什么具体行动，则该对策是静态的(Static)；如果一个对策中参与人能够了解先行者采取的行动，则该对策是动态的，动态博弈又包括具有或不具有完全信息的重复对策、随机对策、生存或毁灭对策、递归对策以及参与人变动对策等(Luce，R．，1957)。如果一个对策中所有参与人的类型特征、战略空间以及支付函数均为常识，即每个参与人都知道它，参与人知道其他参与人知道它，则该对策是完全信息的(Lewis，D．，1969)；如果参与人之间的信息是不对称的，即至少有一个参与人的信息不是常识，则该对策是不完全信息的。

对策论的起源以冯·诺依曼(Neumann，V，1944)出版《对策论与经济行为》为代表。

除了对零和博弈(Zero－sum Games)和多人合作博弈进行了讨论以外，诺依曼对对策论的重大贡献在于三个方面：(1)确定了对策论在经济学中的研究方法，即从个人效用函数及其约束条件出发，讨论个人通过何种战略达成效用极大化以及对策的最终均衡结果，这使得经济学逐渐放弃了一些缺乏微观基础的假定并越来越将其基础建立在对策论之上；(2)提出了最大最小定理，即在二人零和博弈中，每个参与人将极大化其效用函数而极小化其支付函数，因此如果参与人具有有限多个纯战略(Pure Strategy)，则该对策的均衡战略是确定的；(3)提出了等价性原理，即在“博弈参与人数变得真正很大时，某种希望将会出现，每个特定的参与者的影响变得可以忽略不计……因此，市场价格的建立是在市场上运转的基本力量自然地产生的，几乎不管我们假定这些力量是怎样运转的。”(但是和诺依曼共同提出等价性原理的莫根斯坦(Morgenstern)却认为由于参与人趋向于合作，因此完全竞争市场并不具有现实意义)。

早期对策论研究的重点在于零和博弈和合作博弈。在零和博弈中，除了已提到的最大最小定理外，泽梅罗定理(ZermeloDoctrine)称每一个完全信息的二人零和博弈其均衡结果是严格确定的，但是泽梅罗并没有指出参与人如何构建立正确战略。

这两个定理在数学上具有严谨结构，但它们在解决理性决策问题上并无太理想的实际作用(Colman，A．，1982)。

在合作博弈中，诺依曼定义了即使在非合作博弈中也十分重要的预期效用和稳定集的概念，前者指当参与人采取混合战略时(Mixed Strategy)，其效用成为预期效用；后者是指博弈的可能均衡中，应排除劣战略(Dominated Strategy)和在扰动下导致均衡变动的战略，这对后来纳什均衡(Nash Equilibrium)和颤抖手均衡(Trembling Hand Equilibrium)概念的出现有一定影响。

诺依曼还考虑了可转移效用(Transferable Utilities)博弈中的均衡战略问题，所谓可转移效用博弈是指如果某联盟(Coalition)成功，则联盟中的参与人可以以任何方式进行总效用的分配，但这种分配受在联盟外的参与人行为的影响。例如三个参与人以多数票方式分配一个单位的总效用，可能均衡有(1／2，1／2，0)、(1／2，0，1／2)和(0，l／2，1／2)，但这并不意味着结成联盟的两个人将第三个参与人排斥在分配之外，这是因为任何两个人都可能取得联盟的成功。

从个体理性看，一个参与人加入联盟的可能性为2／3，在联盟中的预期分配效用是1／2，结果该博弈的最终结果是参与人在竞争压力下平均分配(1／3，1／3，l／3)；此后比莱拉(Billera，L．，1970)讨论了非转移效用理论的均衡问题，他研究的算法可以寻找出市场均衡状态的核心(即所有非劣战略的集合)和一般映射的不动点，它常常被用于求解多个参与人的博弈中参与人权重(也称沙普利值，Shapley，I．，1964)与竞争均衡之间的关系。后来关于合作博弈的研究逐渐以非合作博弈方法建立合作博弈的一般理论以及投票机制的应用研究为主。

在50年代以后，非合作博弈的理论开始成熟并成为对策论的主流研究方向。纳什(Nash，J．，1950)定义了在完全信息下静态博弈的均衡，如果参与人的战略组合满足这样的特征：给定其他参与人所选择的战略维持不变的前提下，任何一个参与人都不能通过仅仅变动自己的战略而获得比原先更大的效用。

纳什均衡似乎是一种僵局，任何参与人都宁愿维持而不是单独变动该状态。纳什同时还指出，在一个有限参与人和行动的博弈中，至少存在一个纳什均衡。

德布鲁(Debreu，G．，1952)和奥曼(Aumann，R．，1987)随后进一步讨论了完全信息静态博弈中的纳什均衡存在性和相关均衡等问题。稍后塔克发现了囚徒困境(Prisoner’s Dilemma)揭示出个人理性和集体理性的冲突。库恩(Kuhn，H．，1953)为了证明在完全信息动态博弈中至少存在一个纯战略纳什均衡，提出了子博弈(Subgame)的概念，如果在任何时刻所有参与人都知道在此前发生的一切(即参与人具有完美记忆)，那么此后所发生的一切就可称为原博弈的一个子博弈，这和群论中原群和子群的概念极为类似；塞尔腾(Selten，R．，1975)扩展了库恩的结果，提出一个均衡(可以是混合战略均衡)。如果既是原博弈的纳什均衡又在每一个子博弈上给出纳什均衡，则该均衡构成子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium)。而无名氏定理(Nash Folk Theorem)则讨论了无限次重复博弈的纳什均衡问题，指出如果参与人具有足够的耐心(即时间贴现因子足够大)，那么任何满足个人理性的可行支付集均可通过特定的子博弈均衡得到。直到哈萨尼(Harsanyi，J．，1967～1968)提出哈萨尼转换(Harsanyi Transformation)以后，非合作不完全信息博弈的研究才有了突破。

转换思路是引入博弈虚拟参与人“自然”(Nature)，在博弈中自然首先行动并决定参与人的特征；参与人不能确定除自己以外的其他参与人的类型，但是了解其他参与人的可能类型的概率分布函数，并将其当作博弈参与人共同知道的知识(Common Knowledge)，这样不完全信息就转变成完全但不完美信息，求解不完全信息静态博弈的均衡问题基本解决了；如果参与人能够根据观察到其他参与人的行动来修正自己的后验观点和应采取的后续战略，则静态博弈中子博弈精炼纳什均衡就扩展为动态博弈的精炼贝叶斯均衡(Prefect Bayesian Equlibrium)，这种均衡在每一个后续博弈中均成立，并且均衡本身就是参与人利用贝叶斯法则不断修正自己的后验概率和战略的结果。塞尔腾(Selten，R．，1975)则引入了颤抖手均衡(Trembling－hand Equlibrium)的概念，指出在一个均衡必须具有抗扰动性和自适应性，即参与人应该允许其他参与人犯错但是这种无意的错误不会导致均衡的破坏。哈萨尼和塞尔腾还合作对不完全信息博弈中的均衡及双人叫价模型进行了总结(Harsanyi & Selten，1987)。

目前博弈论几乎重塑了经济学的微观基础并导致了经济学研究方法的深刻变革，此外它在社会学、心理学、生物学及现代军事理论中亦有重要地位。

参考文献：

Aumann，R．，1987，Correlated Equilibrium as a Expression of Bayesian Rationality，Econometrica，Vol 55，1-15．

Billera，L．，1970，Some Theorems on the Core of An N －person Game without Side Payments，Journal of Applied Mathematics，567-579．

Colman，A．，1982，Game Theory and Experimental Games，Pergamon Publisher．

Debreu，D．，1952，A Social Equilibrium Existence Theorem，Proceedings of the National Academy of Sciences，Vol 38，886—893．

Harsanyi，J．，1967～1968，Games with Incomplete Information Played by Bayesian Players，Management Science，Vol 14，159—182，320—334，486—502．

Harsanyi & Selten，1987，A General Theory of Equilibrium Selection in Games MIT Press．

Kuhn，H．，1953，Extensive Games and the Problem of Information，Annuals of Mathematical Studies，Vol 29．

Lewis，D．，1969，Convention，Harvard Univ．Press．

Luce，R，& Raiffa，H．，1957，Games and Decisions：Introduction and Critical Survey，John Wiley Publisher．

Nash，J．，1950，Equilibrium Points in N－person Games，Proceedings of the National Academy of Sciences Vol 36，48-59．

Selten，R．，1975，Reexamination of the Perfectness Concept for Equlibrium Points in Extensive Games，International Journal of Game，Vol 4，25—55，1975．

Shapley，I．，1964，Some Topics In Two Person Games，Princeton Annuals of Mathematical Studies，Vol 52．

肯·阿罗，1988，《数理经济学手册》(第1卷)，中国人民大学出版社。

冯·诺依曼等，1963，《竞赛与经济行为》，科学出版社。

张维迎，1996，《博弈论与信息经济学》，上海三联书店。

分享到：

对策论

一周热点