纳什均衡

出处：按学科分类—政治、法律经济科学出版社《政治经济学大辞典》第743页（4025字）

是在非合作博弈论中关于博弈解的重要概念，纳什(Nash，J．)首先给出了在完全信息博弈中的纳什均衡和混合战略(Mixed．Strategy)纳什均衡的定义。

然后由塞尔腾(Selten，R．)和哈萨尼(Harsanyi，J．)将其扩展到完全信息的动态博弈(Dynamic Game)和不完全信息博弈中，给出了子博弈精炼纳什均衡(Subgame Perfect Nash Equlibrium)和贝叶斯纳什均衡(Bayesian Nash Equilibrium)的概念。

在完全信息静态博弈中，如果有n个参与人，其战略式表述博弈为G=｛S₁……S_n；U_i……U_n｝，S_j为第i个参与人的纯战略集，U_i为第i个参与人的预期效用函数，则一个战略组合s^{^*}=，成为纳什均衡的条件是：对每一个i，s_i^*是给定其他参与人选择s_i=的情况下第i个参与人的最优战略，即：U_j(si^*，s_i∈S_i_i(Nash，J，1950)。这也就是说，纳什均衡是指这样一种状态，即当其他参与人不改变其战略时，任何一个参与人已无法通过改变既定战略来获得更大的效用。

例如在囚徒困境中，如果两个参与人面临这样的情况：两个人均坦白罪行时将各被判刑5年，均抵赖时将各被判刑1年，如果一人抵赖另一人坦白，则坦白者被释放而抵赖者被判刑10年，结果对某一囚徒来说，给定对手抵赖，自己坦白时将被释放而抵赖时被判刑1年；给定对手坦白，自己坦白时将被判5年而抵赖时将被判10年，结果只要给定对手的战略，该囚徒总将选择坦白，鉴于博弈的对称性，对手也将选择坦白，结果该囚徒困境的纳什均衡就是(坦白、坦白)，它是一种任何参与人均没有积极性去主动打破的僵局。类似地，所谓混合战略纳什均衡是指其在混合战略情形时的扩展，即某一混合战略组合σ^*=成为纳什均衡的条件为：对每一个i，不等式U_i≥U_i(σ_i，成立(Nash，J．，1951)，式中U_i已经是在特定混合战略下的效用函数的数学期望，同样，在给定对手的混合战略时，纳什均衡是指任何一个参与人无法通过改变自己的概率分布选择来提高自己的效用函数期望。德布鲁(Debreu，G．)讨论了一个有限博弈分别存在纯战略纳什均衡(Debreu，G．，1952)或者混合战略纳什均衡(Debreu，G．，1963)的条件。

由于纳什均衡往往不是惟一的而是多重的，因此在博弈中更重要的是分析何种均衡可能出现，谢林(Schelling，T，1960)为了简化可行解集，讨论了纳什均衡的聚点解(Focal Points)问题，指出聚点解受博弈环境和表现形式的影响。

在完全信息动态博弈中，库恩(Kuhn，H．，1952)提出了子博弈(Subgame)的概念，所谓子博弈是指如果在任何时刻所有参与人都知道在此前发生的一切(即参与人具有完美记忆)，那么此后所发生的一切就可称为原博弈的一个子博弈，准确地说，子博弈必须满足这样的条件：首先它必须是以博弈树(Game Tree)上的一个单结信息集作为源点，其次它的信息集和效用函数必须直接源自原博弈。

库恩证明了一个有限次重复博弈中至少存在者一个纯战略纳什均衡；而无名氏定理(Nash Folk Theorem)则讨论了无限次重复博弈的纳什均衡问题，指出如果参与人具有足够的耐心(即时间贴现因子足够大)，那么任何满足个人理性的可行支付集均可通过特定的子博弈均衡得到(Friedman，1971)。由于在动态博弈中纳什均衡往往也是多重的，塞尔腾(Selten，R．，1975)为了对可行解集进行精炼，扩展了库恩和纳什的结果，提出一个均衡如果既是原博弈的纳什均衡又在每一个子博弈上给出纳什均衡，则该均衡构成子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium)，这样含有不可置信威胁的纳什均衡就被从解集中剔除出去了。

在不完全信息静态博弈中，纳什均衡被拓展为贝叶斯纳什均衡，其定义为：在n人博弈中战略式博弈表述为G=｛A₁……A_n；θ₁……θ_n；P；U₁……U_n｝，式中(θ₁……θ_n)为参与人的类型分布函数，(A₁……A_n)为依存于类型函数的战略空间，P为条件概率函数，(U₁……U_n)为预期效用函数，一个类型依存战略组合如果对于所有的i，满足，则它构成一个贝叶斯纳什均衡，也就是说在博弈中只要给定自己的类型θ_i和其他参与人的类型依存战略，那么该参与人的预期效用函数已经取得极大值。在计算上述均衡中，必须使用哈萨尼转换(Harsanyi Transformation)，即在博弈中引入外生的虚拟参与人“自然”(Nature)，自然首先行动并决定参与人的类型；参与人不能确定除自己以外的其他参与人的类型但是了解其他参与人的可能类型的概率分布函数，并将其当做博弈参与人的共同信息，这样不完全信息就转变成完全但不完美信息，原本在博弈论中几乎不可求解的贝叶斯纳什均衡问题的计算就大为简化了(Harsanyi，J．，1967～1968)。

在不完全信息动态博弈中，子博弈精炼纳什均衡和贝叶斯纳什均衡被进一步拓展为精炼贝叶斯纳什均衡(Prefect Bayesian Nash Equlibrium)，它要求均衡不仅必须在每个后续博弈(Sequential Game)中构成均衡，并且均衡本身也是参与人重复运用贝叶斯法则(Bayesian Doctrine)，通过既得的博弈结果不断地修正自己的后验概率(Posterior Probability)分布的结果(Harsanyi & Selten，1987)，其他与纳什均衡相关的研究主要有：奥曼(Aumann，R．，1973)修正了纳什关于参与人选择战略时的独立性假设，考虑了如果参与人可以在进行战略选择时相协调的情况，从而提出了相关均衡(Correlated Equilibrium)的概念，克里普斯(Kreps，D．，1982)和塞尔腾(Selten，R．，1975)分别给出了时间序列均衡(Sequential Equilibrium)和颤抖手均衡(Trembling－hand Equlibrium)的定义，对精炼贝叶斯纳什均衡进行了进一步的精炼。

参考文献：

Aumann，R．，1973，Subjectivity and Correlation in Randomized Strategies，Journal of Mathematical Economics，Vol 1，67—96．

Debreu，G．，1952，A Social Equilibrium Existence Theorem，Proceedings of the National Academy of Science of U．S．，Vol 38，886—893．

Debreu，G．，1963，A Limit Theorem on the Core of an Economy，International Economics Review，Vol 4，236—246．

Friedman，J．，1971，Non－cooperative Equilibrium for Supergame，Review of Economic Studies，Vol 38，1—12．

Harsanyi，J．，1967—1968，Games with Incomplete Information Played by Bayesian Players，Management Science，Vol 14，159—182，320—334，486— 502．

Harsanyi & Selten，1987，A General Theory of Equilibrium Selection in Games，MIT Press．

Kreps，D．，& Wilson，R，Sequential Equilibrium，Econometrica，Vol 50，863—894．

Kuhn，H．，1953，Extensive Games and the Problem of Information，Annuals of Mathematical Studies，Vol 29．

Nash，J．，1950，Equilibrium Points in Nperson Games，Proceedings of the National Academy of Sciences Vol 36，48—59．

Nash，J．，1951，Non － cooperative Games，Annuals of Mathematics，Vol 54，286—295．

Schelling，T．，1960 The Strategy of Confliction，Harvard Univ．Press．

Selten，R，1975，Reexamination of the Perfectness Concept for Equlibrium Points in Extensive Games，International Journal of Game，Vol 4，25—55．

分享到：

纳什均衡

一周热点