混合策略

出处:按学科分类—经济 经济科学出版社《西方经济学大辞典》第240页(818字)

是纯策略的某种加权组合,权数表达了选择纯策略的概率。

设有一含N个局中人的对策,Si是局中人i(=1,2,…,N)的纯策略集。形式上,称任何满足:

的函数σi∶Si→[0,1]为局中人i的一个混合策略,其中σi(si)解释为i选择策略si的概率。

引入混合策略概念的主要好处在于它使得纳什均衡必定存在。考虑如图所示的标准型对策,它不存在纯策略纳什均衡。

记σA(上)=τ,σB(左)=λ,0≤τ,λ≤1。混合策略组或行动σ=(σA,σB)完全决定于τ,λ,就简记为(τ,λ)。

在(τ,λ)之下,局中人i的期望支付为

Eui(τ,λ)=τ[λui(上,左)+(1-λ)ui(上,右)]+(1-τ)[λui(下,左)+(1-λ)ui(下,右)]

其中i=A,B。若一个行动(,#)同时满足以下两个不等式:

EuA()≥EuA(τ,#),对所有0≤τ≤1,

EuB()≥EuB(,λ),对所有0≤λ≤1,

则称()为一个混合策略纳什均衡。

以支付矩阵的数据代入,得EuA(τ,λ)=(1-τ)(2λ-1),EuB(τ,λ)=(1-λ)(3-4τ)。

容易验证,当=3/4,=1/2时,上述两不等式同时成立,因此行动(3/4,1/2)是一个混合策略的纳什均衡。

上一篇:占优策略 下一篇:动态对策
分享到: