混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:***牌对色游戏(p77)
无纯策略NE
给定混合策略p甲=(r,1-r); p乙=(q,1-q)
π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
整理原则:一项含r,一项不含r
π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
整理原则:一项含q,一项不含q
按照NE的条件,一个策略组合如过是一个NE,那么其中的每一个策略都是参与人针对其他参与人策略组合的最优反应,在纯策略NE中,这个“最优反应”可能是一个具体的纯策略(离散情形),也可能是一个反应函数(reaction function,如连续情形、古诺模型)。而在一个混合策略NE中,这个“最优反应”将是一个概率或很多个概率——被称为“反应对应”(reaction correspondence)
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:***牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q):
观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
r
q
0
1
(红)
1
(红)
1/2
1/2
r*=R(q)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:***牌对色游戏(p77)
再看乙的最优反应,记为q*=R(r):
观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
r
q
0
1
(红)
1
(红)
1/2
1/2
q*=R(r)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:***牌对色游戏(p77)
作为NE,各个参与人的反应应该同时为最优,只有两个反应对应的交点满足
NE:r*=1/2, q*=1/2
NE支付为: π甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0
π乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0
r
q
0
1
(红)
1
(红)
1/2
1/2
q*=R(r)
r*=R(q)
第二节 混合策略纳什均衡的求解方法
二、反应对应法
作业:社会福利博弈。使用反应对应法找到纳什均衡。
流浪汉
寻找工作 游荡
救济
政府
不救济
3,2
-1,3
-1,1
0,0
第三节 寻找多重纳什均衡
例:情侣博弈
两个(多个)纯策略纳什均衡
问题:纳什均衡找完了吗?有无混合策略纳什均衡?
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q)
Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q)
Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2r)
NE:(r*, q*)=(3/4, 1/4)
二、反应对应法
r
q
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
先看陈明的最优反应,记为r*=R(q):
π陈明(p陈明, p钟信) =r(4q-1)+2(1-q)
r
q
0
1
(钟信德语)
1
(陈明德语)
1/4
r*=R(q)
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
再看钟信的最优反应,记为q*=R(r):
π钟信(p陈明, p钟信)=q(4r-3)+(3-2r)
r
q
0
1
(钟信德语)
1
(陈明德语)
1/4
q*=R(r)
3/4
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
反应对应曲线有三个交点:三个NE:
r*=0, q*=0 纯策略(确定性)
r*=3/4, q*=1/4 混合策略(不确定性)
r*=1, q*=1 纯策略(确定性)
r
q
0
1
(钟信德语)
1
(陈明德语)
1/4
3/4
r*=R(q)
q*=R(r)
混合策略纳什均衡 来自淘豆网www.taodocs.com转载请标明出处.