下载此文档

混合策略纳什均衡.ppt

文档分类：论文 | 页数：约35页举报非法文档有奖

1/35

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/35 下载此文档

文档列表 文档介绍

第二节混合策略纳什均衡的求解方法二、支付最大化法例:***牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)π甲(p甲,p乙)=r[q(-1)+(1-q)1]+(1-r)[q1+(1-q)(-1)]=2r(1-2q)+(2q-1)π乙(p甲,p乙)=q[r1+(1-r)(-1)]+(1-q)[r(-1)+(1-r)1]=2q(2r-1)-(2r-1)混合策略纳什均衡是甲在策略空间{}上以概率分布p甲*=(1/2,1/2)进行选择,乙也在策略空间{}p乙*=(1/2,1/2)进行选择Maxπ甲(p甲,p乙)rq*=1/-2q=0Maxπ乙(p甲,p乙)qr*=1/-1=0第二节混合策略纳什均衡的求解方法二、反应对应法例:***牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)π甲(p甲,p乙)=2r(1-2q)+(2q-1)整理原则:一项含r,一项不含rπ乙(p甲,p乙)=2q(2r-1)-(2r-1)整理原则:一项含q,一项不含q按照NE的条件,一个策略组合如过是一个NE,那么其中的每一个策略都是参与人针对其他参与人策略组合的最优反应,在纯策略NE中,这个“最优反应”可能是一个具体的纯策略(离散情形),也可能是一个反应函数(reactionfunction,如连续情形、古诺模型)。而在一个混合策略NE中,这个“最优反应”将是一个概率或很多个概率——被称为“反应对应”(reactioncorrespondence)第二节混合策略纳什均衡的求解方法二、反应对应法例:***牌对色游戏(p77)先看甲的最优反应,记为r*=R(q):观察π甲(p甲,p乙)=2r(1-2q)+(2q-1)rq01(红)1(红)1/21/2r*=R(q)反应对应曲线第二节混合策略纳什均衡的求解方法二、反应对应法例:***牌对色游戏(p77)再看乙的最优反应,记为q*=R(r):观察π乙(p甲,p乙)=2q(2r-1)-(2r-1)rq01(红)1(红)1/21/2q*=R(r)反应对应曲线第二节混合策略纳什均衡的求解方法二、反应对应法例:***牌对色游戏(p77)作为NE,各个参与人的反应应该同时为最优,只有两个反应对应的交点满足NE:r*=1/2,q*=1/2NE支付为:π甲(p甲,p乙)=2r(1-2q)+(2q-1)=0π乙(p甲,p乙)=2q(2r-1)-(2r-1)=0rq01(红)1(红)1/21/2q*=R(r)r*=R(q)第二节混合策略纳什均衡的求解方法二、反应对应法作业:社会福利博弈。使用反应对应法找到纳什均衡。流浪汉寻找工作游荡救济政府不救济3,2-1,3-1,10,0第三节寻找多重纳什均衡例:情侣博弈两个(多个)纯策略纳什均衡问题:纳什均衡找完了吗?有无混合策略纳什均衡?一、支付最大化法给定混合策略p陈明=(r,1-r);p钟信=(q,1-q)Maxπ陈明(p陈明,p钟信)=r[3q+(1-q)]+(1-r)[0+2(1-q)]=r(4q-1)+2(1-q)Maxπ钟信(p陈明,p钟信)=q(2r+0)+(1-q)[r+3(1-r)]=q(4r-3)+(3-2r)NE:(r*,q*)=(3/4,1/4)二、反应对应法rq第三节寻找多重纳什均衡二、反应对应法:情侣博弈先看陈明的最优反应,记为r*=R(q):π陈明(p陈明,p钟信)=r(4q-1)+2(1-q)rq01(钟信德语)1(陈明德语)1/4r*=R(q)第三节寻找多重纳什均衡二、反应对应法:情侣博弈再看钟信的最优反应,记为q*=R(r):π钟信(p陈明,p钟信)=q(4r-3)+(3-2r)rq01(钟信德语)1(陈明德语)1/4q*=R(r)3/4第三节寻找多重纳什均衡二、反应对应法:情侣博弈反应对应曲线有三个交点:三个NE:r*=0,q*=0纯策略(确定性)r*=3/4,q*=1/4混合策略(不确定性)r*=1,q*=1纯策略(确定性)rq01(钟信德语)1(陈明德语)1/43/4r*=R(q)q*=R(r)

混合策略纳什均衡来自淘豆网www.taodocs.com转载请标明出处.