下载此文档

混合策略纳什均衡.ppt


文档分类:论文 | 页数:约34页 举报非法文档有奖
1/34
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/34 下载此文档
文档列表 文档介绍
混合策略纳什均衡Mixed StrategyNash Equilibrium理学院顾聪******@12016-9-142两个参与人各拿一枚硬币,并选择出正面向上还是反面向上。若两枚硬币是一致的(即全部正面或全部反面),则参与人2赢走参与人1的硬币;若两枚硬币不一致(一正一反),参与人1赢得参与人2的硬币。支付矩阵如下:参与人1参与人2 -1,11,-11,-1 -1,1正面反面正面反面由划线法可知,该博弈不存在纳什均衡。所以采取纯策略不存在稳定的纳什均衡解。 严格竞争博弈和混合策略1. 混合策略的提出——猜硬币博弈2016-9-143?在这类博弈中,不存在纯策略纳什均衡。?参与人的支付取决于其他参与人的策略;以某种概率分布随机地选择不同的行动。?每个参与人都想猜透对方的策略,而每个参与人又不愿意让对方猜透自己的策略。这种博弈的类型是什么?如何找到均衡?上述博弈的特征是:2016-9-144?策略:–参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。?纯策略:–如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称为纯策略,简称“策略”,即参与人在其策略空间中选取唯一确定的策略。?混合策略:–如果一个策略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合策略。参与人采取的不是明确唯一的策略,而是其策略空间上的一种概率分布。2. 混合策略、混合策略博弈和混合策略纳什均衡2016-9-145?()–在博弈中,博弈方的策略空间,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且–纯策略可以理解为混合策略的特例,即在诸多策略中,选择该纯策略的概率为1,选其他纯策略的概率为0.–为何参与人可能会选择带不确定性的混合策略而放弃确定性的纯策略??参与人主观因素造成的犹豫不决?外在客观因素的不确定性带来应对策略的不确定性?迷惑对手:为了让其它参与人不能清楚了解自己的选择},;,{11nnuuSSG???i},{1ikiissS??ki1( , , )i i ikp p p??10??ijpkj,,1??11i ikp p? ???2016-9-146),,,(****21n??????* * * 1 2 )i i i i i i i iii nu u Su i? ? ???? ??? ???即,如果对于所有的,,,,有( , ( , ),其中,表示参与人的期望效用。?混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈”。?混合策略纳什均衡(MNE):由最优的混合策略构成的混合策略组合:2016-9-1471 21 2 1 21 21 2 1 21 1 1( ) ( , , )nn nnmm mi j j nj i j j njj j jE p p p p u s s s? ? ?????? ???对于任意混合策略组合:–若各参与人最终确定的组合(纯策略组合)为–参与人的支付为–发生此情况的概率为?参与人的期望效用:1 2 1( , , , ), ( , , )in i i im ip p p p p p p P? ???? ?1 21 2 1( , , ) { , , )n ij j nj i i ims s s S s s? ?? ?1 21 2( , , )ni j j nju s s s?1 21 2nj j njp p p?3. 期望效用(Expected Payoff)2016-9-1

混合策略纳什均衡 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数34
  • 收藏数0 收藏
  • 顶次数0
  • 上传人allap
  • 文件大小857 KB
  • 时间2016-09-14