下载此文档

第三讲 混合策略纳什均衡.ppt


文档分类:通信/电子 | 页数:约51页 举报非法文档有奖
1/51
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/51 下载此文档
文档列表 文档介绍
引言
◆有些博弈不存在纳什均衡,或者纳什均衡不唯一,如猜硬币博弈,前述纳什均衡分析就无法对博弈方的选择和博弈结果作明确的预测。
◆这部分对不存在纳什均衡和存在多个纳什均衡的博弈作一些讨论。
第一页,共51页。
混合策略的引进
一样,博弈不会有纯战略的均衡。
第十二页,共51页。
两人只能玩混合战略博弈,齐威王分别以1/6随机的概率选择出上、中、下马的任一排列,田忌也如此。由于齐威王存在绝对优势,他平均看来仍然会赢田忌一千斤铜。
第十三页,共51页。
混合策略均衡
◆纯策略与纯策略纳什均衡
纯策略:肯定会被选择——以100%的概率——被选择的策略。
纯策略纳什均衡:各个参与人都选择纯策略的纳什均衡。
◆混合策略与混合策略纳什均衡
混合策略:以一定的概率分布选择某几个行动的策略。
混合策略纳什均衡:由参与人的混合策略构成的纳什均衡。
第十四页,共51页。
◆混合策略定义:在n人博弈的策略式表述 中,假定参与人 有K个纯策略: ,那么,概率分布 称为参与人 的一个混合策略,这里
是参与人 选择 的概率,对于所有的 。
◆ 显然,纯策略可以理解为混合策略的特例,比如说,纯策略 等价于混合策略 ,即选择纯策略 的概率为1,选择任何其他纯策略的概率为0。
◆混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。
混合策略均衡
第十五页,共51页。
期望支付函数
例:
◆参与人1的混合策略:(p,1-p)
参与人2的混合策略:(q,1-q)
◆参与人1的期望支付:
如果参与人1选择S11:
如果参与人1选择S12:
EV1(p,q)=
◆参与人2的期望支付:
EV2(p,q)=
u1,u2
u3,u4
u5,u6
u7,u8
参与人2
S11 p
S12 1-p
S21
S22
参与人2
q
1-q
第十六页,共51页。
混合策略均衡
例:监督博弈
给定工人偷懒,老板的最优
选择是监督;给定老板监督,
工人的最优选择是不偷懒;
给定工人不偷懒,老板的最
优选择是不监督;给定老板
不监督,工人的最优选择是
偷懒;如此循环。
1,-1
-1,2
-2,3
2,2
老板
监督
不监督
偷懒
不偷懒
工人
第十七页,共51页。
混合策略均衡
监督
不监督
偷懒
不偷懒
工人
老板
假定老板选择混合战略(,)
工人选择“偷懒”期望支付为 (-1)×+3×=1
工人选择“不偷懒”期望支付为2×+2×=2
工人应选择“不偷懒”
老板选择“不监督”
工人选择“偷懒’……
假定老板选择混合战略(,)
工人选择“偷懒”期望支付为(-1)×+3
工人选择“不偷懒”(期望)支付为2×+2×=2
工人应选择“偷懒” 老板选择“监督” 工人选择“不偷懒’……
1,-1
-1,2
-2,3
2,2
第十八页,共51页。
混合策略均衡
什么情况下达到纳什均衡状态?
假定存在一个概率q,老板选择混合策略(q,1-q)
工人选择“偷懒”期望收益为(-1)×q+3×(1-q)=3-4q
工人选择“不偷懒”收益为2
如果老板真的以概率q选择监督,1-q选择不监督,那么意
味着他不会始终重复地选择某个纯策略,而他不重复选择的
条件必须是工人也不会重复地选择策略。 因此,老板
以概率q选择监督必然意味着在这种情况下工人没有合适的纯
策略选择。====老板的选择必须使工人在两个纯策略之间随机选择。
工人什么情况下随机选择?
第十九页,共51页。
混合策略均衡
◆当工人选择任何一个策略的期望支付相等时,即3-4q=2 ,q*=1/4,1- q*=3/4。这样,当老板选择(1/4,3/4)的混合战略时,可以使工人在两个纯战略之间无差异。
◆ 同理,假设工人选择(p,1-p),(p,1-p)成为其最优混合战略
的条件是老板在选择监督与选择不监督之间无差异,即
1×p+(-1)(1-p)=(-2

第三讲 混合策略纳什均衡 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数51
  • 收藏数0 收藏
  • 顶次数0
  • 上传人350678539
  • 文件大小1.17 MB
  • 时间2022-01-19