下载此文档

第三讲混合策略纳什均衡.ppt


文档分类:通信/电子 | 页数:约53页 举报非法文档有奖
1/53
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/53 下载此文档
文档列表 文档介绍
第三讲混合策略纳什均衡
1
例子1 为什么一般人总是小错不断,大错不犯;偷税漏税的一般是中小企业,大企业会老老实实地交税?
税务部门不会对所有企业的交税情况每一次都去检查,因为这样做的成本太高,得不偿失。所以
给定工人不偷懒,老板的最
优选择是不监督;给定老板
不监督,工人的最优选择是
偷懒;如此循环。
1,-1
-1,2
-2,3
2,2
老板
监督
不监督
偷懒
不偷懒
工人
混合策略均衡
监督
不监督
偷懒
不偷懒
工人
老板
假定老板选择混合战略(,)
工人选择“偷懒”期望支付为 (-1)×+3×=1
工人选择“不偷懒”期望支付为2×+2×=2
工人应选择“不偷懒”
老板选择“不监督”
工人选择“偷懒’……


假定老板选择混合战略(,)
工人选择“偷懒”期望支付为(-1)×+3×=
工人选择“不偷懒”(期望)支付为2×+2×=2
工人应选择“偷懒” 老板选择“监督” 工人选择“不偷懒’……
1,-1
-1,2
-2,3
2,2
混合策略均衡
什么情况下达到纳什均衡状态?
假定存在一个概率q,老板选择混合策略(q,1-q)
工人选择“偷懒”期望收益为(-1)×q+3×(1-q)=3-4q
工人选择“不偷懒”收益为2
如果老板真的以概率q选择监督,1-q选择不监督,那么意
味着他不会始终重复地选择某个纯策略,而他不重复选择的
条件必须是工人也不会重复地选择纯策略。
因此,老板以概率q选择监督必然意味着在这种情况下工人没有合适的纯策略选择。====老板的选择必须使工人在两个纯策略之间随机选择。
工人什么情况下随机选择?
混合策略均衡
◆当工人选择任何一个策略的期望支付相等时,只能随机
选择。于是,3-4q=2 ,即q*=1/4,1- q*=3/4。这样,当老板选
择(1/4,3/4)的混合战略时,可以使工人在两个纯战略之
间无差异。
◆ 同理,假设工人选择(p,1-p),(p,1-p)成为其最优混合战略
的条件是老板在选择监督与选择不监督之间无差异,即
1×p+(-1)(1-p)=(-2)p+2(1-p),即p*=1/2,1- p*=1/2。
◆当老板选择(1/4,3/4),工人选择(1/2,1/2)时,刚
好互为彼此的最优反应,达到纳什均衡状态,称为混合战略
纳什均衡。
混合策略均衡
◆参与人1和参与人2的混合策略组合 构成均衡的必要条件:
混合战略均衡的求解方法
◆方法1:支付最大化法
给定其他参与人的混合战略,自己选择行动的概率分布要使自己期望支付最大化。
q
1-q
1-p
p
工人的期望支付函数为
(-1)pq+2(1-p)q+3p(1-q)+2(1-p)(1-q)=-4pq+p-2q+2
最优化一阶条件为:-4q+1=0 q*=1/4
给定工人的混合战略为(p,1-p),老板的混合战略为(q,1-q)
支付最大化法求混合战略纳什均衡
1,-1
-1,2
-2,3
2,2
老板
监督
不监督
偷懒
不偷懒
工人
混合战略均衡的求解方法
◆方法2:支付等值法
自己选择策略概率分布使对方不会偏好于任何行动,即选择每一个策略都会得到相同的收益。
例子
例:博弈方1的混合策略(p,1-p)
博弈方2的混合策略(q,1-q)
博弈方1:
由 可得 :q=
博弈方2:
由 可得 :p=
2, 3
5, 2
3, 1
1, 5
C
D
A
B
博弈方2



1
得双方的策略及相应得益:
其中,博弈方1的期望得益为:
博弈方2的期望得益为:
策略
期望得益
博弈方1
(,)

博弈方2
(,)

多重均衡博弈和混合策略
一、夫妻之争的混合策略纳什均衡
◆首先,该博弈有两个纳什均衡,本博弈的两个博弈方不会害怕对方猜到自己的选择,他们主观上并不想隐藏自己的选择。因此,该博弈中两博弈方的决策思路和原则应该与没有纳什均衡的严格竞争博弈有所不同。
2, 1
0, 0
0, 0
1, 3
时 装
足 球
时装
足球
丈 夫


夫妻之争
◆但显然,双方的偏好不同,妻子喜欢前一

第三讲混合策略纳什均衡 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数53
  • 收藏数0 收藏
  • 顶次数0
  • 上传人核辐射
  • 文件大小753 KB
  • 时间2022-04-13