第三章完全信息静态博弈(二)混合战略纳什均衡混合战略纳什均衡混合战略纳什均衡举例反应函数纳什均衡的存在性与多重性第一节混合战略纳什均衡问题1纳什均衡不唯一如:斗鸡博弈0,00,2退2,0-3,-3进退进12支付纯策略纳什均衡不存在如:猜币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略问题2这类博弈很多,引出混合策略纳什均衡概念小孩玩的游戏“石头,剪子,布”,也是一种博弈。但是,这个博弈有一种有趣的特征,即给定一方的任何选择,另一方都有制胜对方的战略,所以,给定一方任何一个战略,对方都有制胜这个战略的战略,因而这个战略不是最优的。任何“纯战略”都不是最优的,纯战略是“石头,剪子,布”中的任何一个。但是,我们知道,玩这个游戏是总是以对方不易猜出的随机方式出招。事实上,可以通过数学证明,当双方都以每个战略按1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面。这被称为“混合战略纳什均衡”,而这种以随机方式选择纯战略的博弈被称为“混合战略博弈”。混合战略(mixedstrategies)混合战略:在博弈中,博弈方的战略空间为,则博弈方i以概率分布随机在其个可选战略中选择的“战略”,称为一个“混合战略”,其中对都成立,且混合战略就是博弈方根据一组选定的概率,在可能的行为中随机选择的战略。定义:*=(1*,…,n*)=(i*,-i*)是一纳什混合战略均衡,当且仅当对所有参与人而言,i*是-i*的最适反应,ui(i*,-i*)ui(I’,-i*),对所有i’i成立。混合策略纳什均衡:包含混合战略的战略组合,构成纳什均衡。持混合战略的前提是在均衡时两种战略的报酬会相等,是预期支付最大化的推导结果。混合策略纳什均衡当参与者随机采取纯策略时,博弈的结果本身就是随机的,这时参与者得收益函数变为冯∙诺依曼—摩根斯坦收益函数,参与者i所得的收益就是n个参与者混合策略组合p=(p1,p2,…pn)下的期望值。假设s=(s1,s2,,…sn)为纯策略组合,其中si表示参与者i可用的任意一个纯策略,S=S1XS2X…Sn为策略空间的n重笛卡尔积。参与者i从混合策略组合p得到的VNM收益函数用数学可表示为vi(p)=通常将这种期望偏好称为冯∙诺依曼—摩根斯坦偏好,其中收益函数u称为伯努利收益函数。
博弈论第三章 来自淘豆网www.taodocs.com转载请标明出处.