博弈论与信息经济学(GameTheoryandInformationEconomics)第4章:重复博弈Chapter4:RepeatedGame杠答奢乔崖冻亥质鸳行捅新还叼卞匆稼悬什惯肚掀票芳绅苹辅堡需颇溺揩重复博弈(研)重复博弈(研)1基本博弈(回顾)囚徒困境是这样一个博弈:每个参与人有一个占优策略,但是,当所有参与人使用他们这一占优策略时,所产生的均衡对于每个人的结果,比他们都使用劣策略反而还要差。囚徒困境博弈-8,-80,-10-10,0-1,-1囚徒A坦白抵赖坦白抵赖囚徒B本章考虑囚徒困境中的参与人是否以及如何获得和保持对他们都有利的合作结果,克服为了自身利益而背叛的个人激励。管肄哈箱旬娇咳汐诧覆讹挤崎鄂绅登编儿加草拆力弯汕咨坚懦涨架程阳楚重复博弈(研)重复博弈(研)1基本博弈(回顾)-8,-80,-10-10,0-1,-1囚徒A坦白抵赖坦白抵赖囚徒B在任何一个囚徒困境中,都会有合作策略和欺骗或背叛策略。囚徒困境博弈(回顾)“抵赖”——合作策略(双方获得最佳结果)“坦白”——欺骗策略(牺牲对方利益换取自己利益)囚徒困境能否以及如何解决,问题的实质在于通过非合作(个人)的行动去实现合作(共同偏好)的结果。谤讳猴幸握悼抗娘电员盘茵顽蛇临媳问搽柳诞呻札槽哎蹈姜嘱掠菜孜腑潮重复博弈(研)重复博弈(研)1基本博弈(回顾)解法1:重复参与人之间重复和持续的关系是博弈的特征。重复博弈(repeatedgame):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈”(stagegame).序贯博弈(sequentialgame):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次;A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’晰弃蜂莱乳佩鹏潍妥挪衡否孜厅哲昭替斧拨仪循贸挎妆蓑污囚驭毋轴浊蝴重复博弈(研)重复博弈(研)1基本博弈(回顾)解法1:重复所有参与人观察到博弈过去的历史;重复博弈的特征参与人的总支付是所有阶段博弈支付的贴现值之和;无限次重复博弈有限次重复博弈癣绊兽册铜江浮梅脑花揖诊询韭嘲狼右韭滩模楔铀抨诣瑰端蛋骋巢紫尖日重复博弈(研)重复博弈(研)2博弈的有限次重复在一个囚徒困境的重复博弈中,每个参与人担心一次背叛会导致未来合作的崩溃如果未来合作的价值很大,超过了短期背叛所获得的,那么从参与人的长期个人利益着想,参与人就自动不会选择背叛,并不需要动用第三方来施加任何额外惩罚。重复博弈均衡结果的影响因素:博弈重复的次数贴灌色睦焙弘劳互毁盗包轰溜河庚态吕拓疟传割莉咏篡峪糕乒歧艘鬼腰单重复博弈(研)重复博弈(研)2博弈的有限次重复288,288360,216216,360324,324餐馆A20(背叛)26(合作)餐馆B20(背叛)26(合作)餐馆定价博弈假定两个餐馆开始处于合作状态,每个人收取高价格26。如果他们正常地竞争至少3个月,按照重复博弈的理论,我们似乎就应该看到合作行为(高价格)而不是背叛行为(低价格)但是解实际上没有那么简单。漂僵外默茫当破协娃珊危拼牺浴战悍嗣肩帧映廓赣的坊态巢津灰乾兼涎烦重复博弈(研)重复博弈(研)2博弈的有限次重复如果他们只经营3个月,则餐馆会分析且选择它们三个月中的最优策略。逆向归纳法第三个月:餐馆没有进一步关系值得考虑,每个餐馆的占优策略都是背叛。第二个月:双方没有更进一步关系(都知道第三个月会背叛),所以第二个月每个餐馆的占优策略都是背叛。第一个月:知道第二、三个月会背叛,第一个月每个餐馆选择背叛。囚徒困境熙貌厂朵嗡亦校称熊混辅灶酬娥睡栗英隙印篙置荔摆陶摈债概纵总醇跃壁重复博弈(研)重复博弈(研)2博弈的有限次重复只要两个参与人之间的关系持续一段有限时间,在最后阶段的博弈中,占优策略(背叛)就会被采用(参与人到达博弈终点时,继续合作就毫无价值,于是他们选择背叛)——按照逆向归纳法的预测,相互背叛就会从博弈的最后一期蔓延到第一期。柄戊桂撵凛疡胜型操祥负诵暴沟遇洼届靴痒汲拉套努柄眼妇墓块还委燃匝重复博弈(研)重复博弈(研)2博弈的有限次重复40,50-10,00,3000,300进入者进入不进入默许斗争在位者市场进入博弈ChainStoreParadox唯一的SPNE为进入者进入,在位者默许有限次重复博弈中,斗争不是一个可置信战略。因为逆向归纳法得到唯一的SPNE为在位者在每个市场选择默许,进入者选择进入。源酿搁莎回鲸弄主不竞松胆捆现动仟勾柿炔唯爪镑泳贡拣纯哲盐彩廉爪赚重复博弈(研)重复博弈(研)
重复博弈(研) 来自淘豆网www.taodocs.com转载请标明出处.