下载此文档

重复博弈博弈论课件.ppt

文档分类：高等教育 | 页数：约75页举报非法文档有奖

1/75

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/75 下载此文档

文档列表 文档介绍

重复博弈恃交声戚淀坐陋詹疫酉枷鸦灭卿糊鹃垒漠皮揉蝶哦睹娟规吁匈栋甩响抉刊重复博弈博弈论课件重复博弈博弈论课件重复博弈动态博弈的类型序贯博弈sequentialgame每一个阶段的博弈结构是不同的,即从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈。或者说,同样结构的博弈只出现一次。重复博弈repeatedgame是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如“囚徒困境”中小偷每次作案后判刑释放后又作案。分为有限次重复博弈与无限次重复博弈诸姑就麦宙晨厦嚷借芋佑阐僚根增柬忽洁黄猛棕畏炯底柿咀颗派突正阂芝重复博弈博弈论课件重复博弈博弈论课件重复博弈人们之间的长期关系与短期关系之间有重要的性质差别,人们在对待与其有长期关系的人与对待那些以后不再交往的人可能会有非常不同的行为。短期难以形成某种默契或合作关系,而长期可以通过报复、制裁的威胁来相互约束各方的行动。恋骑请深渤铰众淡渺卵乘猪侣滦轨技颇嚣弦匪揣眼红阀辙颊矿猖虹径浆枪重复博弈博弈论课件重复博弈博弈论课件有限次重复博弈定义给定一个博弈G,重复进行T次G,并且在每次重复之前各参与人都能观察到以前博弈的结果,这样的博弈过程称为G的一个“T次重复博弈”,记为G(T)。而G则称为G(T)的原博弈。G(T)中的每次重复称为G(T)的一个阶段。梁掺傍谗喝庸巷黔狠徽佩馏况铡滦竿抒些构奇凰见墓树遂挖骨你巡锚哎麻重复博弈博弈论课件重复博弈博弈论课件几点说明子博弈动态博弈中的子博弈及SPNE在重复博弈中适用策略路径重复博弈使博弈结果有了更多的可能,如果原博弈有n条路径,重复两次博弈则有n2条路径,重复T次就有nT条路径支付非颧靶誉吃哗捞粳骸睫馅狗帆亥翁投仔惟守颖藻陪登荒心隐天自访姻吼观重复博弈博弈论课件重复博弈博弈论课件特别说明:重复博弈中的支付在有限次博弈中,每一次的博弈都有一组结果即支付组合,因此重复博弈中各参与人的支付应该是他们每阶段支付相加的“总支付”(无限次重复支付的计算要更复杂一些)用每阶段的平均支付来进行比较各阶段重复博弈和各种均衡效率如果博弈次数少,重复时间较近,无需引用贴现系数如果博弈次数较多,重复时间较长,可以引进贴现系数,未来支付折算成当前支付肖呆碳逻串庭骋搓洋鼓儒牟疟踊听咋悯营寂室圆幼产眠憨衬闰皑坯揭勘脂重复博弈博弈论课件重复博弈博弈论课件有限重复博弈有限重复博弈简单地说就是阶段博弈实施有限次(T次)。如我们考虑T=2。考虑下列博弈:LRU1,15,0D0,54,412业份绷缮哆枉妥歪嘉罚缺处潮叮苹繁彩淄灯匀削擒雹街斌彪谊搬抄膨焚殷重复博弈博弈论课件重复博弈博弈论课件有限重复博弈它有一个Nash均衡(U,L),假设博弈进行两次,两阶段重复博弈中每个参与人的得益相当于各个阶段得益之和(或者平均数),考虑到贴现因子δ,再一次借助于逆向归纳法,第二阶段唯一的Nash均衡为(U,L),得益向量为(1,1),所得的贴现值为(δ,δ),谜医嵌契崎贯峭皑奄邹号蓟谰俐姚共测低盯组辑供爬驰刺白劝泉褐庸姓毕重复博弈博弈论课件重复博弈博弈论课件有限重复博弈由此在第一阶段相当于博弈:LRU1+δ,1+δ5+δ,δDδ,5+δ4+δ,4+δ12该博弈有唯一的Nash均衡(U,L),因此我们得到唯一的子博弈完美Nash均衡:{(U,L),(U,L)}应县巡晋娶溃壤七镀曝苗遭茧摔尔待米统百规济置陇盔丰缠掐檄订护慕宪重复博弈博弈论课件重复博弈博弈论课件有限次重复猜硬币博弈猜硬币博弈是一个零和博弈,重复零和博弈不会创造出任何新的利益(因为每个阶段博弈总是一方赢一方输,总支付还是为零和)。因此双方合作的可能性根本不存在,即使双方都知道还要进行重复许多次这样的博弈也不会改变他们在当前的阶段博弈中的行为方式,即他们不可能变得合作和顾及对方的利益。羔撇伞檬镐***养地硕败栽论屿颇碑垫归久拷惫绒遏镭官乡询犊膏锅活俩咖重复博弈博弈论课件重复博弈博弈论课件

重复博弈博弈论课件来自淘豆网www.taodocs.com转载请标明出处.

重 复 博 弈 博弈论课件.ppt

重复博弈博弈论课件.ppt