下载此文档

博弈论经典例子.doc


文档分类:金融/股票/期货 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍
[笔记]——博弈论经典例子的思考摘要:博弈论就是关于在包含相互依存情况中的理性行为的研究,是研究对策现象中各方是否存在最合理的行动方案,以及如何找到合理的行动方案的理论和方法。本文分析思考了博弈论的两个典型例子,也对博弈价格战提出了自己的看法,希望能带给大家一些启发。关键词:纳什均衡非合作博弈无限博弈田忌赛马战国时期,齐王和大将田忌赛马,双方各出三匹马各赛一局。各方的马根据好坏分别称为上马、中马、下马。田忌的马比齐王同一级的马差但比齐王低一级的马好一些。若用同一级马比赛,田忌必然连输三局。每局的赌注为1千金,田忌要输3千金。田忌的谋士建议田忌在赛前先探听齐王赛马的出场次序,然后用自己的下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。结果负一局胜两局赢得1千金。但若事先并不知道对方马的出场次序,双方应取何种策略?双方采用的赛马出场次序安排及相应的结果(齐王赢的千金数)可由下表所示列出。齐王田忌上中下上下中中上下中下上下中上下上中上中下311—111上下中13—1111中上下1131—11中下上11131—1下中上1—11131下上中—111113由图可知,田忌赢的概率只有六分之一,孙膑只是掌握了齐王的思维定势侥幸赢了一把,在一把定胜负的时候管用,当试验的机会增多,田忌就输了。如果赛马的规则发生变化,每个人要将自己的马严格的划分等级,上等马速度必须比中等马快,中等马必须比下等马快,且比赛时同等级的马才可以比赛的话,那么田忌就只有输的份了。孙膑只是一时抓住了规则的某些漏洞耍了些小聪明才取得一盘的胜利,我们只对他的小聪明淡然一笑罢了。博弈根据不同的游戏规则会产生与之相适应的策略。囚徒的困境有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话:检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白***的罪行,你将无罪释放,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他无罪释放。但是,如果你们两人都坦白交代,那么,你们都要被判8年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况下无法串供,所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到无罪释放,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判8年,总比被判10年好。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要延长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时问的监禁的结果。有理由相信现实生活当中不是冤家不聚头。结果第二次,第三次这两个囚徒又被抓到一起。有了第一次教训之后他们会在接下来的审讯里做何选择呢?这就是有限次重复的"囚徒的困境"。博弈论里有一种倒推法来解决这个问题。假设这个例子只重复5次,因为在狱中渡过太多的岁月之后他们都老到做不动坏事了。我们先看第5次他们会怎么选。显然第5次的面临的选择和第1次是一模一样的,因此没有理由相信这两个囚徒会在第5次审讯里合作。如果第5次不合作,为什么他们会在第4次合作呢?如此倒推,有限次重复的"囚徒的困境"和一次的结果没有任何不同,即双双坦白,入狱8年。如果把这种体验无限延长,或至少是他们俩知道肯定还有这种事,只是不知道什么时候才能停止这种把戏,这就是无限次重复的"囚徒的困境",让我们再来看看这会不会有不同。因为无限博弈不存在最后一次,倒推法不再适用。假设一个人在

博弈论经典例子 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人875845154
  • 文件大小0 KB
  • 时间2016-02-16