囚犯困境

囚徒困境是一个非常流行的两人战略互动博弈的例子,也是许多博弈论教科书中常见的介绍性例子。游戏的逻辑很简单:...

01

2004年

囚犯困境

007Ys3FFgy1gu6hi88fz2j30b106dglw

囚徒困境是一个非常流行的两人战略互动博弈的例子,也是许多博弈论教科书中常见的介绍性例子。游戏的逻辑很简单:

  • 游戏中的两名玩家被指控犯罪,并被安排在不同的房间里,这样他们就无法相互交流(换句话说,他们不能串通或承诺合作。)
  • 每个玩家都被独立地询问他是要承认罪行还是保持沉默。
  • 因为两个玩家都有两种可能的选择(策略),所以游戏有四种可能的结果。
  • 如果两名球员都坦白,他们每个人都会被送进监狱,但比其中一名球员被另一名球员出卖的时间要短。
  • 如果一个玩家坦白而另一个保持沉默,沉默的玩家将受到严厉惩罚,而坦白的玩家将获得自由。
  • 如果两名球员都保持沉默,他们每人都会受到比双方都坦白更轻的惩罚。

在游戏本身中,惩罚(和奖励,如果相关)由效用数表示。正数代表好的结果,负数代表坏的结果,如果与之相关的数字更大,则一个结果比另一个好(但是,请注意这对负数的作用,因为例如-5.大于-20!)

在上表中,每个框中的第一个数字表示玩家1.的结果,第二个数字表示玩家2.的结果。这些数字仅表示与囚徒困境设置一致的多组数字中的一组。

02

2004年

分析玩家的选择

007Ys3FFgy1gu6hi8rxlqj30b106dglw

一旦游戏被定义,分析游戏的下一步就是评估玩家的策略,并试图了解玩家的行为。经济学家在分析博弈时会做出一些假设——首先,他们假设两个博弈方都知道自己和另一个博弈方的收益,其次,他们假设两个博弈方都在理性地从博弈中最大化自己的收益。

一个简单的初始方法是寻找所谓的主导策略——不管其他玩家选择什么策略都是最好的策略。在上面的例子中,选择坦白是双方的主要策略:

  • 如果玩家2.选择坦白,那么坦白对玩家1.更有利,因为-6.比-10好。
  • 如果玩家2.选择保持沉默,那么坦白对玩家1.更有利,因为0比-1.好。
  • 如果玩家1.选择忏悔,那么忏悔对玩家2.更有利,因为-6.比-10好。
  • 如果玩家1.选择保持沉默,那么坦白对玩家2.更有利,因为0比-1.好。

既然坦白对双方都是最好的,那么双方都坦白的结果是游戏的均衡结果也就不足为奇了。也就是说,对我们的定义更精确一点是很重要的。

03

2004年

纳什均衡

007Ys3FFgy1gu6hi9acjqj30b106dt9f

纳什均衡的概念是由数学家和博弈理论家约翰·纳什编纂而成的。简单地说,纳什均衡是一组最佳反应策略。对于两人博弈,纳什均衡是一种结果,其中,参与者2.的策略是对参与者1.的策略的最佳响应,而参与者1.的策略是对参与者2.的策略的最佳响应。

通过这一原理找到纳什均衡可以在结果表中加以说明。在本例中,玩家2.对玩家1.的最佳响应以绿色圈出。如果玩家1.坦白,玩家2.的最佳反应是坦白,因为-6.比-10好。如果玩家1.不坦白,玩家2.的最佳反应是坦白,因为0比-1.好。(注意,此推理与用于识别主导策略的推理非常相似。)

玩家1.的最佳回答用蓝色圆圈表示。如果玩家2.坦白,玩家1.的最佳反应是坦白,因为-6.比-10好。如果玩家2.不坦白,玩家1.的最佳反应是坦白,因为0比-1.好。

纳什均衡是同时存在绿色圈和蓝色圈的结果,因为这代表了两个参与者的一套最佳应对策略。一般来说,可能有多个纳什均衡或根本没有(至少在这里描述的纯策略中)。

04

2004年

纳什均衡的有效性

007Ys3FFgy1gu6hi9pczqj30b106dt9f

您可能已经注意到,本例中的纳什均衡在某种程度上似乎是次优的(特别是,它不是帕累托最优的),因为两个参与者都有可能得到-1.而不是-6.这是博弈中存在的交互作用的自然结果-理论上,不承认将是集体的最佳策略,但个人激励阻止了这一结果的实现。例如,如果玩家1.认为玩家2.会保持沉默,那么他会有一个诱因去揭发他,而不是保持沉默,反之亦然。

因此,纳什均衡也可以被认为是一种结果,即没有任何参与者有动机单方面(即自己)偏离导致该结果的策略。在上面的例子中,一旦玩家选择坦白,任何一个玩家都无法通过自己改变主意来做得更好。

  • 发表于 2021-09-06 06:01
  • 阅读 ( 126 )
  • 分类:科学

你可能感兴趣的文章

今年秋天,与covid-19作斗争的监狱面临另一种疾病威胁

在俄克拉荷马州的埃迪勇士惩教中心,超过90%的囚犯检测出COVID-19呈阳性。俄克拉荷马州ACLU的政策和宣传主管妮可·麦卡菲说,俄克拉荷马州监狱系统几乎所有的设施都受到了病毒的侵害。她认为他们还没有看到最糟糕的情况—...

  • 发布于 2021-04-17 21:34
  • 阅读 ( 162 )

华盛顿州州长暂停死刑

...着目前在华盛顿死囚牢房的9个人——或任何未来的潜在囚犯——已经脱离了困境。英斯利说,他不会改变目前的**判决,而是会暂时停止执行任何**“没人能出狱,就这样,”英斯利说。

  • 发布于 2021-04-25 07:49
  • 阅读 ( 128 )

博弈论策略如何改善决策

...球员A的一分钱。 僵局 这是一个社会困境场景,就像囚犯的困境,两个玩家可以合作或缺陷(即不合作)。在僵局中,如果玩家a和玩家B都合作,他们每人得到1的回报,如果两者都有缺陷,他们各自得到2的回报。但是如果玩...

  • 发布于 2021-06-10 10:27
  • 阅读 ( 112 )

纳什均衡

...何联系。检察官没有证据证明两人有罪,因此他们为每个囚犯提供机会,要么通过证明对方犯罪来背叛对方,要么通过保持沉默来合作。 如果两个犯人都背叛对方,每个人都要服刑五年。如果A背叛了B,但B保持沉默,囚犯A将...

  • 发布于 2021-06-10 16:54
  • 阅读 ( 256 )

囚犯(prisoner)和囚犯(inmate)的区别

...果他们被判有罪,他们将被送往州或联邦监狱。他们成为囚犯或囚犯。现在犯罪猖獗,有必要惩罚那些犯罪的人。国家或任何其他当局可根据罪行的严重性作出判决。被监禁的人要么被称为囚犯,要么被称为囚犯。囚犯(prisoner) v...

  • 发布于 2021-07-10 18:37
  • 阅读 ( 289 )

囚犯困境

01 2004年 囚犯困境 囚徒困境是一个非常流行的两人战略互动博弈的例子,也是许多博弈论教科书中常见的介绍性例子。游戏的逻辑很简单: 游戏中的两名玩家被指控犯罪,并被安排在不同的房间里,这样他们就无法相...

  • 发布于 2021-09-06 06:01
  • 阅读 ( 126 )

最高安全的联邦监狱:adx supermax

...系统来说过于危险的罪犯。 ADX Supermax监狱的所有男性囚犯包括在其他监狱经历长期纪律问题的囚犯、杀害其他囚犯和狱警、帮派头目、知名罪犯和有组织犯罪团伙的囚犯。它还收容了可能对国家安全构成威胁的罪犯,包括基...

  • 发布于 2021-09-06 16:48
  • 阅读 ( 206 )

最高安全的联邦监狱:adx supermax

...系统来说过于危险的罪犯。 ADX Supermax监狱的所有男性囚犯包括在其他监狱经历长期纪律问题的囚犯、杀害其他囚犯和狱警、帮派头目、知名罪犯和有组织犯罪团伙的囚犯。它还收容了可能对国家安全构成威胁的罪犯,包括基...

  • 发布于 2021-09-06 16:52
  • 阅读 ( 241 )

黑色代码以及为什么它们今天仍然重要

...用和强迫劳动。 根据黑人法典,所有黑人,不管是否有囚犯,都要遵守当地政府规定的宵禁。甚至他们的日常活动也受到国家的严格控制。黑人农场工人被要求携带雇主的通行证,黑人参加的会议由当地官员监督。这甚至适用...

  • 发布于 2021-09-10 15:03
  • 阅读 ( 182 )

什么是博弈论?(game theory?)

...则每个人都会被判处温和的刑罚(例如:三年)。每一个囚犯必须选择背叛或保持沉默,而每个人的决定都不让对方知道。 囚徒困境也可以应用于许多其他社会情境,从政治学到法律,从心理学到广告。以女性化妆问题为例。...

  • 发布于 2021-09-12 06:17
  • 阅读 ( 225 )
fhhe61951
fhhe61951

0 篇文章

相关推荐