博弈論

博弈論是一個理論框架,用於設想競爭對手之間的社會狀況。在某些方面,博弈論是一門戰略科學,或者至少是戰略環境中獨立和相互競爭的行動者的最佳決策。...

什麼是博弈論(game theory)?

博弈論是一個理論框架,用於設想競爭對手之間的社會狀況。在某些方面,博弈論是一門戰略科學,或者至少是戰略環境中獨立和相互競爭的行動者的最佳決策。

博弈論的主要先驅是20世紀40年代的數學家約翰·馮·諾依曼和經濟學家奧斯卡·摩根斯坦。數學家約翰·納什被許多人認為是馮·諾依曼和摩根斯坦工作的第一個重要延伸。

關鍵要點

  • 博弈論是一個理論框架,它可以在戰略環境中設想相互競爭的參與者之間的社會狀況,並產生獨立的和相互競爭的參與者的最優決策。 
  • 利用博弈論,可以規劃出定價競爭和產品釋出(以及更多)等情況的真實場景,並預測其結果。 
  • 場景包括囚徒困境和獨裁者遊戲等。

假設遊戲中的玩家是理性的,並且會努力使他們在遊戲中的收益最大化。

1:18

博弈論

博弈論基礎

博弈論的焦點是博弈,它是理性參與者之間互動情境的模型。博弈論的關鍵在於,一方的收益取決於另一方實施的策略。遊戲確定玩家的身份、偏好和可用策略,以及這些策略如何影響結果。根據模型,可能需要各種其他要求或假設。

博弈論有著廣泛的應用,包括心理學、進化生物學、戰爭、政治學、經濟學和商業。儘管博弈論有許多進步,但它仍然是一門年輕的、正在發展的科學。

根據博弈論,所有參與者的行為和選擇都會影響到每個參與者的結果。

博弈論定義

當我們遇到兩個或兩個以上參與者的情況,涉及已知的支付或可量化的後果時,我們可以使用博弈論來幫助確定最可能的結果。讓我們從定義博弈論研究中常用的幾個術語開始:

  • 遊戲: 結果取決於兩個或兩個以上決策者(參與者)行動的任何一組情況
  • 玩家: 博弈環境下的戰略決策者
  • 策略: 一個完整的行動計劃,一個球員將採取一套情況下,可能會出現在遊戲中
  • 回報: 一個玩家從達到一個特定的結果中得到的回報(回報可以是任何可量化的形式,從美元到美元) 實用工具。)
  • 資訊集: 在遊戲中給定的點上可用的資訊(當遊戲有一個連續的元件時,通常使用術語資訊集)
  • 平衡: 博弈中雙方都做出決定並達成結果的點

納什均衡

納什均衡是一種結果,一旦達到,意味著沒有玩家可以透過單方面改變決策來增加收益。它也可以被認為是“無怨無悔”,在這個意義上說,一旦一個決定,球員將沒有遺憾的決定,考慮到後果。

在大多數情況下,納什均衡是隨著時間的推移而達到的。然而,一旦達到納什均衡,它就不會偏離。在我們學習瞭如何找到納什均衡之後,我們來看看單邊行動是如何影響局勢的。有什麼意義嗎?不應該,這就是為什麼納什均衡被描述為“無怨無悔”的原因。一般來說,一個遊戲中可以有多個均衡。

然而,這通常發生在遊戲中更複雜的元素比兩個玩家的兩個選擇。在一段時間內重覆的同時博弈中,這些多重均衡中的一個是經過一番嘗試和錯誤之後達到的。當兩個公司決定高度可互換產品(如機票或軟飲料)的價格時,這種在達到均衡之前選擇不同時間的情景在商界最為常見。

對經濟和商業的影響

博弈論透過解決以往數學經濟模型中的關鍵問題,帶來了經濟學的一場革命。例如,新古典經濟學難以理解企業家預期,無法處理不完全競爭。博弈論把註意力從穩態均衡轉向了市場過程。

在商業中,博弈論有助於模擬經濟主體之間的競爭行為。企業往往有幾個戰略選擇,影響他們實現經濟利益的能力。例如,企業可能面臨這樣的困境:是淘汰現有產品還是開發新產品,相對於競爭對手降低價格,還是採用新的營銷策略。經濟學家經常使用博弈論來理解寡頭壟斷企業的行為。它有助於預測當企業從事某些行為,如價格操縱和串通可能的結果。

二十位博弈論者被授予 諾貝爾經濟科學紀念獎。

博弈論的型別

雖然博弈論有許多型別(如對稱/不對稱、同時/序貫等),但合作博弈論和非合作博弈論是最常見的。合作博弈論研究的是當只有收益已知時,聯盟或合作團體如何相互作用。這是一場玩家聯盟之間的博弈,而不是個人之間的博弈,它質疑的是群體是如何形成的,以及他們如何在玩家之間分配收益。

非合作博弈論研究的是理性經濟主體如何透過相互博弈來實現自己的目標。最常見的非合作博弈是策略博弈,其中只列出了可用的策略和組合選擇的結果。一個簡單的例子,現實世界中的非合作遊戲是石頭布剪刀。

博弈論的例子

博弈論分析了幾個“博弈”。下麵,我們將簡要描述其中的一些。

囚徒困境

囚徒困境是博弈論中最著名的例子。舉兩個因犯罪而被捕的罪犯為例。檢察官沒有確鑿的證據證明他們有罪。然而,為了獲得口供,官員們把這些囚犯從單獨的牢房裡帶走,併在不同的房間裡審問每一個人。兩個犯人都沒有辦法互相交流。官員們展示了四宗交易,通常以2×2的形式展示。

  1. 如果兩人都認罪,他們將分別被判處五年徒刑。
  2. 如果一號犯人認罪,二號犯人不認罪,一號犯人將被判三年,二號犯人將被判九年。
  3. 如果二號犯人認罪,一號犯人不認罪,一號犯人將被判十年,二號犯人將被判兩年。
  4. 如果兩人都不認罪,每人將服刑兩年。

最有利的策略是不坦白。不過,兩人都不知道對方的策略,如果不能肯定一人不會招供,兩人都可能招供並被判5年徒刑。納什均衡表明,在囚徒困境中,雙方都會做出對各自有利但對集體不利的舉動。

“以牙還牙”這一表述已被確定為最佳化囚徒困境的最佳策略。針鋒相對是由阿納託爾·拉波波特提出的,他制定了一個策略,在這個策略中,反覆出現的囚徒困境中,每個參與者都遵循一個與對手上一輪行動一致的行動過程。例如,如果被激怒,玩家隨後會報複;如果無緣無故,玩家會合作。

獨裁者遊戲

這是一個簡單的遊戲,玩家a必須決定如何與玩家B分享現金獎品,而玩家B對玩家a的決定沒有任何意見。雖然這不是一個博弈論策略本身,它確實提供了一些有趣的洞察人們的行為。實驗顯示,大約50%的人把所有的錢都留給自己,5%的人平分,另外45%的人分給其他參與者一小部分。

獨裁者遊戲與最後通牒遊戲密切相關,在最後通牒遊戲中,玩家A獲得一定數額的錢,其中一部分必須給玩家B,B玩家可以接受或拒絕所給的金額。關鍵是如果第二個球員拒絕提供的金額,A和B都得不到任何東西。獨裁者和最後通牒遊戲在慈善捐贈和慈善等問題上都有重要的教訓。

志願者的困境

在志願者的困境中,有人為了共同的利益不得不承擔家務或工作。如果沒有人自願,最壞的結果就會出現。例如,假設一家公司的會計舞弊非常猖獗,儘管最高管理層並不知道這一點。會計部門的一些初級員工知道欺詐行為,但不願告訴最高管理層,因為這將導致參與欺詐的員工被解僱,而且很可能被起訴。

被貼上舉報人的標簽也可能會在今後產生一些影響。但如果沒有人自願,這種大規模的欺詐行為可能會導致公司最終破產,並導致所有人失業。

蜈蚣遊戲

蜈蚣博弈是博弈論中的一種廣泛形式的博弈,在這種博弈中,兩個博弈者交替地得到一個機會,在一個緩慢增長的資金儲備中佔有更大的份額。它的安排是這樣的,如果一個玩家把藏匿的東西傳給他的對手,然後他拿走了藏匿的東西,玩家得到的錢比他拿走了罐子的錢要少。

蜈蚣遊戲結束時,一名球員採取了藏匿,與該球員得到較大的部分和其他球員得到較小的部分。遊戲有一個預先定義的總回合數,每個玩家都事先知道。

博弈論的侷限性

博弈論的最大問題是,與大多數其他經濟模型一樣,它依賴於人們是自利和效用最大化的理***者的假設。當然,我們是社會性的人,他們合作,關心他人的福利,往往是以我們自己為代價的。博弈論不能解釋這樣一個事實,即在某些情況下,我們可能會陷入納什均衡,而在其他情況下則不會,這取決於社會背景和參與者是誰。

常見問題

什麼是博弈論中的博弈(the 'games' being played in game theory)?

它被稱為博弈論,因為博弈論試圖理解兩個或兩個以上的“參與者”在一個給定的包含既定規則和結果的情境中的戰略行為。博弈論在許多學科中都有應用,但在商業和經濟學的研究中,博弈論是最著名的工具。因此,“博弈”可能涉及兩個競爭對手公司對另一個公司降價的反應,一個公司是否應該收購另一個公司,或者股票市場的交易者對價格變化的反應。

在理論上,這些遊戲可以歸類為類似囚犯的困境,獨裁者遊戲,鷹和鴿,和性別之戰,以及其他幾個變種。

什麼是關於這些遊戲的一些假設(some of the assumpti*** about these games)?

與許多經濟模型一樣,博弈論也包含一組嚴格的假設,這些假設必須成立,理論才能在實踐中做出良好的預測。首先,所有的玩家都是效用最大化的理性參與者,他們擁有關於遊戲、規則和後果的全部資訊。玩家不允許互相交流或互動。可能的結果不僅是預先知道的,而且是無法改變的。一個遊戲中的玩家數量理論上可以是無限的,但大多數遊戲將被放在只有兩個玩家的環境中。

什麼是納什均衡(a nash equilibrium)?

納什均衡是一個重要的概念,它指的是博弈中的一種穩定狀態,即在其他參與者不改變策略的前提下,任何一方都不能透過單方面改變策略而獲得優勢。納什均衡為非合作(對抗)博弈提供瞭解的概念。它是以約翰納什命名的,他在1994年因其工作獲得諾貝爾獎

誰提出了博弈論?

博弈論在很大程度上歸功於20世紀40年代數學家約翰·馮·諾依曼和經濟學家奧斯卡·摩根斯坦的工作,併在20世紀50年代被其他許多研究者和學者廣泛發展。它至今仍是一個活躍的研究和應用科學領域。

  • 發表於 2021-05-31 10:15
  • 閱讀 ( 17 )
  • 分類:金融

你可能感興趣的文章

如何不讓自己難堪

...典型的推特風暴是埃裡克·加蘭(Eric Garland)的大規模“博弈論”帖子,一位“職業未來學家”在大選後大肆宣揚俄羅斯如何做到了愛德華·斯諾登(Edward Snowden),約翰·麥凱恩(John McCain)將把我們從特朗普手中拯救出來,“...

  • 發佈於 2021-05-15 22:33
  • 閲讀 ( 47 )

用博弈論“贏”了白象禮品交換

...同的禮物。FiveThirtyEight的本·卡塞爾曼(Ben Casselman)運用博弈論,透過三個步驟找到了“贏得”一頭白象的最佳方法:As each gift is opened, mentally assign it a value (perhaps a dollar value or a 1-to-5 ranking);When it’s your turn, average the value of all ...

  • 發佈於 2021-05-16 12:02
  • 閲讀 ( 52 )

如果你覺得不被賞識,就給別人點面子

...個人為企業的成功所做的事情上,否認他人的貢獻。信用博弈的問題是,它通常是一個零和博弈。吉姆要想贏,簡就得輸。過分強調個人成就會削弱每個人為共同目標而犧牲的意願。在大多數情況下,你周圍的每個人都在努力工...

  • 發佈於 2021-05-21 10:25
  • 閲讀 ( 59 )

零和博弈

什麼是零和遊戲(a zero-sum game)? 零和是博弈論中的一種情況,一個人的收益等於另一個人的損失,因此財富或收益的凈變化為零。一個零和遊戲可能只有兩個玩家或數百萬參與者。在金融市場,期權和期貨是零和博弈的例子,不...

  • 發佈於 2021-06-03 01:55
  • 閲讀 ( 63 )

反向誘導

什麼是反向誘導(backward induction)? 博弈論中的逆向歸納是從問題或情境的終點,在時間上進行逆向推理的迭代過程,以求解有限的可拓形式和序貫博弈,並推斷出一系列最優行為。 反向歸納法解釋 自從約翰·馮·諾依曼和奧...

  • 發佈於 2021-06-04 04:51
  • 閲讀 ( 61 )

重覆囚徒困境

...ner's dilemma)? 重覆囚徒困境是一般形式的一種推廣,只是博弈由同一參與者重覆進行。重覆的囚徒困境不同於囚徒困境的最初概念,因為參與者可以瞭解對方的行為傾向。 反覆出現的囚徒困境有時被稱為和平戰爭遊戲。 理...

  • 發佈於 2021-06-06 06:20
  • 閲讀 ( 42 )

博弈論策略如何改善決策

博弈論,戰略決策的研究,彙集了不同的學科,如數學,心理學和哲學。博弈論是由約翰·馮·諾依曼和奧斯卡·摩根斯坦在1944年發明的,從那時起已經走過了漫長的道路。博弈論對現代分析和決策的重要性可以透過這樣一個事...

  • 發佈於 2021-06-10 10:27
  • 閲讀 ( 49 )

商業與經濟中的囚徒困境

囚徒困境是最著名的博弈論之一,由美林·弗雷德和梅爾文·德雷舍於1950年在蘭德公司提出,後來由普林斯頓數學家阿爾伯特·威廉·塔克正式命名。 囚徒困境基本上為理解如何在合作與競爭之間取得平衡提供了一個框架,...

  • 發佈於 2021-06-10 15:29
  • 閲讀 ( 31 )

納什均衡

什麼是納什均衡(nash equilibrium)? 納什均衡是博弈論中的一個概念,博弈的最優結果是沒有動機偏離初始策略。更具體地說,納什均衡是博弈論的一個概念,其中博弈的最優結果是,在考慮了對手的選擇後,沒有人有動機偏離他...

  • 發佈於 2021-06-10 16:54
  • 閲讀 ( 54 )

博弈論基礎

博弈論是在包含既定規則和結果的情況下,對兩個或多個參與者之間的戰略互動進行建模的過程。博弈論在許多學科中都有應用,但在經濟學的研究中,博弈論是一種最著名的工具。博弈論的經濟學應用可以成為一個有價值的工...

  • 發佈於 2021-06-12 09:41
  • 閲讀 ( 43 )
cyGGK
cyGGK

0 篇文章

作家榜

  1. admin 0 文章
  2. 孫小欽 0 文章
  3. JVhby0 0 文章
  4. fvpvzrr 0 文章
  5. 0sus8kksc 0 文章
  6. zsfn1903 0 文章
  7. w91395898 0 文章
  8. SuperQueen123 0 文章

相關推薦