博弈論

博弈論是一個理論框架，用於設想競爭對手之間的社會狀況。在某些方面，博弈論是一門戰略科學，或者至少是戰略環境中獨立和相互競爭的行動者的最佳決策。...

什麼是博弈論(game theory)？

博弈論是一個理論框架，用於設想競爭對手之間的社會狀況。在某些方面，博弈論是一門戰略科學，或者至少是戰略環境中獨立和相互競爭的行動者的最佳決策。

博弈論的主要先驅是20世紀40年代的數學家約翰·馮·諾依曼和經濟學家奧斯卡·摩根斯坦。數學家約翰·納什被許多人認為是馮·諾依曼和摩根斯坦工作的第一個重要延伸。

關鍵要點

博弈論是一個理論框架，它可以在戰略環境中設想相互競爭的參與者之間的社會狀況，並產生獨立的和相互競爭的參與者的最優決策。
利用博弈論，可以規劃出定價競爭和產品釋出（以及更多）等情況的真實場景，並預測其結果。
場景包括囚徒困境和獨裁者遊戲等。

假設遊戲中的玩家是理性的，並且會努力使他們在遊戲中的收益最大化。

1:18

博弈論

博弈論基礎

博弈論的焦點是博弈，它是理性參與者之間互動情境的模型。博弈論的關鍵在於，一方的收益取決於另一方實施的策略。遊戲確定玩家的身份、偏好和可用策略，以及這些策略如何影響結果。根據模型，可能需要各種其他要求或假設。

博弈論有著廣泛的應用，包括心理學、進化生物學、戰爭、政治學、經濟學和商業。儘管博弈論有許多進步，但它仍然是一門年輕的、正在發展的科學。

根據博弈論，所有參與者的行為和選擇都會影響到每個參與者的結果。

博弈論定義

當我們遇到兩個或兩個以上參與者的情況，涉及已知的支付或可量化的後果時，我們可以使用博弈論來幫助確定最可能的結果。讓我們從定義博弈論研究中常用的幾個術語開始：

遊戲：結果取決於兩個或兩個以上決策者（參與者）行動的任何一組情況
玩家：博弈環境下的戰略決策者
策略：一個完整的行動計劃，一個球員將採取一套情況下，可能會出現在遊戲中
回報：一個玩家從達到一個特定的結果中得到的回報（回報可以是任何可量化的形式，從美元到美元）實用工具。）
資訊集：在遊戲中給定的點上可用的資訊（當遊戲有一個連續的元件時，通常使用術語資訊集）
平衡：博弈中雙方都做出決定並達成結果的點

納什均衡

納什均衡是一種結果，一旦達到，意味著沒有玩家可以透過單方面改變決策來增加收益。它也可以被認為是“無怨無悔”，在這個意義上說，一旦一個決定，球員將沒有遺憾的決定，考慮到後果。

在大多數情況下，納什均衡是隨著時間的推移而達到的。然而，一旦達到納什均衡，它就不會偏離。在我們學習瞭如何找到納什均衡之後，我們來看看單邊行動是如何影響局勢的。有什麼意義嗎？不應該，這就是為什麼納什均衡被描述為“無怨無悔”的原因。一般來說，一個遊戲中可以有多個均衡。

然而，這通常發生在遊戲中更複雜的元素比兩個玩家的兩個選擇。在一段時間內重覆的同時博弈中，這些多重均衡中的一個是經過一番嘗試和錯誤之後達到的。當兩個公司決定高度可互換產品（如機票或軟飲料）的價格時，這種在達到均衡之前選擇不同時間的情景在商界最為常見。

對經濟和商業的影響

博弈論透過解決以往數學經濟模型中的關鍵問題，帶來了經濟學的一場革命。例如，新古典經濟學難以理解企業家預期，無法處理不完全競爭。博弈論把註意力從穩態均衡轉向了市場過程。

在商業中，博弈論有助於模擬經濟主體之間的競爭行為。企業往往有幾個戰略選擇，影響他們實現經濟利益的能力。例如，企業可能面臨這樣的困境：是淘汰現有產品還是開發新產品，相對於競爭對手降低價格，還是採用新的營銷策略。經濟學家經常使用博弈論來理解寡頭壟斷企業的行為。它有助於預測當企業從事某些行為，如價格操縱和串通可能的結果。

二十位博弈論者被授予諾貝爾經濟科學紀念獎。

博弈論的型別

雖然博弈論有許多型別（如對稱/不對稱、同時/序貫等），但合作博弈論和非合作博弈論是最常見的。合作博弈論研究的是當只有收益已知時，聯盟或合作團體如何相互作用。這是一場玩家聯盟之間的博弈，而不是個人之間的博弈，它質疑的是群體是如何形成的，以及他們如何在玩家之間分配收益。

非合作博弈論研究的是理性經濟主體如何透過相互博弈來實現自己的目標。最常見的非合作博弈是策略博弈，其中只列出了可用的策略和組合選擇的結果。一個簡單的例子，現實世界中的非合作遊戲是石頭布剪刀。

博弈論的例子

博弈論分析了幾個“博弈”。下麵，我們將簡要描述其中的一些。

囚徒困境

囚徒困境是博弈論中最著名的例子。舉兩個因犯罪而被捕的罪犯為例。檢察官沒有確鑿的證據證明他們有罪。然而，為了獲得口供，官員們把這些囚犯從單獨的牢房裡帶走，併在不同的房間裡審問每一個人。兩個犯人都沒有辦法互相交流。官員們展示了四宗交易，通常以2×2的形式展示。

如果兩人都認罪，他們將分別被判處五年徒刑。
如果一號犯人認罪，二號犯人不認罪，一號犯人將被判三年，二號犯人將被判九年。
如果二號犯人認罪，一號犯人不認罪，一號犯人將被判十年，二號犯人將被判兩年。
如果兩人都不認罪，每人將服刑兩年。

最有利的策略是不坦白。不過，兩人都不知道對方的策略，如果不能肯定一人不會招供，兩人都可能招供並被判5年徒刑。納什均衡表明，在囚徒困境中，雙方都會做出對各自有利但對集體不利的舉動。

“以牙還牙”這一表述已被確定為最佳化囚徒困境的最佳策略。針鋒相對是由阿納託爾·拉波波特提出的，他制定了一個策略，在這個策略中，反覆出現的囚徒困境中，每個參與者都遵循一個與對手上一輪行動一致的行動過程。例如，如果被激怒，玩家隨後會報複；如果無緣無故，玩家會合作。

獨裁者遊戲

這是一個簡單的遊戲，玩家a必須決定如何與玩家B分享現金獎品，而玩家B對玩家a的決定沒有任何意見。雖然這不是一個博弈論策略本身，它確實提供了一些有趣的洞察人們的行為。實驗顯示，大約50%的人把所有的錢都留給自己，5%的人平分，另外45%的人分給其他參與者一小部分。

獨裁者遊戲與最後通牒遊戲密切相關，在最後通牒遊戲中，玩家A獲得一定數額的錢，其中一部分必須給玩家B，B玩家可以接受或拒絕所給的金額。關鍵是如果第二個球員拒絕提供的金額，A和B都得不到任何東西。獨裁者和最後通牒遊戲在慈善捐贈和慈善等問題上都有重要的教訓。

志願者的困境

在志願者的困境中，有人為了共同的利益不得不承擔家務或工作。如果沒有人自願，最壞的結果就會出現。例如，假設一家公司的會計舞弊非常猖獗，儘管最高管理層並不知道這一點。會計部門的一些初級員工知道欺詐行為，但不願告訴最高管理層，因為這將導致參與欺詐的員工被解僱，而且很可能被起訴。

被貼上舉報人的標簽也可能會在今後產生一些影響。但如果沒有人自願，這種大規模的欺詐行為可能會導致公司最終破產，並導致所有人失業。

蜈蚣遊戲

蜈蚣博弈是博弈論中的一種廣泛形式的博弈，在這種博弈中，兩個博弈者交替地得到一個機會，在一個緩慢增長的資金儲備中佔有更大的份額。它的安排是這樣的，如果一個玩家把藏匿的東西傳給他的對手，然後他拿走了藏匿的東西，玩家得到的錢比他拿走了罐子的錢要少。

蜈蚣遊戲結束時，一名球員採取了藏匿，與該球員得到較大的部分和其他球員得到較小的部分。遊戲有一個預先定義的總回合數，每個玩家都事先知道。

博弈論的侷限性

博弈論的最大問題是，與大多數其他經濟模型一樣，它依賴於人們是自利和效用最大化的理***者的假設。當然，我們是社會性的人，他們合作，關心他人的福利，往往是以我們自己為代價的。博弈論不能解釋這樣一個事實，即在某些情況下，我們可能會陷入納什均衡，而在其他情況下則不會，這取決於社會背景和參與者是誰。

常見問題

什麼是博弈論中的博弈(the 'games' being played in game theory)？

它被稱為博弈論，因為博弈論試圖理解兩個或兩個以上的“參與者”在一個給定的包含既定規則和結果的情境中的戰略行為。博弈論在許多學科中都有應用，但在商業和經濟學的研究中，博弈論是最著名的工具。因此，“博弈”可能涉及兩個競爭對手公司對另一個公司降價的反應，一個公司是否應該收購另一個公司，或者股票市場的交易者對價格變化的反應。

在理論上，這些遊戲可以歸類為類似囚犯的困境，獨裁者遊戲，鷹和鴿，和性別之戰，以及其他幾個變種。

什麼是關於這些遊戲的一些假設(some of the assumpti*** about these games)？

與許多經濟模型一樣，博弈論也包含一組嚴格的假設，這些假設必須成立，理論才能在實踐中做出良好的預測。首先，所有的玩家都是效用最大化的理性參與者，他們擁有關於遊戲、規則和後果的全部資訊。玩家不允許互相交流或互動。可能的結果不僅是預先知道的，而且是無法改變的。一個遊戲中的玩家數量理論上可以是無限的，但大多數遊戲將被放在只有兩個玩家的環境中。

什麼是納什均衡(a nash equilibrium)？

納什均衡是一個重要的概念，它指的是博弈中的一種穩定狀態，即在其他參與者不改變策略的前提下，任何一方都不能透過單方面改變策略而獲得優勢。納什均衡為非合作（對抗）博弈提供瞭解的概念。它是以約翰納什命名的，他在1994年因其工作獲得諾貝爾獎

誰提出了博弈論？

博弈論在很大程度上歸功於20世紀40年代數學家約翰·馮·諾依曼和經濟學家奧斯卡·摩根斯坦的工作，併在20世紀50年代被其他許多研究者和學者廣泛發展。它至今仍是一個活躍的研究和應用科學領域。

發表於 2021-05-31 10:15
閱讀 ( 17 )
分類：金融

你可能感興趣的文章

如何不讓自己難堪

...典型的推特風暴是埃裡克·加蘭（Eric Garland）的大規模“博弈論”帖子，一位“職業未來學家”在大選後大肆宣揚俄羅斯如何做到了愛德華·斯諾登（Edward Snowden），約翰·麥凱恩（John McCain）將把我們從特朗普手中拯救出來，“...

發佈於 2021-05-15 22:33
閲讀 ( 47 )

...同的禮物。FiveThirtyEight的本·卡塞爾曼（Ben Casselman）運用博弈論，透過三個步驟找到了“贏得”一頭白象的最佳方法：As each gift is opened, mentally assign it a value (perhaps a dollar value or a 1-to-5 ranking);When it’s your turn, average the value of all ...

發佈於 2021-05-16 12:02
閲讀 ( 52 )