反向誘導

博弈論中的逆向歸納是從問題或情境的終點，在時間上進行逆向推理的迭代過程，以求解有限的可拓形式和序貫博弈，並推斷出一系列最優行為。...

什麼是反向誘導(backward induction)？

博弈論中的逆向歸納是從問題或情境的終點，在時間上進行逆向推理的迭代過程，以求解有限的可拓形式和序貫博弈，並推斷出一系列最優行為。

反向歸納法解釋

自從約翰·馮·諾依曼和奧斯卡·摩根斯坦在1944年出版了《博弈論與經濟行為》一書，將博弈論作為一門學科建立以來，逆向歸納法就被用來解決博弈問題。

在博弈的每一個階段，逆向歸納決定了博弈中最後一步的博弈者的最優策略。然後，根據給定的最後一個玩家的動作，確定下一個到最後一個移動玩家的最優動作。這個過程繼續向後，直到確定了每個時間點的最佳操作。有效地，一個是確定原始博弈的每個子博弈的納什均衡。

然而，從反向歸納中推斷出的結果往往無法預測人類的實際遊戲。實驗研究表明，“理性”行為（如博弈論所預測的）在現實生活中很少出現。如蜈蚣遊戲所示，非理性的玩家最終可能獲得比反向歸納法預測的更高的回報。

在蜈蚣遊戲中，兩個玩家輪流有機會從不斷增加的一罐錢中分得更大的份額，或者把這罐錢傳給另一個玩家。獎金的安排是這樣的，如果一個罐子被傳給了對手，而對手在下一輪拿走了罐子，那麼一個人得到的獎金會比他在這一輪拿走罐子時少一些。當一個玩家拿走藏寶時，遊戲就結束了，這個玩家得到了較大的一部分，而另一個玩家得到了較小的一部分。

反向歸納示例

舉個例子，假設玩家A先去，然後必須決定他是應該“拿走”還是“透過”這個藏品，目前的金額是2美元。如果他拿走了，那麼A和B各得到1美元，但是如果A透過了，那麼現在必須由玩家B來決定拿走還是透過。如果B透過，她得到3美元（即之前的2美元+1美元），A得到0美元。但是如果B透過，A現在可以決定是透過還是透過，以此類推。如果兩個玩家都選擇透過，他們每個人在遊戲結束時都會得到100美元的回報。

遊戲的重點是，如果A和B都合作，並繼續透過，直到遊戲結束，他們得到的最高支付100美元每個。但是，如果他們不信任另一個玩家，並期望他們在第一個機會“採取”，納什均衡預測玩家將採取最低可能的索賠（在這種情況下為1美元）。

這個博弈的納什均衡，在考慮了對手的選擇後，沒有一個玩家有動機偏離他選擇的策略，表明第一個玩家會在博弈的第一輪就拿下**。然而，在現實中，這樣做的玩家相對較少。結果，他們得到了比均衡分析預測的收益更高的收益。

用反向歸納法求解序列對策

下麵是兩個玩家之間簡單的順序遊戲。其中包含player1和player2的標簽分別是player1或player2的資訊集。樹底部括號中的數字是各點的收益。遊戲也是連續的，因此玩家1做出第一個決定（左或右），玩家2在玩家1之後做出決定（上或下）。

像所有的博弈論一樣，反向歸納法使用了理性和最大化的假設，這意味著玩家2將在任何給定的情況下使他的收益最大化。在任一資訊集中，我們有兩個選擇，總共四個。透過消除玩家2不會選擇的選項，我們可以縮小我們的樹。這樣，我們將用藍色標記線，在給定的資訊集中最大化玩家的收益。

在這個減少之後，玩家1可以最大化它的收益，因為玩家2的選擇是已知的。結果是一個均衡發現由向後歸納的球員1選擇“權利”和球員2選擇“向上”。下麵是解決遊戲的均衡路徑加粗。

例如，可以很容易地建立一個類似於上面的遊戲，使用公司作為玩家。這個遊戲可以包括產品釋出場景。如果公司1想要釋出一個產品，那麼公司2會做些什麼？公司2會釋出類似的競爭產品嗎？透過預測這種新產品在不同情況下的銷售情況，我們可以建立一個遊戲來預測事態的發展。下麵是一個如何模擬這樣一個遊戲的例子。

發表於 2021-06-04 04:51
閱讀 ( 52 )
分類：金融

你可能感興趣的文章

感應偶極子(induced dipole)和永久偶極子(permanent dipole)的區別

誘導偶極矩與永久偶極矩的關鍵區別在於，影響偶極矩的因素髮生變化時，感應偶極矩會發生變化，而外部因素的變化則不會影響到永久偶極矩。分子間作用力是分子間的相互作用。這些相互作用可能包括吸引和排斥。分子...

發佈於 2020-10-03 13:11
閲讀 ( 68 )

酶抑制劑(enzyme inhibitor)和酶誘導劑(enzyme inducer)的區別

酶抑制劑和酶誘導劑的關鍵區別在於酶抑制劑透過與酶的活性部位結合來降低酶的活性。相反，酶誘導劑透過結合酶或增加基因表達來增加酶的代謝活性。酶是催化活細胞中發生的生化反應的生物分子。它們透過降低活化能...

發佈於 2020-10-06 17:06
閲讀 ( 56 )

超共軛(hyperconjugation)和誘導效應(inductive effect)的區別

...間的相互作用則是透過超共軛效應來解釋的。超共軛和誘導效應這兩個術語都是有機化合物中的電子效應，它們導致了化合物的穩定。目錄 1. 概述和主要區別 2. 什麼是超共軛 3. 什麼是誘導效應 4. 並排比較-超共軛與表格形式...

發佈於 2020-10-16 03:18
閲讀 ( 67 )

構成(constitutive)和誘導表達(inducible expression)的區別

構成表達與誘導表達的關鍵區別在於，構成表達是構成基因在恆定水平上的表達，誘導表達是誘導基因在一定條件下的表達。基因是遺傳的基本功能單位。基因包含合成蛋白質的遺傳密碼。它們是染色體的特定區域。為了生...

發佈於 2020-10-16 03:52
閲讀 ( 91 )

多能性(pluripotent)和誘導多能幹細胞(induced pluripotent stem cells)的區別

多能幹細胞和誘導多能幹細胞之間的關鍵區別在於，多能幹細胞是未分化的母細胞（來自胚胎等），它們具有天然的分化成不同細胞型別的能力，而誘導多能幹細胞則是經過基因重程式設計的體細胞成體細胞特性類似於天然...

發佈於 2020-10-18 01:43
閲讀 ( 59 )

操縱子(operon)和調節器(regulon)的區別

...的啟動子和一個共同的運算子調節。這種操作由阻遏者和誘導者來調節。因此，這些歌劇主要可分為誘導性歌劇和可抑制性歌劇。因此，由於操作子由多個基因組成，因此在轉錄完成後，它會產生一個多順子mRNA。在原核生物中...

發佈於 2020-10-19 03:56
閲讀 ( 56 )

誘導效應(inductive effect)和電效應(electromeric effect)的區別

...可以觀察到電光效應。目錄 1. 概述和主要區別 2. 什麼是誘導效應 3.什麼是電效應 4. 感應效應與電效應的相似性 5. 並列比較-感應效應與電效應的表格形式 6. 摘要什麼是誘導效應(inductive effect)？誘導效應是指一個化學鍵的電荷...

發佈於 2020-10-19 07:47
閲讀 ( 56 )

隨機突變(random mutagenesis)和定點突變(site directed mutagenesis)的區別

...中。在動物研究中，雖然烷基化劑已被用來透過隨機突變誘導突變，但隨機突變很少使用。當暴露生物體進行誘變劑暴露時，應注意誘變劑的劑量和接觸誘變劑的時間。過量的劑量和暴露時間會損害機體本身。因此，應在控制...

發佈於 2020-10-19 09:22
閲讀 ( 62 )

誘導的(inducible)和壓抑性操縱子(repressible operon)的區別

關鍵區別-誘導型與抑制型操縱子操縱子是基因組DNA的一個功能單元，它包含一組受單個啟動子控制的基因簇。基因調控是透過誘導或抑制操縱子來實現的。操作子有兩種型別：誘導性操作和抑制性操作。可誘導操縱子是一種...

發佈於 2020-10-20 18:24
閲讀 ( 74 )

誘導擬合(induced fit)和鎖(lock)的區別

誘導擬合與Lock-and-key的關鍵區別在於，在誘導擬合理論中，底物與酶的活性位點結合，導致活性位點的形狀改變為底物的互補形狀。然而，在鎖鍵理論中，酶的底物和活性部位在一開始是互補的。酶是代謝反應的催化劑。因...

發佈於 2020-10-22 11:31
閲讀 ( 102 )