多人遊戲中的一桿偏差原則

June 29, 2022

這個問題是由第 4.7.3 節中的一個例子引起的。Fudenberg 和 Tirole在博弈論中與許多玩家的博弈中的開環和閉環均衡。
書中對閉環和開環的定義如下。
**閉環和開環策略（FT 中的第 4.7.1 節）：**我們對具有觀察到的動作的多階段遊戲的定義對應於閉環資訊結構，其中玩家在時間上調節他們的遊戲 $ t $ 直到那個日期的遊戲歷史。相應的策略稱為閉環策略，而開環策略是日曆時間的函式。
下面給出一個例子來說明開環均衡也可以是子博弈完美均衡。
**FT 中的第 4.7.3 節：**考慮一個遊戲具有每個玩家類型的非原子個體的連續體——玩家 1 的連續體，玩家 2 的連續體，等等。（讓個體集合是具有 Lebesgue 具體度量的單位區間的副本）。進一步假設每個玩家 $ i $ 的收益獨立於任何有度量的對手子集的行動 $ 0 $ . 那麼如果一個單獨的玩家 $ j $ 偏離，所有玩家 $ k\not=i,j $ 忽視 $ j $ 的偏差，顯然對玩家來說是最優的 $ i $ 也忽略偏差。因此，開環均衡的結果是子博弈完美的。
我的問題是，在上面的論點中，為什麼我們需要最適合玩家的部分 $ i $ 無視 $ j $ 其他人這樣做的偏差？
據我了解，要證明開環均衡是子博弈完美的，我們需要應用一次性偏差原則。因此假設玩家 $ j $ 偏離，然後由於假設和事實，即玩家的度量 $ j $ 是 $ 0 $ ，這不會影響任何玩家的收益。因此，如果一個策略配置文件構成一個開環均衡，那麼它也是子博弈完美的。
然而，書中的論點似乎表明，我們不僅需要檢查玩家是否 $ j $ 的偏差是盈利的，我們還需要檢查玩家是否有盈利的偏差 $ i $ 在子博弈中 $ j $ 已經偏離了。我對如何應用一次性偏差原則有點困惑。
為了使我的困惑更具體，考慮無限重複版本的兩人囚徒困境，並考慮以下策略配置文件：兩個玩家都會選擇 $ C $ , 如果一名玩家選擇 $ D $ 在某些時候 $ t $ , 兩個玩家都會玩 $ D $ 對所有人 $ \tau>t $ .
假設我們要檢查上述策略配置文件是否構成子博弈完美均衡，我們通過以下步驟應用一次性偏差原則。
第1步：我們假設玩家 $ i $ 偏離 $ D $ 有些時候 $ t $ , 直到出現偏差 $ t $ ，我們檢查這種偏差是否有利可圖。
第二步：接下來我們假設玩家 $ i $ 偏離 $ C $ 在一些已經發生偏差的子博弈中，檢查這種偏差是否有利可圖。
步驟 3：如果兩個步驟的答案都是否定的，我們說上述策略配置構成了子博弈完美均衡。
在這個特定的設置中，我的問題是，在步驟 1 中，我們是否還需要檢查玩家是否有盈利偏差 $ -i $ 偏離後 $ i $ 從 $ C $ 至 $ D $ ? 如何區分所有子博弈中的偏差和一次性偏差？
在此先感謝您的幫助！

這有點複雜。將開環策略視為閉環策略——碰巧在每個時期執行給定的動作，而不考慮歷史——不會給你一個子博弈完美的平衡。因此，沒有給定的閉環均衡，您可以使用單偏差原理來測試它是否是子博弈完美均衡。
相反，該主張是，開環均衡的結果路徑也將是閉環子博弈完美均衡的結果路徑，其中包含連續的個體無關緊要的參與者。教科書沒有詳細說明技術細節，可以在 [Fudenberg, Drew, and David K. Levine. “多玩家動態博弈中的開環和閉環均衡。” 經濟理論雜誌44.1 (1988): 1-18.]。
這個想法是，大多數子博弈實際上無法通過個人偏差達到，因此遊戲將如何進行在戰略上變得無關緊要。如果參與者忽略測量零組代理的偏差——他們可以這樣做，因為收益不取決於這些代理——戰略情況不會改變，並且遵循給定計劃仍然是最優的。單個玩家不能將游戲帶入子遊戲中，在這些子遊戲中，一組積極的玩家以不同的方式玩遊戲。但是為了獲得一個子博弈的完美平衡，從而產生結果，人們也需要為這些難以達到的子博弈制定適當的策略。

引用自：https://economics.stackexchange.com/questions/51907

多人遊戲中的一桿偏差原則

相關問答

理解擴展形式遊戲的屬性

與 N 玩家的 Stackelberg 領導者-跟隨者博弈的嚴格解決方案？

火柴遊戲

子博弈完美均衡的嵌套證明

如何找到所有混合策略納什均衡

在尋找遊戲價值時，我們可以消除弱支配策略嗎？