多人遊戲中的一桿偏差原則
這個問題是由第 4.7.3 節中的一個例子引起的。Fudenberg 和 Tirole在博弈論中與許多玩家的博弈中的開環和閉環均衡。
書中對閉環和開環的定義如下。
**閉環和開環策略(FT 中的第 4.7.1 節):**我們對具有觀察到的動作的多階段遊戲的定義對應於閉環資訊結構,其中玩家在時間上調節他們的遊戲 $ t $ 直到那個日期的遊戲歷史。相應的策略稱為閉環策略,而開環策略是日曆時間的函式。
下面給出一個例子來說明開環均衡也可以是子博弈完美均衡。
**FT 中的第 4.7.3 節:**考慮一個遊戲具有每個玩家類型的非原子個體的連續體——玩家 1 的連續體,玩家 2 的連續體,等等。(讓個體集合是具有 Lebesgue 具體度量的單位區間的副本)。進一步假設每個玩家 $ i $ 的收益獨立於任何有度量的對手子集的行動 $ 0 $ . 那麼如果一個單獨的玩家 $ j $ 偏離,所有玩家 $ k\not=i,j $ 忽視 $ j $ 的偏差,顯然對玩家來說是最優的 $ i $ 也忽略偏差。因此,開環均衡的結果是子博弈完美的。
我的問題是,在上面的論點中,為什麼我們需要最適合玩家的部分 $ i $ 無視 $ j $ 其他人這樣做的偏差?
據我了解,要證明開環均衡是子博弈完美的,我們需要應用一次性偏差原則。因此假設玩家 $ j $ 偏離,然後由於假設和事實,即玩家的度量 $ j $ 是 $ 0 $ ,這不會影響任何玩家的收益。因此,如果一個策略配置文件構成一個開環均衡,那麼它也是子博弈完美的。
然而,書中的論點似乎表明,我們不僅需要檢查玩家是否 $ j $ 的偏差是盈利的,我們還需要檢查玩家是否有盈利的偏差 $ i $ 在子博弈中 $ j $ 已經偏離了。我對如何應用一次性偏差原則有點困惑。
為了使我的困惑更具體,考慮無限重複版本的兩人囚徒困境,並考慮以下策略配置文件:兩個玩家都會選擇 $ C $ , 如果一名玩家選擇 $ D $ 在某些時候 $ t $ , 兩個玩家都會玩 $ D $ 對所有人 $ \tau>t $ .
假設我們要檢查上述策略配置文件是否構成子博弈完美均衡,我們通過以下步驟應用一次性偏差原則。
第1步:我們假設玩家 $ i $ 偏離 $ D $ 有些時候 $ t $ , 直到出現偏差 $ t $ ,我們檢查這種偏差是否有利可圖。
第二步:接下來我們假設玩家 $ i $ 偏離 $ C $ 在一些已經發生偏差的子博弈中,檢查這種偏差是否有利可圖。
步驟 3:如果兩個步驟的答案都是否定的,我們說上述策略配置構成了子博弈完美均衡。
在這個特定的設置中,我的問題是,在步驟 1 中,我們是否還需要檢查玩家是否有盈利偏差 $ -i $ 偏離後 $ i $ 從 $ C $ 至 $ D $ ? 如何區分所有子博弈中的偏差和一次性偏差?
在此先感謝您的幫助!
這有點複雜。將開環策略視為閉環策略——碰巧在每個時期執行給定的動作,而不考慮歷史——不會給你一個子博弈完美的平衡。因此,沒有給定的閉環均衡,您可以使用單偏差原理來測試它是否是子博弈完美均衡。
相反,該主張是,開環均衡的結果路徑也將是閉環子博弈完美均衡的結果路徑,其中包含連續的個體無關緊要的參與者。教科書沒有詳細說明技術細節,可以在 [Fudenberg, Drew, and David K. Levine. “多玩家動態博弈中的開環和閉環均衡。” 經濟理論雜誌44.1 (1988): 1-18.]。
這個想法是,大多數子博弈實際上無法通過個人偏差達到,因此遊戲將如何進行在戰略上變得無關緊要。如果參與者忽略測量零組代理的偏差——他們可以這樣做,因為收益不取決於這些代理——戰略情況不會改變,並且遵循給定計劃仍然是最優的。單個玩家不能將游戲帶入子遊戲中,在這些子遊戲中,一組積極的玩家以不同的方式玩遊戲。但是為了獲得一個子博弈的完美平衡,從而產生結果,人們也需要為這些難以達到的子博弈制定適當的策略。