博弈論

奧斯本、納什均衡和信念的正確性

  • January 13, 2022

在奧斯本的*博弈論導論中,*納什均衡描述如下(第 21-22 頁):

首先,每個玩家根據理性選擇模型選擇她的行為,給定她對其他玩家行為的信念。其次,每個玩家對其他玩家行為的信念是正確的。

在我看來,這個定義並不完全等同於通常將納什均衡定義為一個策略配置文件,其中每個參與者的策略是對其他參與者策略的最佳響應。

通常的定義沒有說明信念,因此考慮到信念可能不正確的可能性。

考慮一個微不足道的可能性,考慮囚徒困境。假設每個玩家都相信另一個玩家不會坦白。由於認罪是一種佔優策略,每個玩家仍然會認罪。因此,即使參與者的信念與實際的均衡行為完全相反,這些行為也構成了納什均衡。

我對奧斯本的定義所描述的不是納什均衡的理解是否正確?

考慮到信念在博弈論的其他部分中確實具有非常特定的含義,在這裡引入信念的語言有點奇怪。

事實上,奧斯本的描述讓人想起貝氏納什均衡。我們可以將信念的概念引入完整資訊博弈的範式中,如下所示:假設有機率 $ a_i $ 每個玩家, $ i $ , 是一種“戰略型”類型,他會根據(納什)均衡進行遊戲,並且有機率 $ 1-a_i $ 他會隨機統一地選擇一些策略(因為,比如說,他對所有動作都無動於衷)。因此,我們有一個貝氏遊戲,其中對信念的思考更為自然。

貝氏納什解決方案概念然後說 $ i $ 的策略必須是最優的,給定由其他玩家的策略引起的預期遊戲以及對他們類型的信念 $ {a_j}_{j\neq i} $ . 如果我們將極限視為 $ a_i\rightarrow 1 $ 對全部 $ i $ 那麼這個博弈的貝氏納什均衡將與奧斯本描述的解概念相吻合。


我猜奧斯本之所以這樣寫它是出於教學原因,因為這是一篇介紹性文本。當我們向學生介紹靜態遊戲時,我們會告訴他們玩家 $ i $ 最好地響應其他玩家的動作。學生們自然想知道“他們如何在不知道該策略將是什麼的情況下對同時選擇的策略做出反應?” 在許多意義上,這是一個哲學問題。常見的答案是

  • 如果博弈是一種經常進行的博弈(拋開可以在重複博弈中維持的其他結果的問題),我們可以將納什視為一種均衡,因為如果我們在那裡收斂,我們可以製定一種人們繼續的規範無限期地發揮這種平衡(並期望其他人也這樣做)。
  • 如果遊戲真的是一次性的,那麼我們通常會引用玩家將嘗試預測其他人會做什麼的想法——而我們的均衡概念包含了這些預測必須是正確的想法。

第二點的預測似乎與奧斯本所援引的“信念”相對應。然而,重要的是要強調這些預測/“信念”只是幫助我們概念化平衡中發生的事情的非正式/直覺工具,而不是這種平衡定義的一部分。納什均衡的概念本身與信念的概念完全不可知(正如您在評論中指出的那樣,它僅被定義為行動),這就是為什麼當奧斯本繼續正式定義納什均衡時,他沒有呼叫信仰的想法。

引用自:https://economics.stackexchange.com/questions/219