貝氏博弈
通過包含自然的遊戲找到完美貝氏均衡
我想為此任務確定所有純策略完美貝氏均衡,但我不能走得太遠。旁注:第一個數字是 A 的收益,第二個數字是玩家 B 的收益。
對於最後一個階段,我知道上層A總是會選擇退出,而下層A總是會選擇通過。
但我不知道如何從那裡著手?我認為玩家 B 位於上節點和下節點(分別為 beta 和 1-beta),但我不確定如何處理它。
我試著假設自然“上升”,在這種情況下 beta=1。然後 B 會選擇通過,因為它比退出有更大的回報。這就是我感到困惑的地方。
您已經正確地確定了 A 在他的最後一個決策節點處的最優操作(如下圖中的紅色箭頭所示)。接下來,您需要
- 在 A 的初始節點推測一對動作,
- 使用這些動作來確定 B 在她的資訊集上的信念,
- 找到 B 對該信念的最佳反應,以及
- 檢查 A 的初始動作是否相對於 B 的最佳響應是最優的。
如果第 4 步的答案是“是”,那麼您就有了 PBE;如果不是,請用不同的猜想重複這些步驟。
在您的特定範例中,沒有純策略 PBE。不過,我將通過一個範例來展示上述方法:
- 假設 A 在兩個初始資訊集(藍色箭頭)處都選擇“通過”。
- 使用貝氏規則,B 的信念必須是 $ 0.9 $ 在頂部節點和 $ 0.1 $ 在底部節點。
- 基於這一信念,B 的預期收益為 $ 1 $ 從選擇“退出”,和 $ 0.9(3)+0.1(-5)=2.2 $ 從選擇“通過”。所以她最好的反應是選擇“通過”(綠色箭頭)。
- 鑑於 B 會選擇“通過”,A 在 Nature 選擇頂部路徑後的最佳響應將是“退出”(紫色箭頭),因為 $ 4>3 $ .
因此,我們沒有涉及 A 在兩個初始節點選擇“通過”的 PBE。您可以在 A 的初始節點處查看其餘可能的操作組合,以驗證不存在純策略的 PBE。