博弈論

順序和完美貝氏均衡:一個例子?

  • January 7, 2022

我的問題很簡單。有人可以舉一個例子,說明如何在給定一組完美貝氏均衡的情況下確定順序均衡?

順序均衡的定義,其中一致的非均衡信念是完全混合策略序列的限制,這有點抽象,所以我不確定如何在實踐中使用它。

任何幫助,將不勝感激。

啤酒和乳蛋餅遊戲為例。

讓我們驗證以下是否為弱 PBE:

  • 兩種類型( $ S $ 和 $ W $ ) 的玩家 1 選擇啤酒 ( $ B $ );
  • 當玩家 2 看到啤酒選擇時,他認為玩家 1 是類型 $ S $ 有機率 $ 0.9 $ , IE $ \mu_2(S\mid B)=0.9 $ ,他選擇 $ R $ 作為回應;
  • 如果玩家 2 看到一個乳蛋餅選擇( $ Q $ ),他可以有任何信念,分配的機率不超過 $ \frac12 $ 給玩家 1 打字 $ S $ , IE $ \mu_2(S\mid Q)=p\in[0,\frac12] $ ,他會選擇 $ F $ .

下圖描繪了博弈樹中的上述均衡。

在此處輸入圖像描述

鑑於玩家 2 的策略 $ (R,F) $ , IE $ R $ 後 $ B $ 和 $ F $ 後 $ Q $ , 玩家 1 最好選擇 $ B $ : $$ \begin{align} u_1(B,(R,F)\mid S)=3&>0=u_1(Q,(R,F)\mid S)\ u_1(B,(R,F)\mid W)=2&>1=u_1(Q,(R,F)\mid W). \end{align} $$

給定玩家 1 的策略 $ \sigma_1(B\mid S)=\sigma_1(B\mid W)=1 $ ,即選擇 $ B $ 無論類型如何,玩家 2 的信仰之後 $ B $ 可以從貝氏規則推導出: $$ \begin{align} \mu_2(S\mid B)&=\frac{0.9\cdot\sigma_1(B\mid S)}{0.9\cdot\sigma_1(B\mid S)+0.1\cdot\sigma_1(B\mid W)}=\frac{0.9\cdot 1}{0.9\cdot 1+0.1\cdot 1}=0.9 \end{align} $$ 鑑於這種信念,玩家 2 最好選擇 $ R $ 後 $ B $ : $$ \begin{equation} u_2(R,\sigma_1\mid B)=0.9(0)+0.1(0)=0>-0.8=0.9(-1)+0.1(1)=u_2(F,\sigma_1\mid B). \end{equation} $$ 貝氏規則不適用於之後的資訊集 $ Q $ , 自從 $ Q $ 以機率零播放,根據 $ \sigma_1 $ . 因此,任何任意信念都將滿足弱 PBE 的要求。然而,為了證明 $ F $ 作為最佳響應,信念必須是這樣的 $$ \begin{align} u_2(F,\sigma_1\mid Q)=p(-1)+(1-p)(1)>p(0)+(1-p)(0)=u_2(R,\sigma_1\mid Q) \quad\Rightarrow\quad p\le\frac12. \end{align} $$

因此,我們已經表明,所提出的策略配置文件和信念系統是一個弱 PBE。

接下來,我們證明這個弱 PBE 也是一個 SE。為此,我們需要特別證明,參與者 2 在弱 PBE 中指定的信念可以通過一系列參與者 1 的完全混合策略收斂到她的均衡策略來證明。

輸入 $ S $ 採用混合的行為策略 $ B $ 有機率 $ (1-\epsilon_S) $ 和 $ Q $ 和 $ \epsilon_S $ . 同樣,讓輸入 $ W $ 玩 $ B $ 有機率 $ (1-\epsilon_W) $ 和 $ Q $ 和 $ \epsilon_W $ . 我們想證明存在的序列 $ \epsilon_S $ 和 $ \epsilon_W $ ,兩者都收斂到零,因此參與者 2 的均衡信念在 $ B $ 和 $ Q $ 是使用貝氏規則從這些完全混合的策略中得出的信念的限制。

首先考慮玩家 2 的信念 $ B $ . 在參與者 1 的完全混合策略下,參與者 2 的信念是 $$ \begin{equation} \widetilde \mu_2(S\mid B)=\frac{0.9(1-\epsilon_S)}{0.9(1-\epsilon_S)+0.1(1-\epsilon_W)}, \end{equation} $$ 這顯然收斂到 $ \mu_2(S\mid B)=0.9 $ 作為 $ \epsilon_S,\epsilon_W\to0 $ .

接下來,考慮玩家 2 的信念 $ Q $ . 在參與者 1 的完全混合策略下,參與者 2 的信念是 $$ \begin{equation} \widetilde \mu_2(S\mid Q)=\frac{0.9\epsilon_S}{0.9\epsilon_S+0.1\epsilon_W}, \end{equation} $$ 我們希望這等於 $ p\le\frac12 $ 作為 $ \epsilon_S,\epsilon_W\to0 $ . 認為 $ p>0 $ . 修復一個小而積極的 $ \epsilon_S $ , 並設置 $ \epsilon_W=\frac{9(1-p)}p\epsilon_S $ . 因此, $$ \begin{equation} \widetilde\mu_2(S\mid Q)=\frac{0.9\epsilon_S}{0.9\epsilon_S+0.1\cdot\frac{9(1-p)}p\epsilon_S}. \end{equation} $$ 作為 $ \epsilon_S\to0 $ ,這意味著 $ \epsilon_W\to0 $ , 我們有 $ \widetilde\mu_2(S\mid Q)\to\mu_2(S\mid Q)=p $ . 如果 $ p=0 $ ,那麼我們可以設置 $ \epsilon_W=\sqrt{\epsilon_S} $ ,這將產生相同的收斂結果。

由於玩家 1 的信念非常一致,我們得出結論,弱 PBE 的策略概況和信念系統是 SE。

引用自:https://economics.stackexchange.com/questions/49984