博弈論

資訊完備完善的廣泛形式博弈中的混合策略

  • July 28, 2022

我看到了引理:

“在具有完整和完美資訊的廣泛形式遊戲中,與玩家 i 可用的某些純策略相比,玩家 i 的任何混合策略都會導致玩家 i 的效用更低或相等。”

我直覺地理解,混合策略決策將低於我能採取的最佳響應,但我不知道如何證明這一點。

我假設引理中隱含的條件是“保持其他玩家的策略固定”。我還將假設策略空間是有限的。

給定其他玩家策略的概況 $ \sigma_{-i} $ , 玩家 $ i $ 混合策略的效用 $ \sigma_i $ 是(誰)給的: $$ \begin{equation} u_i(\sigma_i,\sigma_{-i})=\sum_{s_i\in S_i}\sigma_i(s_i)u_i(s_i,\sigma_{-i}) \end{equation} $$ 在哪裡 $ \sigma_i(s_i) $ 是玩純策略的機率 $ s_i $ 根據 $ \sigma_i $ . 現在讓$$ s_i^\in\mathop{\arg\max}{s_i\in S_i};u_i(s_i,\sigma{-i}). $$這樣的最大值必須存在,因為 $ S_i $ 是有限的。由此可見,對於所有 $ \sigma_i $ , $$ u_i(s_i^,\sigma_{-i})\ge\sum_{s_i\in S_i}\sigma_i(s_i)u_i(s_i,\sigma_{-i}) \tag*{$\blacksquare$} $$

引用自:https://economics.stackexchange.com/questions/52209