廣義形式博弈的量子響應均衡模型的有限理性

March 3, 2018

我正在研究基於行為博弈論模型中的有限理性的碩士論文，我想知道 QRE（Quantal Response Equilibrium）是否可以應用於玩家具有不同策略集的遊戲，而不是我在資源分配遊戲中看到的，如果是，如何？

我不確定您將 QRE 應用於哪些容量分配遊戲。但這是一個非常程式化的例子，其中 QRE 被應用於一個非對稱遊戲，其中兩個玩家的策略空間（名義上）不同：
$$ \begin{array}{c|cc} &L&R\\hline T&1,0&0,9\ D&0,1&1,0 \end{array} $$ 這個遊戲也可以很容易地以廣泛的形式表示。在 QRE 的標準制定中，每個玩家 $ i $ 混合策略 $ \sigma_i $ ，其中純策略的機率 $ s_i $ 正在播放由以下公式確定：
$$ \begin{align} \sigma_i(s_i)&=\frac{\exp(\lambda u_i(s_i,\sigma_{-i}))}{\sum_{s_i’\in S_i}\exp(\lambda u_i(s_i’,\sigma_{-i}))}, \end{align} $$ 在哪裡 $ \lambda\in[0,\infty) $ 測量響應的精度；越大的 $ \lambda $ 反應越準確。應用到上面的遊戲中，讓 $ p $ 是玩家 1 選擇的機率 $ T $ ，和 $ q $ 玩家 2 選擇的機率 $ L $ . 注意 $ p $ 和 $ q $ 參數化兩個玩家各自的混合策略。然後，參與者 1 對參與者 2 的任何給定混合策略的量子響應**（**參數化為 $ q $ ) 是玩 $ T $ 有機率 $ p $ 和 $ D $ 和 $ 1-p $ ，在哪裡
$$ \begin{equation} p=\frac{\exp(\lambda\cdot (1q+0(1-q)))}{\exp(\lambda\cdot(1q+0(1-q)))+\exp(\lambda\cdot(0q+1(1-q)))}.\tag{1} \end{equation} $$ 類似地，參與者 2 對參與者 1 的任何給定混合策略的量子響應**（參數化為 $ p $ ) 是玩 $ L $ 有機率 $ q $ 和 $ R $ 和 $ 1-q $ ，在哪裡 $$ \begin{equation} q=\frac{\exp(\lambda\cdot(0p+1(1-p)))}{\exp(\lambda\cdot(0p+1(1-p)))+\exp(\lambda\cdot(9p+0(1-p)))}.\tag{2} \end{equation} $$ 在量子響應平衡**中， $ (\sigma_1,\sigma_2) $ ，兩個玩家的策略必須是相互的量子響應；那是，
$$ \begin{align} \sigma_1(T)&=\frac{\exp(\lambda \cdot \sigma_2(L))}{\exp(\lambda\cdot\sigma_2(L))+\exp(\lambda(1-\sigma_2(L)))}&\sigma_1(D)&=1-\sigma_1(T)\[12pt] \sigma_2(L)&=\frac{\exp(\lambda\cdot(1-\sigma_1(T)))}{\exp(\lambda\cdot(1-\sigma_1(T)))+\exp(9\cdot\lambda\cdot\sigma_1(T))}&\sigma_2(R)&=1-\sigma_2(L) \end{align} $$ 在下圖中，虛線繪製了每個玩家的最佳反應；實線代表不同精度水平下的量子響應。也就是說，實曲線繪製方程 $ (1) $ 和 $ (2) $ 多於。兩條實曲線的交點是量子響應平衡點，由上面的最後一組方程描述。

引用自：https://economics.stackexchange.com/questions/20525

廣義形式博弈的量子響應均衡模型的有限理性

相關問答

認知層次和k級模型有什麼區別？

理解擴展形式遊戲的屬性

博弈論者如何看待行為經濟學？

尋找納什均衡

進化博弈論和行為博弈論之間是否有任何重疊

平衡和k-合理化之間的差異