廣義形式博弈的量子響應均衡模型的有限理性
我正在研究基於行為博弈論模型中的有限理性的碩士論文,我想知道 QRE(Quantal Response Equilibrium)是否可以應用於玩家具有不同策略集的遊戲,而不是我在資源分配遊戲中看到的,如果是,如何?
我不確定您將 QRE 應用於哪些容量分配遊戲。但這是一個非常程式化的例子,其中 QRE 被應用於一個非對稱遊戲,其中兩個玩家的策略空間(名義上)不同:
$$ \begin{array}{c|cc} &L&R\\hline T&1,0&0,9\ D&0,1&1,0 \end{array} $$ 這個遊戲也可以很容易地以廣泛的形式表示。 在 QRE 的標準制定中,每個玩家 $ i $ 混合策略 $ \sigma_i $ ,其中純策略的機率 $ s_i $ 正在播放由以下公式確定:
$$ \begin{align} \sigma_i(s_i)&=\frac{\exp(\lambda u_i(s_i,\sigma_{-i}))}{\sum_{s_i’\in S_i}\exp(\lambda u_i(s_i’,\sigma_{-i}))}, \end{align} $$ 在哪裡 $ \lambda\in[0,\infty) $ 測量響應的精度;越大的 $ \lambda $ 反應越準確。 應用到上面的遊戲中,讓 $ p $ 是玩家 1 選擇的機率 $ T $ , 和 $ q $ 玩家 2 選擇的機率 $ L $ . 注意 $ p $ 和 $ q $ 參數化兩個玩家各自的混合策略。然後,參與者 1 對參與者 2 的任何給定混合策略的量子響應**(**參數化為 $ q $ ) 是玩 $ T $ 有機率 $ p $ 和 $ D $ 和 $ 1-p $ , 在哪裡
$$ \begin{equation} p=\frac{\exp(\lambda\cdot (1q+0(1-q)))}{\exp(\lambda\cdot(1q+0(1-q)))+\exp(\lambda\cdot(0q+1(1-q)))}.\tag{1} \end{equation} $$ 類似地,參與者 2 對參與者 1 的任何給定混合策略的量子響應**(參數化為 $ p $ ) 是玩 $ L $ 有機率 $ q $ 和 $ R $ 和 $ 1-q $ , 在哪裡 $$ \begin{equation} q=\frac{\exp(\lambda\cdot(0p+1(1-p)))}{\exp(\lambda\cdot(0p+1(1-p)))+\exp(\lambda\cdot(9p+0(1-p)))}.\tag{2} \end{equation} $$ 在量子響應平衡**中, $ (\sigma_1,\sigma_2) $ ,兩個玩家的策略必須是相互的量子響應;那是,
$$ \begin{align} \sigma_1(T)&=\frac{\exp(\lambda \cdot \sigma_2(L))}{\exp(\lambda\cdot\sigma_2(L))+\exp(\lambda(1-\sigma_2(L)))}&\sigma_1(D)&=1-\sigma_1(T)\[12pt] \sigma_2(L)&=\frac{\exp(\lambda\cdot(1-\sigma_1(T)))}{\exp(\lambda\cdot(1-\sigma_1(T)))+\exp(9\cdot\lambda\cdot\sigma_1(T))}&\sigma_2(R)&=1-\sigma_2(L) \end{align} $$ 在下圖中,虛線繪製了每個玩家的最佳反應;實線代表不同精度水平下的量子響應。也就是說,實曲線繪製方程 $ (1) $ 和 $ (2) $ 多於。兩條實曲線的交點是量子響應平衡點,由上面的最後一組方程描述。