Bergemman 和 Morris 貝氏環境下的預期收益計算難度
假設我們有兩種同樣可能發生的世界狀態,然後說 $ \psi $ 是狀態的共同先驗 $ \theta\in\Theta={G,B} $ . 玩家的類型由世界每個狀態下的以下矩陣給出
$$ \begin{pmatrix}{G} & t_1 & t_2 \ t_1 & 1/4 & 1/4 \ t_2 & 1/4 & 1/4 \end{pmatrix}\quad\begin{pmatrix}{B} & t_1 & t_2 \ t_1 & 1/3 & 1/6 \ t_2 & 1/3 & 1/6 \end{pmatrix} $$
支付矩陣是
$$ \begin{pmatrix}{G} & a_2 & p_2 \ a_1 & 8,8 & 3,10 \ p_1 & 10,3 & 0,0 \end{pmatrix}\quad \begin{pmatrix}{B} & a_2 & p_2 \ a_1 & 6,6 & 2,7 \ p_1 & 7,2 & 0,0 \end{pmatrix} $$
正如論文中的 Bergemann 和 Morris
$$ of 2016 $$$$ 1 $$palyer i={1,2} 的值函式由下式給出 $$ V(a,t,\theta)=\sum_{a_{-i},t_{-i},\theta}\psi(\theta)\pi((t_i,t_{-i})|\theta)\sigma((a_i,a_{-i})|(t_i,t_{-i}),\theta)u_i((a_i,a_{-i}),\theta) $$
在哪裡 $ \pi:\Theta\to\Delta(T) $ 是關於世界狀態的類型的機率分佈。
如果我們在不考慮玩家類型和先驗分佈的情況下求解每個博弈的 NE,我們知道第一個矩陣博弈給出兩個純納什均衡,即 $ (a_1,p_2) $ 和 $ (a_2,p_1) $ 第二場比賽也是如此,而每場比賽都有一個混合納什均衡,即 $ \sigma_1^G(a_1,p_1),\sigma_2^G(a_2,p_2)=((3/5,2/5),(3/5,2/5)) $ 在良好的狀態和 $ \sigma_1^B(a_1,p_1),\sigma_2^B(a_2,p_2)=((2/3,1/3),(2/3,1/3)) $ 分別處於不良狀態。
通過考慮玩家的類型,例如,如果玩家 $ 1 $ 是類型 $ t_1 $ 和播放器 $ 2 $ 是類型 $ t_1 $ 處於良好狀態,然後他們每個人都玩 $ a_1 $ 和 $ a_2 $ 作為他們在遊戲中的行為。如果玩家 $ 1 $ 是類型 $ t_1 $ 和播放器 $ 2 $ 是類型 $ t_2 $ 處於良好狀態,然後他們每個人都玩 $ a_1 $ 和 $ p_2 $ 如他們在遊戲中的行為等等。在這種情況下,混合策略略有不同,新的解決方案由下式給出 $ (\sigma_1^{G,T}(a_1,p_1),\sigma_2^{G,T}(a_2,p_2))=((3/5,2/5),(3/5,2/5)) $ 在良好的狀態和 $ (\sigma_1^{B,T}(a_1,p_1),\sigma_2^{B,T}(a_2,p_2))=((2/3,1/3),(1/2,1/2)) $ 分別處於不良狀態。由於關於信仰的更新 $ \pi $ , 我們有不同的策略 $ \sigma_2^{B,T}(a_2,p_2) $ 關於未考慮類型的情況。如果我們對類型的先驗分佈進行任何更改,那麼混合策略均衡會發生很大變化,我自己也做了一些計算。
我的問題如下:
當我嘗試計算純策略 NE 中玩家的預期收益時,我正在進行以下計算。我只為玩家顯示結果 $ 1 $ 而不是為了玩家 $ 2 $ , 那是
$$ V((a_1,p_2),(t_1,t_2),\theta)=\underbrace{\psi(G)}{1/2}\times\left(\underbrace{\pi((t_1,t_2)|G)}{1/2}\underbrace{\sigma((a_1,p_2)|(t_1,t_2),G)}{=1\quad\text{pure strategies}}\underbrace{u_1((a_1,p_2),G)}{3}\right)+\underbrace{\psi(B)}{1/2}\times\left(\underbrace{\pi((t_1,t_2)|B)}{1/3}\underbrace{\sigma((a_1,p_2)|(t_1,t_2),B)}{=1\quad\text{pure strategies}}\underbrace{u_1((a_1,p_2),B)}{2}\right)=13/12 $$
在混合策略中,我對如何計算預期收益有點困惑
$$ V((\sigma_1^{(\theta,t,)},\sigma_2^{(\theta,t,)}),t,\theta)=\underbrace{\psi(G)}{1/2}\times\left(\pi((t_1,t_1)|G)\sigma((a_1,a_2)|(t_1,t_1),G)u_1((a_1,a_2),G)+\pi((t_1,t_2)|G)\sigma((a_1,p_2)|(t_1,t_2),G)u_1((a_1,p_2),G)+\pi((t_2,t_1)|G)\sigma((p_1,a_2)|(t_2,t_1),G)u_1((p_1,a_2),G)+\pi((t_2,t_2)|G)\sigma((p_1,p_2)|(t_2,t_2),G)u_1((p_1,p_2),G)\right)+\underbrace{\psi(B)}{1/2}\times\left(\pi((t_1,t_1)|B)\sigma((a_1,a_2)|(t_1,t_1),B)u_1((a_1,a_2),B)+\pi((t_1,t_2)|B)\sigma((a_1,p_2)|(t_1,t_2),B)u_1((a_1,p_2),B)+\pi((t_2,t_1)|B)\sigma((p_1,a_2)|(t_2,t_1),B)u_1((p_1,a_2),B)+\pi((t_2,t_2)|B)\sigma((p_1,p_2)|(t_2,t_2),B)u_1((p_1,p_2),B)\right)= $$
有誰能夠幫助我?我在正確的方向嗎?
$$ 1 $$: https://onlinelibrary.wiley.com/doi/epdf/10.3982/TE1808
好吧,根據我所看到的,讓我們把價值函式的每一部分都單獨拿出來,然後
$$ \underbrace{\pi((t_1,t_1)|G)}{1/2}\underbrace{\sigma((a_1,a_2)|(t_1,t_1),G)}{3/5\times 3/5=9/25}\underbrace{u_1((a_1,a_2),G)}{8}=36/25 $$ $$ \underbrace{\pi((t_1,t_2)|G)}{1/2}\underbrace{\sigma((a_1,p_2)|(t_1,t_2),G)}{3/5\times 2/5=6/25}\underbrace{u_1((a_1,p_2),G)}{3}=9/25 $$ $$ \underbrace{\pi((t_2,t_1)|G)}{1/2}\underbrace{\sigma((p_1,a_2)|(t_2,t_1),G)}{2/5\times 3/5=6/25}\underbrace{u_1((p_1,a_2),G)}{10}=30/25 $$ $$ \underbrace{\pi((t_2,t_2)|G)}{1/2}\underbrace{\sigma((p_1,p_2)|(t_2,t_2),G)}{2/5\times 2/5=4/25}\underbrace{u_1((p_1,p_2),G)}{0}=0 $$ 因此,如果你總結一切,第一部分是 $ 75/25=3 $
相似地 $$ \pi((t_1,t_1)|B)\sigma((a_1,a_2)|(t_1,t_1),B)u_1((a_1,a_2),B)=2/3\times(2/3\times 1/2)\times 6=4/3 $$ $$ \pi((t_1,t_2)|B)\sigma((a_1,p_2)|(t_1,t_2),B)u_1((a_1,p_2),B)=1/3\times(2/3\times 1/2)\times 2=2/9 $$ $$ \pi((t_2,t_1)|B)\sigma((p_1,a_2)|(t_2,t_1),B)u_1((p_1,a_2),B)=2/3\times(1/3\times 1/2)\times 7=7/9 $$ $$ \pi((t_2,t_2)|B)\sigma((p_1,p_2)|(t_2,t_2),B)u_1((p_1,p_2),B)=1/3\times(1/3\times 1/2)\times 0=0 $$
如果你總結你的結果, $ 21/9=7/3 $ 因此
$$ V((\sigma_1^{(\theta,t,)},\sigma_2^{(\theta,t,)}),t,\theta)=1/2\times 3 + 1/2\times 7/3=16/6 $$