布萊克威爾關於資訊結構的等價定理背後的直覺是什麼?
假設我們有一個貝氏博弈,其中資訊結構定義為 $ P^X={(X,\mathcal{X},P_\theta)}{\theta\in\Theta} $ 其中由每個狀態的資訊結構生成的信號 $ \theta\in\Theta $ 只是一個隨機變數,取值 $ (X,\mathcal{X}) $ 賦予機率分佈 $ P\theta $ . 如果我們有另一個資訊結構 $ Q^Y={(Y,\mathcal{Y},Q_\theta)}_{\theta\in\Theta} $ 需要什麼假設才能比較這些資訊結構,以及如何應用 Blackwell 的資訊結構等價定理進行比較?
此外,如果兩個資訊結構中的一個是另一個的擴展,比如說 $ P^X $ 是一個擴展 $ Q^Y $ ,這會改變什麼?
要回答您問題的第一部分,我們不需要更多的假設來比較實驗(除了一些可測量性問題)。
在繼續之前,為了方便起見,我將把一些符號修正為博弈論文獻中的標準符號。
一個實驗(或資訊結構)被定義為一個元組 $ (S,\pi) $ 對於給定的狀態空間 $ \Omega $ , 在哪裡 $ S $ 是一組被賦予了一些適當的信號 $ \sigma $ -代數,和$$ \pi: \Omega \rightarrow \Delta (S) $$是一個信號函式,其中 $ \pi(s|\omega) $ 是機率 $ s $ 在給定狀態下實現 $ \omega $ . 在你的符號中, $ X $ 將對應 $ S $ , 和 $ P_{\theta}(x)=\pi(x|\theta) $ .
為了陳述布萊克威爾等價定理,我們需要更多的定義。
一個實驗 $ (S’,\pi’) $ 是一個 $ \textbf{garbling} $ 的 $ (S,\pi) $ 如果存在地圖 $ g: S \rightarrow \Delta(S’) $ 這樣 $$ \pi’(s’|\omega)=\sum_{s’\in S’}g(s’|s)\pi(s|\omega) $$ , 或者$$ \pi’= g \circ \pi $$在哪裡 $ \circ $ 表示兩個隨機映射的組合直覺地說,一個亂碼函式 $ g: S \rightarrow \Delta(S’) $ 可以被認為是添加雜訊,並模糊生成的資訊 $ \pi $ . 自從 $ g(s’|s) $ 是信號實現的機率 $ s\in S $ 改成信號實現 $ s’\in S’ $ , $ \pi’ $ 是一個信號函式,它比 $ \pi $ 當狀態空間和信號空間 $ S, S’ $ 是有限的,可以用矩陣來表示亂碼。讓 $ \pi_i(s_j)=\pi(s_j|\omega_i) $ . 一個實驗 $ (S,\pi) $ 可以用矩陣表示 $$ \Pi=\begin{pmatrix} \pi_1(s) \ \pi_2(s) \ … \ \pi_m(s) \end{pmatrix} $$ 然後, $ (S’,\pi’) $ 是一個亂碼 $ (S,\pi) $ 如果存在一個 $ n \times n’ $ 隨機矩陣 G 使得 $ \Pi’=\Pi G $
顯然,亂碼不是一個完整的命令,而是一個 $ \textit{partial} $ 命令。許多資訊結構不能直接相互比較。
我們說 $ (S,\pi) $ 是 $ \textbf{more informative} $ 比 $ (S’,\pi’) $ 如果為 $ \textit{any} $ 有限 $ A $ 和 $ u: A \times \Omega \rightarrow \mathbb{R} $ , 決策者更喜歡 $ (S,\pi) $ 超過 $ (S’,\pi’) $ . 這個定義非常強大,因為它需要任何決策者都喜歡 $ (S,\pi) $ 超過 $ (S’,\pi’) $
我們說以狀態為條件的動作分佈, $ \chi: \Omega \rightarrow \Delta(A) $ 是 $ \textbf{feasible} $ 在下面 $ (S,\pi) $ 如果存在 DM 的策略 $ \sigma: S \rightarrow \Delta(A) $ 這樣 $ \chi=\sigma \circ \pi $ . 換句話說, $ \chi $ 如果可以建構行為策略是可行的 $ \sigma $ 僅作為信號實現的函式,以及由此產生的動作分佈 $ \sigma \circ \pi $ 是 $ \chi $ . 行動的可行分佈集等於 DM 的選擇集。
此外,修復一些對狀態的先驗信念 $ \mu \in \Delta (\Omega) $ . 對於給定的信號實現 $ s $ ,貝氏代理會更新他的信念以形成後驗信念 $ \mu_s(\omega)=\frac{\mu(\omega)\pi(s|\omega)}{\sum_{\omega’\in\Omega}\mu(\omega’)\pi(s|\omega’)} $ . 由於每個信號實現 $ s $ 將對應於後驗信念 $ \mu_s $ , 和信號實現 $ s $ 以機率方式生成,每個實驗 $ (S,\pi) $ 會導致後驗分佈 $ \tau\in\Delta(\Delta(\Omega)) $ . WLOG 假設所有 $ \mu_s\neq \mu_{s’} $ 對於不同的 $ s\neq s’ $ , 有人能看見 $ \tau(\mu_s)=\pi(s)=\sum_{\omega\in\Omega}\pi(s|\omega)\mu(\omega) $ . 實際上, $ \sum_{supp(\tau)}\tau(\mu_s)\mu_s=\mu $ 可以從簡單的計算中看出。這個方程通常被稱為“Bayes plausibility constraint”,它僅僅意味著預期的後驗就是先驗。
我們說分佈 $ F $ 是一個 $ \textbf{Mean preserving spread} $ 的 $ G $ 如果 $ G $ 二階隨機占主導地位 $ F $ 和 $ F $ 和 $ G $ 具有相同的意思。有一些替代的等效定義,但我會跳過這個。
現在,我們擁有了陳述美麗的布萊克威爾等價定理(1951,1953)的所有建構塊。
以下是等價的
- $ (S’,\pi’) $ 是一個亂碼 $ (S, \pi) $
- 任何可行的行動分配 $ (S’,\pi’) $ 下也是可行的 $ (S,\pi) $
- $ (S,\pi) $ 比 $ (S’,\pi’) $
- $ \tau $ 是一個均值保持範圍 $ \tau’ $ , 在哪裡 $ \tau $ 是由 $ (S,\pi) $
術語 $ \textbf{Blackwell Order} $ 指的是 $ \textit{partial} $ 對所有實驗集進行排序 $ \Pi $ , 在哪裡 $ \pi \succeq \pi’ $ 當且僅當上述四個條件之一成立。
希望這能回答你的第一個問題。
對於第二部分,我們說一個資訊結構 $ (S*,\pi*) $ 是一個 $ \textbf{combination} $ 的 $ (S,\pi) $ , $ (S’,\pi’) $ 如果 $$ S*=S \times S’ $$和$$ \sum_{s’\in S’}\pi^(s,s’|\theta)=\pi(s|\theta) $$ $$ \sum_{s\in S}\pi^(s,s’|\theta)=\pi’(s’|\theta) $$ 請注意,上述定義並未對相關結構施加任何限制 $ S $ 一個 $ S’ $ . 它需要的唯一條件是 $ \pi* $ 邊緣化到 $ \pi $ 和 $ \pi’ $
資訊結構 $ (S*,\pi*) $ 是一個 $ \textbf{expansion} $ 的 $ (S,\pi) $ 如果存在某種資訊結構 $ (S’,\pi’) $ 這樣 $ (S*,\pi*) $ 是一個組合 $ (S,\pi),(S’,\pi’) $
如果 $ S* $ 是一個擴展 $ S $ , $ S* $ 至少與 $ S $ . 事實上,它們是 Blackwell 等價的。從上面的等價條件可以直接看出這一點。可能還有其他證明,但我現在將使用可行性條件。
認為 $ \chi: \Omega \rightarrow \Delta(A) $ 下是可行的 $ (S,\pi) $ . 那麼,存在一些 $ \sigma: S \rightarrow \Delta(A) $ 這樣$$ \chi_{\omega}(a)=\sum_{s}\pi(s|\omega)\sigma(a|s) $$ 定義 $ \sigma*: S \times S’ \rightarrow \Delta(A) $ 作為 $ \sigma*(a|s,s’)=\sigma(a|s) $ 對全部 $ s \in S $ , $ s’\in S’ $ 我們有 $$ \chi_{\omega}(a)=\sum_{s}\pi(s|\omega)\sigma(a|s)=\sum_{s}\sum_{s’}\pi*(s,s’|\omega)\sigma(a|s)=\sum_{s}\sum_{s’}\pi*(s,s’|\omega)\sigma*(a|s,s’) \ = \sum_{s,s’}\pi*(s,s’|\omega)\sigma*(a|s,s’) $$ 第二個等式由展開式定義而來,第三個等式就是我們的定義 $ \sigma* $ . 因此,擴展 $ (S*,\pi*) $ 比 $ (S,\pi) $
顯示 $ (S,\pi) $ 比 $ (S*,\pi*) $ , 只需定義 $ \sigma $ 作為 $ \sigma(a|s)=\sigma*(a|s,s’) $ .
希望答案有幫助!歡迎任何意見