決策理論
資訊結構的布萊克威爾階
考慮一個決策者 (DM) 必須選擇行動的模型 $ y\in \mathcal{Y} $ 可能沒有完全了解世界的狀況。
世界狀況有支持 $ \mathcal{V} $ .
當 DM 選擇行動時 $ y\in \mathcal{Y} $ 世界的狀態是 $ v\in \mathcal{V} $ ,她收到了回報 $ u(y,v) $ .
讓 $ P_V\in \Delta(\mathcal{V}) $ 成為 DM 的先驗。
DM 也處理一些信號 $ T $ 有支持 $ \mathcal{T} $ 分配 $ P_{T|V} $ 完善他的先驗並獲得後驗 $ V $ ,表示為 $ P_{V|T} $ ,通過貝氏規則。
讓 $ S\equiv {\mathcal{T}, P_{T|V}} $ 稱為“資訊結構”。
DM 的策略是 $ P_{Y|T} $ . 這種策略是最優的,如果它最大化他的期望收益,其中期望是使用後驗計算的, $ P_{V|T} $ .
問題:考慮兩個資訊結構, $ S $ 和 $ S’ $ . 我們可以使用 Blackwell Theorem 來比較它們,它說 $ S $ 比 $ S’ $ 如果最大預期收益低於 $ S $ 至少等於最大預期收益 $ S’ $ . 它是否正確?如果是,那麼在我看來,我可以使用這個標準對任何資訊結構進行排名。因此,為什麼布萊克威爾階是偏階?
它適用於所有先驗和所有效用矩陣。它可能用於 $ p_1,u_1 $ 和 $ p_2,u_2 $ 排名 $ S $ 和 $ S’ $ 不同的。