決策理論

具有不確定性和資訊結構的選擇問題中最優策略的存在性

  • June 27, 2019

考慮一個決策者選擇一個行動, $ y $ , 從有限集 $ \mathcal{Y} $ ,可能沒有關於世界狀況的完整資訊。

更準確地說,讓 $ V $ 是代表世界狀態的連續分佈的隨機變數(或向量),有支持, $ \mathcal{V} $ . 讓 $ P_{V}\in \Delta(\mathcal{V}) $ 是機率分佈 $ V $ .

自然得出了一個認識, $ v $ , 的 $ V $ 從 $ P_{V} $ . 決策者不知道 $ v $ . 不過,她可以煉化自己的先驗, $ P_{V} $ ,在接收到可能提供有關世界狀況的私人信號時。特別是,讓 $ T $ 是表示決策者接收到的私有信號的隨機變數(或向量),具有支持 $ \mathcal{T} $ . 讓 $ P_{T|v}\in \Delta(\mathcal{T}) $ 是機率分佈 $ T $ 有條件的 $ v $ .

自然得出了一個認識, $ t $ , 的 $ T $ 從 $ P_{T|v} $ . 決策者觀察 $ t $ , 使用貝氏規則更新 $ P_{V} $ 與後 $ P_{V|t}\in \Delta(\mathcal{V}) $ ,並選擇一個動作, $ y\in \mathcal{Y} $ . 最後,決策者得到回報, $ u(y, v) $ .

現在讓我們定義決策者的最優策略。

(混合)策略是 $ P_{Y|T}\equiv {P_{Y|t}\in \Delta(\mathcal{Y}): t\in \mathcal{T}} $ ,收集機率分佈 $ Y $ 以每一個實現為條件 $ t $ 的 $ T $ .

一種策略 $ P_{Y|T} $ 是最優的,如果它允許決策者最大化她的預期收益: $ \forall t\in \mathcal{T} $ , $ \forall y\in \mathcal{Y} $ 這樣 $ P_{Y|t}(y)>0 $ , 和 $ \forall \tilde{y}\in \mathcal{Y}\setminus {y} $ $$ \int_{ \mathcal{V}} u(y,v) P_{T|v}(t) P_{V}(\text{d}v) \geq \int_{ \mathcal{V}} u(\tilde{y}, v) P_{T|v}(t) P_{V}(\text{d} v;\theta_v). $$


**問題:對於****任何資訊結構,**是否總是存在最優策略 $ S\equiv (\mathcal{T}, P_{T|V}) $ ? 如果有的話,你能舉一個不存在的例子嗎?

是的,任何資訊結構都存在最優策略。

證明:第一組 $ \mathcal{Y} $ 是有限的(因此緊湊)。2nd-對於世界的每個狀態, $ v $ , $ u(y,v) $ 是連續的 $ y $ 使用離散度量。3rd-給定積分的線性,對於每個 $ t\in\mathcal{T} $ 我們有 $ \int_{\mathcal{V}}u(y,u)P_{T|v}(v)P_V(dv) $ 也是連續的 $ y $ . 因此,Weierstrass 定理保證了最小值和最大值的存在。

讓 $ y^t $ 當信號為 $ t $ (請注意,每個信號實現可能不同,並且最大化器可能不是唯一的。在後一種情況下,為簡單起見,我任意選擇一個)。最後,定義 $ P{Y|T}(y|t)=\mathbb{1}{y=y^_t} $ . 即玩 $ y^*_t $ 當信號為 $ t $ .

在此設置中,存在可能僅在以下情況下失敗 $ \mathcal{Y} $ 不是緊湊的,或者如果 $ u(y,v) $ 不是連續的 $ y $ . 注意我說可能,即使這兩個條件不存在,最優可能仍然存在。

引用自:https://economics.stackexchange.com/questions/29972