博弈論

具有不確定性的單智能體決策問題中的強韌預測

  • June 25, 2019

我希望您能幫助我更好地理解在具有不確定性的**單智能體決策問題中使用****貝氏相關均衡 (BCE)**概念來預測對信念環境具有強韌性的最優策略的可能性。本文提供了 BCE 的概念,用於通用 $ N $ -玩家遊戲。


考慮以下不確定性下的單智能體選擇問題。

讓 $ V $ 在支持下成為世界的狀態 $ \mathcal{V} $ 和機率分佈 $ P_V\in \Delta(\mathcal{v}) $ . 一、讓大自然畫出一個實現 $ v $ 的 $ V $ 從 $ P_V $ . 然後,讓決策者選擇一個動作 $ y\in \mathcal{Y} $ , 和 $ \mathcal{Y} $ 有限的,沒有觀察到的 $ v $ . 做出決定後,決策者將獲得回報 $ u(y,v) $ .

例如,假設 $ \mathcal{Y}\equiv {1,2,3} $ . $ V $ 是一個 $ 3\times 1 $ 隨機向量, $ V\equiv (V_1,V_2,V_3) $ . $ P_V $ 是三變數標準正態分佈。 $ u(y,v)\equiv v_y $ .

在選擇一項行動之前,決策者可以收到至少一個信號來改進她的先前(最少資訊量)。我假設這個最小信號完全沒有資訊(退化的資訊結構)。


現在,我想使用 Bergemann 和 Morris (2016) 中的定理 1 在對決策者處理的資訊量(在這種情況下為退化)的最小假設下表徵一組最優策略。為此,我介紹了單人貝氏相關均衡 (BCE) 的概念。

所描述遊戲的單人 BCE 是機率分佈 $ P_{Y,V}\in \Delta(\mathcal{Y}\times \mathcal{V}) $ 這樣:

  1. $ \forall v \in \mathcal{V} $ $$ \sum_{y\in \mathcal{Y}}P_{Y,V}(y,v)=P_V(v) $$

  2. $ \forall y\in \mathcal{Y} $ 和 $ \forall \tilde{y}\neq y $ $$ \sum_{v\in \mathcal{V}} (v_y-v_{\tilde{y}}) \times P_{Y,V}(y,v)\geq 0 $$


問題:

1)在我的範例中是否存在 BCE 並且是唯一的?

2)現在假設我確定決策者除了退化的資訊結構之外沒有任何資訊。在這種情況下,我將如何描述最優策略(無需對可能更豐富的信念環境保持穩健)?該定義與上面給出的 BCE 定義有何不同?

1)鑑於 $ \mathcal{Y} $ 是有限的,顯然 BCE 不是一個空集(或者它存在)。請記住,BCE 的集合是對某些信念的最優決策的集合 $ \mathcal{V} $ 可以在觀察一些信號並具有先驗之後形成(作為後驗信念) $ P_V $ .

為了顯示至少有一個分佈滿足 BCE 的定義,您可以考慮一個無資訊信號。鑑於只有一組有限的動作,其中一個必須在給定先驗的情況下最大化預期效用。如果有多個,請隨意在其中隨機分配。讓最優動作為 $ P_Y^* $ (在這個符號中,我擷取了最大化器是唯一的和有多個最大化器的兩種情況)並定義 $ P_{Y,V}=P_Y^*P_V $ ,那麼這樣的分佈就構成了 BCE。

現在,您不應該期望唯一性,因為如果只有一個分佈構成 a,或者如果 BCE 是一個單例(因為我們通常將 BCE 視為一個集合),那麼資訊本質上是不相關的。這將意味著有一個動作 $ \mathcal{Y} $ 無論您可能收到任何額外資訊,這是最好的行動。

2)為了表徵這一點,只需找到當信念等於先驗時的最優策略, $ P_V $ . 如果你想用你擁有的兩個表達式來表達它,那麼 $ P_{Y,V} $ 必須是產品分佈,即 $ P_{Y,V}(y,v)=P_Y(y)\cdot P_V(v) $ 對於一些 $ P_Y(y)\in\Delta(\mathcal{Y}) $ (這將捕捉到玩家除了先驗之外沒有更多資訊,因此無法將他的行為與世界狀態相關聯)。第二個不等式將確定 $ P_Y $ . 事實上,使用上一個要點中的符號,它應該等於 $ P_Y^* $ .

引用自:https://economics.stackexchange.com/questions/29955