貝氏博弈
我的信念什麼時候應該是鞅?
假設我想知道某個事件是否會發生(例如,明天某個特定位置是否會下雨)。假設我對事件是否會發生的信念可以用機率來表示 $ p_t \in [0, 1] $ ; 並且我知道我可能會在此期間收到有關此的新資訊 $ t + 1 $ . 收到這個新資訊後,我會形成一個新的信念 $ p_{t+1} \in [0, 1] $ 使用貝氏法則。
我的理解是,在某些假設下, $$ \mathbb{E}[p_{t+1}] = p_t $$ 也就是說,我的信念應該是鞅。直覺的想法很清楚:如果我預計我的信念明天會上升,那麼我的信念今天應該已經上升了!但是,我不太清楚這應該何時成立,並感謝解釋或一些有用的連結。
更具體地說,有一些事情讓我感到困惑:
- 在這個看起來很有幫助的文件中,我讀到“後驗的預期值……只是先驗”。我想這只是我在這裡討論的主張的概括版本?(概括,因為它允許任意數量的狀態,而不僅僅是我的問題中的兩個狀態。)
- 總的來說,這個結果似乎不是真的。例如,假設在我不知情的情況下,有人想改變我的想法。如果我認為該事件不太可能發生,他們將向我提供表明該事件可能發生的證據;如果我認為它可能會發生,他們會向我提供證據表明它可能不會發生。在這種情況下,該信念似乎不是鞅;相反,可以預期它會朝著 $ 0.5 $ 在下一個時期。如果這是正確的,那麼這裡違反了什麼假設?
$$ Note: for this example to be interesting, I think it’s important that I don’t know that the `data generating process’ takes the perverse form outlined above. $$
非常感謝您提供任何想法、參考資料等。
預期的後驗是先驗。但是要保持這一點,您必須對先驗採取期望。在您的範例中,您描述了貝氏,但根據您的信念評估了他們的更新。
Ann 和 Bob 可能是完美的貝氏主義者,他們預期的後驗可能正是他們的先驗。但這並不意味著 Ann 對 Bob 的後驗的期望就是 Bob 的先驗。