難以理解機率論和博弈論相關的符號
我的問題有點技術性,它與資訊經濟學機率論中一些數學屬性之間的符號和組合有關。
說 $ \mathcal{I}=(X,\mu) $ 和 $ \mathcal{J}=(Y,\nu) $ 是可測機率空間,其中 $ \mu $ 和 $ \nu $ 表示機率分佈 $ X $ 和 $ Y $ 分別。然後,我們定義 $ \phi:X\to\Delta(Y) $ , 在哪裡 $ \Delta(Y) $ 是單純形 $ Y $ . 如果圖像 $ \mu $ 經過 $ \phi $ 是 $ \nu $ 然後它成立 $$ \mathbb{E}_{\mu}\phi(x)(y)=\nu(y),\quad \text{where $\phi(x)(y)$ denotes the conditional probability $\phi(y|x)$} $$
注意 $ \mu $ 和 $ \nu $ 是每個的機率測度 st $ x^i $ 這樣 $ \mu(x^i)>0 $ , 然後 $ p(x^i)\in\Delta(X^{-i}) $ 表示條件機率 $ \mu $ 給定 $ x^i $ 超過 $ X^{-i} $ : $$ p(x^i)(x^{-i})=\mu(x^{-i}|x^i)=\frac{\mu(x^{-i},x^{i})}{\mu(x^i)} $$
另外,請注意 $ \mu(x^i) $ 代表 $ \mu({x^i}\times X^{-i}) $ .
為了幫助您理解符號,從博弈論中想像一下 $ i={1,2,3} $ , 然後 $ X=X^1\times X^2\times X^3= {a^1,b^1}\times{a^2,b^2}\times{a^3,b^3} $ 和 $ x=(\underbrace{a^1}{x^1},\underbrace{a^2}{x^2},\underbrace{a^3}_{x^1}) $
更進一步,定義了以下機率。讓 $ r $ 表示事前機率和 $ q $ 事後機率,它們定義如下 $ \Delta(Y^{-i}) $ :
$$ r(x^i)(y^{−i})= P_{\phi}(y^{−i}|x^i),\quad\text{and}\quad q(y^i)(y^{−i})= P_{\phi}(y^{−i}|y^i) $$
為了 $ P_{\phi}(x^i,y^i)>0 $ , 在哪裡 $ P_{\phi}(x^i,y^i)=\mu(x^i)\phi^{i}(x^i)(y^i) $ 表示在 $ X\times Y $ 經過 $ \mu $ 和轉移機率 $ \phi $ , 然後 $ r(x^i) $ 和 $ q(y^i) $ 是隨機向量,其值為 $ \Delta(Y^{-i}) $ 和 $ P_{\phi}(y^i|x^i)=\phi^{i}(x^i)(y^i) $ 和 $ r(x^i)=\mathbb{E}_{p(x^i)}\phi^{-i}(x^{-i}) $
$ \textit{Question:} $ 我很難理解如何計算 $ r() $ 和 $ q() $ 代表 $ \mu $ 和 $ \nu $ 也是。我無法從符號中澄清事後和事前機率如何與 $ \phi $ , $ \mu $ , $ \nu $ 和 $ p $ ?
我覺得 $ q(y^i)(y^{−i}) $ 等於 $ \frac{\nu(y^{-i},y^i)}{\nu(y^i)} $ ,但我不明白如何從 $ q(y^i)(y^{−i})= P_{\phi}(y^{−i}|y^i)=\dots=\frac{\nu(y^{-i},y^i)}{\nu(y^i)} $ . 還有公式是什麼 $ r(x^i)(y^{−i}) $ 以及結果如何 $ r(x^i)=\mathbb{E}_{p(x^i)}\phi^{-i}(x^{-i}) $ ?
似乎也 $ p $ 是“向後”的版本 $ \phi $ . 然而 $ \phi $ 告訴你每個值的可能性 $ Y $ 給定的值 $ X $ , 功能 $ p $ 告訴你,給定 $ y $ , 它由每個產生的條件機率 $ x $ . 所以我也可以聲稱 $ P_{\phi}(x,y)=\nu(y)p(y)(x)=\mu(x)\phi(x)(y) $ ?
$ \textit{Hint:} $ 請記住, $ f(x)(y)=f(y|x) $ 在任何情況下和 $ f(x^i) $ 是條件機率 $ f(x^i)(x^{-i})=f(x^{-i}|x^{i}) $
我們有那個 $ {\cal I} = ((X^i)_i, \mu) $ 和 $ {\cal J} = ((Y^i)_i, \nu) $ 是兩個資訊結構。
播放器的解釋映射 $ i $ 是一個映射 $ \phi^i: X^i \to \Delta(Y^i) $ 所以它與每個 $ x^i $ 一個分佈 $ Y^i $ .
讓 $ x^i \in X^i $ . 然後 $ \phi^i(x^i) $ 是一個分佈 $ Y^i $ 所以 $ \phi(x^i)(y^i) $ 是這個分佈與結果相關的機率 $ y^i $ .
那麼對於 $ x = (x^1, \ldots, x^I) $ 我們可以定義: $$ \phi: \prod_i X^i \to \Delta\left(\prod_i Y^i\right) $$ 這樣對所有人 $ x = (x^1,\ldots, x^I) $ 和 $ y = (y^1,\ldots, y^I) $ 我們有產品機率度量: $$ \phi(x)(y) = \phi^1(x^1)(y^1) \cdot \phi^2(x^2)(y^2) \cdot \ldots \cdot \phi^I(x^I)(y^I) $$ 我們有這樣的解釋 $ \phi= (\phi^i)i $ 是一致的,如果對於每個 $ x \in \prod_i X^i $ 和 $ y \in \prod_i Y^i $ : $$ \mathbb{E}\mu \phi(x)(y^i) = \nu(y),\ \leftrightarrow \sum_{x \in X} \phi(x)(y) ,, \mu(x) = \nu(y) $$ 現在定義 $ \phi(x)(y) \mu(x) = P(x,y) $ . 那麼總和 $ P(x, y) $ 總體 $ x $ 和 $ y $ 等於 1: $$ \sum_x \sum_y P(x,y) = \sum_x \sum_y \phi(x)(y),, \mu(x) = \sum_y \nu(y) = 1 $$ 邊際分佈也滿足: $$ \begin{align*} &\sum_x P(x,y) = \sum_x \phi(x)(y)\mu(x) = \nu(y),\ &\sum_y P(x,y) = \sum_y \phi(x)(y) \mu(x) = \mu(x) \sum_y \phi(x)(y) = \mu(x). \end{align*} $$ 所以 $ P(x,y) $ 作為一個聯合機率分佈 $ \prod_i X^i \times \prod_i Y^i $ 有邊緣 $ \nu $ 和 $ \mu $ . 然後 $ \phi(x)(y) = \dfrac{P(x,y)}{\mu(x)} $ 這與條件機率相同 $ \phi(x)(y) = P(y|x) $ .
我們可以寫邊緣 $ P(y) = \nu(y) $ 和 $ P(x) = \mu(x) $ . 另外,讓 $ P(y^i) $ 是的邊際分佈 $ P $ 關於 $ y^i $ , $ P(x^i) $ 的邊際分佈 $ P $ 關於 $ x^i $ 等等。
然後我們可以定義: $$ q(y^i)(y^{-i}) = P(y^{-i}|y^i) = \dfrac{P(y^i, y^{-i})}{ P(y^i)}. $$ 和: $$ r(x^i)(y^{-i}) = P(y^{-i}|x^i) = \dfrac{ P(x^i, y^{-i})}{ P(x^i)}. $$
我覺得 $ q(y^i)(y^{−i}) $ 等於 $ \frac{\nu(y^{-i},y^i)}{\nu(y^i)} $
我認為你是對的。請注意 $ P(y^i, y^{-i}) = \nu(y^i, y^{-i}) $ 和 $ P(y^i) = \sum_{y^{-i}} P(y^i, y^{-i}) = \sum_{y^{-i}} \nu(y^i, y^{-i}) = \nu(y^i) $ 確實如此(根據貝氏規則): $$ q(y^i)(y^{-i}) = \dfrac{P(y^i, y^{-i})}{P(y^i)} = \dfrac{\nu(y^i, y^{-i})}{\nu(y^i)} = \nu(y^{-i}|y^i) $$
還有公式是什麼 $ r(x^i)(y^{−i}) $ 以及結果如何 $ r(x^i)=\mathbb{E}_{p(x^i)}\phi^{-i}(x^{-i}) $ ?
這個表達式的計算更複雜一些。第一的: $$ \begin{align*} P(x^i, y^{-i}) &= \sum_{x^{-i}, y^{i}} P(x^i, x^{-i}, y^i, y^{-i}),\ &= \sum_{x^{-i}, y^{i}} \phi(x^i, x^{-i})(y^i, y^{-i}) ,, \mu(x^i, x^{-i}),\ &=\sum_{x^{-i}, y^i} \mu(x^i, x^{-i}) \left[\left(\prod_{j \ne i} \phi^j(x^j)(y^j)\right)\phi^i(x^i)(y^i) \right],\ &=\sum_{x^{-i}} \mu(x^i, x^{-i}) \left(\prod_{j \ne i}\phi^j(x^j)(y^j)\right) \underbrace{\sum_{y^{i}} \phi^i(x^i)(y^i)}{=1},\ &=\sum{x^{-i}} \mu(x^i,x^{-i}),, \phi^{-i}(x^{-i})(y^{-i}),\ \end{align*} $$ 下一個有, $$ P(x^i) = \sum_{x^{-i}} P(x^i, x^{-i}) = \sum_{x^{-i}} \mu(x^i, x^{-i}) = \mu(x^i) $$ 然後: $$ \begin{align*} r(x^i)(y^{-i}) &= \dfrac{P(x^i, y^{-i})}{P(x^i)},\ &= \sum_{x^{-i}} \frac{\mu(x^i, x^{-i})}{\mu(x^i)} \phi^{-i}(x^{-i})(y^{-i}),\ &= \sum_{x^{-i}} p(x^i)(x^{-i}),, \phi^{-i}(x^{-i})(y^{-i}),\ &= \mathbb{E}_{p(x^i)} \phi^{-i}(x^{-i})(y^{-i}) \end{align*} $$
其他問題和答案
- 這是否意味著產品度量總是被轉換為條件機率?
不,這就是作者強加解釋應該一致的定義的原因。
- 你見過和這裡有相同符號的教科書嗎?
不。在我看來,這種符號使用起來相當不方便;-)
- 為什麼 $ P(y^i, y^{-i}) = \nu(y^i, y^{-}) $ .
讓 $ y = (y^i, y^{-i}) $ 然後:
$ P(y^i, y^{-i}) = P(y) $ 這是邊際分佈 $ P(x,y) $ 關於 $ y $ . 健康)狀況 $ (1) $ 表明這等於 $ \nu(y) = \nu(y^i, y^{-i}) $ .
- 你是怎麼想出來的 $ P(x^i, y^{-i}) = \sum_{x^{-i}, y^i} P(x^i, x^{-i}, y^i, y^{-i}) $ .
與第 3 點類似, $ P(x^i, y^{-i}) $ 是邊際分佈 $ P $ 關於 $ (x^i, y^{-i}) $ ,所以你必須“整合” $ (x^{-i}, y^i) $ . 由於這些是有限的,因此這僅相當於求和。