條件均值和線性
的條件均值 $ Y $ 給定 $ X $ 是:
$$ E[Y|X]=\int yf(y|x)dy $$ 與線性模型有什麼關係?我在某處讀到,當 X 和 $ Y $ 是正態的(它們的邊際分佈),那麼 $ Y $ 成為一個線性函式 $ X $ . 我怎麼能看到這個?
如果 X 和 Y 是正態的,那麼以 Y 為條件的 X 的分佈是:
$$ X | (Y = y) = N(\mu_x + \rho \frac{\sigma_x}{\sigma_y}(y - \mu_y), (1-\rho)^2 \sigma^2_x ) $$ 所以, $ E[X|Y = y] = \mu_x + \rho \frac{\sigma_x}{\sigma_y}(y - \mu_y) = (\mu_x - \mu_y (\rho \frac{\sigma_x}{\sigma_y})) + (\rho \frac{\sigma_x}{\sigma_y})y $ 這是線性的 $ y $ . 對稱:
$$ E[Y|X = x] = (\mu_y - \mu_x (\rho \frac{\sigma_y}{\sigma_x})) + (\rho \frac{\sigma_y}{\sigma_x})x $$ 這也是線性的 $ x $
一對隨機變數 $ (Y,X) $ 具有屬於橢圓對稱族和皮爾遜族(它們重疊)的聯合雙變數分佈,具有相關的條件期望函式(的 $ Y $ 給定 $ X $ 但也 $ X $ 給定 $ Y $ ) 是線性(更一般地,仿射)函式。
範例包括正態分佈和學生分佈 $ t $ -分配。其他具有仿射條件期望函式的二元分佈是 Pareto、Beta、Gamma、F-、Binomial、Poisson 和 Negative Binomial。