隨機抽樣會導致零條件均值嗎?
在我的發展經濟學課的講義中,它說
" 在回歸模型中:Yi = β0 + β1Xi + ui,
如果 Xi 是隨機分配的,則 Xi 與 ui 無關,即 E(ui|Xi) = 0,因此 OLS 產生 β1 的無偏估計量。"
教授在他的演講錄音中也說了同樣的話。
我真的不明白這個說法,因為在計量經濟學(線性回歸部分)中,我認為隨機抽樣和零條件均值(E(ui|Xi) = 0)是導致 OLS 無偏估計量理論的兩個獨立假設,而不是一個影響對方。
但是講義是說隨機抽樣導致條件均值為零,而不是我之前認為這兩者是單獨的假設,它們一起用於推導無偏性。
隨機抽樣實際上導致零條件均值的講義是否正確?如果是的話,誰能向我解釋為什麼會這樣,而不是像標準計量經濟學教科書中所說的那樣,它們是兩個獨立的假設?
隨機抽樣導致樣本Xi s 是 iid 但這仍然與****ui沒有任何關係,我認為這就是為什麼添加了零條件均值的額外假設以確保 OLS 的無偏性。如果有人能告訴我講義在這裡想說什麼,我將不勝感激。
這 $ E(u_i|X_i) = 0 $ 即使沒有簡單的隨機樣本或隨機分配也可以成立。但是,隨機分配保證這將保持(在預期中)。違反 $ E(u_i|X_i) \neq 0 $ 通常是遺漏變數偏差的結果。例如,在教育對工資的回歸中,為什麼 $ E(u_i|X_i) \neq 0 $ 可能是經驗也會影響工資,如果受過不同教育的人有不同的經驗,這將導致 $ E(u_i|X_i) \neq 0 $ .
隨機分配 $ X $ 解決了這個問題。例如,讓我們考慮 $ X_i $ 待治療狀態 $ X_i = {0,1} $ 繼 Angrist 和 Pischke Mostly Harmless Econometrics 之後。現在讓 $ Y_{i} $ 是潛在的結果基於 $ X_i $ 所以我們有:
$$ Y_i \begin{cases} Y_{1i} \text{ if } X_i=1 \[2ex] Y_{0i} \text{ if } X_i=0 \end{cases} $$
因此,觀察到的結果將由以下方式給出:
$$ Y_{i} = \underbrace{Y_{0i}}{\beta_0 } + \underbrace{(Y{1i}-Y_{0i})}_{\beta_1}X_i\tag{1} $$
現在上面的期望符號意味著:
$$ \underbrace{E[Y_i | X_i = 1] - E[Y_i | X_i = 0]}{\text{observed difference}} = \underbrace{E[Y{1i} | X_{i} = 1] - E[Y_{0i} | X_i = 0]}{\text{Average treatment Effect on Treated}} + \underbrace{E[Y{0i} | X_{i} = 1] - E[Y_{0i} | X_i = 0]}_{\text{Selection Bias}} \tag{2} $$
選擇偏差的存在會導致 $ E(u_i|X_i) \neq 0 $ .
但是,請注意,如果我們使用隨機分配 $ X_i $ 它消除了問題,因為它使 $ X_i $ 獨立於潛在的結果。如果他們是獨立的,那麼 $ E[Y_{0i} | X_i = 1] = E[Y_{0i} | X_i = 1] $ . 將其代回 2 我們得到:
$$ E[Y_i | X_i = 1] - E[Y_i | X_i = 1]= E[Y_{1i} | X_{i} = 1] - E[Y_{0i} | X_i = 1] \ = E[Y_{1i}- Y_{0i} | X_{i} = 1] \ = E[Y_{1i}- Y_{0i}] . $$
這消除了選擇偏差並確保 $ E(u_i|X_i) = 0 $ (雖然注意隨機分配不是靈丹妙藥,但可能仍然存在各種不同的問題)。