在兩階段最小二乘回歸的第一階段回歸中,內生性是一個問題嗎?
我們有這個模型:
$$ D=\alpha_1+\gamma_1 Z + \epsilon_1 $$
$$ Y=\alpha_2+\gamma_2 D + \epsilon_2 $$
符號和往常一樣:Y 是結果,D 是治療,Z 是儀器
文獻中工具變數起作用的兩個條件:相關性(Z 和 D 之間存在相關性)和外生性(Z 和誤差項之間沒有相關性) $ \epsilon_2 $ )
然而,似乎沒有人關心第一階段回歸的內生性,即 Z 和 $ \epsilon_1 $ . 為什麼會這樣?我從未見過任何應用微型論文來解決這個問題。
是的,這是一個問題。第一階段本身必須滿足與標準 OLS 相同的假設,並且 $ cov(Z,\epsilon_1)\neq 0 $ 會違反它們(參見 Verbeek 的現代計量經濟學指南)。
此外,實際上你提到的兩個條件是不夠的。該儀器也不應該是“弱”,即第一階段應該有 $ F $ - 上面的統計數據 $ 10 $ (根據經驗)。該儀器還應該對 $ Y $ 只有通過 $ D $ - 所謂的排除限制(參見 Angrist 和 Pischke 的 Mostly Harmless Econometrics)。
我將假設“工具變數起作用的條件”是指“工具變數是一致的”。但是,還有其他屬性需要考慮,例如小樣本中的性能等。 $ \newcommand{\Cov}{\text{Cov}} $
在這個簡單的例子中,大小樣本中的 IV 估計量 $ n $ 是 $$ \hat \gamma_2 = \frac{\sum_{i=1}^n (Z_i - \bar Z)(Y_i - \bar Y)}{\sum_{i=1}^n (Z_i - \bar Z)(D_i - \bar D)}. $$ 為了使工具變數估計量一致,我們只需要 $$ \text{Cov}(Z, \epsilon_2) = 0 \quad \text{ (instrument exogeneity)} \tag{1} $$ 和 $$ \text{Cov}(Z, D) \neq 0. \quad \text{ (instrument relevance)} \tag{2} $$ 只要滿足這些條件,沒關係 $ Z $ 與 $ \epsilon_1 $ . IV 估計量將是一致的。為了看到這一點,讓我們根據人口分析模型, $$ \begin{align} \Cov(Z,Y) &= \gamma_2 \Cov(Z, D) + \Cov(Z, \epsilon_2), \end{align} $$ 並解決 $$ \gamma_2 = \frac{\Cov(Z, Y)}{\Cov(Z, D)} - \frac{\Cov(Z, \epsilon_2)}{\Cov(Z, D)}. $$ 如果條件(1)和(2)成立,那麼 $ \frac{\Cov(Z, \epsilon_2)}{\Cov(Z, D)} = 0 $ 和 IV 估計
$$ \gamma_2 = \frac{\Cov(Z, Y)}{\Cov(Z, D)} $$ 是明確的。估計是一致的,因為機率限制是人口模擬, $$ \hat \gamma_2 \overset{p}{\rightarrow} \frac{\Cov(Z, Y)}{\Cov(Z, D)} = \gamma_2. $$
請注意,一旦我們放寬以下假設,弱工具就會成為問題 $ \text{Cov}(Z, \epsilon_2) = 0 $ 確切地說,正如您在分析小樣本中估計器的屬性時可能想要做的那樣。
那麼,如果 $ Z $ 與 $ \epsilon_1 $ ? 嗯,這意味著回歸 $ D $ 到 $ Z $ 將給出一個有偏見和不一致的估計 $ \gamma_1 $ . 但是,IV 的通常假設是您並不真正關心估計 $ \gamma_1 $ . 你想要一致地估計 $ \gamma_2 $ ,只要假設(1)和(2)成立,您就可以做到,如上所示。