關於工具變數(計量經濟學)的一些混淆
正如標題所說,我對工具變數有些困惑。
根據我的講義(應該是可靠的),工具變數有兩個大特性:
- 有效性:工具變數和誤差項不相關,意味著工具變數不會直接導致因變數的變化。
- 相關性:工具變數和內生變數是相關的。
所以這是我的困惑。(讓我們表示 z 是一個工具變數)
內生變數與誤差項相關,z 與內生變數相關。
這是否意味著 z 與誤差項相關?如果是這樣,它就違反了有效性(如上所述)。
以防我的問題不夠清楚。這是我被卡住的情況:$$ score_i = \beta_0 + \beta_1 course_i + u_i $$ 在哪裡 $ course_i $ 是參加預備課程的二元變數,並且 $ u_i $ 是一個錯誤術語。
很明顯, $ course_i $ 與 $ u_i $ 因為父母的收入是不可觀察的變數之一(所以在 $ u_i $ ) 和 $ course_i $ 和父母收入是相關的(我覺得這也很明顯)。
到目前為止,我們知道父母收入(我認為這是一個工具變數)與 $ course_i $ . 但由於父母收入屬於錯誤項,違反了效度。
歡迎任何幫助。
內生變數與誤差項相關,z 與內生變數相關。
這是否意味著 z 與誤差項相關?
不,它沒有。為簡單起見,對於以均值為中心的變數,我們有線性模型,
內生性: $ E(xu) \neq 0 $
相關性: $ E(xz) \neq 0 $
上述條件不一定意味著非有效性( $ E(zu) \neq 0 $ ).
一個非常簡單的例子表明我們可能有一個有效的工具。認為 $ x, u $ 以他們的均值為中心, $ E(x) = E(u) = 0 $ , 然後 $ x $ 具有對稱分佈, $ E(x^3) = 0 $ . 假使,假設 $ E(u \mid x) = ax $ . 然後
內生性
$$ E(xu) = E\big[E(xu\mid x)\big] = E\big[xE(u\mid x)\big] = aE(x^2) \neq 0. $$
考慮候選工具 $ z = x^2 + v $ , 和 $ v $ 獨立於 $ u $ , 但 $ E(xv) \neq 0 $ . 我們有
關聯 $$ E(xz) = E(x^3) + E(xv) = 0 + E(xv) \neq 0 $$.
有效性
$$ E(zu) = E(x^2u) + E(vu) = E\big[E(x^2u\mid x)\big] + E(v)E(u) $$
$$ = E\big[x^2E(u\mid x)\big] + 0 = E\big[x^2a x\big] = aE(x^3) = 0. $$