解釋:具有單位虛擬變數和時間虛擬變數的線性回歸
假設我有一個包含 N 個單位和 T 個時間段的面板數據。
- 對於只有單位假人的模型 1: $$ y_{it} = \text{intercept} + \beta_1 x_{it} + \sum_{j = 2}^{N}\delta_j I\left(i = j\right) + \text{error}, $$ 最小二乘估計 $ \beta_1 $ 僅使用單位內的跨時間變化 $ x $ .
- 對於只有時間假人的模型 2: $$ y_{it} = \text{intercept} + \beta_2 x_{it} + \sum_{k = 2}^{T}\gamma_k I\left(t = k\right) + \text{error}, $$ 最小二乘估計 $ \beta_2 $ 僅使用時間範圍內的跨單位變化 $ x $ .
- 對於具有單位和時間假人的模型 3: $$ y_{it} = \text{intercept} + \beta_3 x_{it} + \sum_{j = 2}^{N}\delta_j I\left(i = j\right) + \sum_{k = 2}^{T}\gamma_k I\left(t = k\right) + \text{error}, $$ 最小二乘估計 $ \beta_3 $ 顯然不使用單位內的時間變化 $ x $ ,因為數據集中不存在這樣的變化。
我的問題是:模型 3 中使用的變化究竟是什麼?
我知道對於模型 3,我們基本上是在貶低 $ x $ 和 $ y $ 以類似的形式
$$ \tilde{x}{it} = \left(x{it} - \bar{x}_i \right) - \left(\bar{x}_t - \bar x \right), $$ 在哪裡 $ \bar {x} _i $ , $ \bar {x} _t $ , 和 $ \bar {x} $ 是單位內平均數、時間內平均數和總平均數 $ x $ . 使用模型 3 的經濟學家經常鬆散地說他們“已經控制了單位固定效應和時間固定效應”,但“控制 x”通常具有其他條件不變的解釋,這意味著我們在具有相同 x 值的組內進行比較。請參閱此答案以獲取不錯的展示文稿。我正在尋找比“控制單位固定效果和時間固定效果”更精確的直覺和詳細的解釋。
模型 3 中使用的單位和時間假人的變化究竟是什麼?
用於辨識的變異 $ \beta_3 $ 基本上是個體水平偏離當年個體平均值和個體平均值的個體水平偏差。因此,如果您感興趣的變數隨時間而變化,但不會在個體之間以不同的方式變化,您將無法檢測到它的影響。
使用模型 3 的經濟學家經常鬆散地說他們“已經控制了單位固定效應和時間固定效應”,但“控制 x”通常具有其他條件不變的解釋,這意味著我們在具有相同 x 值的組內進行比較。請參閱此答案以獲取不錯的展示文稿。我正在尋找比“控制單位固定效果和時間固定效果”更精確的直覺和詳細的解釋。
需要明確的是,當我們在計量經濟學中說單位固定效應時,我們指的是因變數的任何時間不變的觀察到或未觀察到的行列式。很容易表明,所有這些都被個人層面的貶低“抹殺”了。個體水平的貶低還控制了個體間觀察到和未觀察到的自變數的平均差異。模型中的個體固定效應意味著任何偏差來源都必須隨時間變化。因此,如果有人認為您的變數是內生的,因為您的樣本中的某些變數是恆定的,那麼您已經通過僅使用隨時間的變化來辨識您的點估計來控制這一點。
因此,通過包含這些單獨的固定效應,您可以專注於確定確定自變數的時變協變數。時間固定效應將消除在給定時間段內對所有個體都相同的變數的任何變化。例如,如果“個人”被歸為同一個州或市,並且該年對所有個人的州或市政策發生了一些變化,那麼時間固定效應可以去除這些影響而無需測量它們. 這只留下了對在不同個體中具有不同時間路徑的變數的關注。
因此,在時間和麵板固定效應的情況下,要確定您感興趣的變數的影響,撇開外生性問題不談,該感興趣的變數必須
- 隨時間變化
和
- 個體間的時間路徑存在差異(即個體異質性,必須在 $ it $ 不僅是同質的 $ i $ 之內 $ t $ .)
因此,我們確實“控制”了那些時間不變的未觀察到的混雜因素,以及具有面板固定效應的個體之間觀察到的因素的平均差異。我們確實在“控制”協變數,這些協變數在給定的一年內具有個體間的共同變化,具有時間固定效應。
讓 $ y_{it}=\beta_i+\lambda_t+X_{it}\beta+\epsilon_{it} $ 成為規範 $ i=1\dots N $ 和 $ t=1\dots T $ .
最初,您進行面板貶低,這會創建轉換後的變數
$ \overset{..}{y}=(y_{it}-\overline{y_i})=\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{panel demeaned time dummies}+\text{other demeaned terms unrelated to year FE} $ .
這消除了 $ \beta_i $ ,以及任何其他時間不變的混雜因素。
然後你貶低FE年,做轉型 $ \overset{…}{y}=\overset{..}{y_i}-\overline{y_t} $ 在哪裡 $ \overline{y_t}=\frac{1}{N}\sum_{j=1}^{N}y_{jt} $ .
$ =\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-\frac{1}{N}\sum_{i=1}^{N}(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{want to show this = 0}+\text{other demeaned terms unrelated to year FE} $
. .
自從 $ \lambda_t $ 對所有人來說都是共同的 $ i $ 在某一年, $ \sum_{i=1}^{N} \lambda_t=N\lambda_t $ 同樣對於 $ \sum_{i=1}^{N}\frac{1}{T}\sum_{j=1}^{T}\lambda_j=N \frac{1}{T}\sum_{j=1}^{T}\lambda_j $
. .
$ =(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-\frac{1}{N}(N \lambda_t -N \frac{1}{T}\sum_{j=1}^{T}\lambda_j)+\text{other demeaned terms unrelated to year FE} $
. .
分發 $ \frac{1}{N} $
. .
$ =\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{=0}+\text{other demeaned terms unrelated to year FE} $
$ =\text{other demeaned terms unrelated to year FE} $