計量經濟學

為什麼我們需要在雙向固定效應模型中添加與公司和年份相關的自變數?

  • June 5, 2021

據我所知,這些術語在計量經濟學中非常基礎,但我還沒有完全理解。對我來說,年份固定效應是控制時變的遺漏變數,而固定效應是控制時不變的遺漏變數。

當雙向固定效應同時控制時變和非時變變數時,為什麼研究人員還要包括一些自變數?簡而言之,當時變和非時變變數已由時間和年份固定效應控制時,添加其他控制變數是否多餘?

除此之外,我可以要求一些例子來澄清這些我可以更好地理解“公司固定效應”和“年份固定效應”的上下文嗎?

考慮以下回歸規範,其中,[Math Processing Error] $ t $ 是時間,[Math Processing Error] $ c $ 是公司,[Math Processing Error] $ y $ 是一個結果,並且 $ x $ 是一個感興趣的變數。

$$ y_{c,t} = \alpha + \beta x_{c,t} + \varepsilon_{c,t} $$ 遺漏變數分為三種:

  1. 隨時間變化的變數,但在不同公司之間是相同的。範例可能是天氣條件通貨膨脹率利率工資需求衝擊(如果公司在同一市場上經營)讓我們稱之為[Math Processing Error] $ \gamma_t $ 只有一個下標[Math Processing Error] $ t $ 表示它們僅隨時間變化。
  2. 隨公司變化但隨時間不變的變數。範例可以是公司位置,或品牌形象生產力(如果隨著時間的推移保持不變)等。讓我們稱之為[Math Processing Error] $ \delta_c $
  3. 隨公司和時間變化的變數。例子可能是企業產出利潤。讓我們稱這些[Math Processing Error] $ \chi_{c,t} $ .

由於所有這些變數都被省略了,它們進入了誤差項[Math Processing Error] $ \varepsilon_{c,t} $ , 所以:

$$ \varepsilon_{c,t} = \delta_c + \gamma_t + \chi_{c,t} $$ 這種分解總是可以通過設置[Math Processing Error] $ \delta_c $ 成為期望[Math Processing Error] $ \varepsilon_{c,t} $ 有條件的 $ c $ 和[Math Processing Error] $ \gamma_t $ 成為期望 $ \varepsilon_{c,t} $ 有條件的[Math Processing Error] $ t $ . 特別是,讓[Math Processing Error] $ \varepsilon_{.t} $ 是條件均值[Math Processing Error] $ \varepsilon $ 在[Math Processing Error] $ t $ , 和[Math Processing Error] $ \varepsilon_{c.} $ 條件均值[Math Processing Error] $ c $ . 我們有: [Math Processing Error]$$ \varepsilon_{c,t} = \underset{\delta_c}{\underbrace{\varepsilon_{c.}}} + \underset{\gamma_t}{\underbrace{\varepsilon_{.t}}} + \underset{\chi_{c,t}}{\underbrace{(\varepsilon_{c,t} - \varepsilon_{c.} - \varepsilon_{.t})}}. $$ 為了能夠得到一個好的估計[Math Processing Error] $ \beta $ 在原始回歸中,您必須假設[Math Processing Error] $ \varepsilon $ 和[Math Processing Error] $ x $ 是正交的:

[Math Processing Error]$$ \mathbb{E}(\varepsilon x) = 0. $$ 使用上面的分解,這給出了以下要求: [Math Processing Error]$$ \mathbb{E}(\delta x) + \mathbb{E}(\gamma x) + \mathbb{E}(\chi x) = 0 $$ 現在,您可能會擔心這不成立。

固定效應提供了一種解決此問題的方法,只要正交性條件仍然適用於第 3 類遺漏變數,即只要:

[Math Processing Error]$$ \mathbb{E}(\chi x) = 0 $$ 確實,寫出錯誤項 $ \varepsilon_{c,t} $ 在回歸中我們得到: $$ y_{c,t} = \alpha + \delta_c + \gamma_t + \beta x_{c,t} + \chi_{c,t}. $$ 這 $ \delta_c $ 和 $ \gamma_t $ 術語由公司和時間固定效應假人擷取,因此我們可以辨識只要 $ x $ 正交於 $ \chi $ . 另一種看待它的方式 $ \beta $ 確定的是首先取所有公司、時間段和時間和公司的回歸的平均值。這給出了:

$$ \begin{align*} &y_{.t} = \alpha + \gamma_t + \beta x_{.,t},\ &y_{c.} = \alpha + \delta_c + \beta x_{c.},\ &y_{..} = \alpha + \beta x_{..} \end{align*} $$ (請注意 $ \chi_{c.} = \chi_{.t} = \chi_{..} = \delta_. = \gamma_. = 0 $ 作為, $ \chi_{c,t} = \varepsilon_{c,t} - \varepsilon_{.t} - \varepsilon_{c.} $ ) 添加原始回歸的最後一個並減去前兩個回歸得到:

$$ (y_{c,t} + y_{..} - y_{c.}- y_{.t}) = \beta(x_{c,t} + x_{..} - x_{c.} - x_{.t}) + \chi_{c,t} $$ 所以[Math Processing Error] $ \beta $ 通過回歸確定 $ y_{c,t} + y_{..} - y_{c,.} - y_{.t} $ 在 $ x_{c,t} + x_{..} - x_{c.} - x_{.t} $ .

當雙向固定效應同時控制時變和非時變變數時,為什麼研究人員還要包括一些自變數?簡而言之,當時變和非時變變數已由時間和年份固定效應控制時,添加其他控制變數是否多餘?

現在重要的是要將所有其他適合上述第三類的自變數添加到回歸中,特別是如果您認為它們不滿足正交性條件。例如,如果你認為[Math Processing Error] $ y $ 直接受公司利潤的影響(這是時間和公司變化的,因此由[Math Processing Error] $ \chi $ ) 然後[Math Processing Error] $ x $ 也與公司利潤相關,您將無法辨識[Math Processing Error] $ \beta $ 如果你不為堅定的利潤觀察和控制。

引用自:https://economics.stackexchange.com/questions/44295