回歸

為什麼我們需要控制年份和行業固定效應的相互作用?

  • May 15, 2021

通常,我們控制公司和年份的固定效應,但在某些情況下,我看到人們控制公司以及 yearxindustry 或公司和 yearxregion 的固定效應。你能提示我為什麼他們需要這樣做嗎?

當您控制的不僅僅是年份固定效應,而是年份-地區或年份-行業時,它會增加靈活性。

年份固定效應以靈活的方式控制時間趨勢,並且比例如假設時間趨勢是線性的更靈活 - 限制更少 $ a \cdot t $ , 二階多項式 $ at + bt^2 $ , 指數 $ exp(at) $ 等等。

儘管如此,與年份-地區或年份-行業相比,年份固定效應仍然具有限制性,因為假設所有地區或所有行業的時間趨勢相同,而不是允許不同地區遵循不同的趨勢或不同的行業。

例如這裡考慮這個情節

在此處輸入圖像描述

並假設它顯示了一段時間內女性的平均工資(紅色)和男性的平均工資(黑色)。

然後我們得出結論,性別工資差距正在縮小。然而,有人接著指出,情況並非如此,因為雖然女性工人隨著時間的推移平均與男性工人一樣,但這僅僅是因為女性工人已經從主要在低工資行業工作轉變為在高工資行業工作。工資行業。

當然,您很敏銳,並且您對行業進行回歸控制

$$ \log y_{it} = \beta_0 + \alpha \cdot \text{male}{it} + \lambda \cdot \text{industry}{it} + \delta_t + \epsilon_{it} $$

這是一個好主意,對於用於生成上面圖的模擬數據,然後得到一個估計值 $ \hat \alpha = 3.05 $ 清楚地表明男性工人的工資高於女性工人。

然而,真正的 $ \alpha $ 實際上更大並且等於 $ 4 $ 所以你仍然低估了女性工人在勞動力市場上受到歧視的程度。

在此範例中,發生這種情況是因為:

隨著時間的推移,高工資部門的工資增長速度快於低工資部門的工資。因此,雖然隨著時間的推移,女性轉向高工資部門,但您對部門效應的控制不足,因為早年部門之間的差異很小,使部門效應向下偏斜。

在這種情況下,為了獲得無偏估計,您應該做的是執行回歸

$$ \log y_{it} = \beta_0 + \alpha \cdot \text{male}{it} + \lambda{st} + \epsilon_{it} $$

在哪裡 $ \lambda_{st} $ 是扇區時間固定效應。

您可以使用以下程式碼在 R 中模擬此範例

library(data.table)
library(lfe)
N1 <- 1000
N2 <- 1000
N <- N1+N2
T <- 10
b0 <- 1

# a1 is the true gender effect
a1 <- 4

gender <- rep(c(rep(0,N1),rep(1,N2)),T)
a2 <- rep(1:T * 2,N)
dt <- data.table(id=rep(1:N,each=T),time=rep(1:T,N),gender=gender)
setkey(dt,time,gender)  
industry <- c()
for (t in 1:T)
   {
       temp1 <- sample(c(0,1),N1,replace=TRUE,prob=c(0.5,t/T))
       temp2 <- sample(c(0,1),N1,replace=TRUE,prob=c(0.5,0.5))
       industry <- c(industry,temp1,temp2)
   }
dt$industry <- industry
setkey(dt,id,time)
dt$log_y <- b0 + a1*dt$gender + a2*dt$industry + 0.3*dt$time + rnorm(N*T)
foo <- dt[,.(m_wage=mean(log_y)),by=.(time,gender)]
plot(1:T,foo[gender==0,]$m_wage,ylim=c(0,20),col="red",type="l")
points(1:T,foo[gender==1,]$m_wage,type="l")

dt$i_time <- interaction(dt$time,dt$industry)
# Regression with industry dummy

summary(felm(log_y ~ gender+industry|time,data=dt))
#          Estimate Std. Error t value Pr(>|t|)    
# gender    3.05645    0.04164   73.41   <2e-16 ***
# industry 11.13346    0.04215  264.12   <2e-16 ***

# Regression with industry time fixed effects
summary(felm(log_y ~ gender |i_time,data=dt))

#        Estimate Std. Error t value Pr(>|t|)    
# gender  4.00873    0.01443   277.7   <2e-16 ***


savePlot("male_female.jpg",type="jpg")

引用自:https://economics.stackexchange.com/questions/43952