計量經濟學

xtreg、areg、reghdfe 之間的主要區別是什麼?

  • June 22, 2021

通常,當我在 Stata 中使用這三個命令(xtregaregreghdfe)對面板數據進行回歸時,變數係數的結果非常相似;唯一的區別在於R-squareintercept。我想知道這三個程式碼的主要區別是什麼?

除了aregor跑的結果reghdfe比 in 高很多,那麼使用or而不是xtreg上報結果有什麼限制嗎?areg``reghdfe``xtreg

xtreg 回歸:

xtset TYPE2 yr

xtreg y x i.yr, fe

雷格回歸:

areg y x i.yr, a(TYPE2)

reghdfe 回歸

reghdfe y x, a(TYPE2 yr)

我在這裡看到了一個關於 areg 和 xtreg 之間截距差異的小解釋

xtreg

xtreg是面板回歸的通用命令。面板回歸將具有以下一般形式(參見stata 手冊):

$$ y_{it} = α + \mathbf{x_{it}β} + ν_i + \epsilon_{it} $$

在哪裡 $ y_{it} $ 是因變數 $ x_{it} $ 自變數, $ \alpha $ 是恆定的, $ \beta $ 參數, $ v_i $ 是固定效應和 $ \epsilon $ 錯誤術語。

根據您選擇的選項xtreg可以是:

  1. 固定效應模型 xtreg dep var ind var, fe - 此估計在估計器中使用:

$$ (y_{it} − \bar{y}i) = (x{it} − \bar{x}i)β + (\epsilon{it} − \bar{\epsilon}_i) $$

  1. 隨機效應模型 xtreg dep var ind var, re,mle,pa- 此估計使用由下式給出的隨機效應估計量:

$$ (y_{it} − θ\bar{y}i) = (1 − θ)α + (x{it} − θ\bar{x}i)β + (1 − θ)ν_i + (\epsilon{it} − θ\bar{\epsilon}_i) $$

在哪裡 $ θ $ 是一個函式 $ \sigma_ν^2 $ 和 $ \sigma_\epsilon^2 $ . 您可以將其視為 FE 估計器的“加權”版本。事實上如果 $ \sigma_ν^2= 0 \implies \theta=0 $ 所以這個估計量變成了正常的多元回歸,如果 $ \sigma_\epsilon=0 \implies \theta=1 $ 這在上述估計器內。

和選項還估計隨機效應模型mlepa前者估計最大概似隨機估計量,後者估計總體平均模型。我不會討論這些變體,因為它超出了這個答案的範圍,但它們只是上面的變體。

  1. 效果之間模型 xtreg dep var ind var, be使用之間的估計器,它使用:

$$ \bar{y}_i = α + \bar{x}_iβ_1 + ν_i + \bar{\epsilon}_i $$

這裡的平均值是跨時間計算的,例如 $ \bar{y_i} = \frac{\sum_t y_{ti}}{(n-1)} $

雷格

areg是估計吸收一個分類因素的線性回歸的命令(參見stata 手冊)。這在您面對模型時使用,例如:

$$ y = Xβ + d_1γ_1 + d_2γ_2 + · · · + d_kγ_k + \epsilon $$

在哪裡 $ d_1,…,d_k $ 是一些假人。

上面的模型原則上可以通過正則回歸和 statareg命令擬合,但如果 $ k $ 太大,您將超過 stata 的設置 mat 大小(即對矩陣大小的限制,stata 的學生版具有特別小的 mat 大小,這很容易成為問題,小型 stata 只能具有 100 的 matsize 和 stata IC只有 800 <- 這是與 stata 以及他們如何“推動”人們購買更大版本的獨特問題)。

areg``areg通過吸收假人來規避 matsize 問題,兩者之間沒有其他顯著差異reg

高鐵

reghdfe根據此使用者編寫命令的作者,通過實施 Correia (2015) 的估計器,執行具有多個級別的固定效應的線性和工具變數回歸,請參見此處

根據作者的說法,reghde是固定效應模型的泛化,因此xtreg ..., fe. 在這裡,該命令被概括為允許多個固定效果,因此您可以執行以下命令:

$$ Y = Zβ + D_1α + D_2γ + \epsilon $$

兩者都在哪裡 $ D_1 $ 和 $ D_2 $ 是固定的面板效果,但具有不同的維度。

此外,該命令允許對錯誤進行多路分群。錯誤分群是控制異變異數和自相關的技術。xtreg只允許單向分群,例如,在學生的學業成績回歸某些教育政策時,您可以在學校層面進行分群,這將允許分群內錯誤的異變異數性。多路分群允許您向這些分群添加額外的層,因此您可以在縣級或按年等額外分群。

差異

顯然,上述所有估算器之間存在一些差異,不可能在一篇 SE 文章中將它們全部總結。

(非常)廣義地說:

  • 在估計器內 - 在估計器內,所有小組成員都被分配fixed了捕捉時間不變不可觀察量的效果。這個估計器的一個問題是它不能處理時間不變的回歸器(與我們說的隨機效應估計器相反)。
  • 隨機效應估計器 - 隨機效應估計器允許partial pooling組效應估計部分來自更豐富組的資訊。與完全匯集所有組(即固定效應)相比,這可能具有優勢,因為這可以hide組級別的變化,並且單獨估計所有小組/組成員的效應可能會為低樣本組提供較差的估計。此外,這個估計器還可以處理更豐富的模型規範(例如,甚至是時間不變的回歸器等),但這些優勢也以更容易成為一些微妙偏差的犧牲品為代價(參見此處的討論)。
  • 效果估計器之間是固定效果估計器的“對立面”。而固定效應估計器本質上利用面板的時間序列資訊,而效應之間的估計器利用面板的橫截面資訊。大多數時候我們對效果感興趣 $ x $ 在 $ y $ 在特定個體上,當固定效應更合適時,但在您主要對兩個個體之間的差異感興趣的情況下 $ x $ 效果之間會更合適。
  • areg只是reg帶有吸收的虛擬變數,當您想要估計任何帶有太多虛擬變數的回歸時,您可以使用它,因為 stata 無法處理其 matsize 限制(例如各種匯集橫截面模型)。如果您有小型/IC 版本的 stata 或使用非常大的面板,這主要是有用的。
  • reghdfe是它的擴展xtreg ..., fe,允許您添加更多固定效果和更多分群,這在適當的情況下很重要。

您獲得相似結果的原因是,根據您估計這些模型的方式,它們可能會為您提供非常相似的估計量。

例如,內部估計器xtreg ..., fe本質上等同於為每個小組成員執行帶有假人的池 OLS,並且可以通過regareg取決於您如何指定假人來實現相同的結果。此外,根據reghdfe您再次設置的方式,您最終可能會在估算器中獲得固定效果。如果你讓所有變數都只是它們自己的工具,如果你不使用任何花哨的雙向效應或分群,那麼在這些情況下你應該不會看到太大的差異,否則它們是不同的估計量。

此外,要記住的一個重要警告是,這些只是模型之間的表面水平差異。當您查看每個估算器的“幕後”時,還有更多資訊(請參閱連結的來源)。通常,您不應將它們用作彼此的替代品,而應根據您面臨的特定問題的詳細資訊以及您有興趣發現的內容來使用它們。

引用自:https://economics.stackexchange.com/questions/45417