回歸

我可以使用計算數據進行回歸嗎

  • February 24, 2017

我可以使用計算數據進行回歸分析嗎?

案例一:首次執行OLS $ y = \alpha+\beta x $ ,並得到 $ \hat\beta $ , 然後計算 $ z = h^\hat\beta $ , 最後執行 $ m = \gamma + \mu z $ .

案例2:按照與案例1相同的設置,執行 $ z = \zeta + \rho p $ .

案例3:使用matlab求解方程 $ k_i = \sum_j d_{ij} k_j $ 為了 $ k_i $ ,然後執行 $ w = \theta + \pi k $ .

在哪裡 $ \alpha $ , $ \beta $ , $ \gamma $ , $ \mu $ , $ \zeta $ , $ \rho $ , $ \theta $ ,和 $ \pi $ 是係數,其他字母表示變數。我有變數 y,x,h,m,p, $ d_{ij} $ ,w。變數之間的所有關係都來自模型。

它們是我遇到的獨立案例。

我要估計係數 $ \mu $ , $ \rho $ ,和 $ \pi $ .

恐怕公認的答案不夠精確,並且可能會產生嚴重的誤導。

這個問題正式稱為生成回歸問題,當我們在回歸中使用“生成”回歸量時會出現。這是赫克曼選擇模型等估計的一個非常常見的特徵,我們使用結構方程中的選擇方程預測的逆米爾斯比。我們需要將問題分為兩部分:

  • 一致性:在估計中使用生成的回歸量時通常沒有一致性問題。正式證明可以在 Wooldridge (2010),第 123 頁找到。
  • 統計推斷:這裡可能有問題。生成的回歸量為零的空值下,標準誤和所有測試都是有效的(您可能仍需要像往常一樣使用穩健的標準誤來糾正異變異數性和序列相關性)。但是,如果生成的回歸量在統計上是顯著的,那麼標準誤差和任何測試都是無效的。您需要的是對漸近變異數的正確估計。公式取決於每種情況(Newey 和 McFadden 中的更多資訊

$$ 1994 $$)。但是,計算一致標準誤差的一般解決方案是使用bootstrapping。順便說一句,例如,如果您使用 Stata,只需在之前使用以下程式碼執行您的普通命令:

bootstrap, reps(400) seed(10101): regres ...

reps是重複次數,seed是為了重現性。

TL;博士

如果您生成的回歸量在回歸中具有統計顯著性,那麼您需要使用boostrapping估計標準誤,因為它們是無效的。如果它們微不足道,那麼您是安全的。

引用自:https://economics.stackexchange.com/questions/12949