計量經濟學

虛擬變數的係數是否可以接收大於 1 的值並使用 log 表示每百萬變數?

  • September 20, 2021

今天,當我執行回歸時(在特定的差異中,但我認為這無關緊要)。我的結果變數是一個比率(低於 100 萬,大約是每百萬人中的人數)。

我在這裡有兩個問題:

  1. 我是否應該使用 log 作為這個結果變數,因為我不確定它是一個比率還是實際值(與我的比率通常是百分比,而不是像這樣的百萬分之一)?
  2. 我用上面的結果進行回歸,虛擬變數的係數為 2(高於 1),是否異常?(這裡的 dummy 只接收 0 和 1 的值)

考慮一個帶有虛擬變數的回歸: $$ y_i = \alpha + \beta D_i + \varepsilon_i. $$ 然後 $ \beta $ 將通過以下方式辨識: $$ \mathbb{E}(y_i|D_i = 1) - \mathbb{E}(y_i| D_i = 0) = \beta $$

  1. 我是否應該使用 log 作為這個結果變數,因為我不確定它是一個比率還是實際值(與我的比率通常是百分比,而不是像這樣的百萬分之一)?

這取決於你想要什麼。如果你按原樣測量,你會得到 $$ \beta = \mathbb{E}(y_i | D_i = 1) - \mathbb{E}(y_i|D_i = 0). $$ 如果您在日誌中測量,您正在估計: $$ \tilde \beta = \mathbb{E}(\ln(y_i)|D_i = 1) - \mathbb{E}(\ln(y_i)|D_i = 0). $$

  1. 我用上面的結果進行回歸,虛擬變數的係數為 2(高於 1),是否異常?(這裡的 dummy 只接收 0 和 1 的值)

是的, $ \beta $ 如果範圍可以大於 1 $ y_i $ 超出單位區間。另一方面,如果 $ y_i $ 介於 0 和 1 之間,則 $ \beta $ 通常也應該介於 $ 0 $ 和 $ 1 $ 那時 $ 0 \le \mathbb{E}(y_i|D_i = 1), \mathbb{E}(y_i|D_i = 0) \le 1 $ .

在你的情況下, $ y_i $ 介於 0 到 100 萬之間,因此不滿足這些界限。

引用自:https://economics.stackexchange.com/questions/47616