勞動經濟學

RDD、工資和出生日期

  • January 23, 2016

**我在做什麼:**我使用回歸不連續設計(以下稱為 RDD)來研究年底出生的人和年初出生的人所獲得的工資差異。我有一個連續 5 年觀察的面板數據集並使用 Stata。我的執行變數是出生日期和日曆年結束之間的天數。截止日期是1月1日。

**問題:**我匯集了多年的觀察結果,但現在執行變數在其左側沒有任何值。

**我對這個問題提出的解決方案:**我將感興趣的時間視窗從 1 月至 12 月移至 7 月至 6 月。這意味著創建一個新的執行變數,其中 0 分配給 7 月 1 日出生的人,…,30 分配給 7 月 31 日出生的人,…,364 分配給 6 月 30 日出生的人。現在截止值是 183,仍然對應於 1 月 1 日。最後,我還按照 RDD 文獻的建議將這個新變數居中,這樣 7 月 1 日現在是 -183,1 月 1 日現在是 0,12 月 31 日是 +183。現在我在執行變數的截止值的左側和右側都有觀察結果;這個新變數還允許我以不同的頻寬執行 RDD。

我的問題:

  1. 您如何看待這個新的重新縮放的變數?這個解決方案可以被認為是不好的數據操作嗎?(例如,我是否在發明數據並獲得不反映現實的結果?)
  2. 我用的是sharp RDD,這樣合適嗎?
  3. 如果尖銳的 RDD 是合適的,我是否也應該使用模糊 RDD 作為穩健性檢查?(作為穩健性檢查,我已經使用了不同的工具,如此處提出

這個問題也出現在“交叉驗證”中。

(1) 由於 RD 設計僅在截止時確定效果(在您的情況下,正好是一年中最後一天的凌晨 12 點),我認為您刪除尾部不是數據處理問題。您的估計確實不應該對遠離截止點的觀察結果敏感,但這在一定程度上取決於您的數據的粒度以及您有多少觀察結果(很多出生數據是按季度計算的,這可能會使該策略變得困難)。

(2) 尖銳與模糊設計是指處理的分配。如果您感興趣的治療是在 12 月 31 日出生而不是 1 月 1 日出生,那麼這是一個巧妙的設計,因為執行變數確定性地分配治療。如果不遵守治療,(即您出生於 12 月 30 日,但不知何故最終得到“治療”,就好像您出生於次年 1 月一樣)這就是您將使用模糊設計的時候。

(3) Sharp RD 只是模糊 RD 的一個特例。說 $ Y $ 是您感興趣的結果(在本例中為工資), $ X $ 是您的執行變數(一年中的哪一天), $ D $ 是治療分配的虛擬變數,其中 $ D=1 $ 如果 $ X>c $ 和 $ D=0 $ 如果 $ X\leq c $ , 和 $ c $ 是截止日期(12 月 31 日)。那麼模糊設計的處理效果是(來自Lee and Lemieux 2010):

$$ \tau_{fuzzy} = \dfrac{\lim_{\varepsilon\downarrow0} \mathbb{E} \left[ Y | X = c + \varepsilon \right] - \lim_{\varepsilon\uparrow0} \mathbb{E} \left[ Y | X = c + \varepsilon \right]}{\lim_{\varepsilon\downarrow0} \mathbb{E} \left[ D | X = c + \varepsilon \right] - \lim_{\varepsilon\uparrow0} \mathbb{E} \left[ D | X = c + \varepsilon \right]} $$ 因為 $ X>c $ 定義上的意思 $ D=1 $ ,分母減少為 $ 1 $ ,給我們留下了銳利的治療效果。

引用自:https://economics.stackexchange.com/questions/10265