如何通過交錯執行法律來證明差異中的差異的治療組和對照組的合理性?
A. 背景:
Dong, 2019和Dasgupta, 2019使用相同的方式來生成治療組和對照組,因為他們都了解了相同規律對不同因變數的影響。我檢索了有關Dasgupta, 2019, p. 的資訊。2596-2597創建他們的樣本如下:
基線辨識:
$ Y_{it} $ = $ \alpha $ + $ \beta $ $ (Leniency Law){kt} $ + $ \delta $ $ X{ikt} $ + $ \theta $ $ _t $ + $ \gamma $ $ _i $ + $ \epsilon $ $ _{it} $ (1)
在哪裡 $ i $ , $ k $ , 和 $ t $ 指數公司、國家和年份。 $ X_{ikt} $ 是不同公司、國家和行業控制的向量,而 $ \gamma $ 和 $ \theta $ 是固定效應和年份固定效應。
這裡感興趣的變數是 $ (Leniency Law)_{kt} $ . 達斯古普塔,2019 年,第。2597記載,在國家從寬處理法通過之前,這個變數等於0 $ k $ ,然後是 1。他們遵循標準的差異化方法,交錯執行法律(Bertrand,2003)來建構治療組和對照組。
B. 作者簡介:
處理組包括總部位於在 t 年之前通過了寬大處理法的國家的所有公司。控制組包括在我們的樣本期間從未採用過寬大處理法的國家的公司和總部設在後來某個時間點採用寬大處理法的國家的公司。
C. 討論:
- 控制組是否包括在較早時間實施該法律的國家的公司?我的理解是:例如,來自Table 2, Dasgupta, 2019, p. 2599年,韓國於 1997 年通過了該法律,因此,控制組包括 1995 年至 2002 年期間未實施該法律的所有國家的所有公司,包括美國。在我看來,應該是這樣,因為基於這種辨識,美國的公司不會受到韓國基於這種辨識策略通過的法律的影響,因此這些美國公司在 1995-1996 和 1998-2002韓國的對照觀察。但如果是這樣,他們為什麼要寫下“在以後的某個時間點通過了寬大處理法”?? 因為在韓國的情況下,“我們的樣本期”這個詞已經意味著“1995-2002”。
- 是不是意味著只有 $ (Leniency Law)_{kt} $ 法律通過後的治療組的值是 1?除此之外,法律通過前的對照組和治療組的值為 0?
- 想像兩個案例:(1)德國和巴西都在 2000 年實施了這項法律,(2)只有德國在 2000 年實施了這項法律。那麼這兩個案例的對照組觀察次數是否相同?
- 因此,澳大利亞和比利時分別於 2003 年和 2004 年通過了該法律。那麼,馬來西亞的公司在控製樣本中只存在一次嗎?我的意思是,在這個 DiD 設置中,一個觀察是否可以控制許多治療?(意味著沒有重複的對照觀察)。
- 以上是他如何根據自己的身份對控制和處理進行分組,但在2019 年 Dasgupta 的第 2600 頁第 3.1 節中說:“控制公司都是 7 年內未通過寬大處理法的國家的同一行業的公司圍繞活動日期”。這種辨識讓我感到困惑,因為現在我們對這個行業有了更多的了解。我想知道為什麼他們沒有把它放在基線辨識中,而是放在結果部分?這背後的原因是什麼?
- $$ W $$為什麼他們需要寫下“在以後某個時間點通過了寬大處理法”?因為在韓國的情況下,“我們的樣本期”這個詞已經意味著“1995-2002”。
假設韓國是最早採用的國家,那麼在 1997 年之前未接受治療的所有國家都可以作為反事實。這包括從未通過寬大處理法的國家和即將實行治療採用期的國家。
- 是不是意味著只有 $ (𝐿𝑒𝑛𝑖𝑒𝑛𝑐𝑦𝐿𝑎𝑤)_{𝑘𝑡} $ 法律通過後的治療組的值是 1?除此之外,法律通過前的對照組和治療組的值為 0?
正確的。
這種更一般設置中的二元處理變數與“經典”差異差異情況下的變數不同。假設 2000 年處理國家內的所有公司都支持寬大處理法。在這種情況下,您可以更簡單地寫出這個方程,因為在法律生效後處理控制虛擬變數和處理後指標之間的互動作用等於 1兩組均有效,否則為 0。然而,一旦我們離開這個設置並且治療的推出是交錯的,甚至隨著時間的推移切換“開”和“關”,那麼“治療後”變數就不再是明確定義的。要繼續,我們必須使用“廣義的”差異中的差異估計器,它以不同的方式定義乘積項。
在您引用的等式中,互動項隱含在編碼中 $ LL_{kt} $ (即寬大處理法)。在所有總部設在按年通過寬大處理法的國家的公司中,它等於 1 $ t $ , 否則為 0。想像一下,你有一列零。一旦國家的公司輸入值 1 $ k $ 按年採用 $ t $ , 否則為 0!因此,任何從未採用過寬大處理法的國家在整個觀察期內都將保留為 0。
- 想像兩個案例:(1)德國和巴西都在 2000 年實施了這項法律,(2)只有德國在 2000 年實施了這項法律。那麼這兩個案例的對照組觀察次數是否相同?
從這個估計量的角度來看,治療變數 $ LL_{kt} $ 不區分治療組/對照組。我們只有國家 $ k $ 按年轉換他們的政策 $ t $ . 任何國家 $ k $ 從不採用寬大處理法等於0 $ t $ .
假設一個面板從 1995 年到 2002 年執行。在範例 (A) 中,德國和巴西都將在 2000 年“開啟”(即從 0 切換到 1)並保持開啟狀態。因此,巴西和德國有 5 個前處理時間段和 3 個後處理時間段。他們有“相同的”治療史。那些從不支持新法律的國家將成為反事實。
在情景 (B) 中,只有德國的組內觀察值會在 2000 年開啟,而巴西的組內觀察值都將等於 0。從不支持新法律的國家(現在包括巴西)將充當一個反事實。
- 因此,澳大利亞和比利時分別於 2003 年和 2004 年通過了該法律。那麼,馬來西亞的公司在控製樣本中只存在一次嗎?我的意思是,在這個 DiD 設置中,一個觀察是否可以控制許多治療?
是的。
假設馬來西亞永遠不會通過寬大處理法。馬來西亞公司可以作為澳大利亞和比利時公司的反事實,直到他們被處理的時間段。換句話說,馬來西亞行業在早期和晚期採用者各自的暴露期之前是反事實的。
下面的數據框顯示了我們如何編碼 $ LL_{kt} $ 在實踐中。請注意,這有點不同,因為我們只看到國家年份的觀察結果。根據我對這篇論文的粗略審查,我認為寬大處理法會影響每個國家/地區的所有公司。如果是這樣,並且作者在法律生效之前和之後觀察了所有公司,那麼我們可以在公司層面**或國家層面估計方程。
為簡單起見,下面的虛構數據框觀察了 2000-2006 年的三個國家。德國很早就擁護法律; $ LL_{kt} $ 在 2003 年從 0 切換到 1 並保持打開狀態。澳大利亞採用較晚; $ LL_{kt} $ 在 2005 年從 0 切換到 1 並保持打開狀態。馬來西亞市場從不採用寬大處理法。注意如何 $ LL_{kt} $ 在整個觀察期內為 0。如果我們也觀察公司 $ i $ 隨著時間的推移,在馬來西亞的行業中,所有公司在每個公司年度期間都應編碼為 0。
再次,變數 $ LL_{kt} $ 沒有描述經過處理或未經處理的公司/國家的特定子集;相反,它只是“打開”(即從 0 切換到 1),如果一個管轄區被處理並且僅在期間 $ t $ 當法律實際生效時,否則為 0。
以下數據框應該有助於您的直覺:
$$ \begin{array}{ccc} country & year & LL_{kt} \ \hline \text{Malaysia} & 2000 & 0 \ \text{Malaysia} & 2001 & 0 \ \text{Malaysia} & 2002 & 0 \ \text{Malaysia} & 2003 & 0 \ \text{Malaysia} & 2004 & 0 \ \text{Malaysia} & 2005 & 0 \ \text{Malaysia} & 2006 & 0 \ \hline \text{Germany} & 2000 & 0 \ \text{Germany} & 2001 & 0 \ \text{Germany} & 2002 & 0 \ \text{Germany} & 2003 & 1 \ \text{Germany} & 2004 & 1 \ \text{Germany} & 2005 & 1 \ \text{Germany} & 2006 & 1 \ \hline \text{Australia} & 2000 & 0 \ \text{Australia} & 2001 & 0 \ \text{Australia} & 2002 & 0 \ \text{Australia} & 2003 & 0 \ \text{Australia} & 2004 & 0 \ \text{Australia} & 2005 & 1 \ \text{Australia} & 2006 & 1 \ \end{array} $$
請注意,在德國於 2003 年通過寬大處理法規之前,他們的反事實歷史是馬來西亞和澳大利亞部門。還值得強調的是,先前處理過的國家也可能成為後期採用國家的反事實。換言之,當澳大利亞在 2005 年晚些時候通過寬大處理法時,馬來西亞公司(即非採用者)和德國公司(即早期採用者)可能會接近他們的反事實歷史。這個估計器實際上是對所有可能的 2x2 差值估計進行平均。
這個估計器的缺點可以作為一個整體單獨討論。但是,讓我們簡要地解決一個問題。例如,模型假設沒有時變效應。例如,寬大處理法對德國結果軌蹟的影響被認為是瞬時的和恆定的。這個假設是脆弱的,很難在統計上為之辯護。請注意,在所有組的暴露期之前,我們仍然假設所有組的“共同趨勢”。想像一下,德國的結果趨勢在 2003 年之後隨著時間的推移而發生變化。一旦澳大利亞在 2005 年進入治療狀態,那麼德國的結果軌跡可能會被他們早期的暴露所抵消。當“已經治療”的國家被允許作為“即將接受治療”國家的對照時,它們的治療效果隨時間的變化會從差異估計中減去。所有組和時間的治療效果——一些權重可能是負的。負權重僅在存在異質治療效果的情況下出現。仔細閱讀此工作文件以了解有關此主題的更多資訊。
- 以上是他如何根據自己的身份對控制和處理進行分組,但在 2019 年 Dasgupta 的第 2600 頁第 3.1 節中說:“控制公司都是 7 年內未通過寬大處理法的國家的同一行業的公司圍繞活動日期”。這種辨識讓我感到困惑,因為現在我們對這個行業有了更多的了解。我想知道為什麼他們沒有把它放在基線辨識中,而是放在結果部分?這背後的原因是什麼?
據我了解,寬大處理法律的時間並沒有因行業而異,但在我徹底閱讀這篇論文之前,我無法確定。
通常作者可以指定一個基本模型,然後在他們的結果部分對其進行擴展。例如,他們可能會以表格形式報告超前/滯後係數,但沒有明確顯示他們的方程式。作者還可以嘗試一系列替代規範,例如包括逐年影響的行業,即使該術語被排除在他們的主要經驗方程之外。