應用計量經濟學

如何評價綜合控制是否足夠好

  • June 9, 2020

我正在使用綜合控制方法來評估狀態級策略(使用 Stata 中的 synth 包)。我已經閱讀了關於 CA 煙草和德國統一的開創性 ADH 論文,但我仍然不知道如何確定建構的合成狀態是否合適。我們目前所做的是查看圖表 - 看看合成狀態和真實狀態之間是否存在重疊。但是,我覺得這不是一個非常“健壯”的方式……

我們可以使用或測試任何衡量標準嗎?

編輯

在閱讀了回复(以及再次提到的論文)之後,我有另一個相關(但可能有點細微差別)的問題是關於在干預時(或之後)會發生什麼。

ADH (2010)ADH (2015)的以下兩張圖可以看出,CA 煙草Propostion 99 干預的同一年效果很小,而在德國統一研究中,差距僅在2 年內變得明顯之後。在其他一些使用 SC 的論文中,有立竿見影的效果(例如Cavallo et al. (2013))。我想只要有一個一致的故事來支持結果,干預的短期效應大小不會使綜合控制的適用性無效嗎?

ADH (2010) 加州煙草 ADH (2015) 德國統一

這是一個很好的問題,但不幸的是,沒有(尚未)同意答案。

許多作者(例如在那些開創性論文中)為此使用交叉驗證。這基本上是ADH (2015)關於德國統一的論文所暗示的內容。如果綜合控制良好,則 MAPE(平均絕對預測誤差)和 RMSPE(均方根預測誤差)應該非常低。到目前為止,將預處理期分為訓練期和測試期的額外交叉驗證是常用的方法,儘管沒有就預測誤差應該多低達成一致意見,只是越低越好。

接下來還有人認為,檢查分配非零權重的捐助國中的國家的趨勢,並查看這些捐助國的預處理趨勢是否似乎與接受治療的國家的預處理趨勢相匹配,與您類似的方式會為這裡所爭論的 DiD(差異差異)做。

最後,儘管看起來很瘋狂,但實際上也建議進行目視檢查。

除了上述之外,您還應該通過系統地嘗試改變捐助池中的國家數量來進行敏感性分析,並查看由此產生的綜合控制是否仍然合適。ADH 2015 也這樣做了,您幾乎可以在所有研究中找到它。發布您的權重也被認為是一種好的做法。

當然,如果您有少量預處理樣本,則很難進行適當的交叉驗證。我曾經在歐元體系成員國的一個中央銀行與幾個同事一起進行一項綜合控制研究,由於數據限制,我們的預處理期非常短。我們決定不進行交叉驗證,而是使用幾個非參數測試來測試真實的預處理序列是否與合成序列在統計上顯著不同。當我們在研討會上展示結果和方法時,沒有人對此提出異議,而且房間裡有一些非常優秀的計量經濟學家。然而,除了中央銀行'


回复編輯:

與經典的 DiD 一樣,總是存在可能導致結果偏差的延遲效應或預期效應問題。然而,在這種情況下,作者認為,統一後的增加實際上是影響的一部分,而不是延遲影響。正如作者所說:

我們對德國統一對西德人均 GDP 影響的估計是由實際西德與其合成版本之間的差異給出的,如圖 3 所示。我們估計德國統一對西德沒有太大影響西德統一後頭兩年的人均國內生產總值。在這個初始階段,合成西德的人均 GDP 甚至略低於實際西德,這與關於初始需求繁榮的論點大體一致(例如,參見 Meinbardt 等,1995)。然而,從 1992 年開始,這兩條線大相徑庭。雖然西德的人均 GDP 增長放緩,但合成的西德人均 GDP 繼續以類似於統一前時期的速度上升。

然而,可以說這是論文的一個弱點。

否則,如果效果會出現真正的延遲,您將遇到一個問題,該問題可以通過辨識治療開始產生效果的“正確”日期並確定治療前和治療後的時間來解決,方法與使用 DiD 類似。那。

引用自:https://economics.stackexchange.com/questions/37156