為什麼合成控制不受後門混雜因素的影響?
來自Mixtape中的 Scott Cunningham ,關於傾向得分匹配:
傾向得分匹配在經濟學家中的採用並不像在其他非實驗方法(如回歸不連續性或差異中的差異)中那樣廣泛採用。對此給出的最常見原因是經濟學家經常懷疑條件獨立假設是否可以在任何數據集中實現——幾乎是一種信仰。這是因為對於許多應用程序,經濟學家作為一個群體通常更關心對不可觀察數據的選擇,而不是對可觀察數據的選擇,因此,他們較少使用匹配方法。
綜合控制似乎只是一種更複雜的匹配方法,我們不是將每個結果與每個處理過的觀察值匹配一個觀察值,而是基於觀察值的加權平均值進行匹配。
同樣,來自坎寧安(關於合成控制):
未觀察到的因素呢?比較案例研究因影響感興趣結果的未測量因素以及觀察到和未觀察到的因素影響的異質性而變得複雜。Abadie、Diamond 和 Hainmueller (2010) 指出,如果數據中乾預前時期的數量“很大”,那麼對乾預前結果進行匹配可以讓我們控制對多個未觀察到的因素的異質反應。這裡的直覺是,只有在不可觀測和可觀測上相似的單元才會遵循相似的軌跡預處理。
但是,如果我通過對預處理期的訓練來衡量我的觀察結果,是否不可能存在一些變數? $ X $ 這仍然會混淆和偏差我的估計嗎?
例如,假設我想評估醫療干預對降低醫院成本的有效性。接受治療的可能性基於醫生對患者未來病情的主觀評估*(*未觀察到的混雜變數 $ X $ )。現在,我碰巧對我的患者有 3 個協變數:性別、年齡和收入。我使用這些數據來選擇治療後的最佳體重。所以,在這種情況下:
- 綜合控制是否僅適用於這種情況,因為我的協變數能夠大致近似 $ X $ ? 在這種情況下,即使我在預處理期間實現了嚴格的交叉驗證擬合,它們是否也不完全有可能*?*– 即醫生知道一些我的3個變數無法描述的患者未來狀況,即使我的3個變數能夠準確反映患者治療前的費用。
- 此外,我怎麼知道感興趣的結果和我的協變數之間的關係不會隨時間而改變?假設性別、年齡和收入恰好與預測 2022 年的患者住院費用無關,儘管它們在 2019 年非常有效(可能是因為全球大流行等混雜變數)。綜合控制不會完全錯誤地歸因於乾預的因果效應嗎?或者這是否會使用隨機推理沒有實際意義?
答案似乎在您的報價中:
“這裡的直覺是,只有在不可觀測物和可觀測物上相似的單位才會遵循類似的軌跡預處理。”
這種直覺不一定正確。總是可能存在阻礙分析的未觀察到的混雜因素。沒有什麼能讓你免疫。
然而,一旦你控制了所有可觀察的因素,似乎還不清楚還能做什麼。大多數好的計量經濟學分析都包含一個大型的敘述部分,向讀者說明為什麼給定的 DiD(或其他處理方法)是合理隨機的或非隨機部分被充分考慮的原因。這個元素本質上不是統計的——它是一個有說服力的敘述,旨在說服(或向讀者說明)所有未觀察到的因素都受到控制,這是通過指向觀察到的數據無法做到的。
如果所有可觀察到的因素都得到控制,並且已經證明了在辨識不受控制的因素方面的一些值得尊敬的嘗試,那麼我希望任何剩餘的反對者至少應該能夠具體指出是什麼未觀察到的因素導致了問題。否則,批評者總是會假設存在一些遺漏的變數,然後不再添加評論。