計量經濟學

執行 diff-in-diff 的最小數據點數是多少?

  • February 25, 2021

我正在考慮執行具有固定效果的 diff-in-diff 來處理面板數據實驗。問題是我不知道我需要多少數據點才能使實驗可靠。

事情就是這樣:我想看看我的客戶對價格變化有何反應。由於自相殘殺,AB 測試看起來不是一個好的選擇。所以我想在一些城市更改捆綁產品的價格。假設在 A、B、C 和 D 城市,清潔產品會便宜 10%。然後,我將使用每個城市數據點執行具有固定效果的 diff-in-diff。問題是:我需要多少個城市才能進行這個實驗?每個城市必須有多少銷售額才能使實驗可靠?

Diff-in-Diff 是一種參數模型。參數模型的經驗法則是,對於模型中使用的每個獨立回歸量,您應該至少有 25-30 個觀察值(不同的作者可能不同意,但大約是 30 個)(參見 Verbeek A Guide to Modern Econometrics pp 36 中的討論)。但是,請注意這是一條經驗法則,正如 Verbeek 指出的那樣(我的評論在

$$ $$):

不幸的是,對於什麼是“足夠大”沒有明確的定義

$$ talking about sample sizes to justify asymptotic properties $$. 在簡單的情況下,30 個樣本量可能就足夠了,而在更複雜或極端的情況下,1000 個樣本量可能仍然不足以使漸近近似合理準確。

據說為每個案例獲取精確的數字太難了(這將涉及蒙地卡羅模擬),因此人們通常遵循經驗法則,除非他們懷疑有什麼問題。

因此,如果您只是在具有 5 個獨立回歸器的 diff-in-diff 模型中遵循經驗法則,那麼您應該至少有 150 個觀察值,在具有 7 個獨立回歸器的模型中 210,在具有 10 個獨立回歸器的模型中 300 等等。

引用自:https://economics.stackexchange.com/questions/42760