實驗中的隨機化和平衡
假設我們對某些“治療”對某些感興趣的結果的影響感興趣。一種常見的做法是選擇一組人,然後隨機選擇一小部分人(通常是一半)接受治療。其餘的人未經治療(即“對照”)。如(例如)Angrist 和 Pischke所示,組間平均結果的差異是治療的平均因果效應的無偏估計。
雖然這樣的程序確實給了我們一個公正的估計,但它並不能確保治療組和對照組在可觀察的標准上是“平衡的”。例如,雖然平均而言,治療組和未治療組的男性比例相同,但在我們的實際樣本中,一組男性的比例可能更高。在這種情況下,很自然地從“男性過多”組中抽取一些男性,並將他們置於“女性過多”組中,直到兩組的性別比例相同。(如果我們願意,我們可以隨機選擇我們選擇的人。)
一些問題:
- 如果我們這樣做,治療組和未治療組之間平均結果的差異是否仍然是對因果效應的無偏估計?
- 如果是這樣,為什麼不是在所有 RCT 中都這樣做?
- 如果不是,我們如何權衡實現“平衡”的好處與我們引入的可能偏見?
可選額外:我知道這個過程似乎與“分層”非常相似。然而,我的理解是,在分層之後,人們不會比較治療組和未治療組的平均結果(相反,他們比較他們分層的每個子樣本的平均結果,或者等效地使用分層假人進行回歸)。如果我的建議確實等同於分層,那麼我的問題就等同於我們為什麼需要這些假人以及分層的成本和收益是什麼的問題。
好吧,我遠非計量經濟學家,但我的構想如下:
通過使用隨機分配,我們有兩組在所有方面平均相等。正如您正確指出的那樣,由於抽樣變化,會有差異。
我擔心的是,如果我在隨機化後開始“糾正”那些(根據您的性別分佈範例),我會在年齡甚至是未觀察到但重要的特徵方面引入組之間的其他差異。
分層是不同的,因為它是預先完成的。你有一個你知道不同組不同的特徵,所以你在這些組中隨機抽樣。舉一個相當幼稚的例子:我們知道服用避孕藥對男性和女性的影響是相當不同的,所以如果你想測試避孕藥對生育能力的影響,你可以按性別分層,然後在性別中進行隨機分配.
這個想法是,對於因果推理,您希望能夠將對照組視為反事實。在理想的世界中,您希望能夠觀察到平行世界,在那裡您接受治療的同一個人沒有得到一個。
現在簡單的隨機樣本有望實現這一點,因為只要每個人都有真正隨機且最重要的是平等的機會被包括在內,那麼組間不可觀察的分佈應該是相同的,你應該沒有偏見。
但是,如果您正在抽取隨機樣本(特別是如果它們不是很大),您最終可能會遇到一個樣本,假設 90% 的控制只有男性,只有 10% 的女性。在這種情況下,您可能想要平衡這一點,因為那樣控制可能不是很好的反事實。
這並不意味著你可以用任何你想要的方式來平衡它。人們應該在組之間隨機移動以避免偏差,或者更好的是控制組和治療組應該混合,你應該再次隨機化,然後檢查分佈。如果治療/對照之間的男性/女性人數在統計學上沒有顯著差異,則繼續進行實驗。
我們的目標始終是盡可能創造出最好的反事實。這實際上可以在根本沒有簡單隨機抽樣的情況下完成,例如通過使用傾向得分匹配。
有時您甚至可能需要在不可能進行隨機化的情況下進行/觀察現場實驗,但仍有一些技術試圖找到一個好的反事實(您可能想查看差異或綜合控制方法的差異)。
實際上在簡單的 OLS 中,偏置係數可以表示為:
$$ E[\beta]= \beta + \gamma \frac{cov(x,e)}{var(x)} $$
第二項是偏見。因此,要消除偏差,您要確保自變數也獨立於誤差項 $ cov(x,e)=0 $ . 簡單的隨機抽樣可以幫助您實現這一目標,但它不是靈丹妙藥。如果樣本高度不平衡,碰巧所有女性都在控制中,而男性在治療中,那麼治療將不會真正獨立於不可觀察的因素。