做出辨識假設是什麼意思?
試圖理解這個問題:
假設您可以訪問一個數據集,該數據集跟踪從青春期到成年的個體。每年,您都會觀察收入、教育程度、健康和婚姻狀況。假設你有興趣了解婚姻是如何影響男性收入的。使用所描述的數據,您將如何檢查這個問題?您的辨識假設是什麼?你如何評估這個假設的合理性?
首先,我試圖理解,什麼是辨識假設?我認為這是您測試的假設告訴您是否存在因果關係。是對的嗎?
我回答作業問題的第一個想法是:
我必須確定收入和婚姻不是同時確定的,相反的因果關係,或者兩者都受同一個變數的影響。因此,創建一個反事實組(未婚男性)並與已婚男性匹配可以在差異上建立良好的差異。
但是如何評估這個假設的合理性呢?我通常只是將數字插入電腦,而不關心合理性。是什麼讓計量經濟學中的假設更合理?
辨識假設:關於 DGP 的假設,可以讓您得出因果推斷。例如,IV 的外生性假設,diff-in-diff 中的平行趨勢假設。
辨識假設(通常缺乏內生性)永遠無法在統計上得到證實(不拒絕是好的,但這不是證實)。因此,合理性評估包括基於您對 DGP 了解的經驗論據。
也許另一個例子在這裡會有所幫助:
想像一下,您想知道吸煙對患癌症機率的影響。通過簡單地比較吸煙者和非吸煙者的癌症發病率,您可能會對這種影響做出有偏見的估計,因為吸煙者可能還會從事一系列其他增加癌症風險的不健康行為(例如大量飲酒、少運動、高壓力暴露等) .
換句話說,您為估計吸煙對癌症發病率的因果影響所做的“辨識假設”,即吸煙者和非吸煙者僅在吸煙行為方面有所不同,在這裡可能不成立。
出於這個原因,您可能希望使用具有較少可疑假設的辨識策略。例如,與其關注香煙消費對癌症的直接影響,不如關注香煙價格變化對癌症的影響。例如,有些地區可能將捲菸稅提高了 20%,而其他地區沒有這樣做。在這種情況下,與第二組相比,第一組地區的捲煙消費量可能會減少。捲菸消費的這種相對變化隨後可用於估計吸煙對癌症發病率的因果影響,因為價格上漲不太可能與吸煙者/非吸煙者的特徵(飲酒、鍛煉等)相關 –> 在其他方面詞,辨識假設在這個估計模型中比在吸煙者和非吸煙者的天真比較中更合理。
希望這可以幫助!此外,您可能想查看說明如何使用酷而嚴格的辨識策略的學術論文,例如:
Donohue III、John J. 和 Steven D. Levitt。“合法墮胎對犯罪的影響。” 經濟學季刊(2001 年):379-420。
米格爾、愛德華和邁克爾·克雷默。“蠕蟲:在存在治療外部性的情況下確定對教育和健康的影響。” 計量經濟學 72.1 (2004): 159-217。
Abadie、Alberto、Joshua Angrist 和 Guido Imbens。“工具變數估計補貼培訓對學員收入分位數的影響。” 計量經濟學 70.1 (2002): 91-117。