3 年期間的增長回歸;平均值或年份值的回歸變數?
假設我想估計一個基本類似於增廣索洛模型一的增長回歸,除了我的因變數不是 Y/L,而是 3 年期間的平均 GDP 增長。作為我的自變數,我將在該時期開始時採用 GDP,然後在該時期內採用儲蓄率、人力資本等的平均值。但是,我已經看到它完成了該時期最後一年的儲蓄率和此類值。所以,事實證明有些謊言:
2010-2012 年平均增長 = 2010 年 GDP + 2012 年儲蓄率 + 2012 年 Hum K 等…
當我估計它時,係數是正確且顯著的,但是我無法理解它是否正確。我理解在第一年的價值中採用所有自變數,或者將利率作為該時期的平均值,但我不明白為什麼將這一時期的增長基於去年的價值是正確的。
有人可以對此有所了解嗎?會不會只是一個錯誤?
我從未見過任何“嚴肅的”(即經過同行評審的)研究將自變數定義為所考慮的時期的結束(如果您可以提供一些連結到您所指的那些,那將會很有幫助)。通常,它們被用作該期間或最初一年的平均值。例如,在金融和增長的大領域,這是常見的方法。Thorsten Beck - 該領域最著名的研究人員之一 -自己說過(第 2 頁下半部分)。在其他領域也有很多這樣的例子。例如,在估計增長的不平等時(第 282 頁頂部),或者著名的論文通過 Xala-i-Martin,他執行了 400 萬次增長回歸。查看第 7 頁和第 8 頁的“數據”和“選擇固定變數”部分。
現在,為什麼不使用期末變數?因為反向因果關係。在特定時期內快速增長的經濟可能會在該時期結束時具有更高的儲蓄率和人力資本水平。因此,因果關係的順序實際上與您的方程假設的相反(即使來自估計的符號可能相同!),導致內生性,因此導致不一致的估計。
甚至使用平均週期變數也存在一些爭議。正如 Xala-i-Martin 在上述論文(第 8 頁)中所說:
我不情願地使用此類變數(平均儲蓄或投資率以及設備和非設備投資的 DeLong 和 Summers 度量就是此類的範例)。不願納入這些變數的原因是,這些變數可能比期初測量的變數“更具內生性”。
總而言之,使用期末變數是一種非常冒險的做法,在我看來,很難從理論上和經驗上證明其合理性。更何況,這似乎是不必要的。為什麼不使用期初?還是平均?