計量經濟學
用相關係列填補數據空白
我有兩個不同長度的時間序列。時間序列是 GDP 增長。
gdp增長是我需要的系列,也是比較長的系列,但是兩個時期一個接一個有兩個差距。總體經濟指標較短,但它涵蓋了我發現這兩個差距的時期,並且在兩個數據都可用的時期內,它們是嚴格相關的(r=0.94)。
我該如何填補這兩個空白?
一種可能性是使用自回歸預測。AR(1) 很好地描述了序列 R²=0.91,殘差中沒有顯著的自相關。但我不認為這是最佳解決方案,因為:
- 我有兩個空缺,第二個空缺會用提前兩步的預測來填補,這個預測不太準確,
- 我有數據,忽略部分資訊似乎不是最好的解決方案,
- 我還有一些外部資訊(相關係列),我也可以利用這些資訊。
哪種方法最合適?
感謝您的提示!
如果我理解正確,差距就在數據的中間。在這種情況下,您不應使用外推數據的預測,而應使用一些插值方法。
如果數據中存在相對較大的變化,則使用Catmull–Rom spline 之類的方法可以獲得最佳結果。Catmull–Rom 樣條具有一些不錯的特性(參見此處)。Catmull-Rom 樣條的主要優點是您擁有的所有真實觀察都將成為它的一部分,它允許您以非線性方式估計缺失點。
如果您在 R 中工作,則可以使用splineCR輕鬆實現它,如果您使用 Python,則可以查看此 github程式碼。現在你會發現它也是 EViews 或 Stata 等程序的一部分。