時間序列

具有重疊數據的時間序列回歸

  • September 9, 2011

我看到了一個回歸模型,該模型正在回歸滯後(12 個月)相同股票指數的同比回報、信用利差(無風險債券和公司債券的月均值之間的差異)收益率)、同比通脹率和工業生產同比指數。

它看起來是這樣的(儘管在這種情況下您將替換特定於印度的數據):

SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) 
               + b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2)
               + b4*INFLATIONASYMM(T+2)

SP500YOY是 S&P500 指數的同比回報 要計算這一點,需要計算 S&P500 值的月平均值,然後將其轉換為每個月的同比回報(即 2010 年 1 月至 2011 年 1 月、10 年 2 月至 2 月'11, Mar'10-Mar'11, …)。在解釋變數方面,使用了 12 個月的滯後值以及 at time 和SP500YOY兩個CREDITSPREADperiod TAHEAD 。這是通脹是否高於 5.0% 的門檻值的虛擬變數。括號中的索引顯示了每個變數的時間索引。INFLATION``INDUSTRIALPRODUCTION``INFLATIONASYMM

這是通過標準 OLS 線性回歸估計的。要使用此模型預測標準普爾 500 指數未來 1.2 和 3 個月的同比回報,必須對通貨膨脹和工業生產指數進行 3.4 和 5 個月的提前預測。這些預測是在將 ARIMA 模型分別擬合到兩者之後完成的。未來 1,2 和 3 個月的 CreditSpread 預測只是作為心理估計。

我想知道這個 OLS 線性回歸是正確/不正確、高效/低效還是普遍有效的統計實踐。

我看到的第一個問題是使用重疊數據。即股票指數的每日價值每月平均,然後用於計算每月滾動的年度回報。這應該使誤差項自相關。我認為人們必須對以下其中一項進行一些“更正”:

  • White 異變異數一致共變異數估計量
  • Newey & West 異變異數和自相關一致 (HAC) 估計器
  • Hansen & Hodrick 的異變異數一致版本

將標準 OLS 線性回歸(沒有任何校正)應用於此類重疊數據真的有意義嗎?更重要的是,使用 3 期提前 ARIMA 預測解釋變數以用於原始 OLS 線性回歸進行預測SP500YOY?我以前沒有見過這樣的形式,因此無法真正判斷它,除非糾正使用重疊觀察。

這個問題最終在交叉驗證上得到了回答

這裡有幾篇涉及這個主題的文章:

Britten-Jones 和 Neuberger,改進了具有重疊觀察的回歸中的推理和估計

Harri & Brorsen,重疊數據問題

引用自:https://quant.stackexchange.com/questions/740