時間序列
如何處理時間序列數據集中的假期?
我目前正在分析德國股票市場的數據集。雖然像聖誕節或新年這樣的假期對於收益計算或投資組合績效來說不是問題,但我正在測試一些回歸併且不知道如何處理這些日期。
我正在根據過去十天的市場回報率回歸我的投資組合回報率。然後我將 beta 加起來,這樣我就可以繪製每個時間點的樣本隨時間變化的 beta。
這些日子必須取消嗎?我不認為我複制的論文的人在每個假期加上前十天都取消了。但是,如果樣本中有非交易日,則回歸結果會存在偏差。
初步的:
我從您之前的文章中假設您正在使用 Thomson Reuters Datastream。
您的數據類型上有幾個附加參數可用。例如,讓我們看一下 Datatype
MV
,它是一家公司的市場價值:
- 如果您使用
MV
,那麼您將獲得一個時間序列,其中最後一個可用值重複,如果股票 (a) 未交易,(b) 暫停或 (c) 在交易所假期。如果公司死了,最後一個值也會重複到您請求的日期!- 如果您正在使用
MV#S
,則來自 Datastream 的描述指出:#S 限定符取消填充基礎數據點儲存為空值的值 - 因此顯示空值的 N/A 而不是填充最後一個實際值。
您可以使用在您的請求範圍內
MV#S
設置(不正確和重複的)交換假期值。NA
但是,如果您在處理同時退市的股票,您可以另外要求MV#T
設置退市後的重複值NA
,或者手動搜尋數據項TIME
(或Worlscope項WC07015
),這代表公司成為私人控股、合併、清算或以其他方式變得不活躍的日期
並(手動)將比此非活動日期更新的值設置為
NA
.