時間序列

來自不連續數據系列的 ARIMA 模型係數

  • July 27, 2020

股票價格在整週或全天都不是靜止的過程。例如,EURGBP 在歐洲夜間的波動性很小,但由於市場流動性,在工作時間的變化更加動態。

我想收集歷史數據(間隔 15 分鐘),計算 ARIMA 係數並在 R 中獲得預測。但如果我只在白天交易,那麼包含夜間數據是沒有意義的。

那麼,是否可以基於不連續的數據系列(如周一 10:00 - 16:00、週二 10:00 - 16:00、週三 10:00 - 16:00 等)創建 ARIMA 模型?如何合併這些數據以最小化錯誤(從周二 10:00 開始的價格事實上不是周一 16:00 之後的下一個價格)?

但是,如果我只在白天交易,那麼包含夜間數據是沒有意義的。

這種想法似乎是計量經濟學和相關領域的初學者常見的謬誤(不是個人的)。您必須區分問題的兩個要素:

  1. 了解時間序列是如何發展的(例如通過為其建立模型);
  2. 利用您的理解來找出這種發展的功能(例如,對特定時間段的預測)。

想一個類比:如果真正的模型是 $$ y=\beta_0+\beta_1 x_1 + \beta_2 x_2 + u $$ 而你只對 $ \beta_0 $ 和 $ \beta_1 $ 但不是 $ \beta_2 $ , 你最好還是估計一下 $ \beta_0 $ 和 $ \beta_1 $ 來自真實模型而不是子模型$$ y=\beta_0 + \beta_1 x_1 + v. $$ 您對完整模型的估計會更準確,如果 $ x_1 $ 與(高度)相關 $ x_2 $ .

現在回到你原來的問題:如果晚上的時間序列發展與白天的發展完全無關,你可以忽略夜間時間。但很可能這種關係是存在的,所以最好解釋一下。換句話說,我會在不走捷徑的情況下依次解決您問題的兩個核心要素。

引用自:https://quant.stackexchange.com/questions/30403