通過自回歸機器學習進一步預測波動性
ARIMA 和 GARCH 是預測資產收益波動時間序列的舊消息。我知道一些論文用機器學習算法代替了 ARIMA 和 GARCH,以更準確地預測金融波動性,因此這個問題是對現有情況進行調查的參考請求:
以下機器學習算法和其他機器學習算法在預測波動幅度超過 1 天/一步的情況下與其他機器學習算法和 GARCH 算法的表現如何?
- 隨機森林
- 支持向量回歸 (SVR)
- 梯度提升
- K 最近鄰等)
機器學習器是否也在像 GARCH 這樣的自回歸公式中實現(即他們使用先前的歷史波動率觀察來估計目前波動率)?
此外,研究文章對將機器學習應用於波動時間序列的理論原因有何看法?
僅基於我對 ML 模型本身的理解,我很難相信 KNN 或 RF 無論如何都是有用的。它們不會是我嘗試的第一個模型,而且往往只是在課堂上教授的 ML 模型,因為誰知道誠實的原因——也許是因為它們易於理解?從我所讀到的關於 ML 的一般資訊(與時間序列無關),您列出的所有內容都已被神經網路所超越。梯度提升可能仍然有些用處。
KNN 會根據 K 個最相似的觀測值來預測一個值,然後取平均值。你認為明天的波動率真的等於你數據集中最相似的日子嗎,即使這些日子是 3 年前的?如果是這樣 KNN,可能會有所幫助。
RF 只是梯度提升樹的一個不太好的版本。它根據特徵的門檻值進行預測,因此只是對您的數據進行分區,然後根據許多樹的平均值進行預測。因此,明天的波動率等於昨天的 vol 大於 x 但小於 y、snp 移動大於 z 但小於 a 等的日子……這有意義嗎?也許吧,但由於 RF 的分區性質,它永遠無法真正複製任何數學函式。意思是,如果 x 和 y 之間的真實關係是線性的,那麼線性回歸總是比隨機森林做得更好。
這在很大程度上取決於您的設置和可用功能。
您可以通過為模型提供附加特徵(例如以前期間的每日、每週、每月回報)來將更多資訊包含到分類或回歸算法中,並最終使用這些來創建更多特徵,例如波動率、均值回歸或其他方面的度量您將包括在“傳統”方法中。
機器學習算法(尤其是 LSTM 或其他 RNN 等神經網路)的優勢在於,它們往往非常快,並且仍然為許多複雜的期權定價模型提供了相當好的性能。