通過自回歸機器學習進一步預測波動性

August 1, 2020

ARIMA 和 GARCH 是預測資產收益波動時間序列的舊消息。我知道一些論文用機器學習算法代替了 ARIMA 和 GARCH，以更準確地預測金融波動性，因此這個問題是對現有情況進行調查的參考請求：
以下機器學習算法和其他機器學習算法在預測波動幅度超過 1 天/一步的情況下與其他機器學習算法和 GARCH 算法的表現如何？
隨機森林
支持向量回歸 (SVR)
梯度提升
K 最近鄰等）
機器學習器是否也在像 GARCH 這樣的自回歸公式中實現（即他們使用先前的歷史波動率觀察來估計目前波動率）？
此外，研究文章對將機器學習應用於波動時間序列的理論原因有何看法？

僅基於我對 ML 模型本身的理解，我很難相信 KNN 或 RF 無論如何都是有用的。它們不會是我嘗試的第一個模型，而且往往只是在課堂上教授的 ML 模型，因為誰知道誠實的原因——也許是因為它們易於理解？從我所讀到的關於 ML 的一般資訊（與時間序列無關），您列出的所有內容都已被神經網路所超越。梯度提升可能仍然有些用處。
KNN 會根據 K 個最相似的觀測值來預測一個值，然後取平均值。你認為明天的波動率真的等於你數據集中最相似的日子嗎，即使這些日子是 3 年前的？如果是這樣 KNN，可能會有所幫助。
RF 只是梯度提升樹的一個不太好的版本。它根據特徵的門檻值進行預測，因此只是對您的數據進行分區，然後根據許多樹的平均值進行預測。因此，明天的波動率等於昨天的 vol 大於 x 但小於 y、snp 移動大於 z 但小於 a 等的日子……這有意義嗎？也許吧，但由於 RF 的分區性質，它永遠無法真正複製任何數學函式。意思是，如果 x 和 y 之間的真實關係是線性的，那麼線性回歸總是比隨機森林做得更好。

這在很大程度上取決於您的設置和可用功能。
您可以通過為模型提供附加特徵（例如以前期間的每日、每週、每月回報）來將更多資訊包含到分類或回歸算法中，並最終使用這些來創建更多特徵，例如波動率、均值回歸或其他方面的度量您將包括在“傳統”方法中。
機器學習算法（尤其是 LSTM 或其他 RNN 等神經網路）的優勢在於，它們往往非常快，並且仍然為許多複雜的期權定價模型提供了相當好的性能。

引用自：https://quant.stackexchange.com/questions/53276

通過自回歸機器學習進一步預測波動性

相關問答

為什麼說波動是持久的？

什麼是經濟臨近預報？

如何在機器學習中分配 n 天目標變數

因子模型預測中的 T+H 問題

超時評估 GARCH 模型

GARCH 方程中的多步超前預測