時間序列
使用技術指標預測使用機器學習模型的金融時間序列
您好我正在嘗試使用金融技術指標進行預測,使用機器學習模型。時間序列交叉驗證的常用方法是使用移動視窗或增長視窗。我使用的方法在以下步驟中描述
- 使用滯後 1 計算整個歷史數據集的技術指標 TA1、TA2、….TAN
- 然後使用簡單的特徵選擇方法,例如找出自變數之間的互相關,並刪除互相關高於某個門檻值的變數
- 將輸入變數滯後 1
- 然後使用移動視窗訓練機器學習模型,然後在訓練集上報告其性能
- 在訓練過程中未使用的測試集上測試其性能
我面臨的問題是結果非常樂觀。我的問題是我應該分別計算train和test的技術指標然後使用它們,還是我應該在一開始就對整個數據集計算它們,然後將它們分成train和test set。
在預測方面,預測金融時間序列非常困難,尤其是使用 ML 模型。我見過的一篇“成功”論文使用了分類方法(例如預測極端回報)。
見:http ://algorithmicfinance.org/2-1/pp45-58/
綜上所述,您的模型結構將假定參數隨時間穩定。為什麼不使用使用 TA 指標的 VARMA 方法,請參見此處:http ://users.monash.edu.au/~gathana/slides/isf07.pdf
在金融時間序列中使用機器學習技術時要小心。您隱含地假設您在訓練模型的數據上發現的趨勢,相同的趨勢將在未來的時間序列中出現。
除了 KKB 的建議之外,您還應該看看另一個名為“Echo State Network”(RNN 家族)的模型。但話又說回來,建議您使用簡短的數據進行訓練。原因是 - 兩年前發生的事情現在可能不相關,但過去幾個月發生的事情是相關的,因為它們反映了最近的事件。真的是迷宮。你必須運用你的直覺。
還可以使用信賴區間來判斷您的估計值的意義。機率分佈對於衡量預測的有效性非常有幫助。