用於趨勢預測的 LSTM

August 23, 2020

一段時間以來一直想接觸 ML，因為我對金融和交易也很感興趣，所以在閱讀了用於金融趨勢預測的 Deep LSTM 和強化學習層之後，我認為這將是一個很好的入門項目Francesco Rundo 的外匯高頻交易系統( https://www.mdpi.com/2076-3417/9/20/4460/htm )。
我正在第一步，一個具有 3 個時間序列作為輸入和一個分類輸出（0、1、2）的 LSTM。
經過一整天的工作後，我得到了一些工作，但我的結果與 Francescos 模型顯然達到的結果相去甚遠（43% 對 70%），我不確定這是否只是拋出更多訓練數據的問題和時間，或者如果我因為對 ML 不熟悉而犯了一個基本錯誤。
def create_model():
 model = Sequential()
 model.add(LSTM(HIDDEN_CELL_NUMBER, input_shape=(100, 3), return_sequences=True))
 model.add(LSTM(HIDDEN_CELL_NUMBER, input_shape=(100, 3)))
 model.add(Dense(3, activation=activations.softmax))
 return model


HIDDEN_CELL_NUMBER = 300
EPOCHS = 10

class_weights = class_weight.compute_class_weight('balanced', np.unique(y_train), y_train)
y_train = to_categorical(y_train)
y_TEST = to_categorical(y_TEST)

model = create_model()
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['categorical_accuracy'])

model.fit(x_train, y_train, class_weight=class_weights, epochs=EPOCHS, verbose=1)
優化器、損失和指標是 3 個分類輸出的正確選擇嗎？
還有什麼明顯的我做錯了嗎？

幫助神經網路更快地學習的第一件事是規範化 0 和 1 之間的所有輸入。庫 sklearn 有一個 preprocess.scale() 函式可以做到這一點 - 確保單獨進行訓練和測試數據（或訓練、驗證和測試數據，如果您使用三個單獨的集合）。僅此一項就可以產生巨大的影響。我看到了一個深度強化學習教程，它極大地加速了學習。為了安全起見，tensorflow.keras.layers 有一個 BatchNormalization() 函式，您可以在每個 LSTM 之後添加它作為
model.add( BatchNormalization() )
另一個非常重要的細節是，您從未在層之間引入 dropout。它本質上是為了隨機刪除一些資訊而設計的，它通常用於所有類型的循環網路。預設情況下，您可以在每層之間添加它，並以 20% 的 dropout 率進行：
model.add( Dropout(0.2) )
這個也可以在 tensorflow.keras 的層模組中找到。最後一件事是，在引入輸出層之前，人們通常會在 LSTM 層之上堆疊至少一個密集層。美聯儲的庫克和霍爾（2015 年）發現它在宏觀經濟數據上執行良好，並且似乎是所有地方的標準。所以，這些是我個人首先嘗試的第一件簡單的事情。
在財務層面，您必須仔細考慮如何標記數據。例如，如果您可以做空一項資產，您必須確保您沒有將所有下跌走勢都標記為做空頭寸的機會——跌幅必須足夠大，以克服費用、滑點和價格影響。價格上漲也是如此。這通常意味著您的數據中有很多“什麼都不做”標籤，這意味著存在一個局部最優，即 100% 的時間什麼都不做實際上很難被擊敗。我看到您正在使用權重，但是如果您有很多數據，處理它的簡單方法是隨機選擇一個平衡（或更接近平衡）的數據集。如果失敗，在考慮過採樣之前，像你一樣權衡觀察結果將是最後一個簡單的選擇。
例如，我已經看到一些使用很少功能的系統在加密貨幣上表現相對較好。但話又說回來，這是一個教程，他們除了在 3 分鐘間隔內辨識增長率的跡像外，並沒有做更多的事情……根據您對標籤或目標的聰明程度，可能很難獲得準確性。問吉姆西蒙斯。他花了 40 年的時間和許多非常聰明的博士才在量化金融領域大展拳腳。
編輯例如，您可以使用
model = Sequential()
for i in range(N_LSTM_CELLS-1):
   model.add( LSTM(LSTM(HIDDEN_CELL_NUMBER, 
                        input_shape=(100, 3), 
                        return_sequences=True)) )
   model.add( Dropout(0.2) )
   model.add( BatchNormalization() )

model.add( LSTM(LSTM(HIDDEN_CELL_NUMBER, 
                        input_shape=(100, 3)) )
model.add( Dropout(0.2) )
model.add( BatchNormalization() )

model.add( Dense(N_UNITS, activation="relu") )
model.add( Dense(3,       activation="softmax") )
您可以訪問深度學習課程 pythonprogramming.net。

引用自：https://quant.stackexchange.com/questions/54380

用於趨勢預測的 LSTM

相關問答

確定數據趨勢（方向檢測或轉折點檢測）

固定收益與股票中的 ML/AI

Python：檢測燭台數據的測量移動

QF 領域最近有哪些有趣的與機器學習相關的發展？

AFML（由 Lopez De Prado 撰寫）與 Trevor Hastie 的 ESL

如何將機器學習算法應用於股票市場？