量化交易策略

為什麼將深度學習應用於算法交易的已發表研究論文如此之少?

  • November 23, 2018

我能找到的唯一相關論文是:

作為遊戲的金融交易:深度強化學習方法 (2018) 高頻交易中的深度神經網路 (2018) 交易機器學習 (2017) 具有 2-D CNN 趨勢檢測的基於深度學習的股票交易模型 (2017)

…然後是很多舊論文。我不擅長搜尋還是該領域缺乏已發表的研究?

我預計很多研究都未發表(尤其是如果它是有利可圖的),但我對已發表的研究感興趣。

我會說大多數機器學習方法都有過度擬合的風險,並且很大程度上取決於資產類別。深度學習等更複雜的機器學習方法似乎產生重大影響的唯一領域是現金股票,該領域的特徵空間非常豐富(NLP、新聞和公告、企業收益、其他財務)並且數據相對較好,公司債券是一個太不穩定的市場(產品比股票領域多得多),但將是下一個值得考慮的領域。

但是很多開始嘗試計算利率的 ML 人都非常失望。我從一個擁有不錯的股票基金並想做利率的人那裡聽說,並下定決心解析美聯儲的聲明(bfd,在那裡做過,那又怎樣),然後開始問他們為什麼在採購經理人指數如此之高的時候談論遠足低(呃!沒有看新聞)。基本上,FI更難。產品太多,差異化不夠——公告影響2年還是5年?我並不是說它在某些時候不可行,但現在不可行。

簡單地說,DNN 通過降維工作。您可能有數千個,也許是數万個或更多參數。如果您有 PB 級的圖像數據,那麼您在降維方面做得很好。我們在大多數交易中都沒有大數據。擁有更多數據(更長的時間序列)不如增加橫截面維度好,因為無論如何我們都有非平穩序列。除了股票,限價訂單的分析可能是 DNN 可以應用的領域,儘管證據是混合的(領域知識總是比僅僅將數據投入到某些模型中更重要……GIGO)。

僅非平穩性將降低任何好的模型的複雜性。AQR 最近關於使用神經網路(用於 EQUITY 因子提取)的論文表明,NN 的性能優於線性模型,但最佳網路實際上非常淺(參見通過機器學習進行的經驗資產定價)。

一般來說,神經網路在金融方面的幼稚應用從一開始就注定要失敗。Cont 和 Sirignano 的論文將 LSTMs 應用於單名稱和池化的 LOB,顯示了該方法的局限性,他們發現池化數據的效果要好得多(池化數據 = 1/300 左右,參數數量為單一名稱楷模)。他們稱其為“普遍規則”,但他們的解釋非常慷慨!只是沒有足夠的數據(請參閱NN 學習的通用模型。很明顯,應用於大量數據的大型模型似乎只會導致缺乏任何理解。領域知識和更輕鬆的接觸會產生更強大的結果.

引用自:https://quant.stackexchange.com/questions/42752