期權
QF 領域最近有哪些有趣的與機器學習相關的發展?
2020 年,我寫了一篇關於使用循環神經網路對沖奇異期權的理學碩士論文(大致基於 Buehler 等人的論文 Deep Hedging (2018))。
從那時起,我一直對金融領域中所有類型的 ML 應用程序感興趣,但我沒有閱讀任何最近的出版物/關注任何發展。
因此,我的問題如下:在過去的幾年中,在 QF 領域中使用機器學習方面是否有任何特別有趣的出版物/發展?
Gu、Kelly 和 Xiu 的機器學習實證資產定價(2020 年)
Sirignano, J., & Cont, R. (2019)(高頻股票預測):
作者將大規模深度學習模型(具有長短期記憶單元的循環神經網路)應用於高頻金融股票數據,以預測下一個價格方向(上漲或下跌)。
結果:
- 他們不僅發現深度學習模型的預測準確率與基於高頻 VAR 的模型相比大幅提高了 10% ,而且他們還觀察到“通用”深度學習模型是如何在 500 個匯集數據集上訓練的股票能夠擷取數據集中所有股票共有的訂單流和價格變化之間的關係。
- 通用深度學習模型能夠勝過特定於股票的模型,最重要的是能夠**泛化到訓練集中未包含的股票:**如果模型是根據以下數據進行訓練的 $ {1,\ldots,N} $ 股票,那麼它可以保持股票的樣本外預測準確性 $ N+1 $ . 總之,該模型可能有效地預測非流動性股票的價格方向,而計量模型可能因缺乏數據而動搖。
作者巧妙地總結了他們的深度學習模型的主要發現:
- **非線性:**使用深度學習訓練的數據驅動模型在預測準確性方面大大優於線性模型(第 3.1 節)。
- **普遍性:**該模型揭示了所有股票共有的普遍特徵(第 3.2 節)。這些特徵可以很好地概括:它們也被觀察到適用於不屬於訓練樣本的股票。
- **平穩性:**模型在價格預測準確性方面的表現在一段時間內非常穩定,即使在樣本外一年。這表明訂單流和價格變化之間存在固定關係(第 3.3 節),這種關係在很長一段時間內是穩定的。
- **路徑依賴和長期依賴:**顯示包含價格和訂單流歷史可顯著提高預測準確性。這提供了證據表明價格動態不僅取決於限價訂單簿的目前或最近狀態,還取決於其歷史,可能在很長一段時間內(第 3.4 節)。
需要注意的是,論文只關注深度學習模型的預測準確性,並沒有確定這種可預測性是否**會導致盈利的交易策略。**實施交易成本和計算高頻數據中的延遲將超出本文的範圍。
附加資訊:有一個Quant Stack Exchange 問題,詢問有關金融時間序列預測的適當機器學習模型。在這裡,投票最高的答案有一個很好的近期論文列表,包括@MiLuk 的答案中提供的論文。