量化交易策略
Soft Actor-Critic 強化學習算法可以用於實時交易嗎?
我正在為 Avellaneda 和 Stoikov 做市算法(優化風險厭惡參數)的優化問題撓頭,我遇到了https://github.com/im1235/ISAC
它使用 SAC 來優化 gamma 參數。
既然 SAC 是一種無模型的強化學習,這是否意味著它不容易過擬合?
或者換句話說,它可以應用於生活交易嗎?
過度擬合取決於你的代理是否可以泛化到真實的交易世界,而不是它是否是無模型的。當您使用歷史市場數據或模擬數據訓練您的代理時,您需要確保與市場的互動盡可能真實,這很難,尤其是在做市的情況下,您的行為會對市場產生很大影響。就個人而言,我認為除非你有一個非常好的市場模擬器,否則很難讓它發揮作用。但是,如果它確實在樣本外工作,您可以開始執行它並使用真實的市場數據對其進行微調。我更願意在一開始就通過實時執行代理來直接訓練它,儘管這會很昂貴。
我同意自動編碼器;您的環境必須真正精確定義。市場對交易做出反應,為您的環境創建準確的模擬器是一個具有挑戰性的問題。我認為過度擬合將完全取決於您的環境和狀態空間的定義,如果您使用開箱即用的算法,就會發生過度擬合。但是,如果確實存在這樣一個精確定義的環境和狀態空間,那麼創建一個成功的 RL 應用程序並非完全不可能。