處理機器學習模型的隨機結果

May 31, 2020

我正在建立選股模型，並挑選前 5 名和後 5 名的股票。鑑於隨機梯度體面結果的可變性，它們不斷變化。獲得一致結果的一種方法是使用隨機種子，但我正在尋找是否有更好的方法來處理這個問題。此外，您將如何解釋結果，即一組前 5 名與另一組前 5 名（其中 3-4 名相同，但排名可能不同）。我正在執行足夠的迭代以知道這不是關於收斂的問題。

您是否嘗試過選擇任意數量的模型，比如 20 個，每個模型都有自己的種子？然後你執行你的 20 個模型並使用 20 個結果的中值作為信號。該方法的一個優點是，由於 20 個結果的標準差，您還可以獲得預測的可信度估計。

隨機解是隨機方法不可避免的特性，尤其是優化方法。例如，參見《計量經濟學啟發式優化方法評論》中的第 3 節。一般來說，你無法擺脫隨機性。您需要通過查看和分析分佈（例如投資組合）而不是單個數字來分析它。例如，參見《另類投資組合選擇標準的實證分析》（我是其中的合著者）。
收斂意味著（充其量）算法已經停止在局部最優。如果您有多個最優值，則算法可能會在不同的最優值處停止。您是否比較了重複執行的目標函式值？即使它們相同：這意味著算法，或者更具體地說，您的選擇標準（=目標函式）無法區分不同的解決方案。您能否修改模型，例如添加更多約束？

引用自：https://quant.stackexchange.com/questions/54340

相關問答

固定收益與股票中的 ML/AI

August 9, 2022

QF 領域最近有哪些有趣的與機器學習相關的發展？

July 5, 2022

AFML（由 Lopez De Prado 撰寫）與 Trevor Hastie 的 ESL

June 6, 2022

如何將機器學習算法應用於股票市場？

April 24, 2022

最佳執行和強化學習

April 24, 2022

是否有任何關於應用狀態空間或動態線性模型來預測股票風險溢價的研究？

April 22, 2022