機器學習
處理機器學習模型的隨機結果
我正在建立選股模型,並挑選前 5 名和後 5 名的股票。鑑於隨機梯度體面結果的可變性,它們不斷變化。獲得一致結果的一種方法是使用隨機種子,但我正在尋找是否有更好的方法來處理這個問題。此外,您將如何解釋結果,即一組前 5 名與另一組前 5 名(其中 3-4 名相同,但排名可能不同)。我正在執行足夠的迭代以知道這不是關於收斂的問題。
您是否嘗試過選擇任意數量的模型,比如 20 個,每個模型都有自己的種子?然後你執行你的 20 個模型並使用 20 個結果的中值作為信號。該方法的一個優點是,由於 20 個結果的標準差,您還可以獲得預測的可信度估計。
隨機解是隨機方法不可避免的特性,尤其是優化方法。例如,參見《計量經濟學啟發式優化方法評論》中的第 3 節。一般來說,你無法擺脫隨機性。您需要通過查看和分析分佈(例如投資組合)而不是單個數字來分析它。例如,參見《另類投資組合選擇標準的實證分析》(我是其中的合著者)。
收斂意味著(充其量)算法已經停止在局部最優。如果您有多個最優值,則算法可能會在不同的最優值處停止。您是否比較了重複執行的目標函式值?即使它們相同:這意味著算法,或者更具體地說,您的選擇標準(=目標函式)無法區分不同的解決方案。您能否修改模型,例如添加更多約束?