我應該將哪些數據用於機器學習模型
我想請教你們中的任何人的建議,這些資訊可以幫助我獲得這些資訊,這將非常有幫助。
我正在嘗試建構一個基於目前和過去股票數據的強化學習交易機器人,它將嘗試預測何時是買賣股票的最佳時機。但我的問題是我如何才能以一種可以幫助我的模型更快學習的方式對數據進行規範化,以及我應該使用什麼獎勵?
在目前階段,我的標準化策略由兩部分組成
- 將價格轉換為價格與前一價格相比上漲或下跌的百分比
- 使用 MinMax 比例
同樣在獎勵方面,我使用的是sortino ratio。
還有其他更好的選擇嗎?
如果您要問這些問題,那麼您不太可能以您目前的技能水平成功地訓練任何類型的股票數據機器學習或人工智慧模型。
事實上,您提出的每一個問題通常都需要數週、數月以及——在某些情況下——數年的試驗,以發現潛在功能的正確組合。在強化學習中,僅僅找出正確的獎勵函式是一項比看起來要困難得多的任務。
也就是說,我鼓勵您進行廣泛的研究。從一本好書開始,比如 Marcos Lopez de Prado 的《金融機器學習進展》。如果您從頭開始,請從 Andrew Trask 的“Grokking Deep Learning”一書開始,然後繼續閱讀 The Deep Learning Book https://www.deeplearningbook.org/
確保您深入了解統計學的基礎知識。真的,真的,真的很深入。不要跳過這一點。學習和練習基礎統計技能,就像你的生活依賴它一樣。做 Kaggle 挑戰來和他們一起磨牙。您需要知道如何不自欺欺人,紮實的統計方法和假設檢驗基礎將是您在這條孤獨而漫長的道路上的唯一指南。精通線性代數和矩陣數學。有一些堅實的微積分基礎。
網路上有大量的課程和教程——尤其是在 YouTube 上。Udacity 也有很好的人工智慧課程,甚至還有專門的機器學習交易課程。
自然,這些都不會為您指出“答案”。但它們會讓你開始提出正確的問題,最後,開始培養一些直覺,了解如何建構自己的 ML/AI 形式。
祝你好運——這非常困難;地球上最艱鉅的技術挑戰之一。但如果態度和工作正確,也許你會發現一些好的預測信號,然後回到這裡,讓其他人踏上你的旅程!