機器學習
在這個行業中用於非監督式學習的機器學習語言是什麼?
我想知道那些有商業機器學習金融經驗的人,在這個行業中,最一般意義上的機器學習語言選擇是什麼。
此外,什麼是自適應、非監督式機器學習的最佳語言,以便為交易決策提供資訊。
當我說最好時,我的意思是速度和開發人員生產力的平衡,以及在某種程度上現有的庫,儘管使用通用深度學習工具這可能會更輕。
R。
其他在場的是 Python,而且越來越多的是 Scala。但是,如果您嘗試為新問題創建或測試機器學習算法,那就是 R。
2017 年 7 月 2 日更新:這個答案出現在我的提要中,因為有人讚成,所以我認為它值得更新。
這些天來,我選擇哪種語言來解決問題有幾個關鍵的決定因素。問題是對無法在一台機器上放入記憶體的數據進行分析,那麼我可能會使用 Scala for Spark。如果它可以放入記憶體並且數據是相關欄位是數字或類別的形式,那麼我將使用 R。如果數據包含文本或圖像,那麼我更有可能使用 Python (除非我打算使用其中一個 R 文本建模包。)
Python。Scikit-learn是一個用 Python 編寫的強大的機器學習庫。除了統計模型和張量流等庫。Python 是一種穩定的生產級語言(Quantopian 也使用)。
對於非監督式學習,您可能需要研究不需要提前了解集群的相似性傳播、DBSCAN 或 Dirichlet-Process K-Means 算法。對於文本數據,LDA 和線上 HDP 對學習主題很有用。