機器學習

統計學習庫

  • December 22, 2016

是否有一個通用(或專業)的免費圖書館來解決“統計學習的要素”一書中的學習問題。由於編寫所有統計學習算法通常很耗時,我想知道量化金融中使用了哪些(免費)庫。

我正在考慮不用於數值計算的語言庫。所以 R 或 Matlab 庫不適合這個問題的範圍。歡迎使用 C/C++/C# 或 Java 庫。

如果您正在尋找 Java 或 C/C++/C#,那麼與查看 R、Matlab 或 Python(使用 Scipy)相比,您將遇到更多困難。

對於其他語言,我建議:

  • Java:Weka是目前最完整的數據探勘庫之一。幸運的是,它還附帶了一本非常好的書—— 《數據探勘:實用機器學習工具和技術》 ——涵蓋了數據探勘領域。他們剛剛推出了一個新版本。
  • C++:根據我的經驗,最完整、有據可查的庫是Shark。只需注意一點:當他們開始使用 Boost 替換現有的 Array 庫時,它目前正在經歷一個相當大的修訂。

一般來說,我不知道你為什麼不為此使用 R。它是免費提供的,非常完整,有很多文件,並且可以很容易地與 Java ( RJava ) 和 C++ ( Rcpp ) 互動。另外,如果您使用的是“統計學習要素”:該教科書使用 S-Plus/R 進行所有分析。R 是我所知道的唯一一種包含本書所有算法的語言(包括諸如lars之類的東西,它是由本書的一位作者創建的)。我開始慢慢地在我的部落格上用 R 語言複製那本書中的大部分關鍵範例。

引用自:https://quant.stackexchange.com/questions/430