建立自定義索引;從網路獲取數據;統計分析;Python 還是 R?
我想建立幾個自定義索引。我希望能夠在輸入中輸入股票程式碼,並在 x 期間從 yahoofinance、google 金融、finviz 等下載 ohlc、數量、定性 …數據。由此,我想為高動量股票和價值股票建立一個幾何平均指數。然後,我想對這些指數進行分析,因為它們相互關聯。哪些股票在 x 週期內具有最高/最低相關性、數量/範圍分析、x 週期內的動量、配對交易的 sma ……這是 python 或 R 的工作嗎?你對我需要哪些包/資源來進行這種分析有什麼建議嗎?我感謝您的幫助。
除了上述答案 - 您應該非常小心,不要在創建索引時引入倖存者偏差,並仔細選擇您的數據源以消除這種偏差。例如,雅虎財經僅包含目前上市的證券。
R 和 Python 都可以很好地做到這一點。
對於 Python,您將需要
pandas
包及其依賴項。pandas
有很多基本的統計資訊,但是對於看起來像你想做的更高級的統計資訊,你可以使用statsmodels
包,它可以直接處理pandas
數據類型。如果給定 URL,它也可以csv
直接從網站下載文件,甚至從https
網站下載。此外,它可以下載您想要的股票數據,只需為其提供股票程式碼和日期範圍。您可以下載像 anaconda 或 python(X,Y) 這樣的 python 發行版,它們將具有pandas
並statsmodels
內置,因此無需額外安裝。R 不需要任何額外的包。它可以為您的目的做大致相同的事情
pandas
。statsmodels
如果給定一個 url,它也可以csv
從網上下載文件,但顯然會阻塞 https 文件(它pandas
不會),儘管您甚至可能沒有通過這些程序下載任何文件。不過,您可以在 R 中使用其他工具來執行此操作,而且它可能只會添加一兩行額外的程式碼。使用其他軟體包,例如quantmod
或Quandl
,它還可以使用程式碼和日期範圍下載股票數據。