建立自定義索引；從網路獲取數據；統計分析；Python 還是 R？

March 31, 2015

我想建立幾個自定義索引。我希望能夠在輸入中輸入股票程式碼，並在 x 期間從 yahoofinance、google 金融、finviz 等下載 ohlc、數量、定性 …數據。由此，我想為高動量股票和價值股票建立一個幾何平均指數。然後，我想對這些指數進行分析，因為它們相互關聯。哪些股票在 x 週期內具有最高/最低相關性、數量/範圍分析、x 週期內的動量、配對交易的 sma ……這是 python 或 R 的工作嗎？你對我需要哪些包/資源來進行這種分析有什麼建議嗎？我感謝您的幫助。

除了上述答案 - 您應該非常小心，不要在創建索引時引入倖存者偏差，並仔細選擇您的數據源以消除這種偏差。例如，雅虎財經僅包含目前上市的證券。

R 和 Python 都可以很好地做到這一點。
對於 Python，您將需要pandas包及其依賴項。 pandas有很多基本的統計資訊，但是對於看起來像你想做的更高級的統計資訊，你可以使用statsmodels包，它可以直接處理pandas數據類型。如果給定 URL，它也可以csv直接從網站下載文件，甚至從https網站下載。此外，它可以下載您想要的股票數據，只需為其提供股票程式碼和日期範圍。您可以下載像 anaconda 或 python(X,Y) 這樣的 python 發行版，它們將具有pandas並statsmodels內置，因此無需額外安裝。
R 不需要任何額外的包。它可以為您的目的做大致相同的事情pandas。statsmodels如果給定一個 url，它也可以csv從網上下載文件，但顯然會阻塞 https 文件（它pandas不會），儘管您甚至可能沒有通過這些程序下載任何文件。不過，您可以在 R 中使用其他工具來執行此操作，而且它可能只會添加一兩行額外的程式碼。使用其他軟體包，例如quantmod或Quandl，它還可以使用程式碼和日期範圍下載股票數據。

引用自：https://quant.stackexchange.com/questions/17176

建立自定義索引；從網路獲取數據；統計分析；Python 還是 R？

相關問答

使用 ISIN 辨識 yahoo Finance 的股票

Python vs R（vs Stata）：重溫舊戰

如何簡單地計算對指數基金賬戶的定期供款的未來價值？

僅在給定資本收益和收入回報的情況下計算總指數回報

股票指數的市盈率

迷你日經期貨合約 - 點值和點值