因子模型
如何交叉驗證基金收益是否是由於靜態因子暴露?
我目前正在處理以下問題。
我正在使用套索回歸來模擬對沖基金的回報並了解他們的風險敞口。這個想法是,如果他們的回報僅僅是由於因素,沒有理由支付 2&20 並且應該簡單地從最便宜的提供商(etf、smart beta 基金等)購買這些因素敞口。
執行回歸併查看 R^2 會有所幫助,但對我來說似乎並不令人滿意,因為具有足夠可能因素的回歸會過度擬合併虛假地解釋一切。
最近,我一直在嘗試通過對 8 年的數據進行回歸訓練來進行交叉驗證,然後在 2 年或更多年的樣本中測試預測結果。我覺得必須有一種比這種天真的遺漏方法更嚴格的方法,特別是要記住,許多經理的業績記錄都很短。
有什麼建議嗎?像 k-folds 這樣的東西對這種類型的時間序列數據有效嗎?
ps 順便說一句,我正在使用 R,因此任何應用的建議都會有所幫助。
下面的兩個參考資料都專門討論了您正在研究的問題,並討論了可能感興趣的方法。
- 在複製對沖基金回報並研究它們是否可以用共同因素來解釋方面已經做了很多工作。關於這個主題的開創性論文由 Andrew Lo 撰寫
- 此外,在哥倫比亞大學時,Andrew Ang 在他的論文中通過公因子解釋了對沖基金回報的出色工作,這在某種程度上開啟了 smart beta 革命。
wrt R 包 - caret包是您想要查看的包。這是關於插入符號的參考,它討論了使用插入符號進行數據分區、線性回歸和交叉驗證。