大規模投資組合優化/共變異數估計
當使用馬科維茨投資組合理論時,例如尋找最佳投資組合組成,需要估計收益,但最重要的是共變異數矩陣。例如,如果我們的資產/證券領域超過 10,000 個名稱(或只是一個非常大的數字),那麼如何有效地得出共變異數矩陣的可用估計值?
顯然,我們可以使用歷史上觀察到的共變異數/相關性,但鑑於我們有這麼多的名字,這些估計會有多準確?是否可以通過使用某種 PCA 方法來降低維度?
我對完美的解決方案不感興趣,而是對我可以在大規模投資組合優化和參數估計方面閱讀的想法和潛在技術感興趣。
從廣義上講,您可能已經知道,估計大共變異數矩陣有兩種方法:
像Ledoit-Wolf這樣的收縮方法,試圖減少使用傳統方法估計的大矩陣(N x N)中的雜訊。
共變異數因子模型,例如Connor Korajczik 2007中所述,假設只有少數因子很重要。當您提到“某種 PCA 方法”時,這幾乎就是您所想到的。關於估計此類模型的一篇不錯的論文是 從異變異數資產收益中提取因子,作者 Christopher S. Jones
在實踐方面,由 Andrew Ang 指導的 Blackrock 有一個大型項目,該項目正在為大量市場開發和更新一個基於因子的巨大風險模型,這是我所知道的最大的共變異數估計。彭博也在開發此類大型風險模型。
如果您自己進行估算,您必須處理許多實際問題。一是並非所有資產都存在相同的時間長度(Stambaugh 在 1997 年的“分析歷史長度不同的投資”中對此進行了描述)。另一個原因是,不同交易所的股票交易之間的每日相關性很棘手,因為例如紐約和東京的交易時間就完全不同。此外,由於這些和其他問題,您估計的共變異數矩陣通常是非正定的,這在您執行優化器時會導致問題。您必須在使用之前檢查矩陣,並在必要時將其修復為正定矩陣。