投資組合優化
非奇異共變異數矩陣估計的觀測數
Marcos López de Prado 在他的《金融機器學習進展》一書中寫道:
通常,我們至少需要
\frac{1}{2} N (N+1)
獨立且同分佈 (IID) 的觀測值來估計大小為 N 的非奇異共變異數矩陣。例如,估計一個大小為 50 的可逆共變異數矩陣至少需要 5 年的每日 IID 數據。這麼多觀察的原因是什麼?我在哪裡可以找到一些我可以引用的與此相關的資源?
的共變異數矩陣 $ N $ 股票(或其他)包括 $ N(N+1)/2 $ 不同的元素,因此,為了合理地統計測量這些元素,您的獨立觀察次數 $ ND $ ( $ D $ 是天數)應該遠遠超過 $ O(N^2) $ , 或者 $ D\gg N $ . 這個要求比共變異數更嚴格 $ C_{ij}=\sum_dR_{di}R_{dj} $ 滿級。後者只需要 $ D=N $ 天來積累。
但問題在別處:隨機矩陣理論(RMT) 表明與共變異數條件數和反演/求解/優化任務相關的特徵值分佈非常緩慢地收斂到“真實”分佈,誤差僅減少作為 $ \sqrt{N/D} $ . De Prado 的書實際上也討論了 RMT 方面。如果觀察不完全獨立,則進一步增加所需的天數:可以引入獨立觀察的有效數量的統計量。