時間序列

隨著時間的推移優化主成分因子權重

  • December 28, 2015

我得到了 ETF 跨資產類別投資組合的回報,我進行了 PCA 以獲得 Tn、T-3、T-2、…、T 的日期因子。我想做的是分解市場從 T+1, T+2, … 向前移動到 PC 的組合。

我的問題是,我可以使用什麼樣的算法或優化方法來獲得一組因子權重,以解釋未來市場走勢中的最大變異數。此外,這種優化方法應該能夠輸出一個最大值列表,而不僅僅是一個,以便可以隨著時間的推移評估最優因子權重的穩定性,因為一天/時間段的最優因子權重可能不同作為較長時期內的最佳因子權重。

你的方法很好。但在您冒險走得太遠之前,您應該注意與相關矩陣的零特徵值(正半定性)相關的問題 $ \mathbf{R} $ 或共變異數矩陣 $ \mathbf{C} $ . 讓 $ p $ 是資產的數量,和 $ t $ 例如,天數或柱數。您在時間序列中的次數可能比資產次數多得多,因此, $ t\gg p $ . 由於您將數據集放在一邊,並將日期視為變數,將資產視為觀察結果,因此會有 $ t-p $ 共變異數矩陣中的零特徵值 $ \mathbf{C} $ .

鑑於上述情況,永遠不要忽視馬科維茨投資組合優化的基本前提,其中資產之間的共變異數(不是天數)是確定的,而且天數非常大(每年 250 個交易日)與資產數量相比。預設情況下,Markowitz 不需要過多擔心零特徵值 $ \mathbf{C} $ 在介紹他的理論時 $ t\gg p $ .

因此,作為一種解決方案,您可以在您的電腦上使用奇異值分解 (SVD) $ \mathbf{C} $ ,這是大維度和低範例數據集的理想選擇。完成後,您將觀察到某些日子(柱狀圖)將“載入”某些主要成分——因此您基本上是在辨識相似的交易日組。由於主成分在定義上是正交的(它們之間的相關性為零),因此您需要考慮一種將結果投射到未來的方法。然而,總體而言,您為所涉及的 ETF 所做的工作將有很高的價值,因為您將能夠了解一攬子 ETF 的交易日結構和使用的天數。

這是一項複雜的工作,因為涉及到很多問題 $ t \gg p $ ,您無疑會遇到涉及的 Marcenko-Pastur 定律 $ \gamma=p/t $ 和隨機數據矩陣。例如,看看約翰斯通的演講

引用自:https://quant.stackexchange.com/questions/9859