主成分分析

PCA 和風險分桶

  • September 24, 2021

我有一個債券投資組合,我計算了每個風險桶的 PV01。相關的桶是1m,2m,…,1y,2y,…30y;一共40個桶。

我還執行 PCA 並確定了三個主要組成部分。有人說,使用上述 PCA,通過簡單的矩陣乘法,可以將 40 個風險桶轉換為具有相同風險概況的較小風險桶集。

我知道這是一個非常模糊的陳述,但我不知道這是怎麼發生的。

任何提示/想法?

先感謝您。風險桶和向量

進行矩陣轉換非常簡單,您只需具有以下結構:

$$ \begin{bmatrix} m_{11} & m_{12} & m_{13} & m_{14} & m_{15} & m_{16} \ m_{21} & m_{22} & m_{23} & m_{24} & m_{25} & m_{26} \ m_{31} & m_{32} & m_{33} & m_{34} & m_{35} & m_{36} \ \end{bmatrix} \begin{bmatrix} s_1 \ s_2 \ s_3 \ s_4 \ s_5 \ s_6 \end{bmatrix} = \begin{bmatrix} r_1 \ r_2 \ r_3 \end{bmatrix} $$

在哪裡 $ s_i $ 是您的初始風險(即儲存桶 1m … 30Y),除非在這種情況下假設它們是儲存桶 5y、6y、7y、8y、9y、10y

和 $ r_i $ 是您的新(減少的)目標儲存桶。

你可以設計矩陣, $ M = {m_{ij}} $ ,無論如何你喜歡,所以讓我最初建議一個非常簡單的模型:

線性插值

在這個模型中,點 5y、6y、7y、8y、9y、10y 將被壓縮為 5y、7y 和 10y,在相鄰點旁邊使用線性分配。在這個模型下,我們有以下結構:

$$ \begin{bmatrix} 1 & 0.5 & 0 & 0 & 0 & 0 \ 0 & 0.5 & 1 & 0.666 & 0.333 & 0 \ 0 & 0 & 0 & 0.333 & 0.666 & 1 \ \end{bmatrix} \begin{bmatrix} s_1 \ s_2 \ s_3 \ s_4 \ s_5 \ s_6 \end{bmatrix} = \begin{bmatrix} r_1 \ r_2 \ r_3 \end{bmatrix} $$

這種模式的優點是穩定透明。缺點是它可能無法反映曲線的特殊運動

主成分分析

在這個模型中,矩陣的行是 PC 值,每個風險桶代表該組件的風險。

$$ \begin{bmatrix} …PC1… \ …PC2… \ …PC3… \ \end{bmatrix} \begin{bmatrix} s_1 \ s_2 \ s_3 \ s_4 \ s_5 \ s_6 \end{bmatrix} = \begin{bmatrix} r_1 \ r_2 \ r_3 \end{bmatrix} $$

該模型的優點是在歷史樣本期間測量的最大風險變異數由 3 個風險桶擷取。缺點
是它特定於採樣 的歷史時期,因此在未來不是靜態的或必然可靠的,並且很難對沖單個 PC 風險桶,因為您需要非常精確地交易所有工具。

非線性曲線

這一直是我最喜歡的模型,並且對於交易來說非常可靠和準確。這裡的值 $ m_{ij} $ 是當調整 5Y 7Y 或 10Y 速率時曲線建構過程如何影響其插值方案下的每個工具的函式。這將是一個非線性函式。

該模型的優勢在於,它將可靠地提供一種方法,以僅使用(更少)子抽樣風險桶來準確對沖風險。缺點是它依賴於已知可靠的更複雜的曲線構造,並且必須在顛簸/數值過程下計算矩陣值

我曾經為超過 50 個市場(全球跨資產)執行 PCA 模型,我們曾經用它來辨識和量化宏觀風險因素,所以我知道這是可以做到的。我們曾經用它來客觀地定義“風險承擔、風險迴避”、“量化寬鬆單一貿易”、“美元對新興市場和商品”等。

我不是債券/利率專家,但我很驚訝您想要 PCA Pv01,而不是曲線形狀(即水平)或收益率/價格變動(即變化)。Pv01 不是靈敏度測量,基本上已經是持續時間的函式嗎?我不確定您為什麼要分析持續時間與 f(duration); 但很高興根據充分的理由修改以下內容;-)

正式的過程只不過是從您嘗試 PCA 的任何矩陣中提取特徵向量。如果要在模型中賦予每個樣本成員同等的影響力,則應使用相關矩陣。如果要擷取可能的最大雜訊,請使用共變異數。

為了計算風險信號,下一步是將每個桶的度量與其各自的 PCA 權重(特徵向量)的乘積相加。或者,如果使用相關性,則 sum(metric * weight / metric vol)。那是我的多資產“冒險”。在傳統的曲線模型上,它將是“持續時間”。等等。

快速重要檢查 - 執行 PCA 信號的相關表。如果對角線上不是 1 而其他地方不是 0,則說明出現問題。如果是這樣,但沒有任何意義,那麼您正在準確地測量與您認為或希望測量的不同的東西。使用這種因子獨立性的配置文件,可以很容易地對您的原始值與您的風險因素進行 ((X’X)-1)(X’Y) 多元回歸,並確信不存在多重共線性問題。

大多數人傾向於使用 PCA 的目的是使用降維來比較廣泛的樣本與樣本的“正常模式”,通常是為了突出異常。我曾經精確地知道“冒險”或“流動性減少”的 +/-1 sigma 衝擊對標準普爾、澳元兌日元、HY CDX 利差或德國 2s10s 曲線的價值有多大。或者,經典比率 PCA 可能會暗示曲線的水平、陡度和腹部與兩翼。鑑於這些基於其他所有因素,5y1y、3m7y 或 11y2y 應該分別在 X、Y 和 Z 交易(與實際情況相比,這顯然是我要向我的老闆報告的)。

回顧一下: 1- 仔細考慮您實際要測量的內容以及原因。在 correl 和 covar 之間進行選擇。2-計算特徵向量。3- 這些 * 值的總和(如果相關,則標準化)= 風險因素值 4- 檢查這些是否相互獨立 5- 對於每個輸入,回歸值與風險因素 6- 您現在有了基於廣泛輸入範圍的優化描述在盡可能少的維度上。

如果有什麼不合理的地方,很樂意修改和解釋。

引用自:https://quant.stackexchange.com/questions/49528