使用 ML 違約機率的風險回報率
我可以訪問一個非常大的債券數據庫(>20m 行),其中 50% 的集合是到期債券,其中一個虛擬變數辨識債券是否違約。剩下的 50% 是“活”債券。
我已經訓練了一個 ML 分類器並預測了集合中“實時”組件的預設機率。我的最終目標是從風險調整回報的角度評估實時數據集。我想出了以下增強的夏普比率 $ \tilde{S_i} $ 可以在單個債券的基礎上應用:
$ \tilde{S_i} = \log [ \frac{R_i}{\hat{p_i}(\text{Default})}] $
有人知道評估債務證券風險調整後預期回報的類似方法嗎?我的方法對你有意義嗎?我可以高度使用一些評論。
免責聲明:這些只是意見,我不一定有這個話題的權威知識。
如果您考慮傳統的夏普定義:
$$ S = \frac{reward}{risk} $$ 其中回報是預期回報(高於無風險利率),風險是回報的標準差,我不清楚你的增強夏普比率與此有何關係。相反,我本能的方法是在貝努利分佈下模擬債券的回報 $ p_i $ 違約機率,即當隨機變數 $ X_i=1 $ 如果沒有預設值 $ X_i=0 $ . 此外,我們需要一些時間一致性,所以我將在一段時間內進行測量 $ \Delta t $ .
$$ reward_i = (100 + r_i) (1 - X_i) + 100(1-L_{gd})X_i - C_i $$
在哪裡 $ r_i $ 是債券的回報超過 $ \Delta t $ , $ C_i $ 是一些標準化,比如減去無風險利率,給定違約因素我們會有損失。如果你讓 $ R_i=100+r_i $ 和 $ L_i=100(1-L_{gd}) $ 然後;
$$ E[reward_i] = R_i(1-p_i)+L_ip_i-C_i $$ 和 $$ Var(reward_i) = Var((-R_i+L_i)X_i)=(R_i-L_i)^2p_i(1-p_i) $$
所以你最終得到了一個公式,它說明了這一點;
$$ Sharpe(p_i; R_i, L_i, C_i) = \frac{R_i(1-p_i)+L_ip_i - C_i}{\pm(R_i-L_i)\sqrt{p_i(1-p_i)}} ;. $$
作為一個完全獨立的觀點,我懷疑您的機器學習過程將通過以預設時間的數據為條件而受益。如果我記得的話,這是信用危機中基於 copula 的模型的失敗。它最終可能是一個相當複雜的模型公式,該公式基於預設值的及時性來解釋相似性。
為嚴厲的批評感到高興..不要退縮..