金融數學

獲取隨機相關變數集

  • June 19, 2019

對於機器學習模型的訓練,我需要添加額外的特徵(宏變數),並且這些特徵是相關的。我需要執行模型 N 次,並且每次都必須添加隨機特徵。

現在,這些功能具有範圍,例如:

Feature 1 (GDP growth) between 2.0 and 3.5
Feature 2 (Unemployment) between 4.4 and 5.1
Features 3 (Dow Jones index) between 22000 and 24000

通過 Cholesky 分解,我可以獲取其中一個特徵並使用相關矩陣獲得其他特徵。輸入將是其中一個特徵的固定值,結果是其他相關特徵的值。

但我需要的是系統在範圍內計算 N 組隨機特徵。所以沒有一個輸入來生成特徵。

有沒有辦法做到這一點(有或沒有 Cholesky)?

Cholesky(或 SVD 或任何其他基於矩陣乘法的方法)僅適用於正態分佈,而您的特徵不能,因為它們在有限區間內具有值。

要了解 Cholesky 不起作用的原因,假設有兩個額外的特徵,它們是獨立統一的 $ (U_1,U_2) $ . 現在您要創建具有相關性的特徵 $ \rho $ 乘以 $ U $ 與 Cholesky 因子 $ C $ IE $ Y = U C $ . 不難看出,Cholesky 因子為 $$ C=\begin{pmatrix} 1 & \rho \ 0 & \sqrt{1-\rho^2}\end{pmatrix}. $$

這意味著$$ Y = (U_1, U_1 + \sqrt{1 - \rho^2}U_2). $$ 雖然第一個功能 $ Y_1=U_1 $ 很好,你的第二個變數 $ Y_2 $ 不再是統一的,它將具有不同的範圍 $ U_2 $ .

現在你可能有一個想法,你可以從 $ Y_2 $ 然後嘗試逆向工程 $ U_2 $ 和 $ U_1 $ 從中獲得正確的模擬輸入。這個想法的問題是這樣的一對可能並不總是存在。從任意邊距(即獨立的獨立特徵)開始,可能不存在具有規定相關矩陣的聯合分佈。關於邊際分佈和相關矩陣的哪些組合是可能的存在限制。看看 Embrechts、McNeil 和 Straumann 的這篇論文

所以,你可以做什麼?如果您很幸運並且對精度不太挑剔,那麼以下務實的方法可能會奏效:

  1. 從高斯 copula 模擬參見 Wikipedia,將您想要獲得的相關參數作為參數
  2. 應用機率積分變換根據 1 對特徵重新排序。
  3. 測量重新排序的特徵的相關性,如果它們沒問題,那麼你就完成了
  4. 如果它們不正確,重複 1. 稍微改變高斯 copula 的參數

引用自:https://quant.stackexchange.com/questions/46128