相關

共變異數/相關性對極端事件的模型依賴性的最自然概括

  • November 17, 2020

共變異數/相關性最嚴重的缺點之一是線性和正態性假設。

當您想使用重尾分佈(例如廣義極值分佈)對極端事件的依賴結構進行建模時,這些依賴度量最自然的概括是什麼?

對於“最自然的概括”,我的意思是當通常的假設成立時,經典的共變異數/相關性作為特例包含在內。

(披露:這個問題在大約兩週前發佈在Cross Validated上,但沒有收到任何答案)

互資訊衡量知道一個變數在多大程度上減少了另一個變數的不確定性。它考慮任何類型的依賴關係(線性或非線性),以比特為單位,廣泛用於機器學習、電腦視覺 NLP 和其他領域。

user27915816 的回答將我引向了正確的方向,但我認為我找到了更好的概括:

距離相關(dCor)

有幾個原因:

  1. 線上性是一種特殊情況的意義上,它概括了經典(即線性)相關性。它給出了相同的線性相關讀數。
  2. 有變異數、共變異數和標準差的類似物,所以這些恆等式成立:$$ \operatorname{dVar}^2_n(X) := \operatorname{dCov}^2_n(X,X) $$和$$ \operatorname{dCor}(X,Y) = \frac{\operatorname{dCov}(X,Y)}{\sqrt{\operatorname{dVar}(X),\operatorname{dVar}(Y)}} $$
  3. $ dCor=0 $ 暗示真正的獨立性,所有其他讀數暗示線性或非線性相關 - 比較以下讀數,首先是線性相關(來源):

在此處輸入圖像描述

和距離相關性(來源):

在此處輸入圖像描述

注意,前面的過度簡化:它顯示這種行為的原因基本上是它是隨機變數的特徵函式的相關性,即機率密度函式的傅里葉變換,即從時間到頻域的旋轉。因此,不僅要測試線性相關性,而且基本上可以用(週期性)復指數函式表示的所有函式相關性。要獲得直覺,還請閱讀這篇文章:這裡

ExcelR中有實現。

引用自:https://quant.stackexchange.com/questions/4816