波動率

在不改變中位數的情況下減少標準偏差的轉換

  • April 25, 2013

考慮一些負偏斜和高峰度返回時間序列 $ X_t $ . 我不知道 pdf 的函式形式 $ X_t $ 並擁有大約 150,000 個數據點。

假設我要創建一個調整後的 $ X_t $ 叫 $ X_t^a $ 其中均值、中值、偏斜和峰度與原始序列大致相同,唯一的主要區別是 $ \sigma (X_t) = 2*\sigma (X_t^a) $ .

什麼是合適的轉變?我試過了:

$$ X_t^a := (X_t - E[X_t])0.5\frac{\sigma(X_t)}{\sigma(X_t)} + E[X_t] \ = Z0.5\sigma(X_t) + E[X_t] \sim N(E[X_t],(0.5\sigma(X_t))^2) $$ $$ Z \sim N(0,1) $$ 但這嚴重地將正中位數降低到零,這不是我想要的(我想保留 $ \text{median}(X_t) $ 大約等於 $ \text{median}(X_t^a) $ ).

像您提到的那樣進行簡單的線性變換是不可能的:由於需要改變比例以及平均值和中位數之間的距離,因此不會保留平均值或中位數。因此,您必須使用非線性變換,這將使維持偏斜和峰度變得相當複雜,而且恕我直言無論如何都沒有意義(維持統計數據所需的扭曲對經驗 PDF 弊大於利)。

對不起,如果我建議挑戰要求:為什麼要保留均值和中值?這些統計數據除了提供位置估計之外沒有太多內在價值(但不是同一個位置:即使有完整的 PDF 知識,它們也會有所不同!但仍然可能將其中一種轉換為另一種),迫使這樣一個兩者之間的關係聽起來像是麻煩的秘訣。另一種方法是將位置統計定義為兩者的平均值,並在簡單的線性變換中保持該常數。或者甚至更好地使用更強大的位置統計來代替兩者。

正如 Quartz 所說,可以在考慮偏斜和峰度的情況下進行非線性變換,但這主要限於單變數過程(at 分佈的一種方法是匹配矩)。對於多變數過程,這要困難得多。更通用的解決方案是依賴Entropy Pooling。您可以在單變數或多變數設置中查看過程的中位數和變異數。之後請仔細檢查有效的場景數量,以防您無意中採取了極端的觀點(如果固定中位數並減小標準偏差,則不太可能,但如果使標準偏差足夠大,則可能)。

引用自:https://quant.stackexchange.com/questions/7812