風險管理

重疊時間序列數據的經驗分佈函式

  • October 13, 2017

如果我們對超過 1 天(比如超過 1 天)的資產回報波動率進行建模,那麼在某些假設下,平方根規則是成立的。如果我們查看經驗分佈函式,情況會更加棘手。

為了解決這個問題,從業者有時會使用滾動、重疊的數據。將它們視為不重疊對我來說似乎是錯誤的(這是錯誤的)-但是錯誤的程度如何以及如何解決該方法?

用錯我的意思是分配 $ \sum_{i=1}^{180} r_i $ 和 $ r_i $ 採樣不相關將與此重疊數據樣本的分佈不同。

我聽說他採用了以下建模方法:他們取了一個樣本 $ 1000 $ 每日觀察(每日回報/百分比變化),然後它們建立滾動 $ 180 $ 天返回。最後,他們研究了這些滾動/重疊收益的經驗分佈函式 (edf) 和經驗分位數。

數學上他們有 $ (r_i)_{i=1}^{1000} $ 然後他們看著

$$ y_1 = \sum_{i=1}^{180} r_i, \quad y_2 = \sum_{i=2}^{181} r_i, \quad y_3 = \sum_{i=3}^{182} r_i, \cdots $$ 的樣本 $ (y_i){i=1}^{820} $ 是一組強依賴隨機變數。它的edf有什麼特點?它與樣本的edf有什麼關係 $ (r_i){i=1}^{1000} $ ? 我們如何關聯波動率估計?

當我們談論資產回報時,我們可以假設 $ (r_i)_{i=1}^{1000} $ 序列不相關但不獨立。這使得嚴格的治療變得困難。

這是一個交叉文章,因為這個問題沒有得到足夠的關注(經過幾天和賞金)。

關於例如基於重疊數據的年度數據的變異數(例如 2015 年 1 月 1 日至 2016 年 1 月 1 日、2015 年 1 月 2 日至 2016 年 1 月 2 日、2015 年 1 月 3 日至 2016 年 1 月 3 日……等等),可以說些什麼。經驗分佈函式可能太難了。但是變異數呢?

總結目標是:

  1. 估計下一年收益/損失分佈的分位數(使用過去的重疊年度數據)。
  2. 估計下一年收益/損失的變異數(使用過去的重疊年度數據)。

當我們只有重疊數據時,結果可能是上述數量的估計量的一組屬性。可能存在必須糾正的偏見。

編輯:正如一些使用者指出的一種方式來看待它作為引導統計。我開始閱讀這篇文章:金融的引導方法:審查和分析以及其中的參考資料。自舉的觀點看起來最有希望。我還沒有得到一個完整的答案。

分位數和變異數關係取決於您正在分析的數據。首先考慮您的數據(統計上)很好的情況。也就是說,你的一期回報 $ r_i $ 都是高斯和獨立同分佈

我們形成總和

$$ y_i = \sum_{j=t-(k+1)}^t r_j $$ 當然,它們本身是高斯的,但正如您所注意到的,它們現在高度自相關 $ k>0 $ . 跟隨Harri 和 Brosen,我們看到任何 OLS 擬合 $ y_i $ 將有誤差項的變異數 $ k $ 乘以 OLS 的變異數擬合一期收益。由於均值估計量可以看作是一個微不足道的 OLS 回歸,因此我們有 $ \bar{y} = k\bar{r} $ 和

$$ \mathrm{Var}\left[y_i-\bar{y}\right] = k , \mathrm{Var}\left[r_i-\bar{r}\right] $$ 因為一切都是高斯的,所以分佈函式完全遵循。

如果這就是整個故事,我們會得出結論,從來沒有任何真正的理由像這樣過度採樣,然後就這樣吧。

當我們假設存在某種潛在趨勢時,事情會變得更有趣 $ r_i $ 或測量誤差的模式 $ r_j $ . 例如,如果會計中的某些缺陷導致季度銷售與庫存比率表現出季節性模式,那麼這些模式將在年度總和中“消失”。本質上,我們將利用錯誤結構來獲得

$$ \mathrm{Var}\left[y_i-\bar{y}\right] < k ,\mathrm{Var}\left[r_i-\bar{r}\right]. $$ **編輯:**您詢問了共變異數結構 $ y $ . 對於任意兩個觀察 $ y $ 我們有(擴展哈里和布羅森)

$$ \mathrm{Cov}(y_\ell, y_j) = \mathrm{Var}({r_i}) ,(\ell-|\ell - j|)^+ $$ 在哪裡 $ (\cdot)^+ $ 表示返回的函式 $ \max(\cdot, 0) $ .

引用自:https://quant.stackexchange.com/questions/17441