股票

關於移動線性相關(滾動相關)

  • December 17, 2021

假設我有兩個隨機變數 $ X $ 和 $ Y $ 每個代表兩隻給定股票的每日收益。我可以通過找到它們的共變異數矩陣來輕鬆計算它們的(總)相關性 $ \Sigma[X, Y] $ . 但是,我想繪製它們在整個時間中的相關性;不只是一個點。因此,我想有一個它們的相關性向量,如下所示: $ C = { \textrm{corr}_0, \textrm{corr}_1, \cdots, \textrm{corr}_m } $ . 這是我的嘗試:

讓 $ X = {x_1, x_2, x_3, x_4, \cdots, x_n} $ 和 $ Y={y_1, y_2, y_3, y_4, \cdots, y_n} $ 是隨機變數。因此,我們將其整個時間的相關性定義為(如在評論中,它的名稱是滾動相關性)為

$$ \begin{equation} \textrm{corr}[X, Y | k] := \frac{ \textrm{cov}[X, Y | k]}{\sigma_X \cdot \sigma_Y} := \frac{\displaystyle\sum_i^{i+k-1} (x_i-\bar{x})(y_i-\bar{y})}{(k) \cdot \sigma_X \cdot \sigma_Y}, i = {1, 2, 3, \cdots n-k+1} \end{equation} $$

等效地,我會將兩者分開 $ X $ 和 $ Y $ 進入 $ j $ 子集使得每個滿足 $ |X_j|=|Y_j|=k $ 然後計算它們的相關性 $ \textrm{corr}[X_j, Y_j] $ 最後將其包含到向量中 $ C $ .

這是在整個時間內找到相關性的最佳方法嗎?它甚至正確嗎?

謝謝

您的問題確實是關於您的兩種工具之間相關性的平穩性 $ X $ 和 $ Y $ .

為了從理論上講清楚,讓我們考慮它們的 2D 聯合分佈 $ (X,Y) $ :

  • 首先,您需要決定是否要考慮它們是否具有自相關或者它們是否是獨立同分佈的,簡而言之:是 $ (X,Y) $ 一個隨機過程還是一對隨機變數?
  • 那麼你是否假設 $ (X,Y) $ 是在任何時間點都相同(強平穩性)還是只是少數統計數據(如波動率、相關性和平均值)在任何時間點都相同(弱平穩性)?
  • 請注意,對於Gaussians,弱平穩性意味著字元串平穩性,因為 (vol,cor,mean) 是一個充分的統計量。
  • 當然你可以假設那裡沒有任何類型的平穩性,但一切都會更複雜。

為簡單起見,假設 $ (X,Y) $ 是一個弱平穩的隨機變數,那麼在一個時間視窗上計算的經驗相關性之間的唯一區別 $ [t_1,t_1+w_1] $ 在另一個上 $ [t_2,t_2+w_2] $ 是採樣雜訊。這意味著當 $ w_1 $ 和 $ w_2 $ 由於中心極限定理,共同走向無窮大:您將獲得相同的相關性並且收斂將發生在 $ 1/\sqrt{\min(w_1,w_2)} $ (對於均勻採樣的數據)。

如果現在您不相信相關性的平穩性(請注意,您可以有邊際波動率的非平穩性,請說服自己仍然擷取了它,例如由於 2 個 GARCH,因此相關性現在是平穩的),那麼上計算的經驗相關性 $ [t_1,t_1+w_1] $ 和 $ [t_2,t_2+w_2] $ 不一樣有兩個原因

  1. 估計雜訊(如在靜止情況下)
  2. 共變異數的變化(您可以將其命名為協變數變化並閱讀這本好書:非平穩環境中的機器學習,作者 Sugiyama 和 Kawanabe)

而你面臨一個困境:窗戶越大 $ w_1 $ 和 $ w_2 $

  • 估計雜訊越小
  • 但是,您將來自不同潛在相關性的估計混合得越多。

這是微妙的,如果沒有實證調查,您將無能為力:

  1. 經驗相關性的時間序列如何隨時間變化?
  2. 什麼引導程序可以告訴您有關估計雜訊的資訊?(請注意,如果您看到的是隨機過程而不是 iid 隨機變數,則引導是微妙的,請查看Evarist Giné的關於引導的某些方面的講座)。

A 列是資產 A 的價格

B欄是資產B的價格

C是A的回報

D是B的回報

E 是 CORREL(OFFSET( $ D,-t,0,t+1,1),OFFSET( $ E,-t,0,t+1,1))

F是很酷的東西我想把我的相關性關聯起來講一個好故事

G 是相關的(偏移量( $ E,-t,0,t+1,1),OFFSET( $ F,-t,0,t+1,1)),即相關性與真實事物的相關性。

按 F9。

其中“t”是回顧,視覺上針對最酷的圖表進行了優化。唯一的限制是 1d, 1w, 1m, 3m, 6m, 200d=9m 等,因為偏離經典的市場時間界限將是過度擬合的明顯“跡象”。

對缺乏適當的統計符號表示歉意。而且,是的,我誇大了一點。但是上面的過程幾乎讓我的兩個孩子上了私立學校。

您的問題的真正答案是(a)這真的很簡單,在 Excel 中滾動執行;不需要符號。並且 (b) 沒有理論上或經驗上正確的方法來定義您用於隨時間演變計算滾動的樣本。除非你有幸擁有一些直覺的經濟理論,否則回報應該取決於價格。但是,一般來說,在使用符號而不是 Excel 公式加 F9 的出版世界中,這本身被認為是反對效率的異端;-)

但是,如果你想變得非常可愛,你可以做到……計算你的滾動相關性。然後計算相關性的自相關。從中您可以得出相關持久性的半衰期……除了我認為我們都知道這是“擊中 F9”的統計等價物;-)

誠實的答案是 65d(即一個日曆季度的 65 個交易日)、200d(即 9m,很多東西可能是 6-12m 所以人們使用 9)或 12m;而 3y 則傾向於作為此類分析的“短期”、“戰術”和“中期”的市場基準。他們只是分析師和客戶在這裡認識的魔鬼。

希望這會有所幫助,DEM

ps隨著時間的推移不斷演變的相關性的直覺解釋是一個完全不同的主題,我害怕另一天。當然,假設它們是非平穩的(就像市場數據中的大多數實例一樣)。

引用自:https://quant.stackexchange.com/questions/69133