時間序列

我們可以在一組多元多周期時間序列數據中對組件進行建模嗎?

  • February 18, 2014

在 10 年的歷史時間線上,每週/每月發生 N 個數據集。

在每個時期,觀察到五個日期(標記為 a 到 e),其中 a 表示時期開始/事件發生的日期(T=0),而 b 到 e 表示事件之後的後續天數(T = 2 到 4) .

創建了一個插圖,以更好地了解組件的結構以及如何將其輸入到統計推斷的公式中。 在此處輸入圖像描述

問題:有沒有一種方法可以從 N 個數據集中引出主成分,並找到相關性?

PS 該模型旨在觀察影響市場價格變化的每周和每月發生的事件/數字(例如在經濟日曆中)。

您的問題更多是關於“如何估計以不同頻率採樣的變數之間的相關性? ”而不是 PCA。畢竟,PCA 只是共變異數(或相關)矩陣的對角化,旨在獲得驅動變數聯合動態的主向量 $ L^2 $ 感覺。

由於數據是通過建構不以高頻率同步的(即您永遠不會同時對兩種不同的工具進行交易或報價更新),因此這個問題被稱為日內金融中的**Epps 效應**(有一天我將創建一個“標籤wiki 頁面”來詳細描述它)。但它適用於任何其他共變異數計算。

Ayashi 和 Yoshida 在“ On Covariance Estimation of Non-synchronously Observed Diffusion Processes ”中提出了對抗 Epps 效應的“最簡單”方法。因此,您應該看看這篇論文。他們建議對以下簡單原則進行調整:“僅對重疊週期進行計算”。當然它引入了偏見,他們解釋瞭如何補償它們。

引用自:https://quant.stackexchange.com/questions/10263