時間序列
我們可以在一組多元多周期時間序列數據中對組件進行建模嗎?
在 10 年的歷史時間線上,每週/每月發生 N 個數據集。
在每個時期,觀察到五個日期(標記為 a 到 e),其中 a 表示時期開始/事件發生的日期(T=0),而 b 到 e 表示事件之後的後續天數(T = 2 到 4) .
–
創建了一個插圖,以更好地了解組件的結構以及如何將其輸入到統計推斷的公式中。
問題:有沒有一種方法可以從 N 個數據集中引出主成分,並找到相關性?
PS 該模型旨在觀察影響市場價格變化的每周和每月發生的事件/數字(例如在經濟日曆中)。
您的問題更多是關於“如何估計以不同頻率採樣的變數之間的相關性? ”而不是 PCA。畢竟,PCA 只是共變異數(或相關)矩陣的對角化,旨在獲得驅動變數聯合動態的主向量 $ L^2 $ 感覺。
由於數據是通過建構不以高頻率同步的(即您永遠不會同時對兩種不同的工具進行交易或報價更新),因此這個問題被稱為日內金融中的**Epps 效應**(有一天我將創建一個“標籤wiki 頁面”來詳細描述它)。但它適用於任何其他共變異數計算。
Ayashi 和 Yoshida 在“ On Covariance Estimation of Non-synchronously Observed Diffusion Processes ”中提出了對抗 Epps 效應的“最簡單”方法。因此,您應該看看這篇論文。他們建議對以下簡單原則進行調整:“僅對重疊週期進行計算”。當然它引入了偏見,他們解釋瞭如何補償它們。