不同時間序列相似性度量的元視圖?
雖然我將 StackExchange 的大部分時間都花在 MathematicaSE 上,但我在做生意,並懷著極大的興趣關注這個網站上的問題和答案。
最近的問題如下(以及其他一些問題):
甚至來自 Wolfram 部落格的類似內容:
讓我思考可用於分析時間序列相似性的不同方法。
這些方法可能包括:
- 共變異數,
- 相關性,
- 協整,
- 主成分分析,
- 因子分析,
- 熵,
- 圖論,
- 分群分析,和
- 可能是其他人
它們當然有不同的用途,適用於時間序列的不同方面。它們似乎都有助於理解時間序列的相似性。
所以這讓我想到了一些問題(或者可能只是對同一個問題的重述):
- 誰能提供一種很好的直覺來描述它們之間的關係?
我希望這裡有一些東西,比如一些關於相關和協整之間差異的精彩討論,以及它們適用的系列類型,這些已經出現在本網站的其他地方。我希望有更多類似的東西……
- 是否存在某種觀點或見解可以更好地了解所有這些措施?
- 從某種元角度來看,是否可以將這些方法視為某種更廣泛思想的各個方面?
- 一些元視角能否重新定義所有這些方法,以便人們可以用類似的度量單位來看待它們?
甚至不確定這是可能的。即使在我寫這篇文章時,它似乎也像是在要求某人提供類似時間序列相似性的統一場論之類的東西。
儘管如此,如果可能的話,它可能會被證明是有用的,也許這些問題會引發一兩個有趣的答案。
當然,任何探索這方面的論文或其他資源的建議都值得讚賞。
…
美國東部時間 2012 年 8 月 15 日下午 2:00 更新
下面的論文給出了一個例子,說明了朝著這個問題的更廣泛答案方向發展的思維方式:經驗熵操縱和分析。
關於將(至少一些)PCA 問題轉換為熵最大化問題的部分如下:
是的,PCA 可以通過數據共變異數(或相關)矩陣的特徵值分解來完成。
因此,很明顯,其中一些分析具有某種關係。
也許某些視圖可以包含更多。也許是相關或協整的熵或資訊描述。我不確定,但對我來說這似乎是一個有趣的問題。
這是您的要點的結構化列表:
- 共變異數,
- 相關性,
- 主成分分析,
- 因子分析,
是相似的。它們基於高斯假設(即相關性意味著依賴關係)並試圖辨識解釋觀察到的關係的共同因素(即小維度的變數)。
- 協整
在您專注於擷取殘差是固定的關係的意義上更具體*(*比如 iid 以使其更簡單)。
- 熵,
是第一個列表的非線性版本。唯一不好的一點是,當互資訊(它是正確的術語)分析是肯定的時,您無法保證您將能夠建構足夠的模型來擷取已辨識的關係。熵給你一個非線性模型的存在,但沒有找到它的線索。
此外,熵和 PCA 之間可能存在混合:ICA(獨立分量分析)。它著重於尋找不是很少的正交因素,而是很少的獨立因素。
- 圖論,
- 分群分析,
更適合離散關係:它們將為您提供關於二元變數的同質股票組(例如,增加與減少,而不考慮變化的強度)。它是因子或 PCA 分析的良好補充,可幫助您理解因子的含義。