如何對顯示相似曲線的時間序列進行分組

December 20, 2013

我正在嘗試對時間序列的相似外觀曲線進行分類，並且想知道什麼是最好的研究算法。閱讀 R，看起來可以應用 k-means 分群 - 但我不知道是否有更好的算法。任何指針都非常感謝。我擔心的是 k-means 是否可以圍繞特定均值的鄰域對點進行分組，但是如果兩條均值相似的曲線顯示出不同的變異數怎麼辦。

如果均值相似，那麼 K-means 就不會做得很好。我會生成新的特徵，可能是基於更高的分佈矩或其他一些屬性（自相關、光譜密度總結等）。
使用這組新特徵，如果在特徵空間中繪製繪圖時看到兩條曲線分離，那麼 k-means 將是一種有效的分組算法。
如果不更好地了解數據生成過程，就很難診斷出最好的分類工具。例如，使用混合高斯模型可能是有意義的。
這個關於集群的R 任務視圖頁面將提供您可以使用的各種工具的廣泛列表。

為此，我們使用了神經網路。我們所做的是：選擇一組可以直接從時間序列計算的特徵（例如，均值、標準差、偏度、峰度、正態擬合的 p 值、ACF 統計數據等），然後執行NN 從一組時間序列中學習如何對它們進行分類。我們試圖在一組模型中分類哪些模型會為一個系列產生最佳預測。我們有預測的答案，因為我們使用了 M-Competition 數據。
不幸的是，結果並不好。可能是我們查看了錯誤的特徵集，可能是我們的分類錯誤。但這絕對是解決您提到的問題的一種方法。我很想知道你是否在這項工作中取得了任何成功。
如果有人想合作進行這項調查，我也會感興趣。請查看我的個人資料以獲取聯繫資訊。

引用自：https://quant.stackexchange.com/questions/2526

相關問答

多期貢獻

May 4, 2022

我在哪裡可以找到Renaissance Technologies等著名量化公司的詳細資訊？

July 14, 2021

如何平均一個變數的跨年 CDF

November 12, 2020

Java平台/lib在工業中廣泛使用

May 19, 2020

與夏普基於回報的風格分析相關的問題

June 12, 2018

計量經濟學

為什麼 Stata 省略了我的一些變數並且 mfx 不起作用？

October 28, 2022