統計

如何對顯示相似曲線的時間序列進行分組

  • December 20, 2013

我正在嘗試對時間序列的相似外觀曲線進行分類,並且想知道什麼是最好的研究算法。閱讀 R,看起來可以應用 k-means 分群 - 但我不知道是否有更好的算法。任何指針都非常感謝。我擔心的是 k-means 是否可以圍繞特定均值的鄰域對點進行分組,但是如果兩條均值相似的曲線顯示出不同的變異數怎麼辦。

如果均值相似,那麼 K-means 就不會做得很好。我會生成新的特徵,可能是基於更高的分佈矩或其他一些屬性(自相關、光譜密度總結等)。

使用這組新特徵,如果在特徵空間中繪製繪圖時看到兩條曲線分離,那麼 k-means 將是一種有效的分組算法。

如果不更好地了解數據生成過程,就很難診斷出最好的分類工具。例如,使用混合高斯模型可能是有意義的。

這個關於集群的R 任務視圖頁面將提供您可以使用的各種工具的廣泛列表。

為此,我們使用了神經網路。我們所做的是:選擇一組可以直接從時間序列計算的特徵(例如,均值、標準差、偏度、峰度、正態擬合的 p 值、ACF 統計數據等),然後執行NN 從一組時間序列中學習如何對它們進行分類。我們試圖在一組模型中分類哪些模型會為一個系列產生最佳預測。我們有預測的答案,因為我們使用了 M-Competition 數據。

不幸的是,結果並不好。可能是我們查看了錯誤的特徵集,可能是我們的分類錯誤。但這絕對是解決您提到的問題的一種方法。我很想知道你是否在這項工作中取得了任何成功。

如果有人想合作進行這項調查,我也會感興趣。請查看我的個人資料以獲取聯繫資訊。

引用自:https://quant.stackexchange.com/questions/2526