統計
如何對顯示相似曲線的時間序列進行分組
我正在嘗試對時間序列的相似外觀曲線進行分類,並且想知道什麼是最好的研究算法。閱讀 R,看起來可以應用 k-means 分群 - 但我不知道是否有更好的算法。任何指針都非常感謝。我擔心的是 k-means 是否可以圍繞特定均值的鄰域對點進行分組,但是如果兩條均值相似的曲線顯示出不同的變異數怎麼辦。
如果均值相似,那麼 K-means 就不會做得很好。我會生成新的特徵,可能是基於更高的分佈矩或其他一些屬性(自相關、光譜密度總結等)。
使用這組新特徵,如果在特徵空間中繪製繪圖時看到兩條曲線分離,那麼 k-means 將是一種有效的分組算法。
如果不更好地了解數據生成過程,就很難診斷出最好的分類工具。例如,使用混合高斯模型可能是有意義的。
這個關於集群的R 任務視圖頁面將提供您可以使用的各種工具的廣泛列表。
為此,我們使用了神經網路。我們所做的是:選擇一組可以直接從時間序列計算的特徵(例如,均值、標準差、偏度、峰度、正態擬合的 p 值、ACF 統計數據等),然後執行NN 從一組時間序列中學習如何對它們進行分類。我們試圖在一組模型中分類哪些模型會為一個系列產生最佳預測。我們有預測的答案,因為我們使用了 M-Competition 數據。
不幸的是,結果並不好。可能是我們查看了錯誤的特徵集,可能是我們的分類錯誤。但這絕對是解決您提到的問題的一種方法。我很想知道你是否在這項工作中取得了任何成功。
如果有人想合作進行這項調查,我也會感興趣。請查看我的個人資料以獲取聯繫資訊。