時間序列
經濟和金融時間序列數據庫
我正在尋找一種技術解決方案來儲存經濟和金融時間序列(目前沒有盤中,每天/每週/每年)
- 我發現的大多數時間序列數據庫似乎都沒有考慮到時間序列可以修改的事實。例如,一旦政府審查了他們收到的所有資訊,9 月的工業生產可能會在首次發布後 2 個月進行修訂。出於這個原因,我們需要 2 個時間維度:截至日期和發布日期,以便我們能夠進行時間旅行。
- 我還希望能夠使用元數據(單元、來源、產品等)正確標記每個時間序列,以便我的時間序列得到正確組織和可搜尋
謝謝你的建議
有很多方法可以解決這個問題。
一種是使用以下(範例)模式對數據進行建模,這幾乎可以使用任何數據庫完成:
series_id
date
- 這是觀察的參考期start_dt
- 這是觀察date
變得可用的時候to_dt
(可選)- 這是當觀察date
不再活躍時value
- 這是期間的值date
獲取特定年份日期的時間序列 $ t $ ,您只需檢索 a
start_dt
小於或等於的所有觀察值 $ t $ 然後過濾每個date
. 從儲存的角度來看,這種方法非常有效(因為您主要保存時間序列中的增量)。
VersionStore
另一種方法是查看arctic,它也可以非常優雅地處理這個問題。您絕對可以將您選擇的元數據附加到每個系列。一個很好的參考是在 SQL 中開發麵向時間的數據庫應用程序,它對時間序列修訂有非常詳細的介紹。
我所知道的唯一時間序列數據庫類似於 Rob Hyndman 的 R 儲存庫,它是用於建模實驗的最終數據的數據庫,我知道唯一可用且可修改的公共數據庫是 Quandl,它的數量非常大免費和付費的私人、商業和工業、金融和政府數據。您可以嘗試聯繫 Quandl,只需進行Google搜尋即可。否則我無法提供其他想法。