從失去的分時數據中恢復完整的分時數據
由於一些經濟/制度問題,我只能從交易所訪問非全價數據。
為了使問題精確,完整的刻度數據 $ X $ 是一系列 $ (t_i,p_i,v_i) $ 為了 $ 0 \leq i \leq N $ 在哪裡 $ t_i $ 是時間戳, $ p_i $ 是價格, $ v_i $ 是成交量。
我只能看到的數據是較低的解析度 $ \hat{X} $ 的 $ X $ ,從某種意義上說,我只能按順序觀察市場 $ j_1 < j_2 < \ldots < j_m $ 並獲取如下數據:(序列不一定是確定性的或固定間隔)
$ (\hat{t_{j_k}},\hat{p_{j_k}},\hat{v_{j_k}}) $ 在哪裡 $ \hat{t_{j_k}} = t_{j_k}, \hat{p_{j_k}} = p_{j_k} $ , 但
$$ \hat{v_{j_k}} = \sum_{i=j_{k-1}+1}^{j_k} v_i $$ 例如,如果真實數據 $ X $ 是:
$ (0,100,1) \ (1,102,2) \ (2,101,1) $
我可能只看到解析度較低的一個 $ \hat{X} $ 作為
$ (0,100,1) \ (2,101,3) $
或者
$ (1,102,3) \ (2,101,1) $
問題是..
- 假設我只有一個來源 $ \hat{X} $ , 恢復大多數失去的蜱的最佳方法是什麼?我知道這可能是一個糟糕的問題,因為資訊已經失去。我想我需要從貝氏的角度為這個問題添加一些模型假設,對此有什麼參考嗎?
- 假設我有兩個不同的來源 $ \hat{X} $ ,並且由於失去刻度的隨機性,兩個來源會不同。有什麼方法可以恢復嗎?
PS我想我可以將刻度數據視為一維圖像,而較低解析度的數據是真實圖像數據的像素化版本,並對其應用一些圖像處理技術,有什麼想法嗎?
如果您失去了蜱蟲,那麼任何技術都無法恢復這些蜱蟲。
如果您有兩個來源,則將一個來源指定為主要供稿,然後從輔助供稿中填補空白。當然,在確定輔助供稿是否可以正確使用時,您必須注意時間戳。
顯然合併兩個流是無害的,應該這樣做。但是,在不知道為什麼需要它的情況下,很難就可以用來生成刻度的“插值”方法向您提供建議。原因是任何方法都會給數據引入一定的偏差。因此,這在很大程度上取決於下一步您將如何處理更改後的數據。
有關插值方法的一些連結,您會發現它們很有用: