金融

高頻數據清洗

  • May 31, 2020

在 OEBandorff-Nielsen 等人的論文“實踐中的實現核心:交易和報價”中,參見。

https://onlinelibrary.wiley.com/doi/full/10.1111/j.1368-423X.2008.00275.x

在專用於數據清理的部分中,作者建議:

Retain entries originating from a single exchange (NYSE in our application). 
Delete other entries.

它與交易和報價數據相關。

為什麼我們不應該考慮其他交易所的數據?

作者稍後解釋了原因:

它用於減少交易報告和報價更新中的時間延遲的影響。

由於光速的原因,來自外部交易所的數據的時間戳將與紐約證券交易所自身數據的時間戳具有不同的含義。例如,納斯達克的價格更新將在紐約證券交易所觀察到之前幾毫秒發生。

作者繼續考慮在一個交易所與所有交易所進行建模。由於僅紐約證券交易所的交易量就少於所有其他交易所的總交易量,因此考慮總量是有意義的。研究人員將不得不權衡一次交易所的難易程度與來自所有交易所的更全面情況。

引用自:https://quant.stackexchange.com/questions/50918