數據
如何從分鐘數據而不是刻度數據中近似美元條?
受到 de Prado 的《機器學習進展》一書的影響,我開始著手建構美元條形圖(其中每個條形圖代表證券中固定的美元交易量),他認為這是一種優於傳統時間的資料結構——基於條形圖,主要是因為其更平穩、獨立同分佈和統計有用的屬性。
不幸的是,我只是沒有真正將這個想法付諸實踐所必需的滴答數據。
然而,我確實有大量的 1 分鐘數據,這讓我想知道我可以用來近似真實美元條的最忠實方法。
我的計劃是:
- 取每分鐘柱的 OHLC 的平均值,
- 乘以那個條的體積,
- 將該美元價值分配給酒吧,
- 然後開始將條形圖聚合到從原始時間序列開始到結束的所需美元金額。
不過,我意識到,這可能會導致每根柱線的目標美元金額略高於/低於目標金額,具體取決於每根柱線的目標美元金額。鑑於德普拉多對美元酒吧的意圖,這種方法是否有問題或不值得?有沒有更好的方法來解決它?
以下 python 包mlfinlab為標準條形圖和資訊驅動條形圖提供了實現。好消息是您不必從頭開始實施這些技術,它們也可以在分鐘時間戳上工作。
關於如何近似一分鐘柱的 VWAP:
- 也許最好只取低點和高點的平均值(中點)。如果你取 OHLC 的平均值,那麼你會添加關於價格演變的額外假設。
將美元條應用於分鐘數據可能會使您的數據的異變異數性降低,您可能會看到回報恢復正常。實證研究將證明是有用的。