對刻度數據應用具有正態假設的模型?
初學者問題。在閱讀了幾篇關於高頻數據預測的論文和書籍章節後,我很驚訝(和困惑)相同的時間序列技術可以應用於高頻/滴答數據而不是低頻。
鑑於價格以離散步驟變化、具有最小刻度大小、lag-1 自相關等,高頻數據似乎顯然不遵循正態分佈。因此,研究人員如何應用具有強正態性假設的技術?(例如,使用 Hasbrouck 的向量自回歸分析中間價格演變和交易的簽名量)。
例如
$$ 1 $$描述了一個自回歸 (VAR) 報價修正模型,該模型將中間價格變化與簽署的交易規模聯繫起來。顯然,中間價格的差異是離散的,我會說類似於計數數據。 $$ 1 $$衡量股票交易的資訊 Joel Hasbrouck, Quantitative Finance, 1991, Journal of Finance pdf
我正在嘗試為該網站的後期使用者制定一個答案,並希望能吸引一些更有經驗的高頻交易者對我的文章做出進一步的反應。
首先,我注意到你提到的那篇論文發表於 1991 年。我相信從那時起高頻交易已經發展了很多,而且現在的高頻交易策略更加發展。
據我所知,高頻交易涉及多種不同類型的策略,其中一些與正態假設無關。例如,如果你想交易套利策略,你將不得不進行高頻交易以抓住套利機會(否則,更快的人可能已經利用了機會,機會就消失了),但是這種策略顯然沒有’ t 依賴於正態假設。高頻趨勢跟踪(這是我碩士論文的主題)也不依賴於機率假設,它更多的是一種技術或行為策略。
從更一般的角度來看,您還可以討論正常假設的有效性,即使頻率更高,正如 Sornette 在 他的書中非常出色地展示的那樣。《財富的起源》中有一句話,我非常喜歡將金融研究聯繫起來,總是假設金融中的不切實際的假設“胡說八道,胡說八道”。
事實上,您必須在模型中添加一些雜訊才能使其真實,但這種雜訊很可能是框架的一部分,它使整體分佈不真正正常,或者至少具有顯著的波動性隨著時間的推移而演變(例如非對稱 GARCH )。
因此,我嚴重懷疑任何盈利策略(長期)是否真的依賴於純正態假設。
我很樂意被證明是錯誤的。
因為沒有(可公開訪問的?)可行的替代方案,而經典模型已經足夠好了。
有一些模型明確地解決了報價數據的不規則性。例如,Hawkes 過程對觀察的不規則時間間隔、事件分群和自相關進行建模。但是,數學非常複雜,可用的庫很少,即使對於適度的數據集,計算複雜度也太高了。也許,如果您是天才或有一個計算統計團隊為您實施它,您可以讓它發揮作用,但對於不專門研究此類方法的典型 Quant 或研究人員來說,這是不可行的。
經典方法(OLS、VAR、VECM)可能非常健壯,您可以使用數據使其適合方法。OLS(因此使用 OLS 估計的 VAR)對非正態和異變異數數據非常穩健。自相關正是 VAR 所要建模的。您可以說您的觀察在事件時間上是等距的(它甚至比在正常掛鐘時間以不規則間距“正確”工作更好)。