回歸
TAQ 半小時庫存量數據與新聞量的回歸
我計劃對特定股票的半小時新聞量與半小時新聞量進行回歸。我正在查看 2 年的數據進行分析。但是,我一直在思考每天的非交易時間應該怎麼做?
具體來說: 1. 我是否應該只對交易所工作時間的數據進行回歸,這意味著我回歸中的 Y 值將包含從 9:30-16:00 開始每 30 分鐘的“庫存量”從我的回歸期的開始日期到結束日期的每一天,X 值將是每 30 分鐘對應的“新聞量”?
或者
- 我是否需要使數據在 30 分鐘內均勻分佈,並將每天的“非交易時間”包括“零”作為股票量和新聞量?
我相信這兩種情況下的回歸結果都會有所不同。需要緊急建議。
不要對零執行零。這類似於學術研究中對待週末的方式。樣本中每週的回歸中沒有五天,另外兩天為 0……只有五天(儘管我鼓勵您閱讀有關週末效應的資訊)。
你的假設是存在一個函式 $ Volume(t) = f(News(t)) + e(t) $ . 當市場關閉時,不存在這樣的函式,那麼你應該用回歸方程中的零點來估計什麼?如果你包括零,那麼你對模型說的是在這些時間 $ Volume(t)=0 $ 因為 $ News(t)=0 $ . 然而我們知道這是錯誤的,而且它們都為零,因為 $ t \in {Market Close} $ .
如果你真的關心不規則間隔的時間序列,你可以考慮一個更合法的數據生成過程:
$$ Volume(t) = f(News(t))I(t \in {Market Open}) + cI(t \in {Market Close}) + e(t) $$ 在哪裡 $ I $ 是指標函式。但是,您會注意到這將為您提供相同的參數估計值(如果 $ f $ 與截距呈線性關係),就好像您僅在交易時間內簡單地估計了原始方程。