預測
對一隻股票的(滯後)回報使用線性回歸來預測另一隻股票的回報
假設我想建立一個線性回歸來查看一隻股票的回報是否可以預測另一隻股票的回報。例如,假設我想查看第 X 天的 VIX 回報是否可以預測第 (X + 30) 天的標準普爾回報。我該怎麼辦?
天真的方法是形成對(第 1 天的 VIX 回報,第 31 天的標準普爾回報),(第 2 天的 VIX 回報,第 32 天的標準普爾回報),…,(第 N 天的 VIX 回報,標準普爾回報第 N + 30 天),然後執行標準線性回歸。然後,對係數的 t 檢驗將判斷模型是否具有任何真正的預測能力。但這對我來說似乎是錯誤的,因為我的點是自相關的,我認為我的 t 檢驗的 p 值會低估真正的 p 值。(儘管 IIRC,t 檢驗將是漸近無偏的?不確定。)
所以我該怎麼做?我的一些隨機想法是:
- 在我的點對上獲取一堆引導樣本,並使用這些樣本來估計我的係數和 p 值的經驗分佈。(我應該執行什麼樣的引導程序?我應該在模型的係數還是 p 值上執行引導程序?)
- 不是從連續天中獲取數據,而是從每 K 天中獲取數據。例如,使用(第 1 天的 VIX 回報,第 31 天的 S&P 回報),(第 11 天的 VIX 回報,第 41 天的 S&P 回報)等(不過,這似乎會使數據集變得太小。)
這些想法是否有效?還有什麼建議?
一些想法。
是的,您的回報序列是自相關的(即,股票不完全遵循隨機遊走),因此您應該使用Newey-West standard errors。
如果您將其作為單變數回歸
$$ R_{i,t} = \alpha_i + \beta_i R_{j,t-1} + \epsilon_{i,t} $$那麼幾乎可以肯定裡面有一個省略的變數 $ \epsilon $ 這正在推動兩者 $ R_i $ 和 $ R_j $ . 因此,請確保您至少加入了一些正常的“預測因素”,例如市場回報、違約溢價、期限溢價或其他標準因素(Fama 和 French 的 SMB、HML 和 UMD)。在對沖基金研究中,您還可以看到一組七個左右的因素。
您是否考慮過用外生回歸模型擬合 ARIMA?具有自相關誤差的線性回歸可能是合適的。
R 可以通過指定 xreg 參數使用 arima() 函式來做到這一點。