驗證短期交易策略需要多少數據?
假設一個人有一個短期交易策略的想法,我們將其定義為平均持有期低於 1 週,信號計算和執行之間所需的延遲低於 1 分鐘。此類別不僅僅包括高頻做市策略。它還包括統計套利、基於新聞的交易、交易收益或經濟發布、跨市場套利、短期反轉/動量等。在考慮交易這樣的策略之前,顯然需要在足夠的基礎上對其進行回測長數據樣本。
需要獲取多少數據才能確信該策略“有效”而不是統計上的僥倖? 我並不是說有足夠的信心去押注牧場,而是有足夠的信心分配大量的額外資源來進行前瞻性測試或交易相對少量的資本。
對於某些信號,例如基於較新的經濟或金融時間序列的信號,獲取數據(而不僅僅是市場價格數據)可能非常昂貴或不可能。因此,這個問題對於決定調查哪些策略以及預計在數據採集上投資多少都很重要。
一個完整的答案應該取決於策略的預期資訊比率,因為低 IR 策略需要更長的樣本來區分雜訊。
考慮標準誤差,特別是上限和下限之間的距離:
$$ \begin{equation} \Delta = (\bar{x} + SE \cdot \alpha) - (\bar{x} - SE \cdot \alpha) = 2 \cdot SE \cdot \alpha \end{equation} $$ 使用標準誤差公式,我們可以求解樣本量:
$$ \begin{equation} n = \left(\frac{2 \cdot s \cdot \alpha}{\Delta}\right)^{2} \end{equation} $$ 在哪裡 $ s $ 是測量的標準偏差,您已經從 IR 計算中獲得。
高頻範例
我最近在測試一個做市模型,預計每筆交易都會返回幾個基點,我想確信我的回報確實是正的(即,不是僥倖)。所以,我選擇了 3 bps 的距離 $ (\Delta = .0003) $ . 我的樣本測量的標準偏差是 45 bps $ (s = .0045) $ . 對於 95% 的信賴區間 $ (\alpha = 1.96) $ ,我的樣本量需要是 $ n = 3458 $ 交易。如果我一直在模擬這個模型,我會選擇更近的距離,但我是在現場交易,我不能對線上上的錢過於挑剔。
低頻範例
我想對於一個預計每月返回 1.5% 的低頻模型,我可能希望距離為 1% $ (\Delta = .01) $ . 如果希望夏普比率為 3,則標準差為 1.7% $ (s = .017) $ ,這是我通過取消每月回報得出的。所以對於 95% 的信賴區間 $ (\alpha = 1.96) $ ,我需要 45個月的數據。