回測
回測期
對回測時間框架的看法差異很大。好奇什麼時間框架/交易規模會導致統計上顯著的結果。例如,對於每天進行一次往返交易並導致每年約 250 筆交易的系統,多長的回測週期是合理的?兩年、五年、十年?直覺上,我在與問題作鬥爭,因為市場特徵/方向也會影響可以跨越多年的策略表現,因此這表明測試應該跨越多個牛市和熊市等。因此,試圖找到一個合理的平衡點,既實用又具有統計學意義。
你問的是更多的意見。事實上,也許沒有正確或錯誤的答案。
- 將統計數據與現實世界的回測一起使用的謹慎之處在於,如果某個參數(例如夏普比率)看起來不錯,那麼它在 t-stat、p 值和幾乎所有其他參數上都會看起來不錯。回測的主要原因是檢查歷史上是否存在回測結果不佳的時期,儘管總體表現良好。
- 答案可能取決於您頭寸的平均持有期。如果您的交易策略的平均持有期是 2 個月到 6 個月,即使該策略每天或每週重新平衡(或交易),最好使用較長時間,最好是 15 年。絕對包括兩個熊市和兩個牛市。長期框架將突出模型中的弱點。如果您交易的是在 1 週或更短時間內換手的短期策略,那麼大約 7-8 年可能就足夠了。對於日內或其他高頻策略,這可能是您的情況,3-5 年就可以了。由於市場微觀結構可能已經發生變化,因此對於高頻策略而言,超過 5 年實際上可能是不正確的。
- 為了區分樣本外的回測策略和那些不可行的策略,更好的方法是專注於你的宇宙的部分,即如果你取出你的宇宙的一部分,相同的策略是否會運作良好(儘管吸引力較弱) (例如它是否適用於大盤股或僅適用於小盤股等)。
- 最後,很容易找到在 20 年內執行良好的策略,而當您開始交易時,它就不再有效(樣本內偏差)。在實踐中,傾向於在樣本外工作的回測策略也具有您可以定義的明確優勢。問問自己,你的策略有什麼不對稱性。你的策略有意義嗎!例如,採用一個假設規則,例如“將價格乘以 2.3,加 5 並減去交易量的 sqrt”——即使這經過很好的回測,也沒有理由讓它起作用。
如果不做出一些傲慢的假設,我認為沒有一種強大的統計方法。
- 因為您的統計測試視窗也是您進行研究的視窗,所以您的測試規模以您無法預測的方式存在偏差。用於可靠地反映所選擇的統計測試 $ \alpha $ ,您的數據不僅需要滿足估計器的假設,而且您需要提前預先指定您的零假設和替代假設。交易研究並非如此:您嘗試 $ N $ 假設,然後對最成功的假設進行統計檢驗。如果 $ N>1 $ ,你突然有一個嚴重偏向於顯示系統統計顯著性的測試。我也認為不可能知道測試統計的這種偏差的程度,因為它不是隨 $ N $ (並且不能有一個具體的定義 $ N $ ).
- 您可以在一定程度上解決這個問題,例如,假設 $ \alpha = 0.05 $ 並使用 GBM(底層 Wiener 過程中的相關性)或插入系統的聯合過程(請注意,您必須將這些 GBM 插入您曾經嘗試過的每個系統中,這意味著很好的原始碼管理!我希望你有 SVN 或 Github!)。
- 當您擴展測試範圍時,統計功效和過度擬合之間也存在權衡,前者在分佈假設下是可計算的,而後者是不可計算的。也就是說,你的能力在較短的範圍內較弱,鼓勵保守的推斷,但對臨時機會(或更可能的噪音)的過度擬合更多的是一個鼓勵第 1 類錯誤的問題。
- 當然,您需要假設統計平穩性,並且您假定擷取的低效率將持續存在。請注意,這意味著您將要測試的無效假設和替代假設不是您希望測試的假設。
如果您不關心上述內容,則可以使用: