回測
為什麼按市盈率排列股票,賣出前四分之一,買入後四分之一是錯誤的?
我正在閱讀Marcos López de Prado的《金融機器學習進展》 。在第 11 章回測的危險中,練習 11.5 要求:
我們從彭博下載市盈率,每月對股票進行排名,賣出前四分之一,買入多頭。性能是驚人的。有什麼罪?
確實,有什麼問題?我看不出這個方法有什麼問題。
正確的回測很困難,因為如果您不小心,很容易出現各種偏差。
例如,您如何計算歷史市盈率。好吧,您有歷史 E 和歷史 P,因此您可以將 P 除以 E(正如 Dimitri Vulis 建議的那樣,最好將 E 除以 P,正如大多數學術研究所做的那樣)。但是要注意前瞻性偏差(使用當時投資者無法獲得的回測資訊)。ACME Corp. 截至 2016 年第二季度的年度收益在 2016 年第二季度的最後一天是未知的。它們的上市滯後。您需要一個數據庫,其中包含有關何時發布收入以及何時修改/修訂收入(如果有的話)的資訊。大多數數據庫只有最新的資訊和與之相關的時期。相反,您需要“時間點”資訊,即在過去的各個時間點可用的資訊。
彭博社還刪除了停業的公司。另一個偏差(生存偏差,即您只測試倖存的公司)。您需要一個包含已死公司的數據庫。
總之,彭博非常適合查找目前公司的最新資訊,但不一定適合歷史回溯測試(至少無需大量額外工作)。