為什麼按市盈率排列股票，賣出前四分之一，買入後四分之一是錯誤的？

July 27, 2021

我正在閱讀Marcos López de Prado的《金融機器學習進展》。在第 11 章回測的危險中，練習 11.5 要求：
我們從彭博下載市盈率，每月對股票進行排名，賣出前四分之一，買入多頭。性能是驚人的。有什麼罪？
確實，有什麼問題？我看不出這個方法有什麼問題。

正確的回測很困難，因為如果您不小心，很容易出現各種偏差。
例如，您如何計算歷史市盈率。好吧，您有歷史 E 和歷史 P，因此您可以將 P 除以 E（正如 Dimitri Vulis 建議的那樣，最好將 E 除以 P，正如大多數學術研究所做的那樣）。但是要注意前瞻性偏差（使用當時投資者無法獲得的回測資訊）。ACME Corp. 截至 2016 年第二季度的年度收益在 2016 年第二季度的最後一天是未知的。它們的上市滯後。您需要一個數據庫，其中包含有關何時發布收入以及何時修改/修訂收入（如果有的話）的資訊。大多數數據庫只有最新的資訊和與之相關的時期。相反，您需要“時間點”資訊，即在過去的各個時間點可用的資訊。
彭博社還刪除了停業的公司。另一個偏差（生存偏差，即您只測試倖存的公司）。您需要一個包含已死公司的數據庫。
總之，彭博非常適合查找目前公司的最新資訊，但不一定適合歷史回溯測試（至少無需大量額外工作）。

引用自：https://quant.stackexchange.com/questions/66186

為什麼按市盈率排列股票，賣出前四分之一，買入後四分之一是錯誤的？

相關問答

回測與實時交易數據處理和抽象

如何為我的交易策略選擇價格調整、展期日期和數據中心？

如何獲取/估計 OHLC 數據回測的詢價/出價？

使用微觀結構（訂單簿）數據進行回測

Paladin Energy 2020.03.23 的最低成交價是多少？每個消息來源都不同意，然後變得更加奇怪

歷史股票程式碼數據源（用於創建可交易宇宙）