數據

通過 6 位 CUSIP 將 I/B/E/S 映射到 Compustat

  • April 13, 2018

我正在嘗試將 Thomson Reuter 的 I/B/E/S 數據集與 Compustat 連結。兩者都是我通過 WRDS 獲得的。我能找到的唯一有用的資訊是在一個兩年前的論壇文章上,它建議通過連結表通過第三個數據庫(CRSP)。

我的問題是,我們為什麼不直接使用 6 位 CUSIP 來映射這兩個數據集?

它可以由 I/B/E/S 的 8 位“舊”CUSIP 以及 Compustat 上的“新”9 位 CUSIP 建構。正如本網站(以及維基百科文章)所解釋的,前 6 位數字標識公司,隨後的 2 位數字表示證券的特定問題,第 9 位數字是校驗和。由於 Compustat 是特定於公司的,因此對於我們正在研究的大多數安全性的預測而言,這無關緊要。

此外,大多數預測指標,例如 ROA 或營業額,對我來說似乎也是針對公司的,而不是針對安全的。我不完全確定每股收益預測,但如果我沒記錯的話,通常我們也不會同時看到多個同時出現的問題。

將 Compustat 與 IBES 連結的主要問題不是 Compustat 的 cusip 是 9 個字元,而 IBES 是 8 個字元。主要問題是 Compustat Cusip 是標題(最近的),而 IBES Cusip 是歷史的(截至日期)。

因此,通過 Cusips 進行匹配對於許多情況可能是正確的,但並非全部。進行匹配的標準方式確實如您所說的通過 CRSP。

有許多腳本可以為您進行匹配。一個可能會在一分鐘內為您匹配的潛在腳本:

https://gist.github.com/JoostImpink/0e5a8ae738cc8ef14baf

它利用 WRDS 宏 iclink 來合併 CRSP 和 IBES:

https://wrds-web.wharton.upenn.edu/wrds/research/macros/sas_macros/iclink.cfm

引用自:https://quant.stackexchange.com/questions/39230