數據

如何處理 Compustat 和 CRSP 中的 NA 值

  • June 5, 2018

在某些年份,一些公司的一些會計價值在 Compustat 和 CRSP 中缺失。如何處理這些缺失值?我應該用零替換那些還是只是刪除代表缺失值的年份?

例如:

gvkey   datadate    fyear   current aseet     Total Asset       Current Liability
1010    19951231    1995                        2015.8  
1010    19961231    1996                        2218.6
1010    19971231    1997                        3181.3  

你將不得不使用判斷力。在某些情況下,將缺失值視為 0 會很瘋狂。一般來說,我會非常謹慎。

另一方面,在某些情況下嘗試替代計算是合理的,在某些情況下使用 0 可能是合理的。

一個很好的例子可以在 Kenneth French對 Fama 和 French 如何計算圖書權益的描述中找到:

賬面權益 … 是股東權益的賬面價值,加上資產負債表遞延稅和投資稅收抵免(如果有),減去優先股的賬面價值。根據可用性,我們使用贖回、清算或面值(按此順序)來估計優先股的賬面價值。股東權益是穆迪或 Compustat 報告的價值(如果有)。如果不是,我們將股東權益衡量為普通股的賬面價值加上優先股的面值,或資產的賬面價值減去總負債(按此順序)。有關詳細資訊,請參閱 Davis、Fama 和 French,2000 年,“特徵、共變異數和平均回報:1929-1997”,《金融雜誌》。

繼 Fama 和 French 之後,您可以先嘗試使用 SQL 程式碼計算賬面淨值:

SEQ - COALESCE(PSTKRV, PSTKL, PSTK, 0) + COALESCE(TXDITC,0) as be

COALESCE 函式返回列表中的第一個非空結果。對於優先股的賬面價值,首先嘗試 PSTKRV,然後是 PSTKL,然後是 PSTK。如果遞延稅資產加上投資稅收抵免 (TXDITC) 不可用,則將其視為零。

這裡由 CRSP 的 Palacios 和賓夕法尼亞州立大學的 Vora 編寫的程式碼與我上面描述的一樣。

引用自:https://quant.stackexchange.com/questions/40142