數據
如何處理 Compustat 和 CRSP 中的 NA 值
在某些年份,一些公司的一些會計價值在 Compustat 和 CRSP 中缺失。如何處理這些缺失值?我應該用零替換那些還是只是刪除代表缺失值的年份?
例如:
gvkey datadate fyear current aseet Total Asset Current Liability 1010 19951231 1995 2015.8 1010 19961231 1996 2218.6 1010 19971231 1997 3181.3
你將不得不使用判斷力。在某些情況下,將缺失值視為 0 會很瘋狂。一般來說,我會非常謹慎。
另一方面,在某些情況下嘗試替代計算是合理的,在某些情況下使用 0 可能是合理的。
一個很好的例子可以在 Kenneth French對 Fama 和 French 如何計算圖書權益的描述中找到:
賬面權益 … 是股東權益的賬面價值,加上資產負債表遞延稅和投資稅收抵免(如果有),減去優先股的賬面價值。根據可用性,我們使用贖回、清算或面值(按此順序)來估計優先股的賬面價值。股東權益是穆迪或 Compustat 報告的價值(如果有)。如果不是,我們將股東權益衡量為普通股的賬面價值加上優先股的面值,或資產的賬面價值減去總負債(按此順序)。有關詳細資訊,請參閱 Davis、Fama 和 French,2000 年,“特徵、共變異數和平均回報:1929-1997”,《金融雜誌》。
繼 Fama 和 French 之後,您可以先嘗試使用 SQL 程式碼計算賬面淨值:
SEQ - COALESCE(PSTKRV, PSTKL, PSTK, 0) + COALESCE(TXDITC,0) as be
COALESCE 函式返回列表中的第一個非空結果。對於優先股的賬面價值,首先嘗試 PSTKRV,然後是 PSTKL,然後是 PSTK。如果遞延稅資產加上投資稅收抵免 (TXDITC) 不可用,則將其視為零。
這裡由 CRSP 的 Palacios 和賓夕法尼亞州立大學的 Vora 編寫的程式碼與我上面描述的一樣。