微觀經濟學

具有奇怪負值的公司數據庫,從經濟角度來看是否合理?

  • March 28, 2022

我有一個美國公司的數據集(總共大約 6500 家),其中包含以下時間序列:

  • 銷售(191 個負面觀察對應於總觀察的 0.0351%)
  • 負債(70 個負面觀察對應於總觀察的 0.0129%)
  • TotalAssets(37 個負面觀察對應於總觀察的 0.0068%)
  • 資本支出(5957 個負面觀察對應於總觀察的 1.0947%)

這些負值的經濟解釋是什麼?它們只是噪音還是報告錯誤?在經濟研究中如何處理它們?

銷售額、負債、總資產和資本支出在邏輯上應該是非負數。

但是,您應該查閱數據集的元數據/手冊。也許是公司有銷售但客戶要求退貨的負面銷售記錄情況。某些數據集將其他值記錄為負數可能有類似的原因,但這些原因會與這些變數的典型定義不同(例如上面的範例,其中退貨將被記錄為負銷售額說明)。如果無法訪問數據集的元數據/手冊,則無法判斷。

如果沒有元數據/手冊,您可以嘗試聯繫建構數據集的個人/機構以獲得解釋。

如果無法聯繫到建構數據集的人,那麼您可能應該擺脫這些觀察,因為它們似乎是一個錯誤。

在許多數據集中,缺失值記錄為 -99 或 -999。

引用自:https://economics.stackexchange.com/questions/50871