面板數據

如何在基於北美數據的國際研究中設置行業層面的變數?

  • May 14, 2021

在一些國際研究中,作者通常使用北美(美國和加拿大)的行業水平來控制所有甚至非北美國家。我對如何在數據設置中做到這一點感到很困惑。

例如,Dasgupta, 2019記錄了

雖然我們的數據限制不允許我們控制可追溯到 1990 年代的國際公司的個別市淨率,但我們控制行業市淨率以捕捉行業增長機會。我們根據 Compustat 北美數據作為三位數的 SIC 行業中位數來計算後者,並且我們對所有國家(甚至非北美國家)進行控制

根據我的理解,我會逐年將加拿大和美國的市淨率(MTB)數據合併在一起。之後,我將對數據進行排序,得到這個合併數據集每年每個行業的中位數。最後,我將按相關行業和年份將這些數據應用於所有非北美國家。

例如,在 1997 年,在美國,在製造業中,我們有 4 家公司,MTB 等於 3、5、6、12。在加拿大,我們有5家公司有MTB,同年同行業分別是1,2,13,15,16。所以,1997年北美製造業MTB的中位數是{1,2,3,5,6,12,15,16}的中位數,等於5.5。

那麼,這是否意味著,在面板數據集中,全世界每個國家的每個製造業公司在 1997 年的 MTB=5.5?

除此之外,除了國際數據限制的原因或北美數據豐富的原因外,研究人員使用基於北美數據的行業變數還有其他原因嗎?

通常,您需要一個行業分類方案來辨識每個公司的行業。

對於美國和加拿大的公司來說,SIC 是一個合理的選擇,因為它們可以廣泛使用。例如,您可以在此處找到美國和加拿大公司的 SIC 程式碼: https ://siccode.com/

或者,研究人員可以使用 MSCI 行業分類或類似的行業分類方案。

在國際背景下,只有當公司擁有 SIC 標識符時,才有意義使用 SIC 分類。例如,對於 MERCK 或 DAIMLER 等也在美國交易所上市的大公司。

從您顯示的文本摘要中,您的方法聽起來是正確的。取所有美國和加拿大公司的 MTB 併計算中位數。由於將MTB 中值用作控制變數,因此屬於某個行業的每個公司將具有相同的MTB 中值。

我建議您聯繫研究文章的作者以進行澄清。

引用自:https://quant.stackexchange.com/questions/63950