大面板的缺點
我目前正在研究是否某些基金特徵,如(基金規模、基金家族規模、資本流動和基金年齡)解釋了衡量的基金業績(每月阿爾法)。
因此,我使用固定效應面板回歸,其中因變數是每月基金業績;自變數具有滯後月度基金特徵。我執行固定效應回歸併按 (ID) 分群,以調整橫截面相關性和異變異數殘差的標準誤差。
我的樣本量是 350 個基金,每個基金(10 年)有 120 個觀察值。總的來說,我有大約 42,000 個觀察值。
使用大型面板數據集有什麼缺點和/或好處嗎?
感謝您的幫助。
一般來說,更多的數據比更少的數據要好。
在特定場景的主題上,您希望按日期分群或使用其他程序在存在橫截面相關性的情況下產生一致的標準誤差。
隨著時間的推移,月收益基本上不相關,但表現出顯著的橫截面相關性。
對於大量數據,將相關誤差項視為不相關可能會大大低估標準誤差!
例子:
假設我有 $ i=1,\ldots,50 $ 人們記錄我擲硬幣 20 次的結果( $ t=1,\ldots,20 $ )。讓 $ y_{it} $ 做人 $ i $ 的翻轉結果記錄 $ t $ . 我有 $ 20 \cdot 50 = 1000 $ 觀察。
我的模型是:
$$ y_{it} = \mu + \epsilon_{it} $$ 如果我對待每個 $ \epsilon_{it} $ 由於不相關,我將大大低估我的標準錯誤。實際上,我基本上有 20 個獨立的觀察結果,而不是 1,000 個。對於每一次 $ t $ , 這 $ \epsilon_{it} $ 將顯著相關。
基本上同樣的事情發生在退貨
對於任何時間段 $ t $ , 返回 $ {R}_{it} $ 是相關的。有巨大的橫截面相關性。
因此,您希望按date進行**分群。當然還有其他方法可以處理橫截面相關性。
背後的邏輯相同: - 形成投資組合併使用投資組合收益的時間序列變化 - 執行的 Fama-Macbeth 程序 $ T $ 橫截面相關性並採用時間序列平均值和標準偏差來計算估計值和標準誤差。