模型設計 - 配對差異的固定效應模型
我有兩個面板。一個面板,由跨公司和年份的經濟指標變數組成。第二個面板由相同公司和年份的相同經濟指標變數組成。但是,第二個面板中的指標變數是根據與第一個面板中的數據不同的數據計算的,我稱該數據為“調整後的”。因此,第二個面板數據中的變數值與第一個面板中的不同。換句話說,我有兩個對單個變數的成對觀察面板。
我現在想評估基於調整數據的指標是否明顯大於基於未調整數據的指標。
或者簡單地說:一個面板中的值是否大於另一個面板中的值,該值描述了相同公司和年份的相同變數的一組替代值。
要記住的一個問題是,指標變數通過構造自相關,因為它們是在滾動(重疊)視窗的基礎上計算的。我想出如下:
第1步:我計算配對差異,即 $ \delta_{i,t} = x_{i,t} - y_{i,t} $ , 在哪裡 $ x_{i,t} $ 是基於調整後數據的經濟指標, $ y_{i,t} $ 是基於未經調整的數據的經濟指標。
第 2 步:我只在常數上估計一個固定效應模型,即 $ \delta_{i,t} = \alpha + \gamma_{i} + \epsilon_{i,t} $ , 在哪裡 $ \alpha $ 是常數並且 $ \gamma_{i} $ 是一個固定的固定效應。
我檢驗假設 $ \alpha > 0 $ 反對零假設 $ \alpha = 0 $ 使用通常的 t 檢驗。我使用穩健的標準誤差來解釋我期望的自相關 $ \delta_{i,t} $ .
如果 $ \alpha $ 明顯大於 $ 0 $ , 我假設 $ x_{i,t} $ 平均而言,大於 $ y_{i,t} $ .
我不是面板回歸方面的專家,所以我的問題是:這個模型設計合理還是有缺陷?此外,是否有“更好”的方法來評估我感興趣的問題?
編輯 1:我所說的配對樣本的意思是觀察結果是配對的,即它們有些關聯,因為它們指的是相同的 {i,t}。這就是為什麼我計算每個“對”(配對 t 檢驗)的差異。
編輯2:我實際上分析了報告收益的質量。一個面板由質量指標組成,這些指標基於實際報告的收入( $ y_{i,t} $ )。另一個面板包含基於“替代”收益值的質量指標( $ x_{i,t} $ )。我的意思是:例如,可以假設美國的一家公司採用不同的會計準則(例如德國會計準則),這導致同一家公司在同一時期的報告收益值不同。現在簡單地想像一下,第二個面板是基於在一組與第一個面板不同的會計法規下報告的收益數量的收益質量指標,但是針對相同的年份和公司!
編輯 3:小組由大約 500 家公司組成,每家公司 10 年。我想對整個樣本進行測試。也就是說,我有500 $ \delta_{i,t} $ (500 個企業年差異)。
最終 FE 模型中的常數項沒有特定含義,沒有進一步的限制。對於Stata,它只被選擇為使估計的個體效應的(樣本)平均值加起來為0。所以你的測試 $ \alpha>0 $ 實際上是基於 $$ \frac{1}{n} \sum_{i=1}^n \hat\alpha_i,\quad \hat\alpha_i = \frac{1}{T_i} \sum_{t=1}^{T_i} (x_{it} - y_{it}), $$ 我在哪裡使用 $ T_i $ 符號以允許面板數據不平衡。
對於平衡面板數據,如果您對 OLS 使用集群標準誤差,則該測試(幾乎)與基於 OLS 的測試相同,因為那時 $$ \frac{1}{n} \sum_{i=1}^n \hat\alpha_i = \frac{1}{n} \sum_{i=1}^n \frac{1}{T} \sum_{t=1}^T (x_{it}-y_{it}) = \frac{1}{nT} \sum_{i=1}^n \sum_{t=1}^T (x_{it} - y_{it}), $$ 其中 LHS 是來自 FE 回歸的統計量,而 RHS 是來自 OLS 回歸的相應統計量。我認為 OLS、FE 和 RE(以及 BE)都會給出相同的截距估計值。只有標準錯誤會有所不同。如果面板數據集不平衡,則使用 FE 回歸的方法和使用 OLS 回歸的方法在平均差異 ( $ \hat\alpha_i $ ) 在不同的範圍內加權 $ i $ .
你提到的測試是關於 $ x_{it}-y_{it} $ 是否大於 0。這看起來不錯。還有什麼?使用哪種技術(OLS 或 FE 或 RE 或 BE)在這裡似乎並不重要。我只會使用 OLS + cluster se,因為它對研究人員和讀者來說都很簡單。嘗試:
xtset id year gen d = x - y reg d, vce(cl id) xtreg d, fe xtreg d, re xtreg d, be