企業-工人固定效應工資方程的辨識
考慮傳統的 AKM 模型 ,其中 $$ Y_{it}=X_{it}\beta+\psi_{j(i,t)}+\epsilon_{it} $$ 為了 $ i=1,…,N $ (個人指數), $ t=1,…,T $ (時間指數), $ j=1,…,J $ (公司指數),和 $ j(i,t) $ 是僱用工人的公司嗎 $ i $ 有時 $ t $ . 為簡單起見,我忽略了工人的固定效應。 $ \psi_{j(i,t)} $ 被稱為堅定 $ j(i,t) $ 的固定效應。
通過隨時間疊加觀察,上面的等式可以重寫為 $$ \underbrace{Y_i}{T\times 1}=\underbrace{X_i}{T\times K} \underbrace{\beta}{K\times 1}+\underbrace{F_i}{T\times J} \underbrace{\psi}{J\times 1}+\underbrace{\epsilon_i}{T\times 1} $$ 在哪裡 $ F(t,j) $ 是 $ 1 $ 如果工人 $ i $ 受僱於公司 $ j $ 期間 $ t $ .
假使,假設:
**$$ A1 $$**我們有一個觀察樣本 $ {Y_i, X_i, F_i}_{i=1}^N $ iid,對於 $ N $ 大而 $ T $ 小的。
$$ A2 $$ $ E(\epsilon_i| X_i, F_i)=0 $ 對於每個 $ i=1,…,N $ .
我想展示如何 $ \beta $ 和 $ \psi $ 被辨識。我找不到任何“可理解和有機”的身份證明。你能推荐一個嗎?我在這里報告我通過閱讀/結合不同來源所理解的內容。
我的身份辨識嘗試(不完整)
第 1 步:通過$$ A2 $$, 我們有
$$ \begin{pmatrix} E(X_i’ Y_i)\ E(F_i’ Y_i)\ \end{pmatrix}=\begin{pmatrix} E(X_i’ X_i) & E(X_i’ F_i)\ E(F_i’ X_i) & E(F_i’ F_i)\ \end{pmatrix} \begin{pmatrix} \beta\ \psi \end{pmatrix} $$
第 2 步:通過$$ A1 $$, 矩陣 $ \begin{pmatrix} E(X_i’ Y_i)\ E(F_i’ Y_i)\ \end{pmatrix} $ 和 $ \begin{pmatrix} E(X_i’ X_i) & E(X_i’ F_i)\ E(F_i’ X_i) & E(F_i’ F_i)\ \end{pmatrix} $ 從樣本類似物中始終可以估計。因此,它們可以在辨識練習中被視為已知。
**步驟 3:**通過結合步驟 2-3,如果 $ A_{pop}\equiv \begin{pmatrix} E(X_i’ X_i) & E(X_i’ F_i)\ E(F_i’ X_i) & E(F_i’ F_i)\ \end{pmatrix} $ 是可逆的,那麼 $ \beta $ 和 $ \psi $ 被辨識。
**第四步:**在什麼條件下 $ A_{pop} $ 可逆的?
我的理解是,Abowd、Kramarz 和 Margolis 並沒有回答這個問題,而是提供了必要和充分條件,在這些條件下,步驟 1 中的方程的樣本類似物具有唯一解 $ (\beta,\psi) $ . 也就是說,它們提供了條件 $$ \begin{pmatrix} X’Y\ F’ Y\ \end{pmatrix}=\begin{pmatrix} X’X & X’F\ F’ X & F’F\ \end{pmatrix}\begin{pmatrix} \beta\ \psi \end{pmatrix} $$有一個獨特的解決方案 $ (\beta,\psi) $ 在哪裡 $ Y $ , $ X $ , 和 $ F $ 堆 $ Y_i $ , $ X_i $ 和 $ F_i $ 超過個人。我想,根據大數定律,如果樣本類似物具有唯一解,那麼總體方程也將具有唯一解。
**第 5 步:**考慮將樣品分離到 $ G $ 滿足此處討論的連接要求的組。
為簡單起見,假設 $ J=5 $ , $ T=2 $ , $ N=5 $ . 還假設工人 1 在第 1 期受僱於公司 1,在第 2 期受僱於公司 2;工人 2 總是受僱於公司 1;工人 3 在第 1 期受僱於公司 3,在第 2 期受僱於公司 2;工人 4 始終受僱於公司 3;工人 5 在第 1 期受僱於公司 5,在第 2 期受僱於公司 4。因此, $ G=2 $ . 在第 1 組中,有公司 1、2、3。在第 2 組中,有 4,5 家公司。這是此處圖 1 中討論的範例。
反過來,在第 5 頁討論的重新排列時,步驟 1 中等式的樣本類似物是 $$ \text{[Equation $(*)$]} \hspace{1cm}\begin{pmatrix} X’Y\ F_1’ Y\ F_2’ Y \end{pmatrix}=\underbrace{\begin{pmatrix} X’X & X’F_1 & X’ F_2\ F_1’ X & F_1’F_1 & 0_{3\times 2}\ F_2’ X & 0_{2\times 3} & F_2’ F_2 \end{pmatrix}}{A{sample}}\begin{pmatrix} \beta\ \psi\ \end{pmatrix} $$ 在哪裡 $$ F_1’F_1\equiv \begin{pmatrix} 3&0 & 0\ 0 & 2 & 0\ 0 & 0 & 3 \end{pmatrix}, F_2’ F_2\equiv \begin{pmatrix} 1 & 0\ 0 & 1 \end{pmatrix} $$
從這一點開始,我迷路了。尤其,
(1) 作者告訴我們,方程 $ (*) $ 有一個獨特的解決方案 $ (\beta,\psi) $ 當且僅當其中之一 $ {\psi_1,\psi_2,\psi_3} $ 和其中之一 $ {\psi_4,\psi_5} $ 設置為等於已知值(例如, $ \psi_3=0 $ 和 $ \psi_4=0 $ )。你能幫我正式證明這個說法嗎?特別是,我想展示必要性和充分性。
如果我看上面的例子,我不明白為什麼我們需要這樣的規範化。
我確實明白其中不能有攔截詞 $ X $ 為了辨識 $ \psi $ . 為簡單起見,我們假設沒有 $ X $ 一點也不。
那麼,方程 $ (*) $ 減少到系統 $$ \begin{cases} Y_{11}+Y_{21}+Y_{22}=3\psi_1\ Y_{12}+Y_{32}=2\psi_2\ Y_{31}+Y_{41}+Y_{42}=3\psi_3\ Y_{51}=\psi_4\ Y_{52}=\psi_5\ \end{cases} $$ 有一個獨特的解決方案 $ \psi $ 無需進一步規範化。
(2) 為什麼,在第 10 頁,作者回到“預期值”而不是使用“樣本均值”,因為我們關心方程解的唯一性 $ (*) $ ?
考慮一個有兩個因素的回歸。通常,當您在回歸中有一個常數時,您會將每個因素的一個水平設為 0 作為參考水平。省略常數,您有兩個因素,其中一個參考水平為 0。
這裡的情況類似,因為您有公司和個人級別的固定效應,每個都是通常具有多個級別的因素,需要的是每個相關的公司員工組內的參考級別。新的是連通性。
在實踐中,假設您正在研究由兩個島嶼組成的給定國家的就業情況。一個島上的所有工人只為該島上的公司工作,但在這些公司之間變化。另一個島上的工人只為該島上的公司工作,再次在這些公司之間轉換。每個島定義了一組工人和公司,其中一個組中沒有工人曾為另一組中的任何公司工作。
在每個組中,您可以比較為一家公司工作與另一家公司之間的差異,以及一個人相對於另一個人的影響。但是因為沒有工人從一個島上的公司換到另一個島上,所以你無法比較不同群體的固定效應。
**定義(連接)**一個公司-僱員組是連接的,當該組包含曾經為該組中的任何公司工作過的所有工人以及曾經僱用任何工人的所有公司時。
您連結的文本具有在給定的雇主/僱員匹配數據集中查找這些組所需的算法。
在實踐中,您必須找到這些組並在每個組中設置一個公司或員工的固定效應等於 0。通過確保定義正態方程的矩陣的滿秩是滿秩的並且參數向量的解是唯一的,這樣做可以確保確定公司和工人的固定效應以及標準的 beta/參數。
但是,在使用 lfe 包的 R 中,會對此進行自動檢查,它將為您定義參考級別。我不知道stata,但我想是一樣的。