不同組因變數的建議模型
我想測試 X 對 Y 的影響。正在使用因變數 Y。現在,我想看看 X 對農業 (A) 和非農業 (N) 部門的就業人員的影響是否不同。執行此操作的正確模型是什麼?
我需要包括一些互動嗎?
或者我應該為 A 和 N 定義單獨的因變數?我如何定義這些變數?以下哪一項: 1- 為組 A (N) 創建一個虛擬變數,為組 N (A) 和非工作組取值為 0 2- 為組 A (N) 創建一個取值為 0 的虛擬變數對於組 N (A) 並刪除非工作組的觀察 3- 為組 A (N) 創建一個虛擬變數,對於非工作組取值為 0 並刪除組 N (A) 的觀察
對於個人 $ i $ , 讓 $ Y_i $ 和 $ X_i $ 是相關變數並讓 $ D_i $ 是農業部門的虛擬變數:如果在農業中,則為 1,如果不是,則為 0。
然後您可以執行以下回歸: $$ Y_i = \alpha_0 + \alpha_1 D_i + \beta_0 X_i + \beta_1 X_i\times D_i + \varepsilon_i. $$ 假使,假設 $ \mathbb{E}[\varepsilon_i|D_i, X_i] = 0 $ .
那麼如果一個人沒有從事農業,我們有: $$ \mathbb{E}[Y_i|X_i = x, D_i = 0] = \alpha_0 + \beta_0 x. $$ 另一方面,對於從事農業的人,您可以獲得: $$ \mathbb{E}[Y_i |X_i = x, D_i = 1] = (\alpha_0 + \alpha_1) + (\beta_0 + \beta_1) x. $$
所以你只需要創建一個假人。的價值 $ \alpha_1 $ 給出農業和非農業就業的差異 $ x = 0 $ . 的價值 $ \beta_1 $ 給出邊際效應的差異 $ X $ 在 $ Y $ 介於農業和非農業之間。