計量經濟學

為什麼 Stata 省略了我的一些變數並且 mfx 不起作用?

  • October 28, 2022

我正在嘗試使用一些分類和連續變數進行機率回歸,但 Stata 一直忽略某些變數,甚至聲稱有些變數不能用於共線性問題(我檢查了我的 DV 和所說的 PV 之間是否存在相關性,但它不是完全共線或任何東西)。當我也嘗試查找 ML (mfx) 時,它不起作用。

這是我在命令框中輸入的內容:

probit 投票 i.BioDadEdu i.BioMomEdu i.Age i.Region i.Citizenship i.EnrollStat HGC FamilyIncome i.HHSize i.HDE i.MarStat i.UrbanRural i.Income IncomeVal i.SpouseIncome SpouseIncomeVal i.GovtInt if RaceEth==1

請幫忙!這是我的畢業論文,我很迷茫。

Stata是正確的,您必須具有完美的共線性。

如果 stata 只是放棄了一些控制,而您對這些係數不感興趣,那很好。忽略它並只關注您感興趣的變數,因為刪除的控制項無論如何都不會向模型添加任何內容(由於完美的共線性)。

如果您不喜歡 stata 正在下降的變數,請自己刪除一些。

在您的情況下,我懷疑某些收入變數可能會導致共線性。

請注意,變數之間可能不存在完美的共線性 $ x_i $ 和 $ a_i $ 作為 $ cor(x_i,a_i)\neq 1 \lor -1 $ , 但仍然是完美的共線性 $ x_i $ 和 $ a_i $ 有條件的 $ z_i $ 即有可能 $ cor(x_i,a_i)|z=1 \lor-1 $ .

此外,請注意,如果缺少觀測值,則可能不會對整個樣本執行回歸。如果你退步 $ y_i $ 上, $ x_i $ , $ a_i $ , $ b_i $ 和 $ c_i $ 回歸,即使沒有任何“如果”條件,也只會在沒有變數錯過觀察的情況下執行。所以如果你有 300 個觀察值, $ y_i $ 適用於所有 300, $ x_i $ 有一些 N/A,因此它僅適用於 250 個觀測值, $ a_i $ 260, $ b_i $ 對於 207 和 $ c_i $ 對於 265,回歸只會在由觀察組成的樣本上執行 $ i $ 除非 $ y_i,x_i, a_i, b_i, c_i \neq N/A $ 同時。

除了第一段的解釋外 $ cor(x_i,a_i) \neq 1 \lor -1 $ 但同時 $ cor(x_i,a_i) |y_i,x_i, a_i, b_i, c_i \neq N/A= 1 \lor -1 $ .

至於該怎麼做,這取決於您必須首先調查的實際導致問題的原因。

只有當 RaceEth = 1 時,您才想執行回歸是事實嗎?然後刪除該條件或具有完美多重共線性的變數之一。如果變數完全共線,您將無法通過控製附加變數從回歸中獲得更多資訊,因為係數將完全相同或相反,您可以通過變數之間的相關性進行檢查。

如果它的觀察問題嘗試收集更大的樣本。

如果您無法獲得更多數據或刪除變數,請嘗試旋轉您的主題。我希望你不會落入許多學生寫幾乎整篇論文的常見陷阱,而沒有首先檢查是否可以根據你擁有的數據執行回歸。如果你沒有犯這個錯誤,你應該能夠與你的論文導師討論由於數據不足而無法回答目前研究問題而改變主題。大多數教授在論文寫作過程的早期階段不會介意,因為他們預計某些想法可能存在數據問題,使它們不可行。

如果您犯了已經寫完所有內容的錯誤,並且您處於論文寫作過程的後期階段,您仍然應該與您的主管交談。考慮到數據問題,您的主管可能會接受低於標準的輸出,但即使接受,它很可能仍會反映在評分中。

引用自:https://economics.stackexchange.com/questions/53285