為什麼在 WLS 矩陣中使用公司市值的平方根
在進行基於回歸的性能歸因時,我看到人們通常使用 WLS。
所以我們的自變數和因變數都乘以我們的 WLS 矩陣,這是一個對角矩陣,其中對角線上的值是公司市值的平方根。
X = X .* WLS
y = y .* WLS
我的問題是為什麼要使用公司市值的平方根而不是僅僅使用基準權重?是否只是以防萬一有一個偏離基準的名稱?
這取決於您(假設的)基礎數據生成過程。
通常,當您的數據是異變異數但仍然不相關時,可以使用加權最小二乘法 (WLS)。
假設一個線性模型
$$ Y_i = \beta_0 + \beta_1 X_i + \epsilon_i \tag{1} $$
如果你假設 $ var(\epsilon_i) = \sigma^2 $ ,即誤差項是同變異數的,OLS 是最好的線性無偏估計量(BLUE)。然而,如果你允許錯誤是異變異數的,我們有 $ var(\epsilon_i) = \sigma_i^2 $ ,所以殘差的變異數取決於具體的觀察。但是,您可以將後一個模型重寫為:
$$ var(\epsilon_i) = \sigma_i^2 = \sigma^2 \cdot d_i \tag{2} $$
,因此您可以通過假設總體恆定誤差變異數(就像 OLS)來解釋異變異數性,但是用一個因子對每個誤差項進行加權 $ d_i $ . 如果你要分開 $ \epsilon_i $ 經過 $ d_i $ ,如 $ \theta_i = \frac{\epsilon_i}{\sqrt{d_i}} $ , 你得到
$$ var(\theta_i) = var \left( \frac{\epsilon_i}{\sqrt{d_i}} \right)= \frac{\sigma_i^2}{d_i} = \sigma^2 = const \tag{3} $$
,這使得 OLS 再次適用。事實上,假設 (2),WLS 只是具有轉換模型的 OLS,通過將任何觀察除以 $ \sqrt(d_i) $ .
那麼基礎權重如何 $ w_i $ 對於任何觀察 $ x_i $ 在最小二乘算法中?對於 OLS,我們有 $ w_i \propto X_i $ ,在 WLS 中,每個觀察權重與 $ X_i / \sqrt{d_i} $ .
總之,對於 $ d_i $ 作為一家公司的市值,如果您假設剩餘變異數為 $ var(\sigma_i^2) = \sigma^2 \cdot d_i $ 成立,即誤差變異數與市值成正比,您必須對每個觀察值加權 $ X_i $ 和 $ \sqrt{d_i} $ .