計量經濟學

計量經濟學 - 核心頻寬公式

  • July 4, 2022

當使用高斯核來估計高斯分佈的分佈時 $ x $ ,最小化平均積分平方誤差的頻寬是:

$$ h=\left(\frac{4 \hat{\sigma}^5}{3n}\right)^{\frac{1}{5}} $$

在哪裡 $ \hat{\sigma} $ 是估計的標準差 $ x $ 和 $ n $ 是樣本量。我已經看到了這個結果的推導。

我知道有些調整使用四分位數範圍而不是 $ \hat{\sigma} $ 還有那個用途 $ 0.90 $ 而不是 $ 1.06=\left(\frac{4}{3}\right)^{\frac{1}{5}} $ . 我知道這些調整的動機是: $ x $ 可能不是正態分佈,可能是偏斜的。

我沒有看到這些調整的數學理由或解釋為什麼調整是“最佳的”。這些調整對我來說是任意的。這些有數學依據嗎?

在 Henderson 和 Parmeter 編寫的教科書(2015 年,第 2.5 章)中給出了很好的討論,並提供了數學證明的參考。另請參見線上提供的教科書技術附錄: https ://www.the-smooth-operators.com/technical-appendixerratum

Henderson, D. 和 C. Parmeter,2015 年,應用非參數計量經濟學,劍橋大學出版社。

總結那裡暴露的材料:可以優化計算頻寬以最小化 AMSE 或 AMISE。這產生了表達式 $$ h_{opt} = g\left(f(x),f^{(2)}(x),R(f^{(2)}),R(k),\kappa_2(k) \right)\hspace{2mm} n^{-1/5} $$ 其中比例因子 $ g $ 特定於最小化的目標, $ f $ 表示密度和 $ f^{(2)}(x) $ 它的二階導數, $ \kappa_2(k) $ 是核函式的二階矩 $ k $ , 和 $ R(f) = \int f(v)^2 dv $ 表示一個函式的“難度” $ f $ . 該比例因子沒有最佳值,但可以針對核函式和密度函式的特定選擇進行校準。您給出的值是針對正常密度和高斯核獲得的。作者在其表 2.3 中給出了進一步的值。

引用自:https://economics.stackexchange.com/questions/51908