小樣本標準差估計的精度是多少?
我今天被要求“量化”一個小樣本的估計標準偏差的精度,我不知道如何回答。
案例很簡單,我有一個樣本 $ n=25 $ 措施(如您所料返回)。我對標準差使用了經典的無偏估計器:
$$ \sigma_x = \sqrt{\frac{1}{N-1}\sum_{n=1}^n (x_i-\bar{x})^2} $$ 潛在的問題是:我們需要多少數據才能使標準偏差具有統計意義。
我在這裡讀到計算標準差的標準誤差很難估計,但我想知道你們一般使用的通用程序嗎?
將標準差的估計值視為隨機變數。然後,您可以引導樣本估計並為您的統計生成 t 統計量和相關的信賴區間。我在這篇文章中描述了一個通用的自舉過程。
實際上,您應該對 Berry Essen 定理感興趣,該定理精確了中心極限定理的收斂速度。
給定 iid $ X_1,\dots, X_n \sim X $
1)GLN:假設 $ E(X)<\infty $ 然後 $ \overline{X}_n-E(X)\to 0 $
2)CLT(GLN的“比率”):假設 $ E(X^2)<\infty $ 然後 $ \frac{\sqrt{n}}{\sigma^2} \big(\overline{X}_n-E(X)\big)\to N(0,1) $
- Berry Essen(CLT 的“比率”):假設 $ E(X^3)<\infty $ , 然後
$ \sup_{x\in \mathbb{R}}\bigg| ,F_{\frac{\sqrt{n}}{\sigma^2} \big(\overline{X}n-E(X)\big)}(x) - F{N_{0,1}}(x) \bigg| \leq \frac{0.34445 E|X|^3 + 0.16844}{\sqrt{n}} $
在哪裡 $ F_{} $ 持有 CDF。
這是一個上限(順序 $ \sqrt{n} $ ) 可用於您的 CLT 近似值。