統計學

小樣本標準差估計的精度是多少?

  • June 10, 2012

我今天被要求“量化”一個小樣本的估計標準偏差的精度,我不知道如何回答。

案例很簡單,我有一個樣本 $ n=25 $ 措施(如您所料返回)。我對標準差使用了經典的無偏估計器:

$$ \sigma_x = \sqrt{\frac{1}{N-1}\sum_{n=1}^n (x_i-\bar{x})^2} $$ 潛在的問題是:我們需要多少數據才能使標準偏差具有統計意義。

我在這裡讀到計算標準差的標準誤差很難估計,但我想知道你們一般使用的通用程序嗎?

將標準差的估計值視為隨機變數。然後,您可以引導樣本估計並為您的統計生成 t 統計量和相關的信賴區間。我在這篇文章中描述了一個通用的自舉過程。

實際上,您應該對 Berry Essen 定理感興趣,該定理精確了中心極限定理的收斂速度。

給定 iid $ X_1,\dots, X_n \sim X $

1)GLN:假設 $ E(X)<\infty $ 然後 $ \overline{X}_n-E(X)\to 0 $

2)CLT(GLN的“比率”):假設 $ E(X^2)<\infty $ 然後 $ \frac{\sqrt{n}}{\sigma^2} \big(\overline{X}_n-E(X)\big)\to N(0,1) $

  1. Berry Essen(CLT 的“比率”):假設 $ E(X^3)<\infty $ , 然後

$ \sup_{x\in \mathbb{R}}\bigg| ,F_{\frac{\sqrt{n}}{\sigma^2} \big(\overline{X}n-E(X)\big)}(x) - F{N_{0,1}}(x) \bigg| \leq \frac{0.34445 E|X|^3 + 0.16844}{\sqrt{n}} $

在哪裡 $ F_{} $ 持有 CDF。

這是一個上限(順序 $ \sqrt{n} $ ) 可用於您的 CLT 近似值。

引用自:https://quant.stackexchange.com/questions/2523