計量經濟學

幫助解釋標準差

  • January 29, 2021

我正在查看 BLS 的 1979 年全國青年縱向調查隊列。見這裡:https ://www.bls.gov/nls/nlsy79.htm

我只是在解釋標準偏差的值時遇到了一些麻煩。

假設我正在查看工資對數(工資的自然對數)。

假設我的平均值是 2.5,標準差是 0.5。

如何解釋我的 SD?我是否需要假設對數工資的總體分佈呈正態分佈,均值為零,標準差為 1?

我在這裡有點困惑,因為標準偏差是一種關係度量。我們需要將它與一些東西聯繫起來,也許是一些標準化的值,以便得出它是相對高還是低的結論。是否可以在不假設人口分佈的情況下做到這一點?(例如零均值或標準差 1)

謝謝。

首先,有充分的理由相信數據不是對數正態的,因此假設對數正態是不合適的。所以,不,你不應該那樣做。

您可以研究有關青年工資的文獻,它可能包含有關分配的資訊。但是,這可能超出了必要的範圍。

估計經濟學中的標準差有兩種主要方法。有兩種以上的方法。

這兩種方式都通過整合效用函式和機率分佈的乘積來創建風險函式來找到最佳過程,從而將估計量的概念理解為“好”。對於給定的效用函式,具有“最佳”風險函式的方法“獲勝”。

你可能只是認為這是一個公式。有不止一個公式。

這兩種方法的解釋略有不同。如果使用最大概似法,則平均值和標準差是觀測數據最可能的值。畢竟,所有其他方法都是中等可能性的方法。如果使用Frequencyist方法,這是最有可能的情況,那麼它是一個無偏估計量,因此如果您要反復進行測量,那麼它給您的值將是正確的,平均而言,儘管不一定接近一個具體的案例。

由於您不知道分佈,您可能使用了Frequencyist 方法。

現在至於如何解釋它,你真的不知道。它是一個估計器。沒有更多資訊,它就按原樣放置。當然,您確實有更多資訊。你有樣本均值,你有切比雪夫不等式。您知道 75% 的值必須在兩個標準差以內,88.88% 必須在三個標準差以內。您可以選擇任意一組您喜歡的估值。您可以查看 2.5 個標準差,也可以將其反轉並求解一個固定百分比。

這將使您以對數形式了解工資的實際範圍。

正是在這裡,兩種解釋變得重要。如果您決定反轉對數變換,則頻率估計量不再是無偏估計量。那是因為對數是凹的。您只是不能插入這些值然後反轉該過程。儘管如此,在這個規模上,除非你真的在做科學工作,否則它們可能不會那麼遙遠。

最大概似估計量對變換是不變的,因此您可以將其代入自然對數底的指數並得到正確的估計。

然而,即使這樣做也更多的是資訊性而不是解釋性的。

解釋必須始終在經濟理論的框架內。否則沒有任何意義。例如,假設您正在烤一個蛋糕,並且不小心添加了一個雞蛋太多。

如果您要為孩子的生日烤一個直徑為 6 英寸的蛋糕,那麼這可能會產生巨大的影響。如果你正在為贏得超級碗的球隊烤一個 10 英尺高、25 英尺寬的金字塔形蛋糕,那麼這無關緊要。

這還取決於您查看數據的經濟領域。您可以使用相同的數據來查看許多不同類型的現實問題。在某些問題中,工資的廣泛或狹窄分佈可能是好的,而另一些則不好。

引用自:https://economics.stackexchange.com/questions/42325