統計

計算基尼係數

  • January 10, 2019

手動計算相等大小的 bin 收入數據的基尼係數的最快方法(或公式)是什麼?

範例:組內個人數:4 4 4 4 4 每組收入:分別為 1 2 3 4 5。

所有這些答案都是正確的,但沒有提供不使用 excel/code 的簡單解決方案。Gini 也可以很容易地手動計算。

基尼係數從根本上顯示了洛倫茲曲線上方的陰影區域,以便獲得洛倫茲曲線與等值線之間距離的相對度量。從根本上說,這顯示的是收入之間的平均距離。1 是可能的最高收入,0 是最低收入。

一種計算方法是簡單地計算等式線和洛倫茲曲線之間的面積。 在此處輸入圖像描述

這顯然很難做到。幸運的是,有一種更簡單的方法。

基尼係數也等於:(所有收入的平均變異數)/(2 * 平均值)

所有收入的平均變異數可以通過建構所有收入的矩陣,然後計算每個收入之間的距離來計算。

對於您的範例:

 | 1   2   3   4   5
__|___________________
1 | 0   1   2   3   4
2 | 1   0   1   2   3
3 | 2   1   0   1   2
4 | 3   2   1   0   1
5 | 4   3   2   1   0

然後將矩陣內的所有距離相加得到總變異數。

0 + 1 + 2 + 3 + 4 + 1 + 0 + 1 + 2 + 3 + 2 + 1 + 0 + 1 + 2 + 3 + 2 + 1 + 0 + 1 + 4 + 3 + 2 + 1 + 0 = 40.

然後將其除以矩陣中元素的總數,得到平均變異數。

平均變異數 = 40 / 25 = 1.6。

現在將平均變異數除以平均收入乘以 2。

平均值 = (1 + 2 + 3 + 4 + 5)/5 = 15/5 = 3

平均值 * 2 = 6。

由於基尼係數等於:(所有收入的平均變異數)/(2 * 平均值):

基尼 = 1.6 / 6 = .2666

這是其他使用者通過更複雜的方法得到的。

計算任何數據集的基尼係數的最快方法之一是執行以下程式碼:

基尼係數和洛倫茲曲線 - Python

當您執行此程式碼時,您將獲得 0.266666666667 的基尼係數。程式碼還將生成洛倫茲曲線。

引用自:https://economics.stackexchange.com/questions/16444