統計
計算基尼係數
手動計算相等大小的 bin 收入數據的基尼係數的最快方法(或公式)是什麼?
範例:組內個人數:4 4 4 4 4 每組收入:分別為 1 2 3 4 5。
所有這些答案都是正確的,但沒有提供不使用 excel/code 的簡單解決方案。Gini 也可以很容易地手動計算。
基尼係數從根本上顯示了洛倫茲曲線上方的陰影區域,以便獲得洛倫茲曲線與等值線之間距離的相對度量。從根本上說,這顯示的是收入之間的平均距離。1 是可能的最高收入,0 是最低收入。
這顯然很難做到。幸運的是,有一種更簡單的方法。
基尼係數也等於:(所有收入的平均變異數)/(2 * 平均值)
所有收入的平均變異數可以通過建構所有收入的矩陣,然後計算每個收入之間的距離來計算。
對於您的範例:
| 1 2 3 4 5 __|___________________ 1 | 0 1 2 3 4 2 | 1 0 1 2 3 3 | 2 1 0 1 2 4 | 3 2 1 0 1 5 | 4 3 2 1 0
然後將矩陣內的所有距離相加得到總變異數。
0 + 1 + 2 + 3 + 4 + 1 + 0 + 1 + 2 + 3 + 2 + 1 + 0 + 1 + 2 + 3 + 2 + 1 + 0 + 1 + 4 + 3 + 2 + 1 + 0 = 40.
然後將其除以矩陣中元素的總數,得到平均變異數。
平均變異數 = 40 / 25 = 1.6。
現在將平均變異數除以平均收入乘以 2。
平均值 = (1 + 2 + 3 + 4 + 5)/5 = 15/5 = 3
平均值 * 2 = 6。
由於基尼係數等於:(所有收入的平均變異數)/(2 * 平均值):
基尼 = 1.6 / 6 = .2666
這是其他使用者通過更複雜的方法得到的。
計算任何數據集的基尼係數的最快方法之一是執行以下程式碼:
當您執行此程式碼時,您將獲得 0.266666666667 的基尼係數。程式碼還將生成洛倫茲曲線。