收入規模分佈的pdf/CDF對應的qdf/quantile函式的維數分析
我之前在 Stackoverflow 上發布了一個非常相似的問題,但根據那裡的回复,我認為我的問題的真正核心是經濟問題。我將給出一個冗長的介紹,主要是為了區分我所知道的(介紹)和我所要求的(最後 3 段,如果你喜歡,請跳到它)。
假設我有一個代表收入規模分佈的pdf
f(x)
或 CDF 。F(x)
收入是每單位時間流向特定個人的資金流(美元或某種貨幣單位)。因此,我認為正確的計量單位是美元/人年。為了使機率以無量綱單位出現,f(x) 必須以每美元的人年來衡量。對 x 進行積分也產生了 CDF 的無量綱份額,因為積分的單位是被積函式 的單位的乘積
y = f(x)
,這里以人年/美元衡量,而微分的dx
單位,這里以美元/人年衡量.因此,積分
xf(x)
將單位放在以美元/人年為單位的平均收入上;這似乎是合理的。據此,我得出了關於分位數密度函式
q(y)
、分位數函式Q(y)
和積分yq(y)dy
(即 1 階偏矩函式的反函式模擬)的單位和解釋的結論,如果正確將對我非常有幫助,但我對此信心有限。如果有人能證實或否認這些結論,我將不勝感激,也許是在一些討論/解釋分佈函式背景下的維度分析解釋的背景下。我相信 y 軸和 q(y) 的單位必然與之前的 pdf/CDF 分析中的相同,即 y 值仍然以人年/美元來衡量,x = q(y) 仍然以美元/人年衡量。這意味著 q(y) 通常在某個區間上的積分,特別是 Q(y)(它等於 q(y) 從 0 到 y 的積分)都以無單位份額來衡量。但是**(不確定的解釋 #1)**
F(x)
是總收入的無單位份額,而 Q(y) 是一年的總收入的無單位份額。最後,**(不確定的解釋#2)**這將以
yq(y)dy
人年/美元為單位進行積分。但我無法解釋這一點。相應的 x 數量是人均年收入的平均值(或者對於有界 x,部分平均值)。所以這將是平均人年數——為什麼呢?一美元?為了平均收入?考慮這個函式的截斷版本,其中
yq(y)dy
從零到的積分q*
除以F(q*)
。x 的相應截斷函式為收入為 x* 或更少的人提供平均值,$/人年似乎是平均收入的合理單位。但我希望 y 版本以人數或人年數出現,對應於同一時間間隔內人年的份額,以及分母中的“每美元”,我需要製作CDF(x) 和 Q(y) 無單位,對我來說沒有明顯的解釋。
你的隨機變數是 $ X $ =“以美元衡量的人均年收入”。所以 $ X $ 是一個實值函式。正如 OP 所寫,它的域通常未指定,而它的範圍以“每人每年的美元”來衡量。
的密度和分佈 (pdf/cdf) 函式 $ X $ ,說 $ f_X,F_X $ 有作為他們的領域的範圍 $ X $ . 所以域_ $ f_X,F_X $ 是一個帶有“美元/人年”計量單位的集合。
嚴格的維度分析,實際上我們可以說密度必須以“每美元的人年”來衡量(不管這是否有意義)。
所以期望值是積分 $ \int_0^{\infty} x f_X(x) dx $ 一直以“美元”作為計量單位(我只是假設 $ X $ 是非負數),應用 OP 規定的規則(一個單位是另一個單位的倒數,剩下的第三個單位又是“每人年的美元”)。
此外,作為cdf的積分 $ F_x(x) = \int_0^x f_X(s) ds $ 具有“無量綱”的範圍,因為機率是一種相對度量。
(題外話:注意,根據定義,隨機變數的分佈函式衡量隨機變數小於或等於門檻值的機率, $ F_X(x): = Prob(X \leq x) $ . 需要額外的假設來“翻譯”這個機率也代表“收入份額”,這意味著我猜“人均收入低於或等於的人口百分比 $ x $ “)
轉到分位數函式,它被定義為分佈函式的逆函式(廣義逆函式涵蓋所有情況,但讓我們保持簡單)。相反,它使用範圍作為其域 $ F_X(x) $ , 所以域 $ Q(p) $ 以“機率”為計量單位,其範圍是 $ F_X $ . 和域 $ F_x $ 是范圍 $ X $ : Quantile 函式的範圍與 $ X $ 所以它也以“每人年的美元”來衡量(即它的範圍是“每人年的美元”計量單位)。
的導數 $ Q(p) $ “, $ q(p) = dQ(p)/dp $ 具有相同的計量單位 $ Q(p) $ ,而積分 $ \int_0^1 pq(p)dp $ 也以“每人每年的美元”來衡量。