辨識假設意義
我希望對辨識假設的含義有一個很好的解釋。
在許多文章中,根據經驗策略,作者指出:
- 我們利用公司層面的變化來辨識影響
- 我們利用行業水平的變化來確定效果
例子:
本文研究了銀行擠兌對貸款的影響。我們利用銀行負債結構的變化來辨識更容易受到擠兌的銀行。
我們利用地理上不同的商業房地產市場的差異,最終確定來自日本的貸款供應衝擊對美國的經濟活動產生了實際影響。
“辨識”是計量經濟學中最常用的術語。就其含義而言,有多種廉價的談話均衡。它在不同的上下文中,被具有不同方向的人以不同的精度水平使用,具有不同的預期(但相關和重疊)的含義。
因此,您將獲得一系列正確答案。這是一個涵蓋一些變化的嘗試,從光譜的理論末端到經驗。
統計數據
統計模型是一對一的映射 $ \theta \mapsto P_{\theta} $ 從給定的參數空間到一系列機率度量。正是映射的一對一屬性使模型“被辨識”。參數空間中沒有兩個不同的元素可以產生觀測等效的數據生成過程。
因此,在統計學中,根據定義/假設,模型總是被辨識出來的。(這可以在所有基本結果的假設中看到,例如 Neyman-Pearson。)統計學家從不談論辨識,因為他們不必這樣做。
例如,對於 $$ y = \beta x + \epsilon \quad (*) $$ 在哪裡 $ (x,\epsilon) $ 是雙變數正態,用於指定總體模型 $ (x,y) $ 參數化 $ \beta $ , 必須假設 $ Cov(x, \epsilon) = 0 $ . 在不強加這個假設的情況下,不同的 $ \beta $ 的可能會產生相同的分佈 $ (x,y) $ . 在對辨識問題更為明確的計量經濟學中,條件 $ Cov(x, \epsilon) = 0 $ 有時會被稱為辨識假設。
結構模型
如果試圖通過在經濟模型中添加未觀察到的干擾來建構統計模型,則需要解決辨識問題。為了確定由此產生的結構計量經濟學模型,通常需要做出某些假設,無論是經濟性質還是技術性質。這些被稱為辨識假設。
例如,假設有 $ n $ 古諾公司以私人不變邊際成本競爭 $ (c_1, \cdots, c_n) $ 從聯合密度中提取 $ f(x_1, \cdots, x_n) $ . 計量經濟學家觀察公司的產出 $ (q_1, \cdots, q_n) $ 和市場價格 $ P $ 並想確定 $ f $ . 一種可能的辨識假設是 FOC 系統的雅可比行列式 $$ \frac{d P(Q)}{dQ} q_i + P(Q) - c_i = 0, , i = 1, \cdots, n,, \mbox{ where } Q=\sum_1^n q_i $$ 是不消失的。然後,由隱函式定理, $ (q_1, \cdots, q_n) $ 本地一對一映射到 $ (c_1, \cdots, c_n) $ . 這意味著模型,由觀察到的數量參數化 $ (q_1, \cdots, q_n) $ , 至少在本地被辨識。經驗解釋是,公司面臨的權衡取捨有足夠的變化,您可以辨識 $ f $ .
還有更多有趣的例子,其中辨識假設限制了經濟主體的行為等。
經驗使用一致估計
到目前為止,辨識純粹是從參數到數據生成過程的映射的屬性。辨識是估計的先決條件,但它本身並沒有提及樣本。
在某些情況下,計量經濟學家會談論特定的估算器,該估算器旨在估算特定模型中的特定參數。估計者一致估計參數的假設稱為辨識假設。例如,給定時間序列數據 $ (x_t, y_t) $ 由產生 $$ y_t = \beta x_t + \epsilon_t, ; t = 1, 2, \cdots, \quad (**) $$ 參數 $ \beta $ “可以被OLS辨識 $ \hat{\beta} $ “在假設 $ Cov(x, \epsilon) = 0 $ .
在 $ (*) $ 和 $ (**) $ , 條件 $ Cov(x, \epsilon) = 0 $ 並且術語相同,但“辨識假設”具有不同(但明確相關)的含義。
經驗用法-因果推理
當人們對建立因果效應感興趣時,對模型施加的允許對估計進行因果解釋的條件稱為辨識假設。是的 - - $ Cov(x, \epsilon) = 0 $ 因為線性模型也屬於這一類。往往被強化到 $ E[\epsilon|x] = 0 $ ,這對於因果推理更容易解釋。
同樣,當 $ Z $ 是一種工具,外生性條件 $ Cov(Z, \epsilon) = 0 $ 是一個辨識假設。對於 diff-in-diff,平行趨勢條件是一個辨識假設。對於回歸不連續性設計,辨識假設是,第一,除了強迫變數沒有其他不連續性,第二,代理人不能操縱強迫變數。相應的經驗設計(例如IV/DID/RDD/等)有時被稱為辨識策略。
在這種情況下,“辨識”不是二元條件。一個人可能有弱辨識,例如弱工具。
從這個意義上說,當一個辨識假設聲稱在經驗上成立時,它顯然需要被證明是合理的。換句話說,需要證明相應的 變異是外生的——例如,工具的變異是外生的,等等。
在您引用的範例中,
本文研究了銀行擠兌對貸款的影響。我們利用銀行負債結構的變化來辨識更容易受到擠兌的銀行……
擠兌的脆弱性顯然是與貸款相關的內生變數。然後,主張是有問題的經驗設計使用銀行負債結構的外生變化——作為工具/強制變數/任何東西——來規避內生性並實現辨識。
我認為解釋這一點的最好方法是首先快速解釋辨識實際上是什麼。正如這個執行緒中提到的:
例如,在 John Stachurski “A Primer in Econometric Theory”中,辨識是找出參數是否可辨識的過程,可辨識性定義為
“可辨識性意味著與未知分佈相關的參數向量最終可以與數據區分開來。”
此外,正如 BBKing 總結的那樣:
確定的估計是滿足某些條件的任何估計,使其成為我們想要的真實數字。
例如,來自(估計)OLS 回歸的任何係數都是估計值。但是,OLS 模型中滿足所有OLS 假設的無偏一致估計(例如,誤差項和自變數之間沒有關係)的係數是已辨識的估計。只有這樣的模型“實現辨識”或允許作者聲明“我們辨識效果”。
那麼什麼是辨識假設呢?它們是可以說參數是可辨識的假設。例如,在簡單的 OLS
$$ y = X \beta +e $$
參數可辨識的條件是 $ X’X $ 矩陣,用於估計 $ \beta $ (自從 $ \hat{\beta} = (X’X)^{−1}X’y $ ),必須是可逆的。如果矩陣 $ X’X $ 是不可逆的,我們根本無法辨識模型參數。
不同的模型將有不同的條件來辨識參數。如果您認為之前的建議對於您的水平來說太高級而無法知道什麼,您可能想查閱一些計量經濟學教科書,例如 Verbeek 的現代計量經濟學指南或 Pesaran 時間序列和麵板數據計量經濟學或一些本科教科書,例如 Wooldridge 對現代計量經濟學的介紹辨識條件是針對不同模型的(雖然本科教科書只會非常簡要地提及)。