數理經濟學

經濟學中數學的不合理無效

  • July 10, 2022

1960 年,物理學家尤金·維格納 (Eugene Wigner ) 寫了一篇文章《自然科學中數學的不合理有效性》,解釋了數學形式主義可以對現實做出預測是多麼出人意料。儘管他的文章基本上僅限於現代物理學中發生的事情。

維格納所描述的畫面在其他自然科學和社會科學中並不常見。事實上,近來在許多科學領域(從社會科學到生物學等自然科學)都有很多關於**“數學無理無效”的笑話。**

我的問題是:

  1. 為什麼數學似乎在某些領域(物理或工程)工作得很好,但在經濟學等社會科學中卻沒有那麼有用或準確的原因是什麼?
  2. 假設經濟學或社會學有朝一日將像目前物理學中那樣對數學進行密集和預測性的使用,是否合理,或者我們今天所知道的這些科學根本不能被形式化到那種程度?

我認為到今天你提到的論點已經完全過時了。如今,使用心理測量學和計量經濟學相結合的公司可以預測您是否懷孕(從您的購物模式),比人類可能注意到懷孕的時間(見這裡)更早。如果公司能夠使用數據與社會科學相結合來預測懷孕不算“不合理有效”,我不知道是什麼。

最近有很多關於“數學無理無效”的笑話

我不知道你在哪裡聽過這樣的笑話,但它們一定來自一些對現代研究不了解的人。雖然經濟學或其他社會科學還沒有物理學的某些領域那麼精確,但它們也不甘落後。在經濟學的“可信度革命”之前,這樣的笑話會成為現實(參見Angrist 和 Pischke 2010)。在公信力革命之後,這樣的笑話肯定是不准確的。

為什麼數學似乎在某些領域(物理或工程)工作得很好,但在經濟學等社會科學中卻沒有那麼有用或準確的原因是什麼?

過去(80 年代前)社會科學模式非常無效,主要有以下幾個原因:

  • 缺乏數據來驗證/量化關係。
  • 社會科學數據中有更多的噪音,需要大樣本量才能將關係與噪音分開。
  • 計算能力不足。
  • 缺乏為社會科學設計的統計技術和缺乏實驗。

讓我們一一列舉:

  1. 缺乏數據來驗證/量化關係。

過去很難找到高質量的數據。你會發現很多那個時代的社會科學論文都使用了 40-60 的樣本大小,按照現代標準,這將是可笑的。事實上,即使在最近的 90 年代,您也可以看到使用小至 117 個觀察值的樣本量發表的論文(例如,參見Dollar 1992)。

例如,即使在物理學中,如果沒有關於小行星速度、位置等的良好數據,也很難預測小行星的路徑。

  1. 社會科學數據中有更多的噪音,需要大樣本量才能將關係與噪音分開。

與前一點有關,社會科學數據中通常存在更多噪音,因此不用說,社會科學需要更大的數據集才能準確。這就是為什麼像預測懷孕這樣的故事現在突然出現的原因,因為它們是社會科學使用大數據的結果。

計算能力不足。

缺乏計算能力是過去的大問題,現在仍然是限制性的。例如,即使在正常電腦發明之後,模擬液壓電腦(例如MONIAC)也被用於經濟學,因為早期的電腦甚至沒有計算能力來模擬簡單的宏觀模型。

現代電腦更好,但計算能力仍然是很大的限制因素。最近我參加了 Ben Moll 的分佈式宏的研究生課程,在那裡我們建構了具有多個代理的相對簡單的宏模型(例如,請參閱此處的模型範例),但即使是現代 PC 在執行此類模型時仍然存在一些問題(它們可能需要很長時間才能完成解決)。

儘管如此,在模擬領域之外(通常在計算上非常密集),現在的計算能力足以執行過去無法執行的各種統計模型。

  1. 缺乏為社會科學設計的統計技術和缺乏實驗。

過去,社會科學的大問題是缺乏適當的統計模型。在物理學中,大多數關係都是外生的,通常具有非常簡單的因果鏈。在社會科學中,大多數關係是內生的。這種關係不能用(比較)足以滿足許多自然科學的基本方法來分析。

因此,在“信用革命”之前,大多數實證研究處於非常糟糕的狀態。然而,新統計技術的發展,如 diff-in-diff、綜合控制、TSLS、RD 等,以及對執行隨機對照試驗的更多關注,為社會科學研究帶來了可信度和更大的預測能力(參見Angrist 和 Pischke 2010)。

即使社會科學研究仍然不如物理學的某些領域那麼精確,但如果說今天的數學在某種程度上是“不合理的無效”,那將是荒謬的。

假設經濟學或社會學有朝一日將像目前物理學中那樣對數學進行密集和預測性的使用,是否合理,或者我們今天所知道的這些科學根本不能被形式化到那種程度?

假設是合理的。事實上,我想說當今的經濟學可以像幾十年前的許多物理學領域一樣準確。有了更好的數據、更多的計算能力、更好的統計技術,社會科學的精確度可能會驚人地高。例如,最近芝加哥大學的研究人員開發了一種算法,該算法可以提前幾週預測犯罪,準確率約為 90%(參見Rotaru 等人 2022此處),這聽起來幾乎就像“少數派報告中的預兆”。

(通常)在數學確實做得很好的地方,有明確的量化方法,我們量化的方式可以在所有情況下都使用相同的方法,但是,在數學上(通常)失敗的地方,有一個非-量變。

我的意思是什麼?好吧,事情是你用一天衡量的東西不能在另一天使用。比如說,像經濟學或政治學這樣的研究,每天通過“人類思維的力量”,都會發生越來越多的變數和生成效應。

讓我給你一個故事來解釋一下,從前,某處有一座銅礦,由於開採銅時會產生硫磺的環境問題,該礦受到當地環保部門的壓力,要求減少/關閉運營。幾個月後,銅礦選擇了一種根本不同的策略來解決硫產量過高的問題,他們決定將硫轉化為鹽酸。這帶來了很多利潤,並導致該業務專注於銷售鹽酸。

在這種情況下,公司最初的模型是關於銅本身的,隨著時間的推移而改變。但是,假設我們選擇一個像物理這樣的主題,那麼它所描述的主題,無論我們是去年還是昨天,實驗都會表明遵循相同的物理定律。

從本質上講,這個論點是,高效的定量科學,至少在目前的狀態下,依賴於其話語領域中的高水平規律性才能發揮作用。

這並不是說數學在非定量科學中完全不適用,我們可以利用數學思想嚴格地提取觀察到的現象的更深層次的含義。例如,看看這個演講,Eugeina Cheng 討論了類別理論如何幫助人們理解種族主義。

引用自:https://economics.stackexchange.com/questions/51988