ARIMA 模型如何成為預測經濟變數的有效方法?
我注意到在預測通貨膨脹時使用了單變數預測方法(即 ARIMA 模型)(參見下面的參考資料)。
就預測經濟變數而言,這是一種有效的方法嗎?這種方法是否沒有忽略大量的經濟理論,這些理論決定了這些變數是如何確定的(即通過平衡和變數自身以外的相互作用?)
所以你的問題基本上是問為什麼純粹的統計模型比基於理論關係的模型更擅長預測。例如,考慮一個簡單形式的 ARIMA 模型,即一個 AR 模型,您只是使用過程的滯後來解釋過程本身。現在想想過程的滯後中包含什麼……如果真正的過程(即 DGP)是由其他變數之間的理論關係決定的,那麼這些將自動包含在滯後中。因此,ARIMA 模型是一種對過程進行建模的統計方法,以確保您捕捉到潛在關係的統計屬性,但不一定對正在發生的事情提供解釋。在預測中,尤其是當序列波動和不穩定時,你經常會發現像這些簡單的統計模型做得更好,因為潛在的關係可能不是很穩定,或者可能比我們能提出的任何理論都複雜。這與最近的一篇文章有關,您可能會覺得它很有趣:http://www.sciencedirect.com/science/article/pii/S0169207017300997
簡而言之,為了預測的目的,忽略經濟理論往往是方便甚至有益的。當感興趣的問題本質上是因果關係時(例如,當您想了解潛在的因果關係時),經濟理論所暗示的限制對於推理是必要的。但是,如果您感興趣的預測更多的是複雜的外推,那麼像 ARIMA 這樣簡單的預測可能會更有幫助和更準確。
我認為以下是有用的參考。
為什麼我對潛在的因果關係不感興趣?
考慮以下範例,來自 Stock 和 Watson(第 517 頁)的“計量經濟學導論”(第 3 版)。
第 3 章中最簡單的回歸模型將考試成績與師生比例 (STR) 相關聯:
$$ \begin{equation} \widehat {Test Score} = 989.9 - 2.28 \times STR \tag{14.1} \end{equation} $$正如在第 6 章中所討論的,學校負責人在考慮僱用更多教師來減少班級規模時,不會認為這個等式很有幫助。等式 (14.1) 中的估計斜率係數未能提供對學生-教師比率對考試成績的因果影響的有用估計,因為可能遺漏變數偏差是由於學校和學生特徵的遺漏而導致的,這些是考試成績的決定因素,並且與師生比相關。 相反,正如第 9 章所討論的,正在考慮搬到學區的家長可能會發現公式(14.1)更有幫助。儘管該係數沒有因果解釋,但回歸可以幫助家長預測他們不公開的地區的考試成績。更一般地說,即使沒有一個係數具有因果解釋,回歸模型也可用於預測。從預測的角度來看,重要的是模型提供盡可能準確的預測。
同樣,這是在討論機器學習時經常提到的一點。機器學習在幫助理解潛在的因果關係方面可能不是那麼有用。然而,我們通常對預測/預測更感興趣。Sendhil Mullainathan 在這次關於“經濟和金融中的機器學習和預測”的演講中給出了有用的“經驗法則”量規——你對 $ \hat y $ 或者 $ \hat beta $ ?
為什麼像 ARIMA 這樣的預測比更好地反映經濟理論的模型更好?
考慮一下 Peter Kennedy(第 333 頁)的“計量經濟學指南”(第 6 版)中的這段有用的段落。
用於預測目的的計量經濟學模型的主要競爭對手是 Box-Jenkins 或 ARIMA(自回歸綜合移動平均),模型在第 19 章中有詳細解釋。單變數 Box-Jenkins 模型是複雜的外推方法,僅使用變數的過去值預測生成預測;他們忽略了構成計量經濟模型基礎的許多解釋變數。預報員對這些幼稚模型感興趣的原因有幾個:由於改進了電腦軟體,它們易於生產且成本低廉;估計適當的計量經濟模型所需的額外資訊可能很昂貴;此類模型的預測可作為比較的有用基準;來自這個過程的預測可以與其他預測相結合以產生改進的預測;它們作為進一步建模的初步步驟很有用——它們闡明了數據的性質並明確了哪些行為模式需要解釋。
在 1970 年代,關於計量經濟學模型和 ARIMA 模型的相對預測優點的爭論激烈,這是由聲稱 ARIMA 模型優越性的研究引發的。如第 19 章所述,這導致了兩種方法的綜合,並促進了模型的發展,例如更關注動態的糾錯模型 (ECM)。回想起來,計量經濟學模型在這些比較中表現如此糟糕的原因是計量經濟學模型中的錯誤指定錯誤,主要是在它們的動態結構方面。人們普遍承認,只要規範或條件錯誤導致計量經濟學模型不切實際(大多數情況下有人聲稱這是),Box-Jenkins 方法在預測方面具有相當大的優勢。
像 ARIMA 這樣的單變數模型能否代表理性預期均衡?
並不真地。大多數經濟學理論採用理性預期,導致描述模型動態的非線性方程組(在多個變數中)。通常,這些是近似的(例如,對數線性近似),因此可以使用線性狀態空間模型之類的東西來求解和估計它們——但許多仍然需要多個變數(在這裡,排列在一個向量中)來描述模型的全維度。有關使用理性預期的一個特定模型的範例,請參見第 3 頁。Hansen 和 Sargent 的“動態線性經濟學的遞歸模型”第 30 卷。
考慮一個隨機過程 $ {p_t} $ 與隨機過程有關 $ {m_t} $ 通過
$$ \begin{equation} p_t = \lambda E_t p_{t+1} + \gamma m_t \tag{(2.4.38)} \end{equation} $$ 在哪裡 $$ \begin{equation} m_t = G x_t \tag{(2.4.39)} \end{equation} $$ 和 $ x_t $ 由 $$ x_{t+1} = A x_t + C w_{t+1}, \text{ for } t = 0,1,2,… $$ …收集結果,我們有 $ (p_t, m_t) $ 滿足
$$ \begin{align*} \begin{bmatrix}{p_t \ m_t }\end{bmatrix} &= \begin{bmatrix} \gamma G(I - \lambda A)^{-1} \ G \end{bmatrix} x_t \ x_{t+1} &= A x_t + C w_{t+1}. \end{align*} $$ $$ This system $$體現了與理性預期模型相關的交叉方程限制:請注意,相同的參數在 $ A,G $ 該引腳 > 確定隨機過程 $ m_t $ 還輸入確定 > $ p_t $ 作為狀態的函式 $ x_t $ .
這個方程寫得很靈活,允許許多狀態變數和許多(可能是正交的)衝擊。因此,這不能用像 ARIMA 這樣的簡單單變數模型來表示。
許多其他範例可以在 Dejong 和 Dave 的“結構計量經濟學”中找到,或者在 Hansen 和 Sargent 的“動態線性經濟學的遞歸模型”中找到更多範例。有些只有一維狀態空間。有些會有更大的狀態空間。
但是,同樣,如果您只對簡單的預測感興趣,則可能不需要完整描述模型。因此,像 ARIMA 這樣的東西是一個有吸引力的選擇。