如何評估 GARCH 模型的適用性?
假設我下載了一家公司的收盤價,比如穀歌或其他什麼,我想使用 GARCH 模型來建模和預測回報的波動性。
為了簡化,我只有兩個問題。
- 眾所周知,GARCH 用於預測波動率。但是,在我們得到新的回報(或價格)數據後,GARCH 預測的效果如何?有沒有量化的方法來評估這個?
- 一旦我們決定使用 GARCH(p,q),我們如何選擇順序 p 和 q?(例如,如果我們選擇 (p,q)=(1,1),那麼為什麼我們不選擇 (2, 2)或其他)
更具體,
- 如果我使用 GARCH(1,1) 對回報進行建模,我們如何知道結果與真實數據非常吻合?有沒有辦法評價這個東西?(這是擬合優度問題嗎?)
- 當我在思考之前的問題時,一個新的問題出現了。假設我使用 ARMA-GARCH 模型對返回數據進行建模。ARMA 是為回報建模,而 GARCH 是為波動率建模。這樣,我們如何評估擬合的 ARMA-GARCH 結果?假設我使用截至上週的數據來預測本週的收益及其波動性。然後,我可以用本週的價格計算實際收益,然後與 ARMA 的預測收益進行比較,看看效果如何。但是,我們怎麼知道 GARCH 預測的波動率有多好???可以使用 GARCH 來預測它。然而,當我知道這週的真正回報後,它變成了一個常數,並且沒有波動性,因為沒有隨機性。因此,我沒有真正的波動性……這樣,我如何評估 GARCH 的結果?我沒有一個可以比較的標準。
- 我們如何確定 GARCH 的順序。下載數據後,如何知道我需要使用 ARMA(1,1)-GARCH(1,1) 還是 ARMA(20,30)-GARCH(40,50)?或者,Matlab中是否有任何理論或函式可以幫助我們進行選擇?
從候選模型池中選擇哪個模型取決於您想用它做什麼。
如果你想做預測,您應該選擇一個有望提供最準確預測的模型。眾所周知,Akaike 的資訊準則 (AIC) 可以(從給定的池中)漸近地選擇一個模型,該模型將以最低的均方誤差提供預測。因此,它經常被用作預測練習中的模型選擇器,這是有道理的。AIC 很容易從擬合模型中獲得(手動或通過內置功能),因此它是一個方便的工具。AIC 的替代方案可能是聚焦資訊準則 (FIC),它可以更靈活地指定您希望最小化的損失函式類型(例如,平均絕對誤差代替均方誤差),但它也需要更多的參與來自研究人員;您需要根據您的損失函式推導出 FIC 的特定版本,然後才能應用它。
如果要恢復真實模型並且真實模型恰好在候選模型集中,請使用貝氏資訊準則(BIC)。漸近地它將選擇機率= 1的真實模型。由於大多數時候真實模型不在池中(現實比我們的模型更複雜),BIC 將傾向於選擇最接近真實模型的模型。
如果您還有另一個目標,那麼進行模型選擇的一種哲學上直截了當的方法是派生一個反映您的目標的 FIC 版本(但同樣,它本身可能是一項具有挑戰性的練習)。
在所有這些情況下,必須首先選擇候選模型池,這也不是一項簡單的任務。您可以引入主題知識;可能您知道哪種類型的模型應該很好地描述您的數據生成過程。然後,您可以探索計算上可行的最大池。但是,請記住,資訊標準對過度擬合併不完全穩健。當您有多個具有相同數量參數的模型時,AIC 和 BIC 都會減少以最大化概似性,這對於過度擬合根本不可靠。因此,在實踐中,您可以嘗試使用 somehwta 大型游泳池,但不要使用極端尺寸。
如另一個答案中所建議的那樣,尋求具有統計顯著係數和良好殘差的模型的做法在某種程度上與上述方法相切。我不確定後一種策略是否優化了任何合理的損失函式,除了提供一個很好的樣本內擬合(我的意思是:我不確定)。然而,在樣本中我們已經知道了一切,我們知道每個數據點。真正的目標通常是從樣本中進行概括,或者說一些關於數據生成過程的屬性(例如測試一些關於它的假設)或進行預測。那麼上面基於 AIC、BIC 和 FIC 的方法是有意義的。(即便如此,請回想一下,一旦執行了模型選擇並且您最終選擇了一個模型,您不能再相信顯著性檢驗,因為它們取決於已選擇的模型。正確解釋這種條件的方法正在成為統計學中一個活躍的研究領域。)
然後我沒有涉及正則化估計和模型平均,它們是更高級的方法,可以概括模型選擇問題。
此外,您可以在 Stack Exchange 系統中的姊妹站點Cross Validated找到更多關於這一切的資訊。