建構時間序列需求預測模型
我正在預測對某些類型的商品和服務的需求,我希望這些需求與一籃子宏觀經濟指標的子集相關(考慮 15-20 個指標)
我不知道哪些指標對需求的影響更大,它們是否具有簡單的相關性影響,或者變化的導數是否會影響需求(例如 GDP 或 GDP 變化),或者是否對需求有延遲影響(例如政府支出增加去年可能更好地預測今年的需求?)。一些宏觀指標可能相互關聯。
我對可能的指標有一些基本假設——可能是對的,也可能是錯的。
問題 1. 什麼是好的時間序列預測模型?除了多元回歸之外,還可以考慮什麼?2. 有沒有工具可以輸入歷史需求,歷史宏觀指標,然後輸出哪組指標最能預測需求,哪個模型效果最好?
我知道如何在 excel 中進行回歸,但這一次只是一組指標。20 個指標(加上衍生品,加上滯後)引發了很多我無法手動模擬的可能性。
任何幫助表示讚賞。
- 如果只是了解模型,我建議從漢密爾頓的“時間序列分析”開始,但任何類似的書都可以。您還可以在 Google Scholar 中尋找靈感(人們可能已經建立了類似的模型)。看來您有一個 VAR 模型,請查看此維基百科連結,看看它是否符合您的想法:https ://en.wikipedia.org/wiki/Vector_autoregression
- 如果您正在尋找獲得這些預測的工具,我建議您使用 EViews 或 R。它們本身沒有用:您必須有一個模型才能進行任何類型的預測。
您的問題似乎與問題的時間序列性質無關。似乎您的問題是您有“太多”可能的自變數,並且對所有變數進行回歸的“廚房水槽”方法正在產生多重共線性或非常低的預測能力,例如通過 $ r^2 $ .
你應該做的是使用像 LASSO 這樣的模型選擇方法來選擇變數,以最大限度地減少預測誤差。您向 LASSO 提供您認為完全相關的所有變數和變數組合,LASSO 將決定在您的預測模型中包含多少以及哪些變數。關鍵在於它將您的數據拆分為不同的“折疊”,並在所有這些不同的“數據集”上交叉測試建議的模型。這可確保您的模型能夠很好地預測樣本外。
一個權衡是你不能在 excel 中做到這一點,除非 excel 自從我上次使用它以來真的發生了變化。你需要一個真正的統計包,比如 eviews、STATA 或 R。然而,R 是免費的,而且很多人都在按照你的建議做事;你想要的包叫做glmnet。另一個權衡是,像 LASSO 這樣的機器學習方法在係數估計中引入了偏差,以最小化預期的預測誤差,因此您的模型旨在預測將要發生的事情,但不解釋原因:不要查看變數的係數,並嘗試將它們解釋為因果邊際效應。