模特
如何設置數據以了解預付款的驅動因素
我想了解MBS某個部門預付的驅動因素。我有一些解釋變數,我認為這些變數可以解釋實際的 CPR,並希望通過簡單的線性回歸對預付款進行建模。我有數百萬筆貸款和數年的月度數據。據我了解,在執行此回歸之前,我需要將每個時間戳(月)的這些數據匯總在一起。我想了解的是,當按時間對數據進行分組並在解釋變數中取加權平均值時,我最終會在一定程度上失去資訊,那麼除了以這種方式分組之外,還有其他方法可以將預付款數據放在一起嗎? 只做這個分組然後執行回歸是否可以?並且在執行回歸以考慮分組後是否對預測/參數進行了任何調整?我想我只是想知道數據是否通常設置為縱向(我正在嘗試做)或面板數據?
這是一個複雜的決策,涉及聚合偏差和測量誤差之間的權衡。例如,請參閱連結。一般來說,沒有簡單的答案——分組的適當級別取決於模型的特定應用、特徵集和對計算資源的訪問,以及其他因素。
鑑於您正在嘗試使用簡單的線性回歸對預付款進行建模,您選擇的分組級別可能比您選擇的模型規格和解釋變數對模型的預測/解釋能力的影響更小選擇包括。