CAPM 和因子建模:機器學習
請原諒我對此的無知,我仍然試圖圍繞對 Fama French 1992 因子論文的解釋進行解釋。
我來自電腦科學背景,但我也有興趣將自己應用於金融領域。
我的問題是一些機器學習模型(ANN、SVM 等)是否可以應用於 CAPM 模型/FF 3 因子模型,例如;
- 為 FF 3 因子模型找到更多最優投資組合(而不是僅僅對規模排序和高賬面市值排序的投資組合,可以使用機器學習來找到具有相似公司水平特徵的公司的投資組合併詢問神經網路出去尋找“最佳”特徵以對投資組合進行排序。
在學術意義上,使用 ML 創建一個新的因子組合就足夠了嗎?
2)是否也可以通過機器學習方法估計資產的超額收益?
ActualAssetReturn = RskFreeRate + B(ExpectedMktReturn - RskFreeRate)
人們是否將 NN 或其他 ML 方法應用於上述等式?
通過無風險利率、預期市場回報和 Beta 估計(來自 OLS)的深度神經網路 DNN 輸入來獲得資產回報的預測值是否合理?在樣本內數據集上訓練它並在樣本外數據集上進行測試……
再次原諒我的無知,我仍在研究這些東西,但想澄清一兩件我不確定的事情。
1)在學術意義上,使用 ML 創建一個新的因子組合就足夠了嗎?
最初的 FF 論文 (92,93) 說了一些深刻的話,因為它們與當時的主流理論相矛盾。當你從學術意義上說時,如果你現在數據探勘一個因素,你可能不會得到嚴肅學者的太多尊重。但是,作為一項統計練習,是的,如果您找到一個時間 t 變數來解釋時間 t+1 的平均回報,那麼您的投資組合可能是一個因素。
為了確定一個因素,讓我說你可以
**a)**在時間 t 執行特徵的橫截面回歸 (OLS),以在時間 t+1 返回許多不同變數並查看哪些有效(提示,在樣本中很多工作)
**b)**您可以使用收縮和選擇技術來權衡係數中的一些偏差以提高預測能力(參見 LAD/LASSO/等)
您會注意到前兩種方法在特徵和數據之間施加了線性關係,使用非線性學習技術的一個潛在好處是您可以拾取特徵返回關係是非線性的關係,最簡單的是;
**c)**簡單地將股票根據時間 t 的某些特徵分類為投資組合,然後查看每個投資組合在 t+1 的平均回報 - 時間 t+1 的平均回報對時間 t 的特徵的非參數回歸
d) SVM、ANN 等 - 在建模條件期望的意義上,很容易執行上述所有回歸,但可能存在解釋挑戰,考慮多層神經網路,特徵可能會以復雜的方式組合,非線性方法來更好地擬合數據,但可能很難排除負責可預測性的“因素”或公司特徵的組合(假設您沒有過度擬合數據)。