子集選擇以辨識影響市場的自變數？

June 14, 2018

鑑於許多與市場相關的特徵（約 100 個自變數，例如新興市場、發達市場、標準普爾 500 指數、科技股回報等），我需要從中選擇一個理想的獨立變數，並且是時間 t=t1 到 t=t2 期間的全球股票市場回報。
具體來說，模型必須在以下情況下辨識重要/非重要變數：1) 自變數 (p) 的數量很大 (~100) 2) 樣本數量 (n) < 自變數的數量 (p)當 n >= p
Lasso 和 PCA 是實現這一目標的好方法嗎？我猜 Lasso 是一種簡單易行的方法。我認為 PCA 的問題在於結果的解釋並不容易……
有沒有處理這個問題的學術文獻（選擇一個大自變數的子集來預測全球股市收益）

關於資產定價 Lasso 的文獻是最近才出現的，目前還很少有參考資料。主要有：
Freyberger、Neuhierl、Weber - 非參數剖析特徵- 這使用 Lasso。
Huang and Shi (2016) - 也是套索。
Horowitz (2016) - 概述了高維模型中的模型選擇
還有幾篇關於 PCA 的論文：
Giglio and Xiu (2016)
凱利、普魯特和蘇 (2017)

引用自：https://quant.stackexchange.com/questions/40295

相關問答

我在哪裡可以找到Renaissance Technologies等著名量化公司的詳細資訊？

July 14, 2021

Quants需要了解會計嗎？

August 11, 2020

根據季度數據估算月度 GDP 增長

June 12, 2019

與夏普基於回報的風格分析相關的問題

June 12, 2018

CAPM 和因子建模：機器學習

January 6, 2018

雅虎財經股票數據的準確性（Python模組）

July 23, 2016