回歸

如何建立因子模型?

  • March 14, 2018

因子模型,例如Fama-French或此處部分總結的其他模型模型適用於資產收益的橫截面。

因子是如何建立的,敏感性/係數是如何估計的?在這種情況下,通常會提到Fama-MacBeth 回歸。這種方法如何直覺地工作?誰能給個分步手冊?

編輯:論文和手冊的連結已發佈在兩個答案中 - 這很棒。但是有人可以在答案中提供更多的直覺嗎?假設我們有一系列股票(比如 MSCI 歐洲),我們按價值和規模對它們進行分組。我們該如何進行?我們如何建構因素以及我們如何建構敏感性?沒有連結,有人可以給出更直接的解釋嗎?謝謝!

1. 確定因素

在經濟上,因子模型的使用可以通過ICAPMAPT來激發。儘管模型之間存在一些理論差異,但對於經驗和實際工作來說,這些差異是無關緊要的。最後,兩個模型都規定收益和預期收益是因子的線性函式:

$$ r_{i,t} = \alpha_i + \sum_j \beta_{i,j} F_{j,t} + \epsilon_{i,t} \quad (1) $$ $$ \mathbb{E}[ r_{i,t}] = \lambda_o + \sum_j \beta_{i,j} \lambda_j \quad\quad\quad(2) $$ 在哪裡 $ F_{j,t} $ 是因素的因素驚喜 $ j $ 有時 $ t $ 和 $ \lambda_j $ 是因子的因子風險溢價 $ j $ . 這些因素是什麼基本上是不確定的。在ICAPM之後,這些因素應該是未來邊際消費增長的代理(=狀態變數)。無論您使用什麼因素,都應該有一個經濟原因,為什麼回報應該與該因素相關。對於後面的某些步驟,這些因素是交易回報還是其他因素(例如宏觀經濟變數)會有所不同。基於回報的因素通常是作為特定投資組合的回報或兩個投資組合之間的差異得出的。第一組最著名的例子是 Chen、Roll 和 Ross ( 1986 ) 使用的宏觀因子,後一組是 Fama 和 French 因子 ( 1992 , 1993 , 1996 , 2014 ))。當因子返回時,它使統計估計更容易一些(我稍後會解釋這一點) 2. 收集數據

下一步始終是數據收集,包括因子和測試資產。有時,當這些因素是宏觀經濟時間序列(或類似的東西)時,它們的可預測成分會被移除,因此這些因素只是意外因素。原則上,只有意外的成分才能解釋收益的橫截面差異。當因子被建構為投資組合收益時,一個關鍵問題是再平衡頻率。我知道的大多數論文都遵循 Fama 和 French 的例子,並在年中(7 月 1 日)形成投資組合,然後在一年內保持投資組合成分相同(一個眾所周知的反例是動量因子卡哈特 ( 1997)誰使用每月重新平衡)。當根據某種排名將因子建構為頂部和底部投資組合之間的收益差異時,就會出現在哪些分位數處拆分資產的問題。常見的是中位數、30/70 分位數或 10/90 分位數的拆分。

3. 估計回歸

最後一步是估計回歸,看看這些因素是否能夠解釋收益的橫截面。對此有兩種主要方法,有時稱為時間序列回歸和橫截面回歸(我也聽說人們將第一個過程稱為 Fama-French 方法,將第二個過程稱為 Fama-MacBeth 方法)。

a) 時間序列回歸

當所有因素都是回報時,您可以對每個測試資產使用時間序列回歸來估計回歸斜率 $ \beta_{i,j} $ . 在這種情況下,您估計模型 (1)。您將獲得每個因素和測試資產的 beta。在這種情況下您可以使用時間序列回歸的原因是因子溢價 $ \lambda_j $ 可以簡單地估計為因子回報的時間序列平均值。如果在回歸中使用超額收益作為因變數,因子模型有一個含義:所有 $ \alpha_i $ 應該為零。對此進行測試在一定程度上取決於您對誤差項中的時間和橫截面相關性的假設。在任何情況下,當您測試多個假設時,您都必須訴諸某種形式的 F 檢驗(針對自相關、異變異數、一般錯誤等進行了調整)。Cochrane ( 2001 ) 的書使用 GMM 方法(第 12 章和第 13 章)詳細推導了這些。

b) 橫截面回歸

對於一般因素,您需要通過估計方程 (2) 來執行橫截面回歸。這裡的一個關鍵問題是 $ \beta $ 係數和風險價格 $ \lambda $ 不能直接觀察到。通常的方法是遵循 Fama 和 MacBeth ( 1973 )制定的程序:您首先為每個測試資產單獨執行時間序列回歸。這將為您提供每個 $ \beta $ 對於每項資產。然後,這些估計值在橫截面回歸中用作自變數,使用每種資產的平均回報作為因變數。此回歸中估計的係數是因子風險溢價 $ \lambda $ . 同樣,因子模型的預測是定價誤差 $ \lambda_0 $ 每個資產為零。在橫截面回歸的情況下,這是一個單一的參數,可以測試它在總體中為零的零假設。通常使用滾動視窗重複此過程;每月數據通常是 5 年的數據。Fama-MacBeth 方法的真正“肉”是關於如何在橫截面回歸的標準誤差中解釋以下事實的統計理論: $ \beta $ 是來自時間序列回歸和橫截面相關性的估計係數。同樣,關於檢驗統計的詳細資訊,我將參考 Cochrane ( 2001 ) 第 12 章中的書。

4. 評估結果

在評估定價誤差是否很小(測試 $ \alpha_i=0 $ 對於所有 i),下一個問題是檢驗步驟 1 中選擇的因素是否是“好因素”。這意味著它們應該與預期回報表現出密切的關係。橫截面和時間序列方法提供了稍微不同的方法來測試一個因素是否被定價。對於這兩種方法(時間序列和橫截面回歸),應該測試這些因素是否在橫截面中實際定價。對於時間序列回歸,因子風險溢價被估計為因子回報的時間序列平均值。標準統計測試可用於測試這些是否為陽性。對於橫截面回歸,因子風險溢價是回歸的係數,也可以進行檢驗。在這兩種情況下,都應該注意使用的標準誤差(時間序列方法中的自相關,

經常出現的一個問題是哪種方法“更好”。首先,時間序列回歸只能在因子為回報時使用。如果因素是回報,這兩種方法不一定是等價的。時間序列回歸將因子溢價估計為平均回報。因此,任何因素在樣本中的定價誤差為零。這相當於將橫截面中的截距強制為零。為了使這兩種方法等效,您還必須將該因子作為測試資產包括在內。如果你這樣做,那麼使用正確的標準誤差將產生相同的風險價格估計。

引用自:https://quant.stackexchange.com/questions/17125