您如何確定席勒市盈率回歸的正確顯著性?
“席勒市盈率回歸”是指未來 20 年的真實股票市場回報率對席勒市盈率的回歸。當我自己進行此 OLS 回歸時(基於 Shiller 教授的數據),我得到了 c 的 R 平方。67% 和基本為零的回歸的 ap 值(對應的 F stat 超過 1600)。
但是,上述 OLS 統計數據(R 平方,p 值)是否適合考慮擬合優度和回歸的重要性?我擔心樣本中時間段重疊的問題;即樣本中的第一項包含從 1928 年 1 月到 1948 年 1 月的年化實際收益,然後第二項包含從 1928 年 2 月到 1948 年 2 月的年化實際收益——因此樣本中的兩項重疊了整整 19 年 11 個月。與僅包含非重疊時間段的樣本相比,這不會以某種方式降低我的樣本中的“資訊內容”嗎?
請注意,這是 Shiller 教授本人在他的書 Irrational Exuberance 中提到的一個問題(我面前有 2005 年的第 2 版,第 187 頁):
市盈率與後續回報之間的關係似乎比較強,儘管對其統計意義存在疑問,因為在 155 年的數據中只有不到 12 個不重疊的十年間隔。
在相應的腳註中,他進一步寫道(我的書中第 261 頁):
然而,實際的學術文獻仍然沒有解決統計顯著性的問題。存在未解決的統計複雜性,特別是由於比率中的(接近)單位根問題以及自變數和因變數對價格的依賴性。還有其他統計問題:罕見的大異常值觀察的趨勢、漸近分佈理論在小樣本中的相關性問題、有關製度變化的問題和基礎數據的測量問題,以及難以解釋複雜的統計證據由可能有先入為主的研究人員選擇性地呈現。
然後,他提出了一系列學術論文,這些論文解決了其中一些問題,並得出了不同的結論。然而,在我的版本(2005 年)中引用的大多數論文現在都有些過時了,因此我想知道現在學術文獻中是否已經形成了共識。
(我知道這個涉及重疊時間段的問題,但我想知道是否在“席勒市盈率回歸”這一主題上取得了任何進展。)
重疊觀察導致誤差項的相關性
讓 $ r_{t \rightarrow t+k} $ 是從時間返回的日誌 $ t $ 至 $ t+k $ . 假設您正在執行回歸預測 $ k $ 使用年度數據的年度回報:
$$ r_{t \rightarrow t + k} = a + b x_t + \epsilon_{t+k} $$ 您的直覺是正確的,正常標準錯誤存在問題。
- 作為參考,不重疊的回報 $ r_{t \rightarrow t+1} $ 通常可以假設自相關為零並且沒有問題。
- 但有重疊 $ k $ 期間返回,誤差項 $ \epsilon_{t}, \ldots, \epsilon_{t+k-1} $ 將是自相關的。(兩個相鄰 $ k $ 期間回報將有 $ k-1 $ 重疊時期。)
Hansen Hodrick (1980) 標準誤
一個合理的起點是計算 Hansen Hodrick (1980) 標準誤差 $ k-1 $ 重疊時期。下面的一些MATLAB程式碼:
b = X \ y; %solve b = (x'x)^-1 (x' y) resid = y - X * b; Sxx = (X'*X/n); residrep = resid * ones(1,cols2); V = (X .* residrep)' * (X .* residrep) / n; for i=1:k-1, V_lag = (X(1:end-i,:) .* residrep(1:end-i,:))' * (X(i+1:end,:) .* residrep(i+1:end,:)) / n; V = V + V_lag + V_lag'; end; Sxx_inv = inv(Sxx); bcov = Sxx_inv * V * Sxx_inv / n;
John Cochrane 的《資產定價》一書也討論瞭如何做到這一點。209.
其他方法?
縱觀文獻,關於 Hansen Hodrick (1980) 修正的小樣本特性存在一些爭論,並且已經提出了其他一些修正。您在 Cross-Validated 上鍊接到的答案提供了有關該主題的一些參考資料。
參考
Ang、Andrew 和 Geert Bekaert,2007 年,“股票收益可預測性:存在嗎? ”金融研究回顧
Cochrane, John,2005 年,資產定價(修訂版) p。209
Cochrane, John,2011,“貼現率” ,金融雜誌
Hansen, Lars P. 和 Robert J. Hodrick,1980 年,“遠期匯率作為未來即期匯率的最佳預測指標:計量經濟學分析”,《政治經濟學雜誌》