分配

非正態數據的推論

  • April 8, 2015

我有指數收盤價的數據。我稍後將使用對百分比變化進行一些回歸。在檢查數據時,我發現異變異數殘差並且分佈是非正態的。事實上,它更像是一個 t 分佈。觀察次數 > 6000。我的問題是,如果我選擇不考慮正態性而是採用 t 分佈,我如何正確地從這些數據中做出推斷。

如何確定這種分佈中的臨界值?

在執行回歸併檢查殘差中的自相關之後,假設我找到了自相關,我是否需要以任何方式調整 Newey-West SE 以使其工作?

還有什麼我需要考慮的嗎?

您擔心數據中的非正態性、異變異數性和自相關性。

錯誤的正態性不是 OLS 的假設(它用於 MLE 回歸)。也就是說,您可以在不假設正態性的情況下得出結論,OLS 是最佳線性無偏估計量 (BLUE)。然而,在穩健回歸的背景下,有許多技術可以處理異常值和 t 分佈數據,例如假設 t 分佈誤差的貝氏回歸。

OLS 為藍色需要缺乏異變異數性和自相關性。但是,通過一些調整,您仍然可以在假設檢驗中使用 OLS 係數(儘管它們將不再是藍色的)。您所要做的就是調整標準誤差(或更一般地說,調整 OLS 參數的共變異數矩陣)。使用新的標準錯誤,您可以進行新的 t 統計並執行您想要的任何假設檢驗。Huber-White 在回歸包中很常見。它可以糾正錯誤中的異變異數性。Newey-West 錯誤是隨後的發展。他們可以糾正自相關和異變異數。這對於金融中常見的一些時間序列數據尤為重要。如果您已經在使用 Newey-West 錯誤,那麼您可以建構 t 統計量並執行您需要的任何假設檢驗。

自相關的另一種方法是將 ARMA 模型擬合到數據中。同樣,對於異變異數,您可以將 GARCH 或 SV 模型擬合到數據中。

在我結束之前,您還詢問了錯誤分佈的臨界值。人們有時會在頻率統計中感到困惑,即參數的分佈與誤差的分佈不是一回事。例如,假設錯誤是正常的。用於假設檢驗的分佈是 t 分佈。這是什麼分佈?它是 OLS 係數的分佈。

話雖如此,在許多情況下,假設檢驗需要不同的臨界值。例如,在 Augmented Dickey Fuller 測試中,您必須進行調整,因為係數差異很大可能意味著基礎數據將爆炸到無窮大。

引用自:https://quant.stackexchange.com/questions/17281