參數模型和非參數模型有什麼區別?
我正在閱讀有關波動率建模的內容,並且遇到了參數和非參數模型的概念。例如,GARCH 是一個參數模型,Realized Volatility 是一個非參數模型。
據我所知,參數模型假設數據具有一定的形狀並且有一些需要估計/擬合的參數,而非參數模型相當簡單並且沒有參數?
談論什麼是參數模型比談論非參數模型更容易。參數模型在自變數和因變數之間具有明確定義的關係,並且對關係的機會或隨機分量使用明確定義的機率分佈。
在非參數模型中,上述某些內容沒有得到很好的定義。
例如,在回歸方程中$$ Y=\beta_0+\beta_1X+\varepsilon,\varepsilon\sim\mathcal{N}(0,\sigma^2), $$每個參數和每個變數都映射到一個固定的數字。此外, $ \varepsilon $ 具有定義明確的函式形式。
現在讓我們假設我們不知道函式形式,只知道我們相信 $ Y $ 是單調遞增的 $ X $ . 我們可以測試的一種方法是將觀察結果轉換為等級。但是,即使排名遵循表現良好的機率質量或密度函式,我們也不會在兩個變數之間建立明確的關係。
同樣,我們可以有一個定義明確的形式,例如$$ Y=\beta_0+\beta_1X+\epsilon, $$除了我們不知道是什麼 $ \epsilon $ 取自。
為了使問題複雜化,還有一個稱為半參數模型的類別。在半參數模型中,某些部分定義得非常好,而其他部分則沒有。
通常,如果模型假設實際上是有效的假設,則參數模型具有更高的統計功效。非參數模型往往更穩健。
雖然我談到了自變數和因變數,但這實際上並不是必需的。例如,可能只有一個變數。你可以有變數 $ X $ 如果您不知道它的分佈,並且您認為它無論如何都表現不佳。
如果您想知道位置中心是否大於 5,您可以使用符號檢驗,將它們拆分為中位數以查看中位數是否大於 5。
關於頻繁出現的非參數,往往有一個錯誤的措辭。是數據決定模型,還是數據用得更多。這兩個片語都不正確。如果第一部分為真,那麼它將是貝氏非參數模型。如果後者是真的,那麼非參數測試將比參數測試更強大。
發生的事情是數據受到不太明確的關係的影響,這大致就像放鬆約束一樣。如果您從線性關係變為單調遞增(遞減)的關係,那麼您所做的陳述就會變得更弱。
通常,使用頻率模型,您獲得的關於世界如何運作的資訊較少。你也沒有那麼直截了當。到您的模型。對於貝氏模型來說,這不一定是正確的陳述,因為貝氏模型選擇是如何工作的,並且概似函式是最低限度的。
無分佈和無參數模型利用問題的其他屬性,而不是變數之間的直接關係。例如,在所有情況下,分佈都存在中位數。同樣,即使是並列變數也可以排名,只是它們都具有相同的排名。