時間序列

使用不同長度的期貨合約來預測現貨價格

  • August 20, 2021

因此,我試圖了解不同到期時間的未來合約價格如何能夠預測合約到期時原油的實際現貨價格。我有一個簡單的方程:

$ \hat S_{t+h} = F_{t,h} $

因此,預測的未來現貨價格,例如 h=2(月),等於在時間 t 觀察到的期貨合約價格,到期時間為 h 個月。

這個概念非常簡單,可以通過查看該到期日的相應期貨合約來預測未來 h 個月。我從Quandl獲得了不同期限的期貨合約價格(準確地說是連續期貨)

所以,我的問題是,這是根據這個簡單的方程進行這種評估的適當方法嗎?在實踐中,我將從這裡做的是查看在特定年份和月份到期的期貨合約價格:(1-12 個月,即 CL1-CL12),然後將這些設置為我預測的未來現貨價格從他們被觀察到的年份和月份開始的接下來的 12 個月。最後評估這些與未來 12 個月觀察到的實際現貨價格。

感謝您的任何澄清,因為這讓我很困惑..

如前所述,在可儲存商品中,“期貨價格不是對未來現貨價格的預測。它們只是反映目前現貨價格和持有成本”。但是,您可以做的一件事是使用期貨價格來校准定價模型。Schwartz (1997) 就是一個很好的例子:

https://static.twentyoverten.com/593e8a9e7299b471eaecf644/H1tGPLaXM/The-Stochastic-Behavior-of-Commodity-Prices-Implications-for-Valuation-and-Hedging.pdf

在這裡,您還可以明確地看到校準和執行您自己的模型的程式碼:

https://gtezio.medium.com/commodity-pricing-how-do-you-actually-do-it-fac34a0b7e08

讓我們從理論開始。期貨是一種標準化的遠期。原則上,它的價格應該是 $$ \begin{align} F_{0,T} &:= \exp(r_{n0} T) E_0^Q(S_T) = \exp(r_{n0} T) S_0 \ r_{n0} &:= \text{risk-free rate} + \text{storage cost} - \text{dividend yield} - \text{convenience yield} \end{align} $$ 在哪裡 $ Q $ 是風險中性度量,並且 $ (S_t)_{t \geq 0} $ 是您的資產的價格過程。該等式源於沒有套利。

您可以假設的一件事是,該等式並不完全成立,並且差距在 $ h \geq 1 $ 是可預測的,並且取決於先前的差距。例如,您可以為股票收益率編寫一個錯誤校正模型:畢竟,如果您取上面的對數並添加一個乾擾項,那麼對數遠期價格和對數股票價格應該是協整的,實際上是使用協整向量(1,-1)。 $$ \begin{align} lnS_{t+1} - lnS_t = \phi_0 + \beta(lnF_{t,1} - lnS_t) + \sum_{i=1}^{p_s} \phi_{si} (lnS_{t-i} - lnS_{t-1-i}) + \sum_{i=1}^{p_f} \phi_{fi} (ln F_{t-i,1} - ln F_{t-1-i,1}) + \epsilon_{t+1}. \end{align} $$ 這可以通過普通最小二乘來估計,您可以輕鬆選擇超參數 $ (p_s,p_f) $ 通過使用 BIC 等資訊標准或交叉驗證。即使您處理時間序列,K-fold 也是漸近有效的(Bergmeir、Hyndman 和 Koo,2015 年),並且在實踐中,考慮到 CV 中的時間依賴性也並不重要(Goulet-Coulombe, Leroux、Stevanovic 和 Surprenant,2020 年),雖然我不認為在使用線性參數模型時使用這種緩慢的方法有什麼意義——BIC 應該可以正常工作。

上述模型本質上說套利限制是成立的,但只是從長遠來看。它不是超複雜的,是的,您可以在非線性模型(例如支持向量回歸、核嶺回歸或神經網路)中使用相同的回歸器來嘗試提高性能。就個人而言,我會選擇 KRR,可能帶有 2 次或 3 次多項式核心:它會阻止你選擇相關的回歸量,它會允許大量的非線性並且它很容易編碼。


請注意,我提出的模型施加了限制。假設使期貨和股票價格長期上漲的任何因素都是相同的(隨機)趨勢。它可能不成立。您可以做的一件事是比較 (i) 直接與價格合作,(ii) 利用期貨和標的物價格之間可能存在的協整,以及 (iii) 預測對數增長率並使用它們來利用目前價格水平恢復價格.

這樣,您就可以以相同的方式懲罰所有事情,並且您可以了解是否值得施加其中一些限制。此外,您計算的損失是對所有情況下的條件期望的估計,這應該沒問題——只要預測範圍與樣本頻率相比不會變得荒謬地長,該期望的誤差應該是共變異數平穩的(儘管,如果您進行多步預測,則序列相關,因為您將有重疊錯誤)。

引用自:https://quant.stackexchange.com/questions/51832