缺失回報的估算
我正在嘗試計算期貨投資組合的歷史 VaR,但是在某些日子裡,某些資產會缺少價格。由於投資組合包含許多價差頭寸,當價差的一條邊包含回報而另一邊不包含回報時,價格缺失的日子有很大的 PnL。
我想知道估算這些數據的最合適方法是什麼,我嘗試使用每種資產的中位數/平均值,但這忽略了投資組合的共變異數結構。在這種情況下,像 MICE 或 EM 這樣的算法是否合適?
對於 VaR 計算,您可能不想插入缺失值。通過這樣做,您本質上是在編輯收益分佈;這可能會使 VaR 看起來更好或更糟。如果您的目標是準確的風險分佈,那就不好了。
值得考慮缺失值的含義。有兩種情況。缺失值或未更改的值可以反映零交易量。如果您有交易量數據並且它顯示發生了交易,那麼您可能在某個地方遇到了數據錯誤。因此,值得考慮出價/要價數據來幫助完成這項任務。通常在期貨市場中,即使沒有交易量,也總會有買/賣。您可以使用此數據計算每個頭寸的市值。此外,它還允許您靈活地計算基於離標價的 VaR 以進行出價 - 中價 - 賣價。
現在讓我們考慮一個缺少說買或賣的情況,這也告訴你一些有關風險的資訊。如果沒有出價,則意味著無法出售,如果沒有要價,則無法購買。這意味著很大的風險,因為這意味著給定級別的訂單簿是空的。這只是出價/要價數據如何通知您的一個範例。
另一種方法是使用期限結構中流動性更強的契約的數據。您只需要調整價格並返回以匹配目標合約。您可以通過簡單的比率和 beta 計算來做到這一點。
一個問題,您使用的是每日數據還是盤中數據?
讓我知道這是否有幫助。
一種完全不同的統計方法是提出您自己的機器學習問題:
收集一組完整數據,其中您可以在任何一天為所有儀器提供數據值。
提出一個機器學習模型,該模型將為回歸任何缺失數據的任務設計自己的優化參數。
3)通過在監督學習範式下刪除值(您試圖預測的值)從您的一組良好數據中系統地更改數據,損失函式相當於平方誤差殘差。
作為一個可能模型的範例:假設您有 100 個股票價格的每日變化在一組日期內有效。您可以嘗試實現一個神經網路,將 100 個每日變化和 100 個二進制標誌(0 或 1)作為輸入,說明特定股票的數據是否可用(將未知值設置為零)。網路的輸出將是 100 個已知股票價格。
這當然是完全未經測試的,只是一個想法,但該模型允許的好處是數據生成可能很豐富。即使你有 5 年的 100 個股票價格,你也可以生成大量嘈雜的數據,因為對於每個日期,你都有數十億的數據元素組合,你可以刪除這些組合,並希望使用這些組合來讓你的神經網路權重收斂到一個通才設置。我真的很想看看這是否可行……
該模型的優點是它是非參數的,並且對於任何一天的 100 隻股票中的哪隻股票是未知的。它會簡單地接受輸入,並返回一個包含 100 個預期庫存變化的向量。