投資組合優化

Monte Carlo vs. Block Bootstrapping vs. Bootstrapping

  • September 22, 2021

因為我可以通過經驗累積分佈擬合例如約 25 個分佈來擬合相關數據(包括穩定分佈),然後使用每個特徵的最佳擬合分佈基於相關性(共變異數)模擬原始數據,所以我計劃進行以下操作關於 MC 和 bootstrapping 的三種方法,用於估計每月重新平衡的最佳權重(20 個交易日)。

提議的蒙特卡羅方法

為感興趣的股票獲取大約 2-4 年的每日價格數據,估計對數回報,並將各種分佈擬合到每種資產的對數回報。然後,利用資產之間的相關性,模擬小塊,例如 20 天(1 個月)的日誌回報。

接下來,對 20 天的模擬對數收益序列使用 MV 最小化(切線投資組合)和平均收益和共變異數矩陣,重複 $ B=500 $ 次,並平均權重向量 $ \mathbf{w}^{(b)} $ , 投資組合收益 $ r_P^{(b)} $ 和投資組合變異數 $ \sigma^{2 (b)}_P $ 對於所有 $ B $ 迭代。確定中位數,以及每個 ( $ \mathbf{w} $ , $ r_P $ , $ \sigma^2_P) $ .

隨機前進(塊採樣)

Daly 等人關於通過 Marcenko-Pastur 和每日數據進行共變異數雜訊過濾的好論文中,他們隨機選擇了測試日期並使用接下來 20 天的數據作為每個區塊的數據。在每次迭代中,隨機選擇的測試日期之前的所有數據都用於樣本內訓練數據,並對袋外數據進行單獨分析。他們基本上過濾了訓練和測試(20天塊)數據的共變異數和相關矩陣,並報告了信號特徵值的數量大於 $ \lambda_+ $ .

我的想法是簡單地為每個 20 天區塊(對數收益)生成收益向量和共變異數矩陣,然後通過區塊的切線投資組合使用 MV 最小化。重複 $ B=500 $ 次。這種方法將保留資產之間的相關性,同時還使用觀察到的平均回報,這是替代實現。

純自舉方法

這種方法將涉及簡單地獲取隨機的每日數據(一次選擇一天)以建構例如 20 天的序列,然後將 MV 最小化為最小變異數(不是相切) $ GMV $ 投資組合,假設平均回報為零,因為這裡與平均回報相關的任何資訊都會有偏差和錯誤,因為個別日子是隨機抽樣的。重複 $ B=500 $ 次。

我認為上述所有三種方法都有優點,因為第一種方法模擬了小數據序列的相關收益並應用了切線投資組合。第二種方法隨機獲取數據塊並為每個數據塊生成相切投資組合。最後一種方法簡單地獲取隨機天來建構 20 天的序列,並假設 $ GMV $ 文件夾。

鑑於上述以及可將 MC 應用於投資組合優化的眾多方式,哪種方法更常見於確定每月(20 天)重新平衡期間應用的權重?

首先,我會以這種方式重新訂購您的產品

  1. 每日收益的蒙地卡羅
  2. 每日回報率的引導
  3. 20 天的 Block Bootstrap

其次,我想評論一下您想對數據做什麼?

在我看來,您的目標是實施“滑動(20 天)穩健的 Markowitz 投資組合”。這就引出了一個問題**,您的目標是哪種穩健性?**

如果它是相對於

  • 共變異數矩陣,這可能是您想要引導或清理的共變異數矩陣。

    • 它們有很多記錄在案的方法;例如,查看金融市場中的相關性、層次結構和網路(M. Tumminello、F. Lillo、RN Mantegna,2008 年)
    • 但是如果您想自己使用重新採樣的數據來完成,您可以處理共變異數本身的分佈,而不是投資組合
    • 您還可以使用合成數據建構共變異數矩陣,以解釋預測的樣本外風險
    • 無論如何請注意,您的 MS 方法只會破壞資產的相關結構
  • 如果您擔心無法很好地估計預期收益,我不確定您的任何方法是否會有所幫助,您很容易檢查這一點:過去幾天的收益與未來的收益相關嗎?(只需繪製散點圖即可檢查)

您會看到我沒有談論“投資組合的穩健性”本身,因為如果您計劃使用 Markowitz 構造來獲得它們,這意味著您將有兩個輸入:預期收益和共變異數矩陣。不知何故,如果這些是乾淨的,你的投資組合就會是乾淨的。

儘管如此,我還是想分享一個通用的評論:說你有一個方法 $ F() $ 取參數 $ \Theta $ 產生一定數量的興趣。就您而言,您似乎認為

  • $ F $ 是 Markowitz 投資組合構造
  • $ \Theta={C,\mu} $ 在哪裡 $ C $ 是共變異數矩陣和 $ \mu $ 是預期回報。
  • 你的投資組合是

$$ w=F(\Theta). $$

由於某些原因 $ \Theta $ 必須在數據庫上估計 $ D $ , tau 你最好的估計器是 $ \mathbb{E}_D(\Theta) $ . 統計學家將外掛方法稱為您對結果(投資組合)的“最佳猜測”是 $$ \hat w=F(\mathbb{E}_D(\Theta)). $$

但是你可以認為你想要的是 $$ \tilde w=\mathbb{E}_D(F(\Theta)). $$ 這是您想到的方法,因為您想生成多個投資組合併對它們應用過濾器(在您的情況下,您計劃對它們進行平均)以獲得“更好的東西”。

有什麼區別?

  • 什麼時候 $ F $ 是線性的:沒有區別(除非您的程序 $ \mathbb{E}_D $ 獲得一個乾淨的估計是非常奇怪和棘手的)。
  • 如果我們假設最好的估計 $ \Theta $ 是 $$ \Theta^* = \Theta-\epsilon, $$ 在哪裡 $ \epsilon $ 小,可以重寫外掛方式(感謝q Taylor展開) $$ \hat w=F(\mathbb{E}_D(\Theta))=F(\Theta^) + \partial F(\Theta^)\cdot\epsilon+o(\epsilon). $$

因此,要問自己的問題是:我的公式的敏感性是什麼 $ F $ (即 Markowitz 投資組合構造)到我將估計的參數(即預期收益和共變異數矩陣)?

引用自:https://quant.stackexchange.com/questions/68024