現代投資組合理論

一項資產的夏普比率的導數是多少?嘗試針對模型對其進行優化

  • February 2, 2018

似乎大多數夏普比率推導似乎都是針對投資組合的,但我只是在跟踪一項資產?

$ SR = (r_p - r_f) / \sigma_p $ 但是對於優化/自動化案例,我會得到什麼?

我試圖了解他們如何在本文中使用夏普比率:

使用 Q-Learning 和循環強化學習的算法交易”,作者:新都、金建翟、呂口品。

我同意這篇論文可以更清楚:它所謂的“夏普比率導數”實際上是穆迪和薩菲爾在 NIPS 論文中提出的“差分夏普比率” 。

在該論文的第 2.2 節中,他們將差分夏普比率定義為代表交易策略回報影響的價值函式 $ R_t $ 時實現 $ t $ 關於夏普比率 $ S_t $ . 線上學習需要這樣的數量。

對於夏普比率 $ S_t $ , 差分夏普比率 $ D_t $ 是關於一階指數移動平均衰減率的導數 $ \eta $ 在返回的第一和第二時刻:

$ D_t = \frac{d S_t}{d \eta} = \frac{B_{t-1} \Delta A_t - \frac{1}{2} A_{t-1} \Delta B_t}{(B_{t-1} - A_{t-1}^2)^\frac{3}{2}} $

在哪裡 $ A_t $ 和 $ B_t $ 是回報的一階和二階矩的指數移動估計 $ R_t $ , 分別:

$ A_t = A_{t-1} + \eta \Delta A_t = A_{t-1} + \eta (R_t - A_{t-1}) $

$ B_t = B_{t-1} + \eta \Delta B_t = B_{t-1} + \eta (R_t ^2- B_{t-1}) $

這篇論文並沒有很具體地介紹採用導數夏普比率 (DSR) 的方法。純粹基於潛台詞,我推斷作者打算將夏普比率與自身區分開來。

作者最接近指定 DSR:

從經濟學上講,導數夏普比率類似於邊際效用,就每單位夏普比率增量承擔多少風險的意願而言。

這讓我認為這可能是 SR 相對於自身的變化。

無論如何,我們從導數的定義開始:

$$ \frac{dS}{d\tau}=\lim_{\tau \to 0}\frac{S[t+\tau]-S[t]}{\tau} $$ 該論文進一步表示,與其找到導數的符號解,不如跨多個時間步測量梯度。因此,我們可以離散化 $ \frac{dS}{S} $ 像這樣:

$$ \frac{\sum_{t}^T (S[\tau]-S[\tau-1])}{\sum_{t-1}^TS[\tau]} $$ …擴展為:

$$ \left(\frac{r_{a(T))}-r_{m(T)}}{\sigma_{a(T)}}-\frac{r_{a(t)}-r_{m(t)}}{\sigma_{a(t)}}\right) * \left(\frac{\bar{r}_a-\bar{r}_m}{\bar{\sigma}_a}\right)^{-1} $$ 這為我們提供了類似於作者對 SR 中增量增益的邊際效用函式的說明。在這種情況下,“衍生夏普比率”(DSR)本身並不是真正的績效指標,而是對風險調整後績效變化的敏感度指標。

引用自:https://quant.stackexchange.com/questions/37969