骰子問題 - 擲骰子的預期獎金222次
典型的交易面試會考慮賭博問題,例如擲骰子和贏得面值。預期的獎金是 $ \$3.5 $ , $ \$4.25 $ , $ \$\frac{14}{3} $ 分別為一投、二投、三投。的預期獎金 $ n $ throws 可以在知道值的情況下反復計算 $ n-1 $ .
然而,現在考慮一個不同的遊戲,其中一個人獲得 $ \$10,000,000 $ 對於骰子的每個面值。你願意花多少錢進入這個遊戲?
這麼大的價值需要我們規避風險,其中效用函式不是線性的而是凹的。一個典型的選擇是對數,使用它的遊戲的貨幣等值是幾何平均數, $ (\prod_{i=1}^6 i10^8)^{1/6} \approx 2.9938 10^8 $ . 因此,風險反向投資者將支付 $ 30M $ 進入遊戲。但是,如果現在我可以擲兩次骰子呢?顯然,以前的相同策略在這裡不能適用。那麼我們應該如何為這款遊戲定價呢?使用二叉樹?
讓我們應用基本的效用理論。請注意,預期效用由結果、機率和初始財富驅動 $ W_0 $ 賭徒的(見@Dimitri對你的問題的評論)。讓 $ \mathrm{EU} $ 表示預期效用
$$ \mathrm{EU}\equiv\sum\limits_{i=1}^np_iu(x_i+W_0) $$
和 $ \mathrm{CE} $ 是確定性等價物(或您的問題中的金錢等價物) $$ \mathrm{CE}\equiv u^{-1}(\mathrm{EU})-W_0, $$ IE $ u(\mathrm{CE+W_0})=\mathrm{EU} $ . 如果初始財富比賭博的結果高幾個數量級, $ W_0>>x $ , 那麼效用可以很好地近似為一個線性函式, $ u(W_0+x_i)\approx u(W_0)+cx_i $ 和 $ c $ 一些常數取決於 $ W_0 $ 和 $ u $ . 這反映在您問題的第一部分。
讓我們進一步介紹最優決策。和 $ n $ 在遊戲中進行更多輪次,您的賭徒總是會以某種結果停止遊戲 $ x_i+W_0 $ 每當該結果的效用超過延續值時,
$$ u(x_i+W_0)>\max{F_n} $$
在哪裡,有些馬虎, $ \max F_n $ 表示在未來某個時間最優停止遊戲的預期效用。在您的範例中,可以遞歸解決此問題:再進行一輪,賭徒將在某個結果處停止 $ x_j $ 如果 $$ u(W_0+x_j)>\sum\limits_{i=1}^np_iu(x_i+W_0)\Leftrightarrow x_j>u^{-1}(EU)-W_0\equiv \mathrm{CE}_1 $$
賭徒將繼續在任何 $ x_j<\mathrm{CE}_1 $ . 還有兩輪,他們知道下一輪的最佳決策,他們可以相應地調整遊戲的預期持續值,即現在他們停止,如果
$$ u(x_j+W_0)>\sum_{i:x_i < \mathrm{CE}_1}p_iu(W_0+\mathrm{CE}1)+\sum{i:x_i > \mathrm{CE}_1}p_iu(W_0+x_i) $$ 他們將再次找到一些確定性等價物 $ \mathrm{CE}_2 $ 對於這個遊戲,等等。
在任何一步,遊戲的確定性等值(貨幣價值) $ n $ 遊戲可以通過計算來計算
$$ \begin{align} \mathrm{CE_n}&=u^{-1}(\mathrm{EU_n})-W_0\ &=u^{-1}\left(\sum_{i:x_i < \mathrm{CE}{n-1}}p_iu(W_0+\mathrm{CE}{n-1})+\sum_{i:x_i > \mathrm{CE}_{n-1}}p_iu(W_0+x_i)\right)-W_0 \end{align} $$
**注意:**為了完整性,賭博的價格當然也應該反映在效用和結果中……另外:@Dimitri 的評論非常有見地:您只願意為這樣的賭博支付一些基於效用的預訂價格,但賭場平均會以這樣的票價賠錢。