無限地平線模型中的動態規劃
使用無限地平線模型,動態規劃方法使用固定點來求解模型: $ V = \Gamma(V) $ .
- 我如何解釋的意思 $ V $ ? 例如,當我們決定下一次的投資水平時 $ k_{t+1} $ 給定現有值 $ k_t $ ,我們可以計算一個值 $ v(k_t) $ . 這個值是否等於在解決最大化問題後給出的值 $ t $ ( $ t+1, t+2 \cdots $ )?
- 如果解釋是正確的,為什麼定點過程會產生這樣一個最大化的函式?
儘管我檢查了幾本講義,但我無法通過文字來獲得關於這些要點的直覺。
有兩個相互關聯的最大化問題。第一個是無限視野最大化問題: $$ \begin{align*} v(k) = &\max_{a_1, a_2, \ldots} \sum_{t = 0}^\infty \delta^t F(k_t, c_t),\ \text{ subject to } & k_{t+1} = g(k_t, a_t),\ & a_t = \Gamma(k_t),\ & k_0 = k \end{align*} $$ 這裡我們叫 $ a_t $ 決策變數, $ k_t $ 狀態變數。這個問題最大化貼現值的無限總和 $ F(k_t, c_t) $ ,受運動定律的約束,該定律根據今天的動作和狀態確定下一個時期的狀態。 $ \Gamma(k) $ 給出一組可行的動作 $ a $ 可以採取最後 $ k $ 設置為等於初始狀態。
像這樣, $ v(k) $ 是初始狀態為時此優化問題的值 $ k $ .
第二個問題是貝爾曼方程: $$ v(k) = \max_{a \in \Gamma(k)}\left{F(k,a) + \delta v(g(k,a))\right}. $$ 您應該將此解釋為涉及該功能的身份 $ v $ ,它同時出現在等式的左側,所以函式 $ v(.) $ 是這個方程中的未知數(它必須對所有 $ k $ ).
在某些條件下,可以證明對於每個 $ k $ , 功能 $ v(k) $ 第一個問題的值等於 $ v(k) $ 滿足第二個等式。
為了找到這個函式 $ v(.) $ 可以定義貝爾曼運算元 $ T $ : $$ (Tv)(k) = \max_{a \in \Gamma(k)}\left{F(k,a) + \delta v(g(k,a))\right}. $$ 運營商 $ T $ 接受一個函式 $ v $ (在右側)並產生一個新功能 $ Tv $ .
同樣在合適的條件下,可以證明這個運算元是一個收縮映射。所以通過一遍又一遍地迭代這個函式,我們將收斂到這個運算元的不動點,這也給出了貝爾曼方程的解。
- 我如何解釋的意思 $ V $ ? 例如,當我們決定下一次的投資水平時 $ k_{t+1} $ 給定現有值 $ k_t $ ,我們可以計算一個值 $ v(k_t) $ . 這個值是否等於在解決最大化問題後給出的值 $ t (t+1,t+2⋯) $ ?
是的,根據第一個問題的定義, $ v(k_t) $ 給出無限地平線最大化問題的值,當 $ k_t $ 是初始資本水平。
- 如果解釋是正確的,為什麼定點過程會產生這樣一個最大化的函式?
這是由於第一個優化問題和貝爾曼方程之間的等價性。解決方案 $ v $ 貝爾曼方程的 是貝爾曼運算元的一個不動點。