資產定價
貝爾曼方程中的狀態變數
誰能向我解釋一下貝爾曼方程中的狀態變數是什麼?
$$ V(x,y)=max\space u(c)+\beta V(x’,y’) $$ 在一些節省資本的模型中,它是資本 $ k_t $ 你走進經期 $ t $ 在其他有許多未來狀態的地方,它的全部匯總 $ S $ 在過去。在某些模型中,它是紅利 $ d_t $ 的隨機資產。顯然,相關變數會影響您的決策,但我似乎無法找到一種一致的方法來辨識我正在解決的許多問題中的狀態方程。
狀態變數只是對價值函式很重要的變數,價值函式取決於你想要的變數。從概念上講,您可以考慮包含所有變數的狀態向量,然後從狀態向量中刪除無關緊要的變數。
在實踐中,狀態變數的選擇實際上取決於您要解決的問題。對於物理學家來說,它可能是物體的位置、大氣壓或其他任何東西。對於經濟學家來說,它可能是代理人的財富、公司的資本水平等。它可能是任何東西。
如果你很難弄清楚你的模型可能是什麼,試著問自己這樣的問題:“我試圖理解的決定取決於什麼?” 或“什麼會影響這個經濟體中代理人的選擇?”。
如果您想要更詳細的答案,您可以提供有關您嘗試解決的問題的更多詳細資訊。
路易斯的回答很好。
據我了解,狀態變數可確保您的問題可以描述為馬爾可夫決策問題。
考慮燃料消耗約束下的氣球著陸控制問題。位置和燃料水平顯然是狀態變數。但是牛頓原理意味著要考慮加速度。通過牛頓原理的整合通常可以實現,只需要速度。最後,您的狀態變數是位置、速度、加速度和油位。您的控制是對氣球發動機的燃料噴射。