動態規劃

在 Blackwell 條件下 T 是一個收縮映射,我們要求它滿足貼現。打折的直覺是什麼?

  • November 20, 2019

折扣條件如下:

存在一些 $ \beta \in (0, 1) $ 這樣 $ T(f + a) ≤ (T f)(x) + βa $ , 對全部 $ f ∈ B(X), a ≥ 0, x ∈ X $ .

雖然單調性條件是有道理的,但我不能給這個屬性一個好的含義。

不打折,你也不能顯示

$$ T(g + || f - g||) \leq Tg + \beta || f - g|| $$

或者

$$ T(f + || g - f||) \leq Tf + \beta || g - f|| $$

因此你不能證明 $ T $ 是傳統證明中的收縮映射。


出於直覺,請注意 Blackwell 的收縮映射充分條件是用於建立價值函式迭代收斂的*不動點定理。在具有線性運算元的折疊狀態空間的最簡單情況下 $ T(W) = \sigma + \beta W $ , 很清楚 $ \beta \in (0,1) $ 總會導致一個交集 $ T(W) $ (從上方)與 45 度線 $ T(W) = W $ 從而收斂於與初始猜測無關的固定點。*確定這樣一個折扣條件 $ \beta $ 保證這一點。

然而,在具有完全指定的狀態空間的系統中,折扣不再足以建立唯一性。由於對動力學的額外關注,在這些情況下還需要單調性來確定 Blackwell 條件的充分性。

引用自:https://economics.stackexchange.com/questions/25154