研究生
無限重複博弈與動態規劃的一次偏差原理
在未來收益被一個常數參數折現的情況下,一次性偏差原則適用於重複博弈和動態規劃。
因為,在重複博弈中,一次偏差指的是一個歷史,因此在平衡路徑上,一次偏差可能會產生與原始平衡路徑在多個階段不同的遊戲。
動態規劃中的狀態變數和控制變數的序列是真的嗎?換句話說,一次性偏差能否生成上述序列,該序列在多個階段有所不同?
偏差(單次與否)當然可以生成一個序列,該序列在任意數量的周期內與最佳序列不同。
您可以將動態規劃問題視為一個玩家與機會之間的重複遊戲。然後,一次性偏差原則應該從重複博弈延續到動態規劃。
David Blackwell 在動態規劃中有一個舊的結果,根據該結果,靜止問題允許靜止的最佳響應。因此,如果您通過在某個歷史之後改變您的行為而受益,那麼您將通過在對應於相同狀態的每個歷史中改變它而受益。
有關原始參考,請參見此處定理 1 的推論。