博弈論
如果最佳響應動態收斂,它會收斂到納什均衡嗎?
考慮一個具有有限數量玩家和有限動作空間的遊戲。假設我們考慮一個連續迭代的博弈過程,在這個過程中,在每個時期,玩家都短視地選擇對所有其他玩家最後選擇的動作做出最佳響應的動作。
**問題:**假設經過一定次數的迭代後,沒有玩家想要改變動作。因此,最佳響應動態已經收斂到某個動作配置文件。這種行動概況是否一定是純粹的策略納什均衡?
鑑於系統確實收斂,即 $ a_i^t=a_i^{t+1}=a_i^* $ 對全部 $ i $ 經過一番 $ T<\infty $ , 然後 $ a_i^{t+1}\in BR_i(a_{-i}^{t}) $ , 它遵循 $ a_i^\in BR_i(a_{-i}^) $ 對全部 $ i $ . 因此 $ a^* $ 是基礎博弈的納什均衡。