合理化和嚴格支配
什麼時候可以合理化的策略集不等於 IESDS 之後留下的策略集?我的想法是:我知道合理化策略是對玩家 i 的最佳響應,因為玩家 -i 做了什麼,因此合理化策略的集合將包括玩家 i 的所有策略,使得它們中的每一個都是Player-i 的任何其他策略。因此,我們肯定會將所有嚴格佔優策略都包含在集合中,因此如果只有嚴格佔優策略和嚴格佔優策略,那麼 IESDS 之後的集合將與合理化策略集合產生相同的結果。
然而,如果還存在一些弱佔優策略,那麼合理化策略集也將包含這一點,因為弱佔優策略是對某些策略的最佳響應——因為它至少在某些情況下會付出更多。從這個意義上說,合理化策略集不僅可以理解 IESDS 的結果,還包括弱優勢策略,因此比 IESDS 之後的剩餘策略集更廣泛。
我知道最後一個是不正確的,因為可合理化的策略集不能大於倖存的 IESDS 集。有人可以澄清一下嗎?
這取決於玩家對對手打法的看法。如果對手的策略可以相互關聯,那麼在 IESDS 中倖存的策略就是合理化的策略。但是如果你只允許對手獨立選擇(這是大多數教科書中的標準方法),那麼這兩組對於 2 人遊戲是相同的,但對於超過 2 人的遊戲則不需要相同。
這是一個例子:參與者 3 的策略 Z 是非支配的,但不可合理化(假設參與者 1 和 2 的獨立混合)。
合理化策略集不僅可以理解 IESDS 的結果,還包括弱優勢策略,因此比 IESDS 之後剩餘的策略集更廣泛。
您的措辭表明,反复消除嚴格佔優策略的結果不能包括弱佔優策略。然而,事實並非如此。考慮以下兩人遊戲。
$$ \begin{array} {|c|c|c|} \hline & L & R \ \hline T & 1,0 & 0,0 \ \hline B & 0,0 & 0,0 \ \hline \end{array} $$
那個行動 $ T $ 對於排球員弱占主導地位 $ B $ ,但該博弈中沒有嚴格支配的策略,因此沒有策略被 IESDS 淘汰。