博弈論
純混合策略的子博弈完美均衡
在博弈論教科書中有類似於下表的內容,其中有一個純策略納什均衡和多個混合策略納什均衡。這是一個同時進行的遊戲,收益如下所示。
如果我們假設這個遊戲玩了兩次,我如何辨識這個遊戲的所有子博弈完美均衡,以及不是子博弈完美均衡的納什均衡?
對於具有多個純策略納什均衡的遊戲,我認為我可以通過使用反向歸納找到解決方案,但是對於像這樣只有一個純策略納什均衡和多個混合策略納什均衡的遊戲,我不知道如何辨識子博弈完美均衡和可能不是子博弈完美均衡的納什均衡,尤其是當包含混合策略均衡時。
對此的任何幫助將不勝感激。
$$ \begin{array}{|c|c|c|c|} \hline & A & B & C \\hline A & (1,1) & (0,0) & (0,0)\\hline B & (0,0) & (2,1) & (1,2)\\hline C & (0,0) & (1,2) & (2,1)\\hline \end{array} $$
- 檢查一次性博弈的納什均衡(純或混合)。
- 重複一次性版本的納什均衡的策略配置文件會產生一組子博弈完美均衡:例如,玩 $ (A,A) $ 在第一階段,對於在第一階段播放的任何動作配置文件,播放 $ (A,A) $ 在第二階段。這同樣適用於混合(完整或其他)以及。例如,完全混合的 SPNE 是 :Play $ \left(\frac{3}{5},\frac{1}{5},\frac{1}{5}\right) $ 在第一階段和任何行動概況(假設隨機化是可觀察到的),玩 $ \left(\frac{3}{5},\frac{1}{5},\frac{1}{5}\right) $ 在第二階段。
- 一次性博弈的納什均衡組合產生另一組 SPNE:例如,Play $ (A,A) $ 在第一階段和玩 $ \left(0,\frac{1}{2},\frac{1}{2}\right) $ 對於第二階段中的任何操作配置文件,依此類推。
- 在第一階段使用可信的威脅來播放非納什的動作配置文件:播放 $ (B,B) $ 在第一階段。在第二階段,如果 $ (B,B) $ 玩過,玩過 $ \left(0,\frac{1}{2},\frac{1}{2}\right) $ . 對於第一階段的任何其他動作配置文件,玩一次性博弈的完全混合納什均衡。為什麼這行得通?無論如何,玩家 1 沒有任何偏離的動機,因為他們在第一階段打出了最好的回复。對於玩家 2,如果他們偏離 $ C $ . 他們會收到 $ 2 $ 在第一階段和 $ 1/3 $ 在第二階段。假設沒有折扣,他們得到 $ 7/3 $ 而如果他們服從策略,他們會得到 $ (1+3/2) $ 嚴格來說更大。相似地 $ (C,C) $ , $ (B,C) $ 和 $ (C,B) $ 可以作為子遊戲完美平衡中的第一階段動作配置文件進行播放。