博弈論
重複博弈SPNE
我以這種方式處理了這個問題: $ (P_1,P_2), (R_1,R_2), (S_1,S_2) $ 是第一階段博弈的納什均衡。對於要作為 SPNE 持續存在的給定策略,單方面的偏差不應該增加個人的收益。什麼時候 $ (Q_1,Q_2) $ 在第 1 階段進行,第 2 階段結束時的收益將是 $ 4+2=6 $ 每個。現在,如果玩家 1 偏離了更高的收益,通過玩 $ P1 $ ,他將在兩個階段後獲得的總收益為 $ x+0 $ 如果偏離將是徒勞的 $ x \leq 6 $ . 此外,它被賦予 $ x>4 $ 所以,一個值為 $ x $ 可以維持上述策略,因為 SPNE 是 $ 5 $ . 請糾正我哪裡錯了。謝謝!
在具有唯一 NE 的有限重複博弈中,唯一的 SPNE 是唯一 NE 的重複。原因是通過反向歸納,NE 將在最後一個週期播放,因此,也會在倒數第二個週期播放,依此類推。
在這裡,有多個 NE,因此可以使用不同的 NE 來獎勵和懲罰以前的行為。您關於如何建構這樣一個 SPNE 的想法是正確的。第二個(所以最後一個)週期的獎勵收益是 2,每個玩家的懲罰收益是 0。所以我們只有我們的 SPNE 如果 $ 4+2 \geq x+0 \iff x\leq 6 $ . 否則,獎勵不夠有利可圖(或懲罰 NE 不夠嚴厲)。
如果 $ x<4 $ , $ (Q,Q) $ 是一個NE,重複這個NE兩次就是一個SPNE。