博弈論

具有轉換成本的無限重複囚徒困境

  • January 18, 2021

在此處輸入圖像描述

我正在用轉換成本做這個有限重複的囚徒困境,但我很難證明這樣一個事實 $ \varepsilon $ 必須是 $ 1 < \varepsilon < 2 $ . 我確實知道為什麼並且這是一個子博弈完美的納什均衡,但我該如何展示它。

我的方法: 考慮參與者 1 的偏差,假設參與者 2 在他的子博弈中堅持他的策略,遵循以博弈的四個結果中的每一個結果結束的歷史。(通過對稱性,如果玩家 1 堅持他的策略,下面也將解釋玩家 2 的偏差)。

我們知道玩這個遊戲 $ T $ 次。讓 $ m $ 表示合作階段的數量(即策略配置文件的次數 $ (C,C) $ 已播放),讓 $ n $ 表示懲罰階段的數量(策略配置文件的次數 $ (D,D) $ 已播放),並讓 $ T = m + n +1 $ . 如果玩家合作 $ T $ 他們得到的時間 $ 3 $ 在回報。因此,我們可以寫 $$ 3T=3(m+n+1) $$ 如果玩家 1 在遊戲的任何階段出現偏差,他將獲得 $$ 3 \cdot m + (4 - \varepsilon) + 2 \cdot n $$ 為了讓玩家 1 的偏差獲利,偏差收益必須大於或等於合作收益。那是, $$ 3 \cdot m + (4 - \varepsilon) + 2 \cdot n \geq 3m + 3n + 3 $$ 我們可以簡化這個 $$ n \leq 1 - \varepsilon $$

這就是我卡住的地方。我應該從中解釋什麼?當 $ \varepsilon \in (1,2) $ 那麼懲罰階段的數量是否為負?

我的另一個問題是:假設上面的問題得到了回答。夠了嗎?還是我需要展示更多內容?因為我很清楚玩 $ (C,C) $ $ T $ 時代是一個 SPNE 和玩 $ (D,D) $ $ T $ times 也是一個 SPNE,無論哪種方式都沒有盈利偏差。

所以,總結一下:我想知道我是否以正確的方式解決這個問題。我想獲得一些幫助,了解如何從卡住的地方繼續前進。如果以上內容足以說明問題的要求。

提前謝謝了!

$$ Update $$—————- 以下是我在 MJ Osbourne 的一些靈感和我從@Herr K. 那裡得到的回饋對解決方案的更新嘗試。 在此處輸入圖像描述 在此處輸入圖像描述 在此處輸入圖像描述

幾個提示。

  1. 關於下限 $ \epsilon $ : 如果在階段發生偏差會發生什麼 $ T $ ? 也就是說,你們所謂的“懲罰階段”是沒有機會的。
  2. 關於上界 $ \epsilon $ : 假設玩家 2 在階段偏離 $ T-1 $ 但玩家 1 沒有。什麼必須是真實的 $ \epsilon $ 為了讓玩家 1 有動力切換到 $ D $ 在最後階段?

一般來說,為了證明給定的策略配置文件是完美的子博弈,你需要證明玩 $ C $ 後 $ (C,C) $ 和 $ D $ 之後 $ (C,D),(D,C),(D,D) $ 是最優的。

引用自:https://economics.stackexchange.com/questions/42162