我需要在接下來的遊戲中提供 0.89 還是 0.90？

October 9, 2021

我最近在看耶魯大學的博弈論公開課。提出的一個遊戲涉及以下內容：遊戲從“桌上”的 1 美元開始。在每一輪中，一名玩家向另一名玩家提供一定數量的美元，另一名玩家可以接受或拒絕。如果遊戲繼續下一輪，桌上的金額減少 10%（由於玩家的時間偏好）。
每個玩家必須在每一輪中向其他玩家提供一些錢。為簡單起見，報價僅以整便士的形式提供（不允許使用任何便士報價）。顯然，它們必須至少為 1 並且最多為目前桌面上的金額 - 例如，在第一輪中，玩家 1 可以為玩家 2 提供從 0.01 到整美元的任何金額。在第二輪中，桌上只有 0.90，因此玩家 2 可以為玩家 1 提供從 0.01 到 0.90 的任何值。
在一輪遊戲中，玩家 1 應該清楚地為玩家 2 提供 0.01 並為自己保留 0.99。
在兩輪比賽中，我對提供的確切金額有點困惑。顯然，如果玩家 1 給玩家 2 一個不好的報價，遊戲將進入第 2 輪，在這種情況下，玩家 2 將給玩家 1 0.01 並為自己保留 0.89。因此，玩家 1 應該向玩家 2 提供剛好足以讓他們接受報價並將其餘的留給自己。
這可能是一個挑剔的點，但玩家 1 應該提供 0.89 還是 0.90？玩家 2 會接受 0.89，因為現在的 0.89 比以後的 0.89 好，還是提供 0.89 只會讓玩家 2 無動於衷，因為折扣已經考慮了時間偏好？在第一種情況下，顯然玩家 1 應該提供 0.89；在第二種情況下，他們應該提供 0.90 以保證玩家 2 會接受這個提議。
有人可以讓我在這個領域直截了當嗎？

根據您的描述，我認為玩家對現在的 0.89 和以後的 0.89 無動於衷，因此我們可以將金錢和效用視為同一事物。時間（輪次）的重要性僅在於它縮小了總餡餅以及提供報價的人交替出現。這是假設他們的效用函式是基於最大化他們獲得的金錢——沒有偏好怨恨或懲罰其他玩家。
由於離散作用空間的多重均衡
如果我們不限於以便士工作，那麼 0.8900000001 的報價是可能的，我會說 0.89 的報價給出了唯一的平衡。為什麼不 .8900000001 以確保其他玩家接受？因為為什麼不是 .89000000000000001？你總能找到一個更小的數字。
因為我們使用便士，我們已經離散化了動作空間。現在，我認為可以公平地說，在兩輪博弈中存在多重均衡。但是上面的連續參數類型為如何考慮離散情況設置了預設值，這就是為什麼我認為在引用的課程中他們可能鍵入了 0.89 的報價。
一種均衡是參與者 2 的策略是接受任何報價 $ x \geq 0.89 $ . 那麼玩家 1 出價 0.89，均衡行為曲線是（出價 0.89，接受）。
另一個均衡是參與者 2 的策略是接受任何提議 $ x > 0.89 $ （相當於 $ x\geq .90 $ 在這個行動空間）。那麼玩家 1 提供 0.90 並且均衡行為曲線是（提供 0.90，接受）。
這兩種策略都是可信的偏離路徑（假設我們想要一個子博弈完美均衡），這意味著如果玩家 2 確實拒絕 0.88 或 0.89，我們會進入最後一輪，保證它們至少是 0.89。他們至少通過拒絕報價也能做到這一點，而這正是平衡所需要的。
那麼玩家 1 應該怎麼做呢？ 這取決於我們處於何種均衡狀態。有了 2 策略的均衡知識，玩家 1 可以提供 0.89 或 0.90。

引用自：https://economics.stackexchange.com/questions/47876

我需要在接下來的遊戲中提供 0.89 還是 0.90？

相關問答

理解擴展形式遊戲的屬性

與 N 玩家的 Stackelberg 領導者-跟隨者博弈的嚴格解決方案？

火柴遊戲

子博弈完美均衡的嵌套證明

如何找到所有混合策略納什均衡

在尋找遊戲價值時，我們可以消除弱支配策略嗎？