我需要在接下來的遊戲中提供 0.89 還是 0.90?
我最近在看耶魯大學的博弈論公開課。提出的一個遊戲涉及以下內容:遊戲從“桌上”的 1 美元開始。在每一輪中,一名玩家向另一名玩家提供一定數量的美元,另一名玩家可以接受或拒絕。如果遊戲繼續下一輪,桌上的金額減少 10%(由於玩家的時間偏好)。
每個玩家必須在每一輪中向其他玩家提供一些錢。為簡單起見,報價僅以整便士的形式提供(不允許使用任何便士報價)。顯然,它們必須至少為 1 並且最多為目前桌面上的金額 - 例如,在第一輪中,玩家 1 可以為玩家 2 提供從 0.01 到整美元的任何金額。在第二輪中,桌上只有 0.90,因此玩家 2 可以為玩家 1 提供從 0.01 到 0.90 的任何值。
在一輪遊戲中,玩家 1 應該清楚地為玩家 2 提供 0.01 並為自己保留 0.99。
在兩輪比賽中,我對提供的確切金額有點困惑。顯然,如果玩家 1 給玩家 2 一個不好的報價,遊戲將進入第 2 輪,在這種情況下,玩家 2 將給玩家 1 0.01 並為自己保留 0.89。因此,玩家 1 應該向玩家 2 提供剛好足以讓他們接受報價並將其餘的留給自己。
這可能是一個挑剔的點,但玩家 1 應該提供 0.89 還是 0.90?玩家 2 會接受 0.89,因為現在的 0.89 比以後的 0.89 好,還是提供 0.89 只會讓玩家 2 無動於衷,因為折扣已經考慮了時間偏好?在第一種情況下,顯然玩家 1 應該提供 0.89;在第二種情況下,他們應該提供 0.90 以保證玩家 2 會接受這個提議。
有人可以讓我在這個領域直截了當嗎?
根據您的描述,我認為玩家對現在的 0.89 和以後的 0.89 無動於衷,因此我們可以將金錢和效用視為同一事物。時間(輪次)的重要性僅在於它縮小了總餡餅以及提供報價的人交替出現。這是假設他們的效用函式是基於最大化他們獲得的金錢——沒有偏好怨恨或懲罰其他玩家。
由於離散作用空間的多重均衡
如果我們不限於以便士工作,那麼 0.8900000001 的報價是可能的,我會說 0.89 的報價給出了唯一的平衡。為什麼不 .8900000001 以確保其他玩家接受?因為為什麼不是 .89000000000000001?你總能找到一個更小的數字。
因為我們使用便士,我們已經離散化了動作空間。現在,我認為可以公平地說,在兩輪博弈中存在多重均衡。但是上面的連續參數類型為如何考慮離散情況設置了預設值,這就是為什麼我認為在引用的課程中他們可能鍵入了 0.89 的報價。
一種均衡是參與者 2 的策略是接受任何報價 $ x \geq 0.89 $ . 那麼玩家 1 出價 0.89,均衡行為曲線是(出價 0.89,接受)。
另一個均衡是參與者 2 的策略是接受任何提議 $ x > 0.89 $ (相當於 $ x\geq .90 $ 在這個行動空間)。那麼玩家 1 提供 0.90 並且均衡行為曲線是(提供 0.90,接受)。
這兩種策略都是可信的偏離路徑(假設我們想要一個子博弈完美均衡),這意味著如果玩家 2 確實拒絕 0.88 或 0.89,我們會進入最後一輪,保證它們至少是 0.89。他們至少通過拒絕報價也能做到這一點,而這正是平衡所需要的。
那麼玩家 1 應該怎麼做呢? 這取決於我們處於何種均衡狀態。有了 2 策略的均衡知識,玩家 1 可以提供 0.89 或 0.90。