博弈論

在這個遊戲中,如何通過一個語句達到最好的結果?

  • May 20, 2020

該遊戲取自Schelling 的博弈論:RV Dodge 的《如何做出決定》,其中競爭者利用邊緣政策來發揮自己的優勢。它是這樣的:

安德森、巴恩斯和庫珀將進行槍戰。他們會站得很近,這樣每個人都可以一槍殺死其他人或故意錯過。將隨機選擇第一個開火的人,他們將按照安德森、巴恩斯和庫珀的順序輪換,每人一次開火。

如果多輪後有超過一名倖存者,將隨機選擇其中一名競爭者並強制殺死其他一名,如果多輪後仍有一名以上還活著,則會重複此操作。

在決鬥開始之前,安德森可以發表任何聲明,然後是巴恩斯的聲明,最後是庫珀的聲明。他們將遵守以下規則:

  1. 聲明是不可撤銷的。競爭者不得採取與他的陳述相矛盾的行為。
  2. 在不與規則一沖突的情況下,他將按照自己的最佳利益行事。
  3. 在不違反規則一和規則二的情況下,他會隨機行動。

有裁判確保規則得到遵守。如果競爭者採用混合策略(例如,以 1/3 的機率失手),則將客觀地確定機率(通過擲骰子等)。

Q1:安德森會發表什麼聲明?他最好的策略是什麼,他的生存機率是什麼?

Q2:如果三個競爭者按照 ACB 的順序發表聲明,安德森最好的聲明是什麼?

Q3:如果有超過三個競爭者,這個遊戲會變得更簡單還是更難?我們能說什麼嗎 $ N $ 競爭者的理由 $ N\gt 3 $ ?


請注意,如果沒有人發表任何聲明,則沒有人會開槍,每個人都有 1/3 的倖存機會。如果只允許安德森發表聲明,他可以通過對B和C發表這樣的聲明來保證幾乎一定的生存:“如果你們不第一時間殺死對方,我會殺死第一個不這樣做的人所以在我的第一個機會;否則,我會以 1% 的機率向你的倖存者開槍。”

在書中,Q1 建議的最佳解決方案是讓 A 說:“如果 B 不承諾無條件射殺 C,我會射殺他。” 論據是B別無選擇,只能接受,因為拒絕A的提議會導致B必死無疑。但這顯然是錯誤的!因為 B 可以說:“如果 C 不答應在第一時間殺死 A,我會在我的時候殺死 C;如果 C 答應了,我會在第一時間殺死 A,然後以 1% 的機率向 C 射擊,如果他先殺了A。” 通過拒絕 B 的提議,C 有 2/3 的機會生存(A 先射擊 1/3,C 先射擊 1/3);通過接受,他有 2/3+0.33% 的機會(A 先投 1/3,B 先投 1/3,C 先投 0.33%)。所以C會接受。然後 A 注定要被他自己的不便陳述所束縛。

一個警告,這不是一個真正的答案,更多的是一個擴展的評論——這就是為什麼我把它作為社區維基。這是一個很酷的遊戲,一個承諾。

我會嘗試將問題形式化。這是第一次通過,所以人們應該按照他們認為合適的方式進行編輯。

這可能是最容易解決的情況, $ T $ ,強制執行前的輪數是 $ 1 $ . 讓每個玩家得到 $ 1 $ 如果他們向別人開槍並且 $ -1 $ 如果他們自己被槍殺。

比賽分為兩個階段,承諾階段和射擊階段。順序階段是(恰當地)順序移動,而承諾階段並不是真正的博弈論,因為玩家是自動機(他們的策略是預先確定的)。我很快就會回到這個。

一個簡單的結果:存在一種平衡,其中規則 2 和 3 變得多餘,因為每個參與者都可以承諾所有可能的意外情況。

有一個外生隨機性的來源,一個世界的隨機狀態 $ \Theta = \Theta_{1} \times \Theta_{2} $ , $ i = 1,2 $ , 在哪裡 $ \Theta_{i} $ 是排列的集合 $ \left{A,B,C\right} $ . 這些是拍攝部分的可能順序。

玩家的動作集 $ A $ 是 $ \mathcal{A} = \mathcal{A}{1} \times \mathcal{A}{2} $ 在哪裡 $ \mathcal{A}_{i} = \left{B,C,\emptyset\right} $ 為了 $ i = 1,2 $ (對應“拍 $ B $ ” “射擊 $ C $ ”和“射門沒人”)。另外兩個玩家的動作集, $ \mathcal{B} $ 和 $ \mathcal{C} $ , 類似地定義。

(混合)承諾策略 $ A $ 是一個映射$$ \sigma_{A}: \Theta \times \Sigma_{B} \times \Sigma_{C} \to \Delta\left(\mathcal{A}\right) $$ 在哪裡 $ \Sigma_{i} $ , $ i = A, B, C $ 是所有(可行的)混合策略的集合。玩家不可行策略的範例 $ A $ , 說, 是一個沒有 $ \emptyset $ 玩機率 $ 1 $ 當其他玩家的狀態和混合策略是這樣的 $ A $ 肯定被槍殺了。

請注意,我使用的事實是遊戲的射擊部分可以被視為承諾部分的瞬時(隨機)結果,這是真正的遊戲。

我不太確定的承諾策略 $ B $ 和 $ C $ ,由於承諾階段的順序移動性質。我懷疑這無關緊要,並且它們的定義類似。我對此並不完全贊同,並且願意被說服。

每個玩家的收益以顯而易見的方式定義。

Schelling 自己給出了 Q1 的答案,其中 A 可以實現任意接近 5/6 的生存機率。我在下面引用這本書。措辭有時令人痛苦地曲折。但答案似乎是正確的。我不知道這是否是A 可以達到的最佳結果。

謝林教授提供了一個解決方案,通過在他的投籃中加入機率,保證安德森幾乎可以確定生存。在這個解決方案中,安德森承諾以很小的機率向殺死對方的人開槍,但如果克萊默未能殺死巴恩斯,則殺死克拉默。他必須包括一些東西,以防止克萊默的巴恩斯做出任何單方面的承諾,因此他會補充說,如果他們中的任何一個做出承諾而不是接受他的承諾,他會輪到他殺死那個人或朝空中開槍如果這個人已經死了。如果雙方都做出單方面的承諾,安德森保證殺死克拉默,或者如果克拉默已經死了,則向空中開槍(將執行決鬥規則)。謝林的回答:

安德森必須阻止巴恩斯做出讓克萊默有更好生存機會的承諾,他可以這樣說:“如果你不接受我的提議,我會輪到我殺了你。如果你接受,我保證你有三分之二的生存機會,如下:如果安德森在你接受我的提議後承諾殺了我,那麼如果你答應殺了安德森,我保證殺了安德森。如果安德森在你接受我的提議後對他開槍的人沒有承諾,那麼他有 50-50 的機會開槍打我。如果你是殺他的人,我會以50%的機率向你開槍殺了你。最後,如果安德森承諾以特定的機率殺死我們每個人,例如 0.8 他會向你開槍,如果我們都犯了 0.2 他會向我開槍,那麼我會在你之後以 0.2 的機率向你開槍殺了安德森。”

如果安德森沒有向克拉默提出同樣好的報價,巴恩斯的報價將被接受,安德森肯定會死。如果安德森向克拉默提出同等的報價,克拉默有 2/3 的機會生存或接受巴恩斯的報價。如果他接受巴恩斯的提議,安德森有 1/3 的機會殺死他,否則他會活著,因為如果巴恩斯先被殺死,他就會殺死安德森。如果他不接受巴恩斯的提議,巴恩斯一有機會就會殺了他,否則安德森就會殺了巴恩斯。由於無論是否接受 Barnes 的提議,Cramer 的機會都是相同的,規則三說他是隨機決定的,所以如果 Barnes 接受這個提議,他有 50-50 的機會獲得 1/3 的生存機會。

如果安德森不能超過巴恩斯 1/6 的生存機會,那麼他就無法阻止承諾,這使他有相同的可能性。為了巴恩斯閉嘴,他必須做得更好。所以。安德森的聲明:“如果巴恩斯提出要約並且克萊默接受,我會輪到我殺死克萊默,或者如果克萊默已經死了,我會朝空中開槍。如果巴恩斯提出要約,而克萊默不接受,我會輪到我殺了巴恩斯,如果他已經死了,我會朝空中開槍。如果有人做出不依賴於回應的單方面承諾,我會殺死最後一個這樣做的人,或者如果他已經死了,我會朝空中開槍。否則,如果克萊默沒有第一時間殺死巴恩斯,巴恩斯還活著,我會殺了他。如果克萊默殺了巴恩斯,我會以 1% 的失手機率向他開槍。

如果巴恩斯和克萊默閉嘴,他們有 2/3 的機會先開火。如果安德森是第一個,他將向空中射擊,而巴恩斯將殺死克萊默,並有 27% 的生存可能性。如果克萊默先是巴恩斯死了,那麼巴恩斯的生還機率是27%或18%的2/3。克萊默保持安靜,如果他第一個出手,他有 1% 的機會倖存下來,總體上只有 0.33% 的機會。這讓安德森有 71.67% 的生還機會。

Schelling 的結論是,通過給 Cramer 一個比 1% 和 Barnes 更小的可能性,在 Anderson 的 1/6 之上增加一個增量可以使他自己的機會接近 5/6,即 84%,如他所願。

引用自:https://economics.stackexchange.com/questions/36739