說謊者撲克的策略
這個問題只與量化金融無關。Scott Patterson 的書 The Quants 描述了 Kidder Peabody 的一個 quant 在 80 年代後期如何想出一個玩 Liar’s Poker 的策略。這種策略在投資銀行的量化分析師中傳播開來,導致它不再被使用。
以下是遊戲基礎知識的簡單描述,供不熟悉的人使用:http: //www.investopedia.com/terms/l/liars-poker.asp#axzz27gZIYnwx
Patterson 書中描述的策略或多或少是利用您自己賬單中的資訊來更有信心進行大賭注。例如,如果您的賬單上有兩個 3,而之前的出價是四個 9,那麼您應該出價 10 個或更多的 3(當有 10 個玩家時),而不是出五個 3。您應該在策略中增加多少賭注可能是基於貝氏推理,儘管這本書沒有詳細介紹。
這真的是最好的策略還是在某些條件下只是最好的策略?
簡短的回答:有多種最優混合(即非確定性)策略。
長答案:有一種等效的遊戲,稱為bluff 或 liar’s dice,使用骰子進行遊戲。每個玩家都有一些骰子,並且只能看到自己的骰子。遊戲包括對所有玩家骰子的整個池的聲明,例如“至少有 4 個骰子顯示 5”。玩家輪流在哪裡可以跟注或加註。加註意味著要麼增加每個骰子必須顯示的數量,要麼增加骰子的數量。
對於兩個玩家,並且由於說謊者的骰子是零和遊戲,您可以應用mini-max 參數來證明它必須至少有一個最優策略。對於更多的參與者,納什表明在納什均衡處總是存在一組最優策略。但是,這些不可能是確定性策略,因為確定性策略會向對手透露有關玩家骰子的資訊。Lanctot 和 Long 使用電腦程序為 2 人骰子 2 人虛張聲勢的遊戲尋找解決方案。他們還展示了Liar 的骰子如何表示為線性程序。由於線性程序具有凸可行區域,因此說謊者的骰子在納什均衡時具有多對最優策略。
不過,我們對這些最佳策略的外觀知之甚少。