博弈論
玩家不會根據自己的收益變化而改變他們的混合比例這一結論有多現實?
博弈論的一個重要教訓似乎是,在同時移動遊戲中,玩家不會根據自己收益的變化而改變混合比例。相反,他們的對手改變混合比例,而玩家改變混合比例只是為了響應他們對手收益的變化。
這種行為實際發生的頻率如何?它主要是一個玩具模型,只適用於非常受控制的決定,例如在運動中向左或向右作弊,還是更普遍地觀察到?
我很難相信改變對稅收撒謊的懲罰只會影響被審計的人的比例,而不會影響現實世界中對稅收撒謊的人的比例,即使我了解找到納什所涉及的數學平衡。也很難相信僱傭更多警察的均衡效應是懲罰嚴重程度會下降,而降低懲罰嚴厲程度的均衡效應是僱傭更多警察,這對犯罪率沒有任何影響。這種因果模式似乎與通常關於激勵結構的論述相矛盾。在預測日常生活中各種激勵結構變化的影響時,應該如何認真地考慮這一結論?
我不認為主要的教訓是這樣的。如果一個期望收益最大化的玩家混合了幾種純策略,那麼他們必須對所有這些策略都無動於衷。這有一個奇怪的效果,在完全混合的納什均衡中,一個玩家隨機化的方式恰好使另一個玩家無動於衷。
但是沒有理由將自己限制在完全混合的納什均衡中。有些人在稅收上撒謊,有些人沒有。對於這些人中的大多數人來說,只有一種選擇可能是最佳的。更嚴厲的懲罰可能意味著代理人從前一類轉移到後一類。
然而,在實驗室實驗中,受試者的行為方式似乎與標準論證相矛盾,即使對於平衡必須完全混合的遊戲也是如此。參見範例 B
Goeree、Jacob K. 和 Charles A. Holt。“博弈論十件小寶,十個直覺矛盾。” 美國經濟評論 91.5 (2001): 1402-1422。