博弈論：均衡利潤的連續性？

April 27, 2021

考慮 2 個代理 $ A_i $ . $ A1 $ 在代理之前移動 $ A2 $ . 他們的每個效用函式在每個代理人的決策中都是連續的 $ 0<s_i\in \mathbb{R} $ 和一個參數 $ x $ . 此外，每個智能體的效用函式在其自己的決策中具有唯一的內部最大值 $ s_i $ .
代理具有字典優先權（主要需要以便其他代理可以預測策略）： $ A_1 $ 最大化自己的效用，如果兩個或更多策略最大化自己的策略，它會在這些策略中選擇最適合的策略 $ A_2 $ . $ A_2 $ 最大化它自己的效用，如果兩個或多個策略最大化它自己的策略，它會在這些策略中選擇最適合的一個 $ A_1 $ .
聲明一：本遊戲至少有一個SPNE，但一般有多個。在多個 SPNE 的情況下，它們將具有相同的效用配置文件，也就是說，為每個代理提供相同的效用。
陳述二：代理的效用配置文件在 $ x $ （記住，他們的每一個效用都是連續的 $ x $ .) 我對陳述二的推理是 x 的增量變化意味著 ne NE 將非常接近於 NE 變化之前的 NE 之一 $ x $ . 由於這些 NE 具有相同的實用程序配置文件，因此 $ x $ 只會對實用程序配置文件產生增量影響。
你是否同意這兩個陳述，你是否有更可靠的論據（尤其是第二個）。

讓我首先嘗試回答陳述 2：
代理的效用配置文件在 x 中是連續的
讓我們試著充實這個問題。讓 $ S_1 $ 和 $ S_2 $ 是緊湊的、凸的、玩家的策略集（比如 $ \mathbb{R}^n $ ）（為簡單起見）。讓 $ u_1(s_1, s_2, x) $ 和 $ u_2(s_1, s_2,x) $ 是兩個參與者的連續效用函式。
讓我們解決SPNE。在第 2 階段，參與者 2 在給定行動的情況下最大化她的效用 $ s_1 $ 玩家 1. 這給出： $$ v_2(s_1, x) = \max_{s_2 \in S_2} u_2(s_1, s_2, x)\ s_2(s_1, x) = \arg\max_{s_2 \in S_2} u_2(s_1, s_2, x). $$
由於最大值定理，該問題得到了很好的定義。
功能 $ v_2(s_1, x) $ 是連續的（Berge 最大化定理）。
最好的回應 $ s_2(s_1, x) $ 只保證是一個上半連續的非空對應。
如果 $ s_2(s_1, x) $ 是單值的，那麼它是連續的。然而，單值性將取決於函式形式 $ u_2(s_1, s_2, x) $ （例如嚴格的準凹度），因此到目前為止的假設並不成立。
讓 $ \tilde s_2(s_1, x) $ 成為一個選擇 $ s_2(s_1, x) $ . 在階段 1，玩家 1 的優化問題是： $$ v_1^\ast(x) = \max_{s_1 \in S_1} u_1(s_1, \tilde s_2(s_1, x), x).\ s_1^\ast(x) = \arg\max_{s_1 \in S_1} u_1(s_1, \tilde s_2(s_1, x), x). $$
如果選擇 $ \tilde s_2(s_1, x) $ 玩家 2 的最佳選擇是 $ s_2(s_1, x) $ 對於玩家 1，目標函式似乎是上半連續的（但通常不是連續的）。由於目標函式的上半連續性，最大化問題得到了很好的定義。
雖然 $ v_1^\ast $ 將（我認為）上半連續，不一定是連續的。無論如何，最好的回應對應 $ s_1^\ast(x) $ 不需要是連續的。
如果 $ s_2(s_1, x) $ 是單值的，那麼它是連續的，這意味著 $ v_1^\ast(x) $ 也是連續的。如果，另外 $ s_1^\ast(x) $ 也是單值的，那麼它也將是連續的。
讓 $ \tilde s_1(x) $ 從最佳響應中選擇 $ s_1^\ast(x) $ 來自玩家 1。那麼，我們可以定義： $$ v_2^\ast(x) = v_2(\tilde s_1(x), x),\ s_2^\ast(x) = \tilde s_2(\tilde s_1(x), x). $$
一般來說，既不 $ v_2^\ast(x) $ 也不 $ s_2^\ast(x) $ 需要連續。
如果兩者 $ s_1^\ast(x) $ 和 $ s_2(s_1, x) $ 是單值的，那麼 $ v_2^\ast(x) $ 和 $ s_2^\ast(x) $ 兩者都是連續的。
因此，如果兩者都成立，則陳述 2 似乎成立 $ s_2(s_1, x) $ 和 $ s_1^\ast(x) $ 是單值的。
單值 $ s_2(s_1, x) $ 如果（例如）成立 $ u_2(s_1, s_2, x) $ 是嚴格準凹的 $ s_2 $
反過來，單值性 $ s_1^\ast(x) $ 持有如果 $ u_1(s_1, \tilde s_2(s_1, x), s_1) $ 是嚴格準凹的 $ s_1 $ . 請注意，嚴格的擬凹 $ u_1(s_1, s_2(s_1, x), x) $ 是一個強有力的假設，因為它對最佳響應施加了形狀限制 $ s_2(s_1, x) $ （不僅在功能上 $ u_1 $ 本身）。
我希望這能回答聲明 2。
對於聲明 1：
這個遊戲至少有一個 SPNE，但通常是多個。在多個 SPNE 的情況下，它們將具有相同的效用配置文件，也就是說，為每個代理提供相同的效用。
如上所示，SPNE 的存在可以僅使用 $ u_1 $ 和 $ u_2 $ 和策略集的緊湊性，並假設 $ \tilde s_2(s_1, x) $ 為玩家 1 選擇最佳選項。
不同的 SPNE 通常不會提供相同的效用。假設在階段 2，參與者 2 在多個最優策略之間無差異，所以 $ s_2(s_1, x) $ 是多值的（例如，假設 $ u_2(s_1, s_2, x) $ 是常數函式，所以玩家 2 在 $ S_2 $ ）。如果選擇不同 $ \tilde s_2(s_1, x) $ 從 $ s_2(s_1, x) $ , 為玩家 1 提供不同的實用程序，那麼有可能 $ v_1^\ast $ 根據遊戲第 2 階段中玩家 2 的選擇，取不同的值。所以不同的 SPNE 可能會提供不同的效用。

引用自：https://economics.stackexchange.com/questions/43591

博弈論：均衡利潤的連續性？

相關問答

如何找到所有混合策略納什均衡

玩家不會根據自己的收益變化而改變他們的混合比例這一結論有多現實？

MWG 8.B.7 - 任何嚴格佔優策略都必須是純策略

為什麼需要預先規定懲罰令來操縱合規性？

Level-k模型中的Level-0

具有決策變數約束的納什均衡