博弈論:均衡利潤的連續性?
考慮 2 個代理 $ A_i $ . $ A1 $ 在代理之前移動 $ A2 $ . 他們的每個效用函式在每個代理人的決策中都是連續的 $ 0<s_i\in \mathbb{R} $ 和一個參數 $ x $ . 此外,每個智能體的效用函式在其自己的決策中具有唯一的內部最大值 $ s_i $ .
代理具有字典優先權(主要需要以便其他代理可以預測策略): $ A_1 $ 最大化自己的效用,如果兩個或更多策略最大化自己的策略,它會在這些策略中選擇最適合的策略 $ A_2 $ . $ A_2 $ 最大化它自己的效用,如果兩個或多個策略最大化它自己的策略,它會在這些策略中選擇最適合的一個 $ A_1 $ .
聲明一:本遊戲至少有一個SPNE,但一般有多個。在多個 SPNE 的情況下,它們將具有相同的效用配置文件,也就是說,為每個代理提供相同的效用。
陳述二:代理的效用配置文件在 $ x $ (記住,他們的每一個效用都是連續的 $ x $ .) 我對陳述二的推理是 x 的增量變化意味著 ne NE 將非常接近於 NE 變化之前的 NE 之一 $ x $ . 由於這些 NE 具有相同的實用程序配置文件,因此 $ x $ 只會對實用程序配置文件產生增量影響。
你是否同意這兩個陳述,你是否有更可靠的論據(尤其是第二個)。
讓我首先嘗試回答陳述 2:
代理的效用配置文件在 x 中是連續的
讓我們試著充實這個問題。讓 $ S_1 $ 和 $ S_2 $ 是緊湊的、凸的、玩家的策略集(比如 $ \mathbb{R}^n $ )(為簡單起見)。讓 $ u_1(s_1, s_2, x) $ 和 $ u_2(s_1, s_2,x) $ 是兩個參與者的連續效用函式。
讓我們解決SPNE。在第 2 階段,參與者 2 在給定行動的情況下最大化她的效用 $ s_1 $ 玩家 1. 這給出: $$ v_2(s_1, x) = \max_{s_2 \in S_2} u_2(s_1, s_2, x)\ s_2(s_1, x) = \arg\max_{s_2 \in S_2} u_2(s_1, s_2, x). $$
- 由於最大值定理,該問題得到了很好的定義。
- 功能 $ v_2(s_1, x) $ 是連續的(Berge 最大化定理)。
- 最好的回應 $ s_2(s_1, x) $ 只保證是一個上半連續的非空對應。
- 如果 $ s_2(s_1, x) $ 是單值的,那麼它是連續的。然而,單值性將取決於函式形式 $ u_2(s_1, s_2, x) $ (例如嚴格的準凹度),因此到目前為止的假設並不成立。
讓 $ \tilde s_2(s_1, x) $ 成為一個選擇 $ s_2(s_1, x) $ . 在階段 1,玩家 1 的優化問題是: $$ v_1^\ast(x) = \max_{s_1 \in S_1} u_1(s_1, \tilde s_2(s_1, x), x).\ s_1^\ast(x) = \arg\max_{s_1 \in S_1} u_1(s_1, \tilde s_2(s_1, x), x). $$
- 如果選擇 $ \tilde s_2(s_1, x) $ 玩家 2 的最佳選擇是 $ s_2(s_1, x) $ 對於玩家 1,目標函式似乎是上半連續的(但通常不是連續的)。由於目標函式的上半連續性,最大化問題得到了很好的定義。
- 雖然 $ v_1^\ast $ 將(我認為)上半連續,不一定是連續的。無論如何,最好的回應對應 $ s_1^\ast(x) $ 不需要是連續的。
- 如果 $ s_2(s_1, x) $ 是單值的,那麼它是連續的,這意味著 $ v_1^\ast(x) $ 也是連續的。如果,另外 $ s_1^\ast(x) $ 也是單值的,那麼它也將是連續的。
讓 $ \tilde s_1(x) $ 從最佳響應中選擇 $ s_1^\ast(x) $ 來自玩家 1。那麼,我們可以定義: $$ v_2^\ast(x) = v_2(\tilde s_1(x), x),\ s_2^\ast(x) = \tilde s_2(\tilde s_1(x), x). $$
- 一般來說,既不 $ v_2^\ast(x) $ 也不 $ s_2^\ast(x) $ 需要連續。
- 如果兩者 $ s_1^\ast(x) $ 和 $ s_2(s_1, x) $ 是單值的,那麼 $ v_2^\ast(x) $ 和 $ s_2^\ast(x) $ 兩者都是連續的。
因此,如果兩者都成立,則陳述 2 似乎成立 $ s_2(s_1, x) $ 和 $ s_1^\ast(x) $ 是單值的。
- 單值 $ s_2(s_1, x) $ 如果(例如)成立 $ u_2(s_1, s_2, x) $ 是嚴格準凹的 $ s_2 $
- 反過來,單值性 $ s_1^\ast(x) $ 持有如果 $ u_1(s_1, \tilde s_2(s_1, x), s_1) $ 是嚴格準凹的 $ s_1 $ . 請注意,嚴格的擬凹 $ u_1(s_1, s_2(s_1, x), x) $ 是一個強有力的假設,因為它對最佳響應施加了形狀限制 $ s_2(s_1, x) $ (不僅在功能上 $ u_1 $ 本身)。
我希望這能回答聲明 2。
對於聲明 1:
這個遊戲至少有一個 SPNE,但通常是多個。在多個 SPNE 的情況下,它們將具有相同的效用配置文件,也就是說,為每個代理提供相同的效用。
- 如上所示,SPNE 的存在可以僅使用 $ u_1 $ 和 $ u_2 $ 和策略集的緊湊性,並假設 $ \tilde s_2(s_1, x) $ 為玩家 1 選擇最佳選項。
- 不同的 SPNE 通常不會提供相同的效用。假設在階段 2,參與者 2 在多個最優策略之間無差異,所以 $ s_2(s_1, x) $ 是多值的(例如,假設 $ u_2(s_1, s_2, x) $ 是常數函式,所以玩家 2 在 $ S_2 $ )。如果選擇不同 $ \tilde s_2(s_1, x) $ 從 $ s_2(s_1, x) $ , 為玩家 1 提供不同的實用程序,那麼有可能 $ v_1^\ast $ 根據遊戲第 2 階段中玩家 2 的選擇,取不同的值。所以不同的 SPNE 可能會提供不同的效用。