數理經濟學
具有決策變數約束的納什均衡
我正在嘗試解決對決策變數有限制的兩人遊戲。一般結構如下所示: $$ \max_{x_1} f(x_1, x_2) $$ $$ \max_{x_2} g(x_1, x_2) $$ 受制於 $$ x_1 + x_2 \leq x_0 $$ 什麼可能是解決方法?或任何解決此類問題的資源方向都將受到高度讚賞。
通常在(非合作)博弈論中,假設玩家獨立採取行動。
從這個意義上說,一個玩家的一組可行的行動應該獨立於其他玩家採取的行動。在您的設置中,情況並非如此 $ x_1 $ 只能取值 $ [0, x_0 - x_2] $ 和 $ x_2 $ 只能取值 $ [0, x_0 - x_1] $ (假設兩者 $ x_1 $ 和 $ x_2 $ 大於或等於零)。
玩家 1 如何知道選擇大於 $ x_0 - x_2 $ 如果她不知道該動作,則不允許 $ x_2 $ 玩家 2?
- 一種解決方案可能是定義 $ f(x_1, x_2) $ 和 $ g(x_1, x_2) $ 在整個集合上 $ [0,x_0]\times[0,x_0] $ 但是將支付函式定義為非常負的,例如, $ -\infty $ 什麼時候 $ x_1 + x_2 > x_0 $ . 定義: $$ \tilde f(x_1, x_2) = \begin{cases} f(x_1, x_2) &\text{ if } x_1 + x_2 \le x_0 \ -\infty &\text{ if } x_1 + x_2 > x_0 \end{cases} $$ $$ \tilde g(x_1, x_2) = \begin{cases} f(x_1, x_2) &\text{ if } x_1 + x_2 \le x_0 \ -\infty &\text{ if } x_1 + x_2 > x_0 \end{cases} $$ 玩家 1 和玩家 2 的問題就變成了: $$ \max_{x_1} \tilde f(x_1, x_2) \text{ s. t. } x_1 \in [0, x_0]\ \max_{x_2} \tilde g(x_1, x_2) \text{ s.t. } x_2 \in [0, x_0]. $$ 注意納什均衡 $ (x_1^\ast, x_2^\ast) $ 對於這樣的遊戲(如果存在)將永遠有 $ x_1^\ast + x_2^\ast \le x_0 $ 否則每個玩家都可以通過滿足約束來提高他或她的收益。
- 第二種選擇是簡單地定義兩個人的優化問題,條件是另一個參與者採取的行動: $$ \max_{x_1} f(x_1, x_2) \text{ s.t. } x_1 \le x_0 - x_2\ \max_{x_2} g(x_1, x_2) \text{ s.t. } x_2 \le x_0 - x_1. $$ 該博弈的“納什均衡”將與前一個案例相同。
- 無論如何,如果收益函式 $ f $ 和 $ g $ 在他們自己的策略中是連續的和凹的可以使用角穀不動點定理來證明總是存在納什均衡,即策略 $ (x_1^\ast, x_2^\ast) $ 這樣 $ x_1^\ast+ x_2^\ast \le x_0 $ 和: $$ f(x_1^\ast, x_2^\ast) \ge f(x_1, x_2^\ast) \text{ for all } x_1 \le x_0 - x_2^\ast\ g(x_1^\ast, x_2^\ast) \ge f(x_1^\ast, x_2) \text{ for all } x_2 \le x_0 - x_1^\ast. $$