Stackelberg 模型中先發優勢背後的數學
假設市場需求為 $ P(Q) = a-bQ $ 並且一件物品的製造成本是 $ c_1q_1 $ 對於公司 $ 1 $ 和 $ c_2q_2 $ 對於公司 $ 2 $ .
在古諾模型中,我們最大化利潤函式並將一家公司的最佳響應函式插入另一家公司的最佳響應函式中。
為什麼我們不能這樣做:如果 $ \pi_1 = (a-q_1-q_2)q_2 - c_1q_1 $ 是企業的利潤 $ 1 $ ,我們為什麼不插入 $ q_2^* = \text{BR}2(q_1) $ 並為公司解決 $ 1 $ 的 BR 功能。也就是說,我們區分 $ \pi_i = (a-q_i-\text{BR}{-i}(q_i))q_i - c_iq_i $ 寫 $ q_i $ 對彼此而言 $ i=1,2 $ .
我試過了,但沒有用。這也是 Stackelberg 模型的求解方法。所以我的問題是,為什麼在最終兩家公司都在選擇最佳響應函式時,在前後插入 BR 函式會產生差異?我不明白後來插入 BR 是如何創造“先發優勢”的數學原理,而如果我們按照通常的 Cournot 方式進行操作則不會。
符號:如果 $ i=1 $ , BR $ _{-i}(q_1) $ 對應於BR $ _2(q_1) $ . 同樣對於 $ i=2 $ .
簡而言之:在古諾(在任何同時進行的博弈中),每家公司都會根據其他玩家的反應選擇他的最佳反應,而在斯塔克爾伯格,一家公司會根據其他玩家的反應(追隨者)選擇他的最佳反應,而另一家公司在給定其他玩家的 BEST RESPONSE(Leader)的情況下選擇最佳響應,即她正在“選擇自己”SPNE。
在 Cournot 中,每家公司都在選擇一個函式,它們的交點是 NE(他們自己不能選擇 NE),而在 Stackelberg 中,一個公司正在選擇一個函式,另一家公司正在選擇這個函式中最大化她的點自己的回報。
如果問題是“為什麼我不能針對古諾中兩位玩家的最佳反應進行優化”,答案很簡單:您基本上將他們視為壟斷者,您選擇了兩個不同函式的兩個點(恰好只是因為玩家是對稱的),你不是在尋找兩個最佳響應交叉的點。
例如,如果你有一個壟斷者最大化 $ \Pi(p_1,p_2,p_3) $ , 是同時求解還是先順序選擇沒有區別 $ p_1 $ (你會發現 $ p_1(p_2,p_3) $ , 然後 $ p_2 $ (這樣你就發現 $ p_2(p_3) $ , 接著 $ p_3 $ :你總是選擇一個向量 $ R^3 $ , 不是函式 $ R^3 $ .
我希望我很清楚…
PS 請注意,領導者“不知道”追隨者的選擇(她推斷!就像棋手一樣!她知道他將在給定的參數組合下最佳下棋,比方說),但追隨者確實知道領袖的選擇。問題不是資訊不對稱,而是這種數學技巧(點的選擇與函式的選擇)“模擬”了戰略優勢。