博弈論中的高階信念和連貫性
我正在閱讀有關高階信念的內容。在進入正式定義之前,我將定義一些正式定義所需的常用術語。
如果 $ X $ 和 $ Y $ 是兩個空間,表示機率的集合 $ X $ 作為 $ \Delta(X) $ ,並且對於 $ \delta\in \Delta(X\times Y) $ 定義邊際機率測度 $ \delta $ 在 $ X $
$$ marg(\delta;X)(E)=\delta(E\times Y) $$ 對於每個可測量的子集 $ E $ 的 $ X $ .
高階的正式定義如下:
讓 $ N={1,2,\dots, n} $ 成為玩家的集合。對於每個 $ i\in N $ , $ A_i\neq\emptyset $ 是玩家可用的有限動作集 $ i $ . 表示玩家的混合策略集 $ i $ 作為 $ \Sigma_i=\Delta(A_i) $ . 像往常一樣定義 $ \Sigma_{-i}=\times_{j\neq i} \Sigma_i $ 和 $ \Sigma=\times_i \Sigma_i $ . 定義這組一階信念 $ B_i^1=\Delta(\Sigma_{-i}) $ 和 $ B_{-i}^1=\times_{j\neq i} B_j^1 $ , 和 $ B^1=\times_i B_i^1 $ . 歸納地定義,對於每個 $ k\geq 1 $
$$ B_i^{k+1}=\Delta(\Sigma_{-i}\times B_{-i}^1\times \dots B_{i}^k)\ B_{-i}^{k+1}=\times_{j\neq i} B_j^{k+1}\quad B^{k+1}=\times_i B_i^k $$ 最後, $ B_i=\times_{k=1}^\infty B_i^k $
連貫信念用以下方式描述:
$ b_i=(b_i^1,b_i^2,\dots)\in\times_i B_i^k $ 是連貫的,如果對於每個 $ k\geq 1 $ $ marg(b_i^{k+1},\Sigma_{-i}\times B_{-i}^1\times\dots\times B_{-i}^k)=b_i^k $ 在哪裡 $ marg $ 是邊際機率測度。
現在根據這個定義 $ E\subset \Sigma_{-i} $ 我們有 $ marg(b_i^2;\Sigma_{-i})(E)=b_i^1(E) $ .
我試圖理解這個定義。所以我試著考慮一個有兩個玩家的遊戲 $ i $ 和 $ j $ 每個玩家有兩個動作。所以
$$ \Sigma_i={(p,1-p):p\in[0,1]}\quad \Sigma_j={(q,1-q):q\in[0,1]} $$ 和 $ b_i^1\in\Delta(\Sigma_j) $ 和 $ b_i^2\in\Delta(\Sigma_j\times B_j^1) $ . 所以 $ b_i^1 $ 是一個機率測度 $ q $ , 和 $ b_i^2 $ 是一個聯合機率測度 $ q $ 和一階信念 $ j $ . 認為 $ E $ 是集合 $ (q,1-q) $ 這樣 $ q\leq 0.5 $ ,它是 $ \Sigma_j $ . 我無法說服自己為什麼 $ marg(b_i^2;\Sigma_j)=b_i^1(E) $ . 非常感謝問題的長度和任何幫助。
信念的等級被指定的方式,對相同事件的信念被編碼在不同的地方。
基本思想其實很簡單。比如說,你有兩個玩家,安和鮑勃。Ann 的一階信念指定了她認為 Bob 的每個策略選擇的可能性有多大。Ann 的二階信念指定了她認為 Bob 的策略選擇和 Bob 對 Ann 的策略選擇的信念的每種組合的可能性有多大。二階信念是聯合機率。
現在假設 Ann 的一階信念指定她相信 Bob 以機率執行策略 C 和 D $ 1/2 $ 每個。
還假設安相信機率 $ 1/4 $ “Bob 玩 C 並且以機率 1 相信 Ann 肯定會玩 D”並且以機率相信 $ 3/4 $ “Bob 扮演 D 並且相信 Ann 肯定扮演 D”。
如果你問一個只知道安的一階信念的人,安認為鮑勃會玩 C 的可能性有多大,那個人會回答 $ 1/2 $ . 如果你問一個只知道 Ann 的二階信念的人,Ann 認為 Bob 玩 C 的可能性有多大,那個人會回答 $ 1/4 $ . 事實上,這就是她關於戰略空間的二階信念的邊緣所說的。
這是荒謬的,沒有任何意義。根據她的一階信念和二階信念,Ann 對 Bob 扮演 C 的可能性的信念應該是相同的。現在,一致性正是保證這一點的條件。如果對事件 E 的某個信念在不止一個級別的信念層次中指定,則每個層次都應指定對事件 E 的相同信念。
就形式而言:機率測度的邊際又是一個機率測度,所以 $ marg(b_i^2;\Sigma_j)=b_i^1(E) $ 比較蘋果和橘子;左邊是機率度量,右邊是數字。你想要的是 $ marg(b_i^2;\Sigma_j)(E)=b_i^1(E) $ ,正如連貫性所規定的——實際上也是常識所規定的。