欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

博弈论--不完全信息静态博弈(九)

最编程 2024-03-16 13:11:49
...

前述各种静态博弈实例均有一个共同点,即每个参与者完全知晓自己和对手的支付相关信息。但实际问题中,经常出现某个(或所有)参与者对于其他参与者(甚至自身)支付或策略的信息了解并不充分的情况。一般地,在不完全信息博弈中,并非所有人均知晓同样的信息。博弈参与者除了均知晓的公共信息外,还具有各自的私有信息,后面用参与者的类型集来表示。由于参与者的私有信息对其他参与者是未知的,因此在决策时,参与者只能对对手的私有信息进行猜测,同时还要对其他参与者对自己的私有信息的猜测作出猜测,这种猜测之猜测序列可以无限持续下去。这一点与共同知识非常相似,所不同的时,基于公共知识可得到的是确定性的推断,而不完全信息下,参与者只能获得一定条件下的概率性猜测。

一、不完全信息静态博弈案例

1.1 暗标拍卖

拍卖和招投标是比较典型的不完全信息静态博弈,拍卖和招投标的两个基本功能是示信息和减少代理成本。根据拍卖交易制度的不同,目前有5种主要的拍卖机制:英式拍卖、荷式拍卖、一级密封价格拍卖、二级密封价格拍卖、双方叫价拍卖。
不完全信息博弈的一个常见例子暗标拍卖通常有这样几个基本特征:(1)密封递交标书; (2)统一时间公证开标; (3) 标价最高者以所报标价中标。由于博弈方的标书密封递交和同时开标, 各博弈方在选择策略之前都无法知道其他博弈方策略, 而且是一次性选择, 因此这是静态博弈问题。各博弈方无法知道确知其他博弈方拍得标的物的得益,最多能根据一般情况或以往经验作大致判断。 这意味着, 暗标拍卖博弈是不完全信息博恋, 且是不完全信息静态博弈。

1.2 市场进入博弈

设有一个市场已经为某企业A(称为在位企业)所占有,现在有一个潜在的企业B(称为进入者)也想进入这一市场分享一些利润,但都不知在位企业A的成本函数,以及当自己决定进入市场时企业A的反击策略选择(假设企业A有默许和斗争两种策略)。假定在位企业A有高成本和低成本阻止进入两种成本函数,且对应两种成本情况的不同策略组合的得益矩阵如下图所示。

在此“市场进入”博弈中,假设在位企业知道进入企业的成本函数,但进入企业对在位企业的成本信息是不完全的,这是一个不完全信息博弈。

1.3 不完全信息古诺模型博弈

前面讨论的古诺模型,是假设企业彼此完全了解对方的产量和成本等信息,产量的市场价格也是统一的,因此博弈方的得益是公共知识。但在现实经济活动中,相互竞争的企业之间一定会保守自己生产和经营的秘密,轻易不会让其他企业了解到自己的真实情况,因此前面的古诺模型中的假设与现实情况并不相符,现实的寡头市场产量博弈模型中各博弈方的得益不可能是公共知识。这样的博弈我们称为“不完全信息的古诺模型”。
假设:两寡头同时作产量 决策, 市场需求为$P(Q)=a-Q, Q=q_1+q_2 $为市场总产量, \(q_1、q_2\)分别是两个厂商产量。厂商 1 成本函数\(C_1=C_1(q_1)=c_1q_1\), 即无固定成本, 边际成本为\(c_1\), 这是两个厂商都知道的。厂商 2 的成本有两种可能情况, 一种\(C_2=C_2\left(q_2\right)=c_Hq_2\), 另一种\(C_2=C_2\left(q_2\right)=c_L q_2\), 而\(c_H>c_L\), 究竟是哪种成本厂商 2 自己知道,厂商 1 只知道前一种的概率\(\theta\),后一种的概率\(1-\theta\)

  • 当高成本,\(q_{2}^{*}(c_{H})\) 满足:$$\max_{q_2}\left[\left(a-q_1-q_2\right)-c_{\mathrm{H}}\right] q_2$$
  • 当低成本,\(q_{2}^{*}(c_{L})\) 满足:$$\max_{q_2} \left[\left(a-q_1-q_2\right)-c_L\right] q_2$$
  • 厂商1的策略:$$\max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\} $$
  • 求解:三个式子各自求极值,然后联立求解,得:

\[\begin{aligned} & q_2^*\left(c_H\right)=\frac{a-2 c_H+c_1}{3}+\frac{1-\theta}{6}\left(c_H-c_L\right) \\\\ & q_2^*\left(c_L\right)=\frac{a-2 c_L+c_1}{3}-\frac{\theta}{6}\left(c_H-c_L\right) \\\\ & q_1^*=\frac{a-2 c_1+\theta c_H+(1-\theta) c_L}{3} \end{aligned} \]

事实上,当 \(c_2=c_H\)时,\(q_2^*(c_H)>q_2^*\)(两厂商成本不同时的完全信息静态古诺博弈的纳什均衡产量\(q_2^*=\frac{a-2c_2+c_1}{3}\)),他本应该少产,但考虑到对方不知道它是高成本,因此他认为可以适当多产一些,信息的不完全的确对其更有利;当\(c_2=c_L\)时,\(q_2^*(c_L)<q_2^*\),这说明此时企业1的信息不完全对企业2并非有利。

二、不完全信息静态博弈模型

在完全信息静态博弈时,我们将其表示为:$$G=\{ N,S_1, \cdots, S_n ; u_1, \cdots, u_n \} $$,其中\(S_i\)是博弈方\(i\)的策略空间, 即全部可选策略的集合,\(u_i\)是其得益函数\(u_i=u_i(s_1,\cdots,s_n)\)。在不完全信息静态博弈中,需要表示信息的不完全性,用\(T\)来表示:\(t_i\)表示博弈方\(i\)的类型,\(T\) 表示博弈方\(i\)的类型空间,\(t_i \in T_i\)\(u_i(a_1, \cdots, a_n, t_i)\)表示博弈方\(i\)在策略组合 \((a_1, \cdots, a_n)\)下的得益。信息不完全可以通过\(t_i\)的取值只有博弈方\(i\)知道而其他博弈方不清楚这一情况来反映。

\(T=\{t_1,t_2, \cdots, t_n)\)是某参与人的类型空间,比如是参与人1的类型空间,从\(T\)中取出一个特定值\(t_k\)作为参与人的类型,令\(pr(t_k)\)为类型\(t_k\)的概率,且\(\sum_{k=1}^{n}Pr(t_k)=1\),参与人1知道自己的类型,其他参与人观察不到参与人1的类型,但知道其概率分布,这是博弈中的共同知识。
每个参与人根据上面概率分布(共同知识)推断其他参与人的类型分布,这就是下面条件概率\(p_i\)的意义。
\(Pr(t_k)\)被称为参与人的信念(Beliefs),代表其他参与人对参与人1类型的概率分布的认知(Important)。动态博弈中先行动的参与人是否会相信后行动的参与人会采取对自己有利或不利的行动,因而可信性是动态博弈分析的一个中心问题,后行动的参与人采取对先行动的参与人有利的行动称为许诺,后行动的参与人采取对先行动的参与人不利的行动称为威胁。
贝叶斯纳什均衡解的结构或解的表述=策略组合+信念。

另一个需要添加的是博弈方对不完全信息概率的判断:如果用博弈方\(i\)在自己类型为\(t_i\) 的前提下, 对其他博弈方类型的所有可能(或类型组合) $$(t_1,⋯ t_{i − 1} , t_{i+1}, ⋯, t_n )$$ 的条件概率$$p_i=p_i\left\{t_{-i} \mid t_i\right\} $$, 作为反映不完全信息的概率判断, 则可用$$G=\left\{N,A_1, \cdots, A_n ; T_1, \cdots, T_n ; p_1, \cdots, p_n ; u_1, \cdots ,u_n\right\}$$表示不完全信息静态博弈问题,常常参与人集\(N\)可以省略。
例1:不完全信息的 \(\boldsymbol{BoS}\) 博弈
考虑 \(BoS\) 模型(见下图),其中局中人 1 不能肯定局中人 2 是愿意与她一起外出, 还是想躲开她, 而局中人 2 和前面一样, 知道局中人 1 的偏好。具体地讲, 假设局中人 1 认为局中人 2 愿意同自己外出的可能性有 \(\frac{1}{2}\), 躲开她的可能性有 \(\frac{1}{2}\) (这种判断可能源自局中人 1 的经验: 她有一半时间碰到的是愿意与自己一起外出的局中人 2 , 也有一半时间碰到的是试图回避自己的局中人 2)。也就是说, 局中人 1 认为她处于图中左边那个博弈的概率为 \(\frac{1}{2}\), 处于右边那个博弈的概率也是 \(\frac{1}{2}\) 。即使我们只对纯策略均衡感兴趣, 但由于涉及概率, 分析这种情况需要知道局中人关于随机结局的偏好; 表格中的数字代表局中人的博弈收益。

例2:收益是类型函数的博弈

这里,只有当甲选择U且乙选择L时,参与人1的收益是一个随机变量\(t\)。假设\(t\)的概率分布为:\(\frac{1}{2}\)概率等于6,\(\frac{1}{2}\)的概率等于0。现在我们来求解这个博弈的纳什均衡。如果甲的类型是\(t=0\),那么他会选择策略D而不是U(无论乙选择什么,选择D的收益2都会大于选择U的收益0)。如果甲的类型是\(t=6\),那么他的最优反应应该是:当乙选择L时选择U。当乙选择R时选择D。这就出现了两个可能的均衡:
(1)甲采取的策略是\((U|t=6,D|t=0)\),乙采取的策略是L;
(2)甲采取的策略是\((U|t=6,D|t=0)\),乙采取的策略是R(此策略不稳定,如果乙选择R,甲不管哪一种类型,都应选择策略D);
(3)甲采取的策略是\((D|t=6,D|t=0)\),乙采取的策略是R(当甲的策略定了,乙策略L是劣势策略,不可能选择L)。
比较而言,如果给定甲的策略是\((U|t=6,D|t=0)\),那么乙选择L的期望收益为(甲的类型的概率分布已知)

\[\frac{1}{2} \times 2+\frac{1}{2} \times 0 =1 \]

如果给定甲的策略是\((U|t=6,D|t=0)\),那么乙选择R的期望收益为

\[\frac{1}{2} \times 0+\frac{1}{2} \times 4 =2 \]

很显然,乙可以通过背离到策略R来获取更高的期望收益,所以策略组合(1)不是稳定的,同样地,既然乙选择策略R,那么甲必然选择策略D。因此,策略组合(3):甲采取的策略是\((D|t=6,D|t=0)\),乙采取的策略是R——就是这个博弈的纳什均衡。
不失一般性,假设\(t\)的概率分布为:以\(p\)的概率等于6,\(1-p\)的概率等于0。给定甲的策略是\((U|t=6,D|t=0)\),则乙选择L的期望收益为\(2p\);给定甲的策略是\((U|t=6,D|t=0)\),则乙选择R的期望收益为\(4(1-p)\)。若

\[2p \ge 4(1-p) \]

\(p \ge \frac{2}{3}\)时,策略组合(1)是该博弈的纳什均衡;若

\[2p \le 4(1-p) \]

\(p \le \frac{2}{3}\)时,策略组合(3)是该博弈的纳什均衡。
总之,纳什均衡的概念同样适用于不完全信息博弈。但一般称呼不完全信息博弈的纳什均衡为贝叶斯纳什均衡(Bayesian-Nash equilibrium),其贝叶斯纳什均衡可表述为

\[\{ (U|t=6,D|t=0),L,p\ge \frac{2}{3} \} \quad结构为\{甲策略,乙策略,信念 \} \]

特别地,当信念为\(p=\frac{3}{4}\)时,贝叶斯纳什均衡为

\[\{ (U|t=6,D|t=0),L,p= \frac{3}{4} \} \]

同样,当信念为\(p=\frac{2}{5}\)时,贝叶斯纳什均衡为

\[\{ (D|t=6,D|t=0),R,p= \frac{2}{5} \} \]

例3:不完全信息 \(BoS\) 博弈的变形
考虑 \(BoS\) 博弈的另一个变形, 这里没有一个局中人知道对方是否愿意同自己一起外出。具体地, 假设局中人 1 认为局中人 2 想和自己一起外出的概率为 \(\frac{1}{2}\), 局中人 2 想回避自己的概率为 \(\frac{1}{2}\), 而局中人 2 认为局中人 1 愿意与自己一起外出的概率为 \(\frac{2}{3}\), 局中人 1 想回避自己的概率为 \(\frac{1}{3}\) 。和前面一样, 假设每个局中人都了解自己的偏好(共同知识)。
我们可以引人四种状态来模拟这种情况, 每种状态对应着一个可能的偏好布局。将这些状态记为 \(y y\) (每个局中人都想与对方一起外出),\(y n\) (局中人 1 想与局中人 2 一起外出, 而局中人 2 想回避局中人 1\(), n y\)\(n n\)
局中人 1 不知道局中人 2 的偏好的事实意味着她无法区分状态 \(y y\)\(y n\), 或者不能区分状态 \(n y\)\(n n\) 。同样, 局中人 2 不能区分状态 \(y y\)\(n y\), 或者不能区分状态 \(y n\)\(n n\) 。我们可以通过假设“每个人在选择行动前接受一个信号”来对局中人的信息建立模型。局中人 1 在状态 \(y y\)\(y n\) 中会收到同一个信号, 譬如为 \(y_1\), 在状态 \(n y\)\(n n\) 中会收到另一个信号, 譬如为 \(n_1\); 局中人 2 在状态 \(y y\)\(n y\) 中会收到同一个信号, 譬如为 \(y_2\), 在状态 \(y n\)\(n n\) 中会收到另一个信号, 辟如为 \(n_2\) 。局中人 1 在收到信号 \(y_1\) 后, 被归类为类型 \(y_1\) 的局中人 1 (想与局中人 2 一起外出); 在收到信号 \(n_1\) 后, 被归类为类型 \(n_1\)的局中人 1 (想回避局中人 2 )。同样, 局中人 2 也有两个类型, \(y_2\)\(n_2\)\(y_1\) 类型的局中人 1 相信状态 \(y y\)\(y n\) 中每一个发生的概率都是 \(\frac{1}{2}; n_1\)类型的局中人 1 相信状态 \(n y\)\(n n\) 中的每一个发生的概率都是 \(\frac{1}{2}\) 。同样地, \(y_2\) 类型的局中人 2 相信状态 \(y y\) 发生的概率为 \(\frac{2}{3}\), 而 \(n y\) 发生的概率为 \(\frac{1}{3}\)\(n_2\)类型的局中人 2 相信 \(yn\) 发生的概率为 \(\frac{2}{3}\), 而 \(n n\) 发生的概率为 \(\frac{1}{3}\)(见下图)。

例4:斗鸡博弈
两个所谓的勇士举着长枪,准备从独木桥的两端冲上桥*进行决斗。每位勇士都有两种选择:冲上去(用U表示),或退下来(用D表示)。若两人都冲上去,则两败俱伤;若一方上去而另一方退下来,冲上去者取得胜利,退下来的丢了面子(至少心理上是这样的);若两人都退下来,两人都丢面子。现在考虑这样的情形:假设参与人可能有这样的两种性格特征(类型)——“强硬”(用s表示)或“软弱”(用w表示)。 “强硬”的参与人:争强好胜、不达目的誓不罢休的决斗者;“软弱”的参与人:胆小怕事、遇事希望息事宁人的决斗者。

图1 图2

在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都知道自己的性格特征,但对对手的性格特征往往不甚了解。这意味着,当博弈真正开始的时候,双方对到底体现为哪一种博弈情形并不清楚。在这种情况下,对每位决斗者而言,存在事先的不确定性,即博弈开始之前就不知道的信息。例如,对于“强硬”的参与人1来讲,虽然他知道自己的类型,但他不知道对手是“强硬”的还是“软弱”的,这意味着“强硬”的参与人1面临着事前无法确定的信息。同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。
假设\(p_{ss}=0.2,p_{sw}=0.3,p_{ws}=0.25,p_{ww}=0.25\),其中\(p_{ss}\):决斗者1和决斗者2同时强硬的概率;\(p_{sw}\):决斗者1强硬、决斗者2软弱的概率;\(p_{ws}\):决斗者1软弱、决斗者2强硬的概率;\(p_{ww}\):决斗者1软弱、决斗者2软弱的概率;虽然决斗者1不知道决斗者2 的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。
根据贝叶斯规则,“强硬”的决斗者1可以推知:决斗者2是“强硬”的概率为\({p_1}(s\left| s \right.) = \frac{{0.2}}{{0.2 + 0.3}} = 0.4\);决斗者2是“软弱”的概率为\({p_1}(w\left| s \right.) = \frac{{0.3}}{{0.2 + 0.3}} = 0.6\);“软弱”的决斗者1可以推知:决斗者2是“强硬”的概率为\({p_1}(s\left| w \right.) = \frac{{0.25}}{{0.25 + 0.25}} = 0.5\),决斗者2是“软弱”的概率为\({p_1}(w\left| w \right.) = \frac{{0.25}}{{0.25 + 0.25}} = 0.5\)。 虽然决斗者1不知道决斗者2 的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。
例4:不完全信息古诺博弈
\begin{aligned} & \text { 厂商 } 1 \text { 的行动空间- } A_1=\left\{q_1\right\} \\ & \text { 厂商 } 2 \text { 的行动空间- } A_2=\left\{q_2\right\} \\ & \text { 厂商 } 1 \text { 的类型空间- } T_1=\left\{c_1\right\} \\ & \text { 厂商 } 2 \text { 的类型空间- } T_2=\left\{c_H, c_L\right\} \\ & \text { 厂商 } 1 \text { 的得益-- } u_1=\pi_1\left(q_1, q_2, t_1\right) \\ & \text { 厂商 } 2 \text { 的得益-- } u_2=\pi_2\left(q_1, q_2, t_2\right)\\ & \text { 厂商 } 1 \text { 条件概率- } p_1\{c_H|c_1\}=\theta;p_1\{c_L|c_1\}=1-\theta\\ &\text { 厂商 } 2 \text { 条件概率- } p_2\{c_1|c_H\}=1; p_2\{c_1|c_L\}=1 \end{aligned}

2.1海萨尼变换

在上面的描述中,对“类型”的了解是解决静态贝叶斯博弈问题的一个关键,因为在不完全信息静态博弈中,如果一些博弈方对其他博弈方的“类型”完全不了解,就完全失去了进行决策的依据。因此,这些博弈方至少应该了解其他博弈方各种“类型”出现机会的相对大小,即对每种“类型”出现的概率分布有一个基本判断,这样才可能根据其他博弈方各种可能的得益,推导出自己的选择,并对相应的期望利益进行估计。在这一思路的基础上,海萨尼( Harsanyi )1967年提出将“不完全信息静态博弈” 转化为“完全但不完美信息动态博弈”:

  • 第一步:引进虚拟博弈方 “自然”, “自然”进行动态博弈第一阶段的行动选择
    “自然” 为每个博弈方随机选择类型\(t=\left(t_1, \ldots, t_n \right)\),其中$t_i \in T_i, i=1, \cdots $
  • 第二步:表示不完全信息
    每个博弈方知道自己的类型,但不知道“自然”为其他博弈方选择的类型,只知道所选类型的概率分布。
  • 第三步:博弈方在动态博弈第二阶段进行原来的静态博弈\(a_1, \ldots, a_n\)
  • 第四步:表示得益
    除 “自然” 博弈方外, 其余博弈方各自得益$u_i=u_i \left(a_1, \ldots, a_n \right) $

在作了海萨尼转换之后, 仍然有对 “类型” 的判断问题。但这时对类型的判断形式上变成了对博弈进程,即 “自然”对实际博弈方类型选择的判断, 其概率分布与类型的概率分布相同, 即 “自然”以概率分布\(p_1, \cdots p_n\)分别选择\(t_1, \cdots, t_n\)

在“市场进入”博弈中,假设在位企业A知道进入企业B的成本函数类型,但进入企业对在位企业的成本信息是不完全的。从得益矩阵中可以看出,在在位企业A是高成本的情况下,如果企业B决定进入,此时在位企业A的选择是“默许”。当在位企业A是低成本的情况时,如果进入企业B决定“进入”,显然在位企业A的选择应该是“斗争”,因此在信息完全情况下,如果企业B决定“进入”,显然在位企业A的选择应该是“斗争”。因此在信息完全情况下,如果在位者是高成本,企业B的最佳策略选择是“进入”,如果在位企业A是低成本,进入者的最优选择是“不进入”。如果企业B并不知道在位企业A的成本类型,企业B此时的最优选择就依赖于它在多大程度上认为在位企业A是高成本或低成本的。现在假定企业B认为在位企业A是高成本的概率为\(p\),低成本的概率为\(1-p\),通过海萨尼转换,我们可以把上述不完全信息的“市场进入”静态博弈转换为完全但不完美的动态博弈,如下图所示:

此时,“自然”首先随机选择在位企业A成本的类型,然后我们就可以使用标准的动态分析中的“逆向归纳法”来分析该完全但不完美动态博弈。与完全信息博弈之间在策略和策略空间方面的相同。

2.2 贝叶斯纳什均衡

将纳什均衡推广到不完全信息静态博弈中,基本思想与完全信息静态博弈的纳什均衡是一样的, 各博弈方的策略必须是对其他博弈方策略(或策略组合)的最佳反应。不同的是, 这里的策略比完全信息静态博弈复杂一些,不是简单的行为选择,而是由类型决定行为选择的函数。这种策略有新含义的纳什均衡, 称为 “贝叶斯纳什均衡”。
在不完全信息静态博弈$$G=\{A_1,⋯,A_n;T_1,⋯,T_n; p_1 , ⋯, p_n ; u_ 1 , ⋯, u_n\} $$ 中, 如果对任意博弈方\(i\)和他的每一种可能的类型 \(t_i \in T_i\), 策略函数\(S_i^*\left(t_i\right)\)所对应的行动\(a_i\) 都能最大化其期望得益。

\[\max_{a_i \in A_i} \sum_{t=i} \left \{u_i \left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n \right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\} \]

则称策略组合 \(S^*=\left(S_1^*, \cdots, S_n^*\right)\)\(G\)的一个 (纯策略) 贝叶斯纳什均衡。

性别之战(Battle of the Sexes)的贝叶斯纳什均衡
夫妇分别为玩家1和玩家2,对于打发周末的时间,玩家1喜欢看拳击(Boxing),玩家2喜欢看歌剧(Opera)。以此为背景列出这对夫妇的博弈矩阵:

玩家1\玩家2 B O 玩家1\玩家2 B 0
B 9;3 0;0 B 3;0 0;3
O 0;0 3;9 0 0;3 3;0
2:高兴,概率\(\alpha\) 2:难过,概率\(1-\alpha\)

妻子(玩家2)可能高兴也可能难过。如果高兴,会和丈夫(玩家1)一起打发周末;如果难过,就不会和丈夫一起。由于“女人心,海底针”,玩家2知道自己的情绪状态,但丈夫由于很迟钝所以不知道,但是他假设妻子高兴的概率为\(\alpha\)
对于性别之战,要素可以整理为:

参与人集:夫妇(夫=玩家1,妇=玩家2)
行动集:每人都可以选择任意活动, \(A_i\)={看拳击,看歌剧}
类型集:玩家1没有类型 \(T_1\)={∗} ,玩家2的类型为\(T_2\)={高兴,难过}
收益函数:列于矩阵中
先验概率(信念Beliefs):玩家2高兴的概率为\(\alpha\) , $Pr(玩家2高兴)= \alpha $
这样的博弈就是贝叶斯博弈(Bayesian Game)。

假设这对夫妇晚上外出,妻子(玩家2)的情绪取决于下午发生的事情。但是早上的时候一觉醒来睡眼惺忪,就连妻子自己也不知道自己是高兴还是难过,只知道自己有\(\alpha\)的概率会高兴。在丈夫的眼中,早上的妻子和晚上的妻子是一样的,丈夫不知道妻子的心情,但知道妻子高兴的概率是\(\alpha\)
吃早餐的时候,妻子决定考虑晚上应该看拳击(B)还是看歌剧(O),因为妻子也不知道自己是否会高兴,所以需要制定相机选择(contingent play)。4种可能的策略组合如下:

1 2 3 4
高兴时 看拳击 看拳击 看歌剧 看歌剧
难过时 看拳击 看歌剧 看拳击 看歌剧

玩家的纯策略是一种偶然的行动计划,将行动分配给每种可能的类型。在包含完整信息的扩展式博弈中,要注意行动和策略之间的区别。在性别之战的例子中,玩家1的策略是B, O,而玩家2的策略是(B, B), (B,O), (O, B), (O, O)。
如果玩家1选择B,玩家2选择(B, B),则二人的预期收益为:

\[u_1(B; BB) = \alpha 9 + (1-\alpha)3;\quad u_2(B; BB) = \alpha 3 + (1- \alpha)0 \]

如果玩家1选择B,玩家2选择(B, O),则二人的预期收益为:

\[u_1(B;BO) = \alpha 9 + (1- \alpha)0;\quad u_2(B;BO) = \alpha 3 + (1- \alpha)3 \]

同样可以求出其他策略的预期收益,得到事前策略矩阵

玩家1/玩家2 BB BO OB OO
B 7;2 6;3 1;0 0;1
O 0;1 1;0 2;7 3;6

从上面策略矩阵中,可知纯策略贝叶斯纳什均衡是(B;BO), (O;OB)。下面在再考虑其他的贝叶斯纳什均衡,设玩家1去看拳击(B)的概率为\(p\),绘制图象:

注:该图的取点采用博弈矩阵中的右侧数。例如BB曲线取B=2,O=1,连接起来。

如上图,BB从来都不是最优的(因为均位于其他直线之下),所以它永远不会处于均衡状态。但玩家2的BO的概率必须严格在0到1之间,否则玩家1就不愿意混合博弈了。这在\(p\)=3/4 时,玩家2才混合BO和OO。
再假设玩家2选择BO的概率为\(q\) ,选择OO的概率为\(1-q\)。对于玩家1就愿意混合的情况,有:

\[6q=q+3(1-q),解得 q=\frac{3}{8} \]

因此这个博弈有三个贝叶斯纳什均衡:

\[(B;BO)\quad 其实是纯纳什均衡,混合策略表示为((1, 0); (0,1, 0,0)) ;\\ (O;OB) \quad 其实是纯纳什均衡,混合策略表示为((0, 1); (0,0,1,0));\\((3/4, 1/4); (0,3/8, 0,5/8)) \quad 混合纳什均衡,参考事前策略矩阵 \]

贝叶斯纳什均衡其实就是博弈的事前策略矩阵(Ex-ante Normal Form)的纳什均衡,它是前面定义的贝叶斯纳什均衡的离散化表达,可帮助我们更好地理解贝叶斯纳什均衡。

三、示例

3.1 贝叶斯博弈

Alice(玩家1)和Bob(玩家2)进行以下贝叶斯博弈。Alice只有一种类型,Bob有两种类型H和L。Alice和Bob在Bob知道自己的类型之前,都为每种类型分配0.5的概率。在做决定之前,Bob知道自己的类型和Alice的类型,但是Alice不知道Bob的类型。每个Alice有两个动作:(贡献,不贡献);每种类型的Bob都有两个动作:(贡献,不贡献)。
如果Bob的类型是H,那么二者的收益如下:
如果双方都有贡献,则为2;如果双方都没有贡献,则为0;如果自己有贡献而对方没有贡献,则为1。
如果Bob的类型是L,那么二者的收益如下:
如果双方都有贡献,则为1;如果双方都没有贡献,则为0;如果自己有贡献而对方没有贡献,则为-4。
记贡献为C,不贡献为N。问:① 绘制该贝叶斯博弈的收益矩阵。② 求解所有的贝叶斯-纳什均衡。

:① 根据上面信息归结出博弈矩阵如下:

Alice玩家1\Bob玩家2 C N Alice玩家1\Bob玩家2 C N
C 2;2 1;0 C 1;1 4;0
N 0;1 0;0 N 0;4 0;0
概率\(P(H)=\frac{1}{2}\) 概率\(P(L)=\frac{1}{2}\)

② 事前预期策略矩阵如下:

Alice玩家1\Bob玩家2 (C,C) (C,N) (N,C) (N,N)
C 1.5;1.5 -1;1 1;0.5 -1.5;0
N 0;-1.5 0;0.5 0;-2 0;0

从上面可以发现,该博弈有两个纯策略贝叶斯纳什均衡(C, (C,C))、(N, (C, N))。对于玩家2,(N,C)和(N,N)都严格劣于策略(C,N),因此不参与纳什均衡的考虑范围。设\(p\)是玩家1选择C的概率,\(q\)是玩家2选择(C,C)的概率。列出:

\[1.5p-1.5(1-p) = p+0.5(1-p);\quad 1.5q-(1-q) = 0 \]

解得混合策略贝叶斯纳什均衡为\((p, q) = (0.8, 0.4)\)

3.2 细分市场博弈

在两个细分市场中有两家公司。公司1(玩家1)是高端市场中的老牌公司。公司2(玩家2)长期以来一直在向低端市场销售产品。最近,公司1正在决定是大促销(行动B)还是小促销(行动S)。与此同时,公司2正在决定是进入高端市场(行动H)还是留在低端市场(行动L)。在做出自己的决定时,两家公司都不知道对方的选择。然而,结果也取决于公司1是否有强大的财政支持。公司1知道自己是强是弱。公司2只知道1强的概率是1/3,弱的概率是2/3。收益矩阵如下:

玩家1\玩家2 H L 玩家1\玩家2 H L
B 3;-6 6;0 B 6;-3 3;0
S 0;-3 9;0 S 0;6 6;0
概率\(\frac{1}{3}\) 概率$$\frac{2}{3}$$

问:① 绘制与这个贝叶斯博弈相关的事前标准形式。② 求解唯一的贝叶斯-纳什均衡。③ 假设已知公司1强,求对应博弈的纳什均衡;假设已知公司1弱,求对应博弈的纳什均衡。④ 一个神秘UP主向公司2提出建议,该UP主可以获得公司1的秘密财务文件并将其公布于大众。公司2愿意为UP主支付多少?
:① 事前标准形式如下。玩家1的策略中,第一个字母为强时的行动,第二个字母为弱时的行动;星号表示最佳对策。例如,U1(BB;H) = 1/33 + 2/36 = 5,U2(BB;H) = 1/3(-6) + 2/3(-3) = -4,以此类推可得事前策略矩阵,见下表。

H L
BB 5*,-4 4,0*
BS 1 ,2 6,0
SB 4,-3 5,0*
SS 0,3 7,0

② 根据事前标准形式,该博弈不存在纯策略贝叶斯纳什均衡(没有两个星号在一起的情况)。而对于混合策略贝叶斯纳什均衡,令\(q\)为玩家2选择行动H的概率,则玩家1的纯策略预期收益可以分别表示为:

\[u_1(BB; q) = 5q + 4(1-q);\quad u_1(BS; q) = q + 6(1-q) \]

\[u_1(SB; q) = 4q + 5(1-q);\quad u_1(SS; q) = 7(1-q) \]

绘制预期收益图象如下:

由图可知,BS从来不是最佳对策(从未出现在最高处),所以玩家1在任何均衡中都不会选择BS。如果没有BS,玩家1必须混合SS和另一种策略,以便玩家2愿意混合。这是因为,如果玩家1从不选择SS,玩家2就只会选择L;如果玩家1总是选择SS,玩家2就只会选择H。因此玩家1选择SS的概率必须严格在0到1之间。
如果玩家1要混合SS和另一种策略,只会混合SS和SB,发生在\(q=1/3\)处。设\(p\)是玩家1选SB的概率,\(1-p\)是选SS的概率。要让玩家2对选择H和选择L效果等价,可以列出\(-3p + 3(1-p) = 0\),解得\(p=1/2\)
因此,唯一的贝叶斯纳什均衡是玩家1选择BB和BS的概率为0,选择SB和SS的概率均为1/2,而玩家2选择H的概率为1/3,选择L的概率为2/3。可以表示为:((0, 0, 1/2, 1/2), (1/3, 2/3))。
③ 若公司1强,玩家2的支配策略是L。假设玩家2选择L,玩家1的最佳对策是S,因此唯一的纳什均衡是(S,L)。若公司1弱,不存在纯策略纳什均衡。设p为玩家1选择B的概率,q是玩家2选择H的概率。可以列出:

\[-3p + 6(1-p) = 0,解得p=2/3 \]

\[6q + 3(1-q) = 6(1-q),解得q=1/3 \]

因此,唯一的纳什均衡是,玩家1选择B的概率为2/3、S的概率为1/3,而玩家2选择H的概率为1/3、L的概率为2/3。
④ 在②的贝叶斯纳什均衡中,玩家2的均衡收益为0。注意玩家2在H和L之间是无所谓的,L总是给玩家2的收益为0。如果众所周知,公司1是强的,玩家2的均衡收益是0,也就是(S,L)的收益。如果众所周知公司1是弱的,玩家2的均衡收益也是0,因为玩家2在H和L之间混合,而L总是给玩家2的收益为0。不管公司1的财务实力是否已知,公司2的均衡收益总是0。所以公司2没有动力去购买公司1的财务优势信息,公司2愿意为UP主支付的金额是0。

3.3 暗标拍卖

假设:
(1) 两投标者:博弈方1、博弈方 2
(2) 两博弈方对拍品估价: \(v_1, v_2\)
(3) 若标价\(b_i\)中标, 其得益:\(v_i-b_i\)
(4) 各博弈方不知对方估价, 但知对方估价是 [0,1] 上的均匀分布,即取[0,1] 中任何数值的概率相等。
(5) 博弈方都风险中性:一单位期望得益和一单位确定性得益价值相同。
表示为不完全信息静态博弈
把上述问题表示为标准的不完全信息静态博弈, 需要找出两个博弈方的行为空间、类型空间、判断和得益函数。
*行为空间:博弈方\(i\)的行为就是自己的标价 \(b_i\),其中\(0\leq b_i\leq v_i\leq 1\)
*类型空间:博弈方\(i\)的类型即自己的估价\(v_i\), 类型空间\(T_i\)就是 估价可能取值区间 [0,1]
*判断:博弈方知道对方的类型是[0,1]上的标准分布, 这就是他们对对方类型的判断。
*得益函数:

\[u_i = u_i(b_1, b_2, v_1,v_2 ) =\begin{cases} v_i-b_i, \text { 当 } b_i>b_j \\\\ \left(v_i-b_i\right) / 2, \text { 当 } b_i=b_j \\\\ 0, \text { 当 } b_i<b_j \end{cases}\]

式中\(i=1\)\(j = 2\)\(i=2\)\(j=1\)
寻找贝叶斯纳什均衡
先要构筑两博弈方的策略空间,即根据类型决定行为的函数关系:
本博弈中, 博弈方\(i\)的策略是符合要求的函数关系\(b_i(v_i)\), 所有这种函数关系\(b_i(v_i)\) 的集合构成博弈方\(i\)的策略空间。
分析贝叶斯均衡
策略组合\([b_1(v_1), b_2(v_2)]\)是一个贝叶斯纳什均衡, 意味着博弈方 1 的策略\(b_1(v_1)\)与博弈方 2 的策略\(b_2(v_2)\)相互是对对方的最优反应,对每个博弈方\(i\)的每个类型 \(v_i \in [0,1], b_i(v_i)\)都满足中标的期望得益最大化:

\[\operatorname{Max}_{b_i}\{[v_i-b_i(v_{\mathrm{i}})] P(b_i>b_j)+1/2[v_i-b_i(v_{\mathrm{i}})] P(b_i=b_j\} \]

对于上面博弈,若博弈方的报价:由基价和估价的一个固定线性比例组成,即:
$$b_1(v_1)=a_1+c_1 v_1, \quad b_2(v_2)=a_2+c_2 v_2$$其中\(a_1<1、a_2<1\)\(c_1 \geq 0、c_2\geq 0\)
简化:由于\(v_j\)服从均匀分布, $b_j=b_j(v_j)=a_j+c_jv_j $也服从均匀分布, 因此 $P\{b_i=b_j\}=0 $(概率趋近于0) 。这样上式变为:

\[\begin{aligned} & \max_{b_i}(v_i-b_i) P\{b_i>a_j+c_j v_j\} =max_{b_i}(v_i-b_i) P\{v_j<\frac{b_i-a_j}{c_j}\} =\max _{b_i}(v_i-b_i) \frac{b_i-a_j}{c_j} \end{aligned} \]

求一阶导可得:$b_i=(a_j+v_i) / 2 $

分析:当 \(v_i<a_j\) (博弈方\(i\)估价小于博弈方\(j\)的基价)则博弈方\(i\)一定不会中标,所以\(v_i\)至少大于等于\(a_j\)才有希望,综合来看,\(v_i\)的最佳反应为:

\[b_i(v_i)=\begin{cases}\frac{v_i+a_j}{2} & \text { 当 } v_i \geqslant a_j \\\\ a_j & \text { 当 } v_i<a_j\end{cases} \]

若要求双方策略是严格的线性函数,可以要求\(a_j \leq 0\),这样$ v_i$ 的最佳反应变为:

\[b_i(v_i)=\frac{v_i+a_j}{2} \]

将此式与之前的策略空间 $$b_i(v_i)=a_i+c_i v_i$$相比较,最终可得$a_i=a_j / 2, c_i=1 / 2 $,另一个博弈方同理,联立得最终结果:
$$a_i=a_j=0, c_i=c_j=1 / 2$$计算出$ b_i=v_i/2$,即博弈方最佳策略:把报价定为对拍品估价的一半。

上述贝叶斯纳什均衡是在上述暗标拍卖博弈中, 双方采用线性策略时唯一的贝叶斯纳什均衡。如果没有限定采用线性策略, 贝叶斯纳什均衡会发生改变。如果博弈方估价的概率分布不是上述标准分布, 暗标拍卖博弈的贝叶斯纳什均衡也会发生变化。此外,参与投标人数更多时情况也要更复杂一些,但分析思路是相同的。

3.4 “市场进入”博弈

对于进入企业B来说,虽然不知道在位企业A究竟选择低成本阻止还是高成本阻止,但它知道企业A只能有这两种策略选择以及相应策略选择的概率分布。若企业A属于高成本阻止的概率为\(p\),则企A属于低成本阻止的概率就为\(1-p\)。如果企业A的阻止成本高,则A将默许企业B进入市场;如果企业A的阻止成本低,则企业A将阻止企业B的进入。在以上两种情况下,对照本节最上面的收益矩阵图,企业B的收益分别为30和-10。所以,B选择进人的期望收益为\(30p+(−10)(1−p)\);选择不进人的期望收益为0。显然,只要企业B选择进入的期望收益大于不进入的期望收益,B就应该选择进入;否则,企业B选择不进入。也就是说,企业B的选择取决于\(30p+(-10)(1-p)\geq 0\),即只要企业A高阻止成本的概率大于25%时,企业选择进入是其最优策略。这时的贝叶斯纳什均衡为:企业B选择进入,高成本在位企业A选择默许,而低成本在位企业A选择阻止。

参考文献

  1. 第六章 不完全信息静态表示
  2. 不完全信息静态博弈--贝叶斯纳什均衡
  3. 3.3不完全信息静态博弈(一)
  4. 博弈论06:贝叶斯博弈及其应用
  5. 第五章 博弈论(5):不完全信息博弈