欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

博弈论--信息不完全的动态博弈(X)

最编程 2024-03-16 13:15:08
...

不完全信息动态博弈是博弈论的重要构成部分,研究多方参与、信息有限的决策过程。在这种博弈中,参与者面临不完全的信息,意味着他们并不清楚其他参与者的全部策略、偏好或者收益。此外,博弈的进程是动态的,参与者在不同时间点做出决策,并且每个人的行动都会影响其他人的决策选择。不完全信息动态博弈一开始,某一参与人根据其他参与人的不同类型及其所属类型的概率分布,建立自己的初步判断;当博弈开始后,该参与人就可以根据他所观察到的其他参与人的实际行动,来修正自己的初步判断,并根据这种不断变化的判断,选择自己的策略。不完全信息动态博弈的研究对象涵盖了多种实际情境,例如市场竞争、国际贸易、策略决策等。在这些情境下,参与者需要基于有限的信息和历史经验做出决策,同时还要考虑其他参与者可能的行动和反应。

一、不完全信息动态博弈案例

1.1黔驴技穷

完美贝叶斯纳什均衡是完全信息动态博弈的子博弈完美纳什均衡与不完全信息静态博弈的贝叶斯纳什均衡的结合。贝叶斯方法是概率统计中的一种分析方法。它是指根据所观察到现象的有关特征,并对有关特征的概率分布的主观判断(即先验概率)进行修正的标准方法。中国著名成语故事黔驴技穷,就是贝叶斯方法思想的一个典型表达。
老虎没有见过驴子,因而不知道自己比驴子强还是弱。老虎的策略是:如果自己弱,那就只能躲,如果自己强,那就吃驴子。对于自己并不了解驴子,老虎的做法是不断试探,通过试探,修改自己对驴子的看法。如果驴子表现温顺无能,老虎就认为驴子是美食的概率比较大,起初驴子没有反应,老虎认为驴子不像强敌,胆子越来越大。后来驴子大叫,老虎以为驴子要吃它,吓的逃走,但后来想想,又觉得不一定,于是继续试探,直到驴子踢老虎,老虎才觉得驴子“仅此技耳”,于是采取自己强时的最优行动——吃驴子。

1.2 信号传递

由于信息不完全,每个人都希望向对方传递对自己有利的信号。比如,在招聘时,应聘者总是显示自己最好的一面。谈判中,企业总是把最能显示自己实力的一面展示出来。公司越来越注意企业形象的塑造。女孩子总是把自己打扮得漂亮。人们总是把最好的衣服穿在外面。等等。问题是,对方不一定相信你所传递的信号是真实的。有的信号,一下子是难以识别真伪的,需要时间。所以,“百年老店”是最好的信号传递方式。
为什么招聘单位看重学历,因为学历容易甄别,而且比起能力的描述来,相对可靠;为什么顾客喜欢买名牌产品,因为名牌是经过很多年才形成的,广告、产品质量、服务质量等因素起了很大的作用,名牌传递的信号就是:质量好,服务好。教育信号传递模型是分析劳动力市场上工人的教育水平如何传递有关能力的信息的模型。在这个模型里,企业的生产率取决于工人的能力。工人的能力可能高可能低,工人本人知道,雇主不知道;教育本身不改进工人的能力,但却可以传递有关这种能力的信息,原因是,教育要花费成本,而高能力的人的教育成本相对于低能力的人的要低,因为一个笨蛋要比一个聪明人遭受更大的痛苦才能完成必修的课程,拿到文凭。这样,文凭就成为能力的象征,尽管它不一定是能力的源泉。高能力的人要把自己与低能力的人分开,就要选择受更多的教育,企业看到受过教育的人就推断是高能力,支付高工资。如果这个模型是正确的话,我们也许不应该简单地因为所学内容无用就否定一种教育制度,如中国古代社会的科举制度,它或许也具有信号传递的功能。

1.3 二手车交易

设汽车有“好”和“差”两种可能的质量状态。卖方清楚自己的选择,第二阶段他选择“卖”还是“不卖”时,是根据汽车是“好”和“差"的状况来做选择。在第一阶段为“好”和“差”的情况下,卖方第二阶段都可以选择“卖”或“不卖”。如果他选择的是“不卖”,则显然不管第一阶段是“好”还是“差”,博弈都立即结束。如果卖方选择是“卖”,则博弈进行到第三阶段,轮到买方进行选择。我们假设买方(博弈方2)无法知道第一阶段的卖方选择,因此在第二阶段卖方选择卖的情况下,买方无法知道卖方前两阶段的路径究竟是“好”而“卖”还是“差”而“卖”,显然他无法做出准确的选择。我们把两个代表前面阶段博弈不同路径的节点放在一个信息集中,表示买方在该决策阶段的信息具有不完美性。这意味着虽然买方在此处只有“买”、“不买”两种选择,但可能的结果却有四种,包括“买”到好车、差车,“不买”好车、差车。前两种结果对买方、卖方都有差异,而后两种结果则最多只对卖方有差异。

1.4 扑克牌(Poker)游戏

扑克牌是一种广泛流行的纸牌游戏,其通常由两名玩家或更多玩家参与游戏过程中。在扑克游戏中,玩家持有的底牌是不完全信息,其他玩家无法知道这些底牌是什么。这意味着玩家需要根据自己的底牌、公共牌和其他玩家的行为来推测对手的牌型和策略,从而做出最优的下注和决策。这种情况下,玩家需要综合考虑自己的牌、对手可能的牌型、对手的下注行为以及自己的风险承受能力,来决定是否跟注、加注或者弃牌。玩家之间的心理策略也是扑克游戏的一部分。通过观察对手的表情、下注习惯以及游戏中的种种细节,玩家可以尝试识别对手的策略,然后利用这些信息来做出更好的决策。

二、完美贝叶斯纳什均衡(Perfect Bayesian Nash Equilibrium,简化为PBNE)

在不完全信息动态博弈(Dynamic game of incomplete information) 中,“自然”首先选择参与人的类型,参与人自己知道,其他参与人不知道;在自然选择之后,参与人开始行动,参与人的行动有先有后,后行动者能观测到先行动者的行动,但不能观测到先行动者的类型,因为参与人的行动是类型依存的,每个参与人的行动都传递着有关自己类型的某种信息,后行动者可以通过观察先行动者所选择的行为来推断其类型或修正对其类型的先验信息(概率分布),然后选择自己的最优行动。先行动者预测到自己的行动将被后行动者所利用,就会设法选择传递对自己最有利的信息,避免传递对自己不利的信息。因此,博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。完美贝叶斯纳什均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔腾(Selten)的完全信息动态博弈子博弈完美纳什均衡和海萨尼(Harsanyi)的不完全信息静态博弈贝叶斯均衡的结合。完美贝叶斯纳什均衡要求,给定有关其他参与人的类型的信念,参与人的策略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的信念。
考虑下面动态博弈(见图1),参与者1在3个行动中进行选择——L、M及R,如果参与者1选择R,则博弈结束(不等参与者2行动);如果参与者1选择了L或M,则参与者2就会知道1没有选择R (但不清楚1是选择了L还是M),并在\(L^{'}\)\(R^{'}\)或两个行动中进行选择,博弈随之结束。收益情况由图1的扩展式博弈给出。

图1扩展式 图2策略式

从策略式可以发现存在两个纯策略纳什均衡\((L,L^{'})\)\((R,R^{'})\)。为确定这些纳什均衡是否符合子博弈完美纳什均衡的条件,我们先明确博弈的子博弈,图中不存在子博弈。如果一个博弈没有子博弈,则子博弈完美纳什均衡条件(具体地说,即参与者的策略在每一个子博弈中均构成纳什均衡)自然就得到满足。从而在任何没有子博弈的博弈中,子博弈完美纳什均衡的定义便等同于纳什均衡的定义,于是在图中,\((L,L^{'})\)\((R,R^{'})\)都是子博弈完美纳什均衡。然而,却又明显要依赖于一个不可信的威胁:如果轮到参与者2行动,则选择\(L^{'}\)要优于选择\(R^{'}\),于是参与者1便不会由于2威胁他将在其后的行动中选择\(R^{'}\),而去选择\(R\)。换言之,参与人1认为参与人选择\(R^{'}\)不过是个空头威胁。
该例中反映出一个问题,在信息完全但不完美的博弈中,尽管是子博弈纳什均衡,它依赖一个不可信的空头威胁,应该从合理的预测中排除。问题出现的原因是,参与人2不知道参与人1若不选择\(R\),他究竟选择了\(L\)还是\(M\)?。在附加的条件中,将要求参与人2对这个问题有一定的信念(Beliefs)推断,并在这个信念下采取最佳的策略行动。为此要进一步强化均衡概念,以排除图中像\(p\times 0+(1-p)\times 1=1-p\)的子博弈完美纳什均衡,对均衡附加以下两个要求。

要求1:在每一信息集中,应该行动的参与者必须对博弈进行到该信息集中的哪个结有一个信念推断。对于非单结信息集,推断是在信息集中不同结点的一个概率分布;对于单结的信息集,参与者的推断就是到达此单一决策结的概率为1。
要求2:给定参与者的推断,参与者的策略必须满足序贯理性的要求。即在每一信息集中应该行动的参与者(以及参与者随后的策略),对于给定的该参与者在此信息集中的推断,以及其他参与者随后的策略(其中“随后的策略”是在达到给定的信息集之后,包括了其后可能发生的每一种情况的完全的行动计划)必须是最优反应(序贯理性)。

在图1中,要求l意味着如果博弈的进行达到参与者2的非单结信息集,则参与者2必须对具体到达哪一个结(也就是参与者l选择了L还是M)有一个推断。这样的推断就表示为到达两个结的概率\(p\)\(1-p\),见图3。

图3 图4

给定参与者2的信念推断,选择\(R^{'}\)的期望收益就等于\(p\times 0+(1-p)\times 1=1-p\),而选择\(L^{'}\)的期望收益等于\(p\times 1 +(1-p)\times 2=2-p\)。由于对任意的\(p\),都有\(1-p<2-p\),要求2就排除了2选择\(R^{'}\)的可能性,从而,在本例中简单要求每一参与者持有一个推断,并且在此推断下选择最优行动,就可以排除不合理的均衡\((R,R^{'})\)
要求1和2只保证了参与者持有推断,并对给定的推断选择最优行动,但并没有明确这些推断是否是理性的。为进一步约束参与者的推断,我们需要区分处于均衡路径上的信息集和不处于均衡路径上的信息集。为此,首先给出如下说明。

对于一个给定的扩展式博弈中的均衡,如果博弈根据均衡策略进行时将以正的概率达到某信息集,我们称此信息集处于均衡路径之上。反之,如果博弈根据均衡策略进行时,肯定不会达到某信息集,我们称之为不在均衡路径上的信息集。(其中“均衡”可以是纳什、子博弈完美、贝叶斯以及完美贝叶斯均衡)
要求3:在处于均衡路径之上的信息集中,推断由贝叶斯法则及参与者的均衡策略给出。

如在图3的子博弈完美纳什均衡\((L,L^{'})\)中,参与者2的信念推断一定是\(p=1\):给定参与者1的均衡策略(具体地说,L),参与者2知道已经到达了信息集中的哪一个结。作为要求3的另一种说明(假定性的),设想在图3中存在一个混合策略均衡,其中参与者1选择L的概率为\(q_1\),M的概率为\(q_2\),选择R的概率为\(1-q_1-q_2\)。要求3则强制性规定参与者2的推断必须为\(p=\frac{q_1}{q_1+q_2}\)
要求1到要求3包含了完美贝叶斯均衡的主要内容,这一均衡概念最为关键的新的特征要归功于克雷普斯和威尔逊(1982):在均衡的定义中,推断被提高到和策略同等重要的地位。正式地讲,一个均衡不再只是由每个参与者的一个策略所构成,还包括了两个参与者在该他行动的每一信息集中的一个推断。通过这种方式使参与者推断得以明确的好处在于,和前面我们强调参与者选择可信的策略一样,现在我们就可以强调参与者持有理性的推断,无论是处于均衡路径之上(要求3),还是处于均衡路径之外(后面的要求4)。
在简单的经济学应用中,包括信号博弈和空谈博弈——要求1到3不仅包括了完美贝叶斯博弈的主要思想,而且还构成了它的定义。不过,在更为复杂的经济学应用中,为剔除不合理的均衡,还需引入进一步的要求。不同的学者使用过不同的完美贝叶斯均衡定义,所有的定义都包括要求1到3,绝大多数同时包含了要求4;还有的引入了更进一步的要求。我们用要求1到4作为完美贝叶斯均衡的定义。

要求4:对不在均衡路径上的信息集,推断由贝叶斯法则以及可能情况下的参与者的均衡策略决定。

满足要求1到4的策略和推断构成博弈的完美贝叶斯均衡。对要求4再给出一个更为精确的表述,有助于我们理解 “可能情况下均衡策略”的含义。我们通过图4和图5中的三位参与者博弈来说明并理解要求4的必要性。此博弈有一个子博弈:它开始于参与者2的单结信息集。这一子博弈(参与者2和3之间的)唯一的纳什均衡为\((L,R^{'})\),于是整个博弈惟一的子博弈完美纳什均衡为\((D,L,R^{'})\)。这一组策略和参与者3的推断\(p=1\)满足了要求1到要求3,而且也简单地满足了要求4,因为没有不在这一均衡路径上的信息集,于是构成了一个完美贝叶斯均衡。
下面考虑策略\((A,L,L^{'})\)以及相应的推断\(p=0\)。这组策略是一个纳什均衡,没有参与者愿意单独偏离这一结果。这一组策略及推断也满足要求1到3,参与者3有一个推断并根据它选择最优行动。但是,这一纳什均衡却不是子博弈完美纳什均衡,因为博弈中仅有子博弈有唯一的纳什均衡为\((L,R^{'})\),这也说明要求1到3并不能保证参与者的策略是子博弈完美纳什均衡。为什么会出现这样的问题呢?问题在于参与者3的推断\(p=0\)与参与者2的策略L并不一致,但要求1到3并没有对3的推断进行任何限制,因为如果按给定的策略进行博弈将不会到达3的信息集。不过,要求4强制3的推断决定于参与者2的策略:如果2的策略为L,则3的推断必须为\(p=1\);如果2的策略为R,则3的推断必须为\(p=0\)。但是,如果3的推断为\(R\),则要求2又强制3的策略为\(R^{'}\),于是策略\((A,L,L^{'})\)及相应推断\(p=0\)不能满足要求1到4。根据定义,策略\((A,L,L^{'})\)以及相应的推断\(p=0\)不能构成完美贝叶斯均衡。要求4的作用,排除了一个一个不合理的纳什均衡与推断,尽管这组策略及推断满足要求1到3。
现在我们讨论几种均衡概念之间的关系。在纳什均衡中,每一参与者的策略必须是其他参与者策略的一个最优反应,于是没有参与者会选择严格劣策略。在完美贝叶斯均衡中,要求1和2事实上就是要保证没有参与者的策略是始于任何一个信息集的劣策略。纳什均衡及贝叶斯纳什均衡对不在均衡路径上的信息集则没有这方面的要求,即使是子博弈完美纳什均衡对某些不在均衡路径上的信息集也没有这方面的要求,例如那些不包含在任何子博弈内的信息集。完美贝叶斯均衡弥补了了这一缺陷:参与者不可以使用起始于任何信息集的严格劣策略,即使该信息集不在均衡路径上。我们引入子博弈完美纳什均衡概念剔除了那些包含不可置信威胁策略的纳什均衡。尽管子博弈完美纳什均衡不能直接应用于上述博弈,但子博弈完美均衡概念的逻辑是适用的。完美纳什均衡要求均衡策略不仅在整个博弈上构成纳什均衡,而且要求在每个子博弈上构成纳什均衡。仿照这一逻辑,如果我们将从每一个信息集开始的博弈的剩余部分称为一个“后续博弈”(continuation game)(不同于子博弈,因为子博弈必须开始于单结信息集,并且不能切割信息集),一个“合理”的均衡应满足序贯理性(sequentially rational,序贯博弈基于一个原则,即在博弈的每个阶段,需要选择行动的参与人,关于他的信息集中哪个结点是博弈当时真正处在的结点,有一个信念(即概率分布),以及给定任何他可能会选择的行动,博弈的展开将如何进行,有一个信念,给定这些信念,参与人选择能给他带来最高期望收益的行动。),对于每一个其所在的信息集(information set)都会选择能使其期望收益最大的策略,即满足如下要求:给定每一个参与人有关其他参与人类型的后验信念参与人的策略组合在每一个后续博弈上构成贝叶斯均衡

完美贝叶斯纳什均衡(perfect Bayesian equilibrium)是贝叶斯均衡子博弈完美均衡贝叶斯推断结合。它要求:
(1)在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);
(2)给定该信息集上的概率分布和其他参与人的后续策略,参与人的行动必须是最优的;
(3)每一个参与人根据贝叶斯法则和均衡策略修正后验概率。
后续策略(subsequent strategy):是从给定信息集开始的后续博弈上的完备的行动规则。

2.1 贝叶斯法则

理解贝叶斯法则对理解完美贝叶斯纳什均衡概念是至关重要的。在给出完美贝叶斯纳什均衡的正式定义之前,我们先来解释一下贝叶斯法则。
在日常生活中,当面临不确定性时,在任何一个时点上,我们对某件事情发生的可能性有一个判断。然后,我们会根据新的信息来修正这个判断。统计学上,修正之前的判断称为“先验概率”(prior probability),修正之后的判断称为“后验概率”(posterior probability)。贝叶斯法则正是人们根据新的信息从先验概率得到后验概率的基本方法。
让我们以不完全信息博弈为例说明贝叶斯法则。如通常一样,我们假定参与人的类型是独立分布的。假定参与人\(i\)\(K\)个可能的类型,有\(H\)个可能的行动。我们用\(\theta^k\)\(a^h\) 分别代表一个特定的类型和一个特定的行动(因为我们现在只考虑一个参与人,所以省略了下标\(i\))。假定 \(i\)属于类型\(\theta^k\)的先验概率是

\[p(\theta^k)\geq 0,\quad \sum\limits_{k=1}^Kp(\theta^k)=1 \]

给定 \(i\)属于 \(\theta^k\), \(i\)选择\(a^h\)的条件概率为

\[p(a^h|\theta^k),\quad \sum_hp(a^h|\theta^k)=1 \]

那么\(i\)选择\(a^h\)的边缘概率是:

\[Prob\{a^h\}=p(a^h|\theta^1)p(\theta^1)+\cdots+p(a^h|\theta^K)p(\theta^K)=\sum\limits_{k=1}^Kp(a^h|\theta^k)p(\theta^k) \]

即参与人\(i\)选择行动\(a^h\)的“总”概率是每一种类型的\(i\)选择\(a^h\)的条件概率 \(p(a^h|\theta^k)\)的加权平均,权数是他属于每种类型的先验概率\(p(\theta^k)\)

2.2 完美贝叶斯纳什均衡

现在来给出完美贝叶斯纳什均衡概念的正式定义。假定有 \(n\) 个参与人,参与人 \(i\) 的类型是 \(\theta_i \in \Theta_i\)\(\theta_i\) 是私人信息, \(p_i\left(\theta_{-i} \mid \theta_i\right)\) 是属于类型 \(\theta_i\) 的参与人 \(i\) 认为其他 \(n-1\) 个参与人属于类型 \(\theta_{-i}=\left(\theta_1, \cdots, \theta_{i-1}, \theta_{i+1}, \cdots, \theta_n\right)\) 的先验概率。令 \(S_i\)\(i\) 的策略空间, \(s_i \in S_i\) 是一个特定的策略 (依赖于类型 \(\left.\theta_i\right), a_{-i}^h=\left(a_1^h, \cdots, a_{i-1}^h, a_{i+1}^h, \cdots, a_n^h\right)\) 是在第 \(h\) 个信息集上参与人 \(i\) 观测到的其他 \(n-1\) 个参与人的行动组和,它是策略组合
\(s_{-i}=\left(s_1, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n\right)\) 的一部分(即 \(s_{-i}\) 规定的行动), \(\widetilde{P}_i\left(\theta_{-i} \mid a_{-i}^h\right)\) 是在观测到 \(a_{-i}^h\) 的情况下参与人 \(i\) 认为其他 \(n-1\) 个参与人属于类型
\(\theta_{-i}=\left(\theta_1, \cdots, \theta_{i-1}, \theta_{i+}, \cdots, \theta_n\right)\) 的后验概率, \(\tilde{p}_i\) 是所有后验概率 \(\tilde{p}_i\left(\theta_{-i} \mid a_{-i}^h\right)\) 的集合 (即 \(\tilde{p}_i\) 包括了参与人 \(i\) 在每一个信息集 \(h\) 上的后验概率), \(u_i\left(s_i, s_{-i}, \theta_i\right)\)\(i\) 的效用函数。 那么,完美贝叶斯纳什均衡可以定义如下:

完美贝叶斯纳什均衡是一个策略组合 \(s^*(\theta)=\left(s_1^*\left(\theta_1\right), \cdots, s_n^*\left(\theta_n\right)\right)\) 和一个后验概率组合 \(\tilde{p}=\left(\tilde{p}_1, \cdots, \tilde{p}_n\right)\) ,满足:
(P) 对于所有的参与人 \(i\) ,在每一个信息集 \(h\)

\[s_i^*\left(s_{-i}, \theta_i\right) \in \arg \max _{s_i} \sum_{\theta_{-i}} \tilde{p}_i\left(\theta_{-i} \mid a_{-i}^h\right) u_i\left(s_i, s_{-i}, \theta_i\right) \text { ; } \]

(B) \(\tilde{p}_i\left(\theta_{-i} \mid a_{-i}^h\right)\) 是使用贝叶斯法则从先验概率 \(p_i\left(\theta_{-i} \mid a_{-i}^h\right)\) ,观测到的 \(a_{-i}^h\) 和最优策略 \(s_{-i}^*(\cdot)\) 得到(在可能的情况下)。

三、完美贝叶斯纳什均衡示例

例1:性别之战博弈
试问:① 识别博弈树中的所有子博弈。② 解出所有子博弈完美均衡。

:① 有两个子博弈:一个是整个博弈,一个是外出(Go out)之后的历史(点1以下的部分)。
② 考虑第二个子博弈。可以列出:

b o
B 3;1 0;0
O 0;0 1;3

可知包含三个纳什均衡:(B; b)、(O; o)、((3/4; 1/4); (1/4; 3/4))。

(B; b):玩家1外出得到3,而在家得到2。因此((Go Out;B); b)为一个子博弈完美均衡
(O; o):玩家1外出得到1,而在家得到2。因此((Home;O); o)为一个子博弈完美均衡
((3/4; 1/4); (1/4; 3/4)):在混合策略纳什均衡中,玩家1的收益是3/4(这可以通过\(3q\)得到,其中\(q\)是玩家2选择b的概率)。因此,如果在子博弈中执行混合策略纳什均衡,玩家1外出获得3/4,在家得2,宁愿在家。因此存在子博弈完美均衡,玩家1在第一个信息集中选择“Home”,在第二个信息集中3/4的概率选B,1/4的概率选O;而玩家2选择b的概率是1/4,选择o的概率是3/4。

例2:市场整合博弈。
一家大公司(玩家1)一直是零件市场的垄断者,而有一家小公司(玩家2)正在研究一种新的零件生产技术,博弈结构见图5。大公司不知道这个研究是否成功,但估计研究将以\(p\)的概率失败,其中\(0<p<1\)。在了解研究结果之前,大公司必须决定,是应该收购小公司(行动A),还是发起大型广告宣传阻碍小公司进入市场(行动D)。如果大公司收购,小公司一定会接受,博弈结束。如果大公司阻碍小公司进入市场,小公司可以选择退出(行动O/o)或进入市场(行动E/e)。博弈树如下所示。问:① 识别所有子博弈。② 在子博弈完美均衡中,玩家2在每个决策节点上会怎么做?③ 在子博弈完美均衡中,要使玩家1愿意选则A,\(p\)的取值范围是多少?

图5 图6

:① 共有三个子博弈。整个博弈、两个玩家2的决策结点下形成的两个小博弈。② 在任何子博弈完美均衡中,玩家2在每个决策节点上选择最优行动,在(fail;D)之后选O,在(success;D)之后选o。③ 给定玩家2在子博弈中的选择,玩家1的决策树中就去掉了玩家2的E和e路径,见图6。在给定\(p\)的情况下,玩家1的期望收益为:

\[u_1(A; p) =-p + 3(1-p);\quad u_1(D; p) = 2 \]

因此,玩家1愿意在子博弈完美均衡中选择A,当且仅当\(-p + 3(1-p)≥2\),即\(p≤0.25\)

例3:给出下面博弈的完美贝叶斯纳什均衡。
博弈树见图7,数字1、2、3表示三个玩家的序号。

图7 图8

:找出最深的子博弈:右下角这个“1”点的位置(在ln、R、D的结点之后)。找出该子博弈的所有纳什均衡:玩家1的唯一均衡为采取行动\(t\)
对于每个均衡收益向量,用该收益替换子博弈,得到一个更小的博弈,并解出这个更小的博弈。对每一个均衡收益向量重复这个过程。继续分析。将收益向量(2 2 2)粘贴到子博弈中就得到了下面博弈(图8):
现在最深的子博弈是ln之后的结点。把结点2以上的部分裁掉,就成为3人子博弈。每个玩家只有一个信息集和两个行动,仍然可以用收益矩阵来表示:

L R L R
T 4; 4; 4 0;0;0 T 4; 4; 4 2; 2; 2
B 0; 0; 0 1; 1; 1 B 0; 0; 0 2; 2; 2
U D

我们可进一步归结为:
当均衡为\((T; L; (r ; 1-r )); 0 ≤ r ≤ 1\)时,收益为4,4,4
当均衡为\(((p; 1- p); R;D); 0 ≤ p ≤ 1/2\)时,收益为2,2,2
可以把这些收益都粘贴到子博弈中然后解出大博弈,见下图。

图3

左:将(4 4 4)粘到结点2,玩家1选择In。对\(r∈[0,1]\),所标记的行为策略组合都是完美贝叶斯纳什均衡;
右:将(2 2 2)粘到结点2,玩家1选择Out。对\(p∈[0,1/2]\),所标记的行为策略组合都是完美贝叶斯纳什均衡;
这些就是所有的完美贝叶斯纳什均衡。

例4:劳动力招聘
假设工人按能力标准分析在[0,1] 区间。一般来说、高学历工人的劳动生产率高,低学历工人的劳动生产率也低。因此,假设工人素质与劳动生产率的关系可以用下图表示。图中横轴反映工人学历,从左至右对应于一个学历从高到低的工人。设图中 PP′代表各种学历工人对应的劳动生产率,劳动生产率与工人学历之间呈线性函数关系。

工人的学历和相应的劳动生产率如上图所示。如果企业不运用任何信号机制,随机选择工人,那么所招工人的平均期望学历是0.5,平均期望劳动生产率为$ b$,都属于平均水平。企业通常会运用信号机制,如对应聘者提学历要求或进行招工考试。设工人满足学历要求和通过考试的成本与工人的素质负相关,即成本是素质的线性减函数,如下图中的曲线 cc′所示。

假设到该企业工作的收益是\(d\),那么发出信号的成本低于\(d\)的工人,也就是素质高于\(e\)的人给企业发信号是合算的,有发信号的愿望,而素质低于\(e\)的人发信号的成本高于发信号的收益,因此没有发信号的意义。于是,企业最后录取的都是发出信号的高素质工人,这样企业通过采取上述学历要求作为筛选机制,就将素质低的人自然而然地排除掉,录用的工人的平均期望素质能够达到\(\frac{e+1}{2}\),工人的平均期望劳动生产率为\(a(a>b)\)

参考文献

  1. 不完全信息动态博弈--空口声明博弈
  2. 4 不完全信息动态博弈
  3. 不完全信息动态博弈--信号博弈
  4. 博弈论07:不完全信息扩展式博弈