完美体育

咨询热线

400-123-4657

Classification

完美动态

400-123-4657
传真:+86-123-4567
手机:13800000000
邮箱:admin@gzcanna.com
地址:广东省广州市天河区88号
当前位置: 完美体育 > 完美动态

完全完美信息动完美体育态博弈(精品)

发布时间:2022-10-13 01:11:38 丨 浏览次数:503

  完全完美信息动态博弈(精品),完全但不完美动态博弈,不完美信息动态博弈,完美信息动态博弈,不完全信息动态博弈,完全信息动态博弈,完全信息动态博弈案例,完全信息动态博弈模型,不完全信息的动态博弈,子博弈完美纳什均衡

  第四讲完全且完美信息动态博弈生活中许多经济行为的决策活动是以此选择行为而不是同时行动,比如商业中的讨价还价、拍卖中的轮流竞价等等。本章介绍动态博弈。我们仍集中分析完全信息的博弈即即参与者的收益函数是共同知识的博弈参与者的收益函数是共同知识的博弈。。完全且完美信息的动态博弈完全且完美信息的动态博弈:指在博弈进行的每一步当中,要选择行动的参与者都知道这一步之前博弈进行的整个过完全但不完美信息博弈完全但不完美信息博弈:在博弈的某些阶段,要选择行动的参与人并不知道在这一步之前博弈进行的整个过程。简单类型的完全且完美信息动态博弈的模式简单类型的完全且完美信息动态博弈的模式3每一可能的行动组合下参与者的收益都是共同知识。411阶段和扩展性表示阶段:阶段:动态博弈中一个博弈方的一次选择行为。不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒41动态博弈的表示法和特412动态博弈的基本特点策略策略是在整个博弈中所有选择、行为的计划,不能分割。结果结果是上述“计划型”策略的策略组合,构成一条路径得益得益对应每条路径,而不是对应每步选择、行为动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利,有“先行优势”。静态博弈的分析方法在动态博弈中能应用吗?答案是否定的,简单纳什均衡在动态分析中的实效,原因在于多阶段中参与者策略的可信性值得怀疑。作为不可置信的威胁的一个例子:第一,参与者1选择支付1000美元钱给参与者2还是一分不给;第二,参与者2观察参与者1的选择,然后决定是否引爆一颗手雷把两人一块儿炸死。假设参与者2威胁参与者1,如果他不付1000美元就引爆手雷,如果参与者1相信这一威胁,他的最优反应是支付1000美元。但参与者1却不会对这一威胁信以为真,因为它不可置信;如果给参与者2一个机会,让他把威胁付诸实施,参与者2也不会选择去实施它,这样参与者1就会一分不付。42可信性和纳什均衡的问题动态博弈中各个博弈方的策略是自己设定的,在各个博弈阶段,针对实际情况可以进行随机的选择,这称为“相机选择”。相机选择的存在使得博弈方的策略的可信性值得怀疑,也就是说博弈方是否会真正始终按照自己策略所设定的方案行为还是临时改变主意?在这个例子中,对乙来说,对乙来说,甲的分钱许诺是不可信的。甲的分钱许诺是不可信的。关键是对甲的行为有所约束。421相机选择和策略中的可信性问题(0,4)(2,2)(1,0)不借不分开金矿博弈不同版本的开金矿博弈——分钱和打官司的可信性不借(1,0)不打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信(2,2)不分(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈——分钱打官司都不可信第一个图中,通过法律手段使乙的利益得到保障,这样乙的完整策略:“第一阶段借,如果第二阶段甲不分完美体育,第三阶段打官司。”甲的完整策略是:“第二阶段分。”这是这个3阶段动态博弈的解。但是第二个图中,乙的利益在法律的情况下仍然得不到保障,可以看出法律在社会中的重要性。422纳什均衡的问题第三种开金矿博弈中,(不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题423逆推归纳法定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方(0,4)(2,2)当在博弈的第二阶段参与者2行动时,由于其前参与者1已选择行动a,他面临的决策间题可用下式表示:假定对A表示,这就是参与者2对参与者1的行动的反应或最优反应。由于参与者1能够和参与者2一样解出2的问题,参与者1可以预测到参与者2对1每一个可能的行动a所作出的反应,这样1在第一阶段要解决的问题可以归结为:我们称是这一博弈的逆向归纳解。逆向归纳解不含有不可置信的威胁:参与者1预测参与者2将对1可能选择的任何行动a由于动态博弈中纳什均衡是不可靠的,不具备稳定性,因此要发展能排除不可信行为的新的均衡概念。赛尔腾(1965)提出了子博弈完美纳什均衡(SubgamePerfectNashEquilibrium的概念。要介绍子博弈完美纳什均衡,必须先了解子博弈的概念。43子博弈和子博弈完美纳什均衡331子博弈定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。首先子博弈不能包含原博弈的第一个阶段,这意味着动态博弈本身不会是他自己的子博弈。其次子博弈必须有一个明确的信息集,不能分割任何信息集,在多节点信息集合的不完美信息集中有可能不存在子博弈。(1,0)(0,4)(2,2)(-1,0)332子博弈完美纳什均衡定义:如果一个完美信息的动态博弈中,各博弈方的策如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个为该动态博弈的一个““子博弈完美纳什均衡子博弈完美纳什均衡””。。子博弈完美纳什均衡本身也是纳什均衡,不过它是比纳什均衡更强的解。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。子博弈是倒着看的,从最小的子博弈开始我们就找稳定策略组合,直至最开始的节点,那么当然是稳定的了。大家会发展这正是逆推归纳法。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。我们将定义子博弈完美纳什均衡为:只有不包含不可置信的只有不包含不可置信的威胁的纳什均衡才是子博弈完美纳什均衡。威胁的纳什均衡才是子博弈完美纳什均衡。一个完全且完美信息动态博弈可能会有多个均衡,但惟一的子博弈完美纳什均衡就是与逆向归纳解相对应的均衡。正如我们在前面所观察到的,有些博弈会有多个纳什均衡,但有一个均衡明显占优,成为博弈的解。比如,上例分钱博弈中,双方的策略组合“乙第一阶段选择‘借’,第二阶段选择‘打’;甲第二阶段选择’分”’虽然是整个博弈的一个纳什均衡,但这个策略组合中乙的策略要求乙在第三阶段单人博弈构成的子博弈中选择的“打”不是该子博弃的一个纳了卜均衡,因此根据子博弈完美纳什均衡的定义判断,这个策略组合不是子博弈完美纳什均衡。这也是上述纳什均衡策略组合不稳定的根源。 策略组合“乙在第一阶段选择‘不借’、如果有第三阶段选择则选择不打;甲如果有第二阶段选择选‘不分”’,则是了 博弈完美纳什均衡,因为该策略组合的双方策略不但在整个 博弈中构成纳什均衡,而且在两级子博弈中也都构成纳什均 值得注意的是,当两个博弈方按照上述子博弈完美纳什均衡策略组合行为时,实际上不会进行到博弈的第二、第三阶段完美体育, 两个博弈方在第二、二阶段的行为实际上不会发生。我们称 此时第二阶段甲的选择点和第三阶段乙的选择点为“不在均 “不在均 衡路径上” 衡路径上”的,两博弈方的策略在这两个节点的选择称为 “不在均衡路径上的选择”。我们必须强调,子博弈完关纳 什均衡必须对博弈方在所有选择节点处的选择都作出规定, 包括最终不在均衡路径土几的节点,不管是在均衡路径上的 选择还是不在均衡路径。 我们用博弈树表示一个动态博弈,树上每一枝的末端都有两个收益值,上面代表参与者1的收益,下面代表参与者2的收 益。考虑下面的三步博弈,其中参与者1有两次行动: 433 逆向归纳法背后的理 性假设 为计算出这一博弈的逆向归纳解,我们从第三阶段即参与者1的第二次行动开始。这里参与者1面临的选择是L 那么在第二阶段,参与者2预测到一旦博弈进入到第三阶段,则参与者1会选择L ,这会使2的收益为0,从而参与者2在第二阶段的选择为:L‘可得收益1, R“可得收益0,于是 L‘是最优的。 这样在第一阶段,参与者1预测到如果博弈进入到第二阶段,2将选择L’,使参与者1的收益为1,从而参与者1在第一阶 段的选择是:L收益为2, R收益为1,于是L是最优的。 上述的求解过程求出:参与者1在第一阶段的最优选择是L,从而博弈结束。 但是即使逆向归纳预测博弈将在第一阶段结束,我们论证过程的重要部分却是考虑如果博弈不在第一阶段结束时可能发 生的情况。 比如在第二阶段,当参与者2预测如果博弈进入第三阶段,则1会选择L’’,这时2假定1是理性的。由于只有在1偏离了博 弈的逆向归纳解,才能轮得到2选择行动,而这时2对1的理 性假定便看似是矛盾的,即如果1在第一阶段选择了R,那么 第二阶段2就不能再假定1是理性的了。但这种理解是不对的。 如果1在第一阶段选择了R,则两个参与者都是理性的就不可能是共同知识,但这时1仍有理由在第一阶段选择R,却不与 2对1的理性假定相矛盾。 一种可能是“参与者1是理性的”是共同知识,但“参与者2是理性的”却不是共同知识:如果1认为2可能不是理性的, 则1就可能在第一阶段选择R,希望2在第二阶段选择R’,从 而给1以机会在第三阶段选择L‘‘。另一种可能是“参与者2是 理性的”是共同知识,但“参与者1是理性的”却不是共同 知识:如果1是理性的,但推测2可能认为1是非理性的。 这时1也可能在第一阶段选择R,希望2会认为1是非理性的而在第二阶段选择R’,期望1能在第三阶段选择R’’。逆向归 纳中关于1在第一阶段选择R的假定可通过上面的情况得到解 释。不过在有些博弈中,对1选择了R的更为合理的假定是1 确实是非理性的。 在这样的博弈中,逆向归纳在预测博弈进行方面就会失去其在这样的博弈中,逆向归纳在预测博弈进行方面就会失去其 大部分作用,正像在博弈论不能提供惟一解并不能达成协议 大部分作用,正像在博弈论不能提供惟一解并不能达成协议 的博弈中,纳什均衡也对预测博弈的结果所助无几。 的博弈中,纳什均衡也对预测博弈的结果所助无几。 44 四个经典的动态博 弈例子 斯塔克尔贝里1934提出一个双头垄断的动态模型,其中一个支配企业领导者首先行动,然后从属企业追随者 行。比如在美国汽车产业发展史中的某些阶段,通用汽车 就扮演过这种领导者的角色这一例子把模型直接扩展到 允许不止一个追随企业,如福特、克莱斯勒等等。根据 斯塔克尔贝里的假定,模型中的企业选择其产量,这一点 和古诺模型是一致的只不过古诺模型中企业是同时行动 的,不同于这里的序贯行动。 时的市场出清价格,c是生产的边际成本,为一常数固定成本为0。 为解出这一博弈的逆向归纳解,我们首先计算企业2对企业1任意产量的最优反应,R 是企业2对假定的企业1的产量的最优反应,且企业1的产量选择是和企业2同时作出的。 由于企业1也能够像企业2一样解出企业2的最优反应,企业1就可以预测到他如选择q 选择产量。那么在博弈的第一阶段,企业1的问题就可表示为: 回顾在古诺博弈的纳什均衡中,每一企业的产量为a一c3,也就是说,斯塔克尔贝里博弈中逆向归纳解的总产量3a- c4,比古诺博弈中纳什均衡的总产量2a-c3要高,从而斯 塔克尔贝里博弈相应的市场出清价格就比较低。不过在斯塔 克尔贝里博弈中,企业1完全可以选择古诺均衡产量a一 ,这时企业2的最优反应同样是古诺均衡的产量,也就是说在斯塔克尔贝里博弈中,企业1完全可以使利润水平达 到古诺均衡的水平,而却选择了其他产量, 那么企业1在斯塔克尔贝里博弈中的利润一定高于其在古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清价格降低 了,从而总利润水平也会下降,那么和古诺博弈的结果相比, 在斯塔克尔贝里博弈中,企业1利润的增加必定意味着企业2 福利的恶化。 和古诺博弈相比,斯塔克尔贝里博弈中企业2利润水平的降低,揭示了单人决策问题和多人决策间题的一个重要不同之 处。在单人决策理论中,占有更多的信息决不会对决策制定 者带来不利,然而在博弈论中,了解更多的信息或更为精 确地说,是让其他参加者知道一个人掌握更多的信息却可 以让一个参与者受损。 •斯塔科尔贝里博弈中信息进一步的探讨 在斯塔克尔贝里博弈中,存在问题的信息是企业的产量:企业2知道q 看清楚这一信息的影响,我们把上面序贯行动的博弈稍作修改,假设企业1先选择q ,但事前并没有观测到q ,如果企业2确信企业1选择了它的斯塔克尔贝里产量a-c2,则企业2的最优反应仍是R 但是,如果企业1预测到企业2将持有这一推断并选择这一产量,企业1就会倾向于它对a-c4的最优反应----即3a- c8—而不愿去选择斯塔克尔贝里产量a-c2,那么企业2 就不会相信企业1选择了斯塔克尔贝里产量。从而这一修 改过的序贯行动博弈的惟一纳什均衡,对两个企业都是选 择产量a-c3----这正是古诺博弈中的纳什均衡,其中企 业是同时行动的。 2里昂惕夫的工会模型 在里昂惕夫1946模型中,讨论了一个企业和一个垄断的工会组织即作为企业劳动力惟一供给者的工会组织的相 互关系:工会对工资水平说一不二,但企业却可以自主决 定就业人数在更符合现实情况的模型中,企业和工会间 就工资水平讨价还价,但企业仍自主决定就业,得到的定 性结果与本模型相似。工会的效用函数为UW, L,其中 W为工会向企业开出的工资水平,L为就业人数。 假定UW,L是W和L的增函数。企业的利润函数 ,其中RL为企业雇佣L名工人可以取 得的收入在最优的生产和产品市场决策下,假定R L的具体的表达式,从而无法明确解出该博弈的逆向归纳解完美体育,但我们仍可以就解的主要特征 进行讨论。 首先,对工会在第一阶段任意一个工资水平w,我们能够分析在第二阶段企业最优反应L*W的特征。给定w,企业选择 L*W满足下式: 下面的图把L*w表示为w的函数但坐标轴经过旋转以便于 和以后的数据相比较,并表示出它和企业每条等利润线交 于其最高点。若令L保持不变, L保持不变,w降低时企业的利润就会提高,于是较低的等利润曲线代表了较高的利润水平。 这张图描述了工会的无差异曲线,若令L不变,当w提高时工会的福利就会增加。于是较高的无差异曲线代表了工 会较高的效用水平。 下面我们分析工会在第一阶段的问题,由于工会和企业同样可以解出企业在第二阶段的问题,工会就可预测到如果它要 求的工资水平为w 表现在图中的无差异曲线上就是,工会希望选择一个工资水平w,由此得到的结果w,L*w处于可能达到的最高的无 差异线上。这一最优化间题的解为w*,这样一个工资要求将 使得工会通过w*,L*w*的无差异曲线;相切于该点, 如图所示。从而w*,L*w*就是这一工资与就业博弈的逆 向归纳解。 更进一步我们还可以看出,w‘*,L*w*是低效率的,在上图中,如果w和L处于图中阴影部分以内,企业和工会的效 用水平都会提高。这种低效率对实践中企业对雇佣工人数 量保持的绝对控制权提出了质疑。允许工人和企业就工资 相互讨价还价,但企业仍对雇佣工人数量绝对控制,也会 得到相似的低效率解。 nosa&Rhee,1989 基于如下事实为这 一质疑提供了一个解释:企业和工会之间经常会进行定期或 不定期的重复谈判在美国经常是每三年一次,在这样的重 复博弈中,可能会存在一个均衡,使得工会的选择w和企业 的选择L都在图所示的阴影部分以内,即使在每一次性谈判 中,这样的w和L都不是逆向归纳解。 参与人1和2就一美元的分配进行谈判。他们轮流提出方案:首先参与人1提出一个分配建议,参与人2可以接受或拒绝; 如果参与人2拒绝,就由参与人2提出分配建议,参与人1选 择接受或拒绝;如此一直进行下去。一个条件一旦被拒绝, 它就不再有任何约束力,并和博弈下面的进行不再相关。每 一个条件都代表一个阶段,参与人都没有足够的耐心:他们 对后面阶段得到的收益进行贴现,每一阶段的贴现因子为 。参与人2或者接受这一条件这种情况下,博弈结束,参与人1的收益为s ,参与人2的收益为1-s ,都可立刻拿到;或者拒绝这一条件这种情况下,博弈将继续进行,进入第二阶段。 3序贯谈判 ;参与人1或者接受条件这种情况下,博弈结束,参与人1的收益s 都可立即拿到,或者拒绝这一条件,这种情况下,博弈继续进行,进入第三阶段。 (3)在第三阶段的开始,参与人1得到1美元的s,参与人2得到1-s。 在这样的三阶段博弈中,第三阶段的解决方案s,1-s是外 生给定的。在我们后面将考虑的无限期模型中,第三阶段的 收益、将表示如果博弈进行到第三阶段即如果前面两个提 议都被拒绝的线在其后进行的博弈中可得到的收 为解出此三阶段博弈的逆向归纳解,首先需要计算如果博弈进行到第二阶段,参与人2可能提出的最优条件。参与人1 拒绝参与人2在这一阶段的条件s ,可以在第三阶段得到s,只有在满足: ,2在第二阶段面临着在:通过向参 与人1提出条件,给他 之间进行选择,很明显她将选择前者。也就是说,于是参与人2在第二阶段可 以提出的最优条件是: 由于参与人1可以和参与人2同样地解出参与人2在第二阶段的决策问题,参与人1也就知道参与人2通过拒绝参与人1的 条件,在第二阶段可以得到1-S 。从而参与人1在第一阶段的决策问题就可归于在本阶段收入 通过向参与人2提出条 之间作出选择。由于:明显小于前者,所以参与人1在第一阶段提出的最优条件 这样,在此三阶段博弈的逆向归纳解中,参与人1向参与人2提出分配方案(S 经济生活中有大量的委托代理问题:有合同关系的显性委托和没有合同但是有明确委托关系的隐性委托。 所以如何使得代理人的行为符合委托人的利益是委托代理理论的重要课题。 问题的核心在于委托合同的设计问题,因此也被称为“激励机制设计”或者“机制设计”。更进一步的实际上是薪 酬工资制度的选择。 无不确定性的委托人—代理人模型 偷懒努力 拒绝 接受 不委托 委托 无不确定性是指代理人的产 出是努力程度的确定函数。 代理人的选择 激励相容约束: wS+E-S其经济含义是只有代理人努 力工作的报酬到达偷懒的时 候的基本报酬,还有至少一 个不低于能补偿努力和偷懒 的负效用的增加额才可以。 参与约束: 拒绝接受 拒绝 接受 接受:wE-E0接受:wS-S0 参与约束 不委托委托 委托 数值例子[12, [0,0][0,0] 偷懒努力 拒绝 接受 不委托 委托 [7,1] [0,0][0,0] [10-wS, 不委托高产 01 低产 09 低产 01 高产 09 努力 偷懒 接受 拒绝 委托 偷懒: 委托: 01*[20-wS] +09*[10-wS]0 不委托: 01*[20-wS] +09*[10-wS]0 努力 委托: 09*[20-wE]+01*[10-wE]0 不委托: 09*[20-wE]+01*[10-wE]0 因为可监督,因此代理人报酬与成 果无关,只与努力情况有关。不确 定性风险由委托人承担。代理人选 择同无不确定性情况。 有不确定性且不可监督的委托人—代理人博弈 [0,0][0,0] [10-wS, w10-S] [20-w20, w20-S] [10-w10, w10-E] [20-w20, w20-E] 不委托 高产 01 低产 09 低产 01 高产 09 努力 偷懒 接受 拒绝 委托 只能根据成果付酬,w是成果函数,而非努力程度函数。不确定性对 代理人利益、选择有影响。 努力: 09*[w20-E]+01*[w10-E] 01*[w20-S]+09*[w10-S] 接受: 09*[w20-E]+01*[w10-E]0 委托: 09*[20-w20]+01*[10-w10]0 激励相容约束 促使代理人努力的激励相容约束、参与约束,以及 委托人选择委托的条件 参与约束 对于委托人来说,就是要根据上 述两个条件,以及E、S的值,选 择最佳的工资水平w20和w10, 或者它们的差额w20 -w10 委托人委托条件 选择报酬和连续努力水平的委托人— 代理人博弈 模型的条件描述: 努力成果不确定而且不可监督,而且委托人可以选择 报酬函数、代理人在连续区间选择努力水平e的委托- 代理模型。代理人的机会成本U,努力有负效用是单调 递增的凸函数C=Ce。 代理人的产出是e的随机函数Re; W=wR,委托人只能看到产出R,不能知道努力e,所以 只能跟根据产出R设计薪酬制度。 这样,委托人的利润:R-W=Re-w[Re] 代理人的利润:w-c= 不一定是代理人根据自身利益最大化作出的选择,也就是同时e 就意味着两者的利益完全一致,代理人的行为就符合委托人的利益最大话。委托人按照参与约束和激励相容条件设 计报酬函数,就可以达到均衡状态。 委托人希望的代理人努力水平(满足参与约束) 激励相容约束:参与约束: 一个委托代理的例子:店主和店员的问 是均值为0的随机变量店员的负效用 ,是店员的努力程度; 机会成本为1。 店主采用的报酬计算公式 店员的得益 店员期望得益为 店主的得益为 现在的问题是:店主需要确定AB的水平,以使这种工资制度成为一种有效的激励! 参与约束: 当店员风险中性时 符合其最大利益,店主选择下限 店员的期望得益为: 这意味着店员的努力程度是提成比例的正函数。下面看店主: 店主所给出的工资应该是店员参与约束下限: 代入得益公式得: ,期望得 ,易求得 则店主的最优激励工资计算公式是实际上是一种承包或者租赁经营制! 现在我们对前一节所讨论的博弈类型加以丰富。和在完全且完美信息动态博弈中相同,我们继续假定博弈的进行分 为一系列的阶段,下一阶段开始前参与者可观察到前面所 有阶段的行动。与上节分析的不同之处在于,本节我们每 一阶段中存在着同时行动。将看到,这种阶段内的同时行 动意味着本节分析的博弈包含了不完美信息。此类博弈和 前一节所讨论的博弈又有着很多共同特性。 这种模型又被称为“有同时选择的动态博弈模型”“有同时选择的动态博弈模型” 我们将分析以下类型的简单博弈,并称其为完全非完美信息两阶段博弈: 许多经济学问题都符合以上的特点,包括对银行的挤提、关税和国际市场的不完全竞争以及工作竞赛如一个企业中, 几个副总裁为下一任总裁而竞争。 这种博弈的求解仍然是逆推归纳法为主的求解方法,核心仍然是子博弈完美纳什均衡。但由于在某阶段同时选择策略, 所以不是阶段性的单人最优化问题,而是一个静态博弈问题。 还有很多经济问题可通过把以上条件稍加改动而建立模型,比如增加参与者人数或者允许同一参与者在一个以上的阶 段多次选择行动。也可以允许少于四个的参与者:在一些应 用中,参与者3和4就是参与者1和2。 我们解决此类问题使用的方法,仍沿用了逆向归纳的思路,但这里从博弈的最后阶段逆向推导的第一步就包含了求解一 个线;给定第一阶段结果时,参与者3和4在第二阶 段同时行动的博弈,而不再是前一节求解单人最优化的决 策问题。为使问题简化,本节中我们假设对第一阶段博弈每 一个可能结果a ,其后参与者3和4之间的第二阶段博弈有惟一的纳什均衡,表示为 如果参与人1和2预测到参与人3和4在第二阶段的行动将由给出 ,则参与人1和2在第一阶段的 问题就可用以下的同时行动博弈表示: 2收益情况为:假定a* )为这一两阶段博弈的子博弈完美解。此解与完全且完美博弈中的逆向归纳解在 性质上是一致的。 如果参与者3和4威胁在后面的第二阶段博弈中,他们将不选择纳什均衡下的行动,参与人1和2是不会相信的,因为当博 弈确实进行到第二阶段时,参与人3和4中至少有一个人不愿 把威胁变为现实恰好是因为它不是第二阶段博弈的纳什均 两个投资者每人存入银行一笔存款D,银行已将这些存款投入一个长期项目。如果在该项目到期前银行被迫对投资 者变现,共可收回2r,这里DrD2。不过,如果银行允 许投资项目到期,则项目共可取得2R完美动态,这里RD。有两 个时间,投资者可以从银行提款:在银行的投资项目到期 之前或者在到期之后。为使分析简化,假设不存在贴现。 从日期2开始先考虑日期2的标准式博弈,由于明显的RD,也就是说2R-DR。我们可以得到这个博弈的纳什均衡(R,R)。 由于rD并且由此可得2r-Dr,这一由两阶段博弈变形得到 的单阶段博弈存在两个纯战略纳什均衡:1两个投资者都提款, 最终收益情况为r 两个投资者都不提款,最终收益为R,R。从而,最初的两阶段银行挤提博弈就有2个子博弈完 前一种结果可以解释为对银行的一次挤提。如果投资者1相信投资者2将在日期1提款、则投资者1的最优反应也是去提 款,即使他们等到日期2再去提款的话两人的福利都会提高。 这里的银行挤提博弈在一个很重要的方面不同于第1章中讨论的囚徒困境:虽然两个博弈都存在一个对整个社会是低效率 的纳什均衡;但在囚徒困境中这一均衡是惟一的并且是参与 者的严格占优战略,而在这里还同时存在另一个有效率的 均衡。从而,这一模型并不能预侧何时会发生对银行的挤提, 但的确显示出挤提会作为一个均衡结果而出现。 模型假设:1雇员ii=1,2的产出函数为 为雇员努力水平,为随机扰动。 服从分布密度 ,均值为0的随机变量。 雇员努力的负效用函数为 2产量高的雇员得到高工资,产量低的得到低工资 雇员选择雇主决定了工资以后,雇员同时决定努力程度: 一阶条件 这是雇员所选择努力程度必须满足的基本条件。 maxmax 利用条件概率的贝叶斯法则:代入得: 两雇员情况一样,对努力程度的选择也相同,即: ,这样 就得到: 这就是两雇员之间的静态博弈纳什均衡。 若进一步假设 ,那么 雇主选择由于雇员之间博弈的均衡是对称均衡,因此双方赢得竞赛的机会都是 05,假设雇能得到其他工作机会提供的得益是 ,则保证雇员接受工作 的基本条件是: 此即“参与约束”。 由于在雇员接受工作的前提下,雇主必然尽可能压低工资,因此约束 条件可取等号: 于是得到: 设上述参与约束条件满足,雇主的利润函数为 雇主的期望利润为,因此雇主有如下的最优化问题: 上述雇主决策可转化为促使雇员的努力程度满足: 一阶条件为: 代入两雇员的最优努力水平决定公式得到: 符合雇主利益而且有激励作用的奖金水平只于 工作成绩的不确定有关, 进一步的,与产出函数 随机影响因子的方差正 相关。 46 动态博弈分析的问题和 扩展讨论 461 逆推归纳法的问题 逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚, 并且各个博弈方了解博弈结构,相互知道对方了解博 弈结构。这些可能有脱实际的可能 在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难 对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈 方相互了解和信任对方的理性,对理性有相同的理解, 或进一步有“理性的共同知识” 462 颤抖手均衡和顺推归纳法 颤抖手均衡:是由塞尔腾提出的一个思想,它是理解有限理性的博弈方在动态博弈中偏离子博弈完美纳什均衡行为 最重要的思想之一,也是精练子博弈完美纳什均衡的一种。 10, 顺推归纳法0,0 1,3 0,0 3,1 VanDamme 博弈 3,1 0,0 2,2 2,2 0,0 1,3 Ds 博弈方2Van Damme 博弈策略形 463 蜈蚣博弈问题 98,9897,100 98,101100,100

  完美体育

Copyright © 2012-2022 完美体育 版权所有
电 话:400-123-4657    手 机:13800000000   传 真:+86-123-4567    E-mail:admin@gzcanna.com
地 址:广东省广州市天河区88号
粤ICP备17070116号

扫一扫关注完美体育

免费咨询 投诉建议
网站地图