最新完全完美信息动态博弈精品课件完美体育_完美体育

咨询热线

400-123-4657

设为首页
加入收藏
联系我们

Classification

完美动态

400-123-4657

传真：+86-123-4567
手机：13800000000
邮箱：admin@gzcanna.com
地址：广东省广州市天河区88号

当前位置：完美体育 > 完美动态

最新完全完美信息动态博弈精品课件完美体育

发布时间：2023-01-08 07:40:27 丨浏览次数：572

　　简单类型的完全且完美信息动态博弈的模式简单类型的完全且完美信息动态博弈的模式1参与者参与者11从可行集从可行集A1A1中选择一个行动中选择一个行动a1a1；；2参与者参与者22观察到观察到a1a1之后之后zhhuzhhu从可行集从可行集A2A2中选择一个行动中选择一个行动a2a2；；3两人的收益分别为两人的收益分别为u1u1（（a1,a2a1,a2和和u2u2（（a1,a2a1,a2；；完全且完美信息动态博弈的主要特点是：完全且完美信息动态博弈的主要特点是：1行动是顺序发生的；行动是顺序发生的；2下一步行动选择之前，所有以前的行动都下一步行动选择之前完美体育，所有以前的行动都可被观察到；可被观察到；3每一可能的行动组合下参与者的收益都是每一可能的行动组合下参与者的收益都是第一页，共69页。411阶段jidun和扩展性表示阶段：动态博弈中一个博弈方的一次选择行为。阶段：动态博弈中一个博弈方的一次选择行为。动态博弈最好的表示方法：扩展型（博弈树）。动态博弈最好的表示方法：扩展型（博弈树）。例子：仿冒和反仿冒博弈例子：仿冒和反仿冒博弈并不是所有的动态博弈都并不是所有的动态博弈都可以可以kyǐkyǐ用扩展形表示，比如用扩展形表示，比如动态博弈的阶段很多：象棋。动态博弈的阶段很多：象棋。战略空间是连续函数：产量。战略空间是连续函数：产量。不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒41动态博弈by的表示法和特点第二页，共69页。412动态dngti博弈的基本特点策略是在整个博弈中所有选择、行为的计划，不能分割。策略是在整个博弈中所有选择、行为的计划，不能分割。结果是上述“计划型”策略的策略组合结果是上述“计划型”策略的策略组合zǔhzǔh，构成一条路径，构成一条路径得益对应每条路径，而不是对应每步选择、行为得益对应每条路径，而不是对应每步选择、行为动态博弈的非对称性动态博弈的非对称性————先后次序决定动态博弈必然是非对称的。先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利，有“先行优势”。先选择、行为的博弈方常常更有利，有“先行优势”。第三页，共69页。42可信性和纳什均衡jnhng的问题第四页，共69页。动态博弈中各个博弈方的策略是自己设定的，在各个博弈阶段，针对实际情况qngkung可以进行随机的选择，这称为“相机选择”。相机选择的存在使得博弈方的策略的可信性值得怀疑，也就是说博弈方是否会真正始终按照自己策略所设定的方案行为还是临时改变主意？关键是对甲的行为有所约束。421相机选择xuǎnz和策略中的可信性问题（0，4）（2，2）（1，0）不借不分开金矿博弈第五页，共69页。不同版本bǎnbn的开金矿博弈——分钱和打官司的可信性不借（1，0）不打（0，4）（1，0）（2，2）有法律保障的开金矿博弈——分钱打官司都可信（2，2）不分（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈——分钱打官司都不可信第六页，共69页。第一个图中，通过法律手段使乙的利益得到保障，这样乙的完整策略：“第一阶段借，如果第二阶段甲不分，第三阶段打官司。”甲的完整策略是：“第二阶段分。”这是这个3阶段动态博弈的解。但是第二个图中，乙的利益在法律的情况qngkung下仍然得不到保障，可以看出法律在社会中的重要性。第七页，共69页。422纳什均衡jnhng的问题第三种开金矿博弈by中，完美体育（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。结论：纳什均衡在动态博弈by可能缺乏稳定性，也就是说，在完全信息静态博弈by中稳定的纳什均衡，在动态博弈y中可能是不稳定的，不能作为预测的基础。根源：纳什均衡本身不能排除博弈by方策略中包含的不可信的行为设定，不能解决动态博弈by的相机选择引起的可信性问题第八页，共69页。423逆推归纳法定义：从动态博弈的最后一个阶段jidun博弈方的行为开始分析，逐步倒推回前一个阶段jidun相应博弈方的行为选择，一直到第一个阶段jidun的分析方法，称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。（0，4）（2，2）第九页，共69页。当在博弈的第二阶段参与者2行动时，由于其前参与者1已选择行动a1，他面临的决策juc间题可用下式表示:假定对A1中的每一个a2，参与者2的最优化问题wnt只有惟一解，用R2a1表示，这就是参与者2对参与者1的行动的反应或最优反应。第十页，共69页。由于参与者1能够和参与者2一样解出2的问题wnt，参与者1可以预测到参与者2对1每一个可能的行动a1所作出的反应，这样1在第一阶段要解决的问题wnt可以归结为：假定参与者1的这一最优化问题同样有惟一解，表示为a1*，我们称是这一博弈的逆向归纳解。逆向归纳解不含有hnyǒu不可置信的威胁:参与者1预测参与者2将对1可能选择的任何行动a1做出最优反应，选择行动R2a1。第十一页，共69页。由于动态博弈中纳什均衡是不可靠kko的，不具备稳定性，因此要发展能排除不可信行为的新的均衡概念。赛尔腾（1965）提出了子博弈完美纳什均衡（SubgamePerfectNashEquilibrium的概念。要介绍子博弈完美纳什均衡，必须先了解子博弈的概念。43子博弈by和子博弈by完美纳什均衡第十二页，共69页。331子博弈b定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成guchng的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。首先子博弈不能包含原博弈的第一个阶段，这意味着动态博弈本身不会是他自己的子博弈。其次子博弈必须有一个明确的信息集，不能分割任何信息集，在多节点信息集合的不完美信息集中有可能不存在子博弈。（1，0）（0完美动态，4）（2，2）（-1，0）第十三页，共69页。332子博弈完美wnmi纳什均衡定义：如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡本身也是纳什均衡，不过它是比纳什均衡更子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺，因此是真正稳定的。子博弈是倒着看的，从最小的子博弈开始我们就找稳定策略组合，直至最开始的节点，那么当然dngrn是稳定的了。大家会发展这正是逆推归纳法。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方我们将定义子博弈完美纳什均衡为：只有不包含不可置信的威胁的纳什均衡才是子博弈完美纳什均衡。一个完全且完美信息动态博弈可能会有多个均衡，但惟一的子博弈完美纳什均衡就是与逆向归纳解相对应的均衡。正如我们在前面所观察到的，有些博弈会有多个纳什均衡，但有一个均衡明显占优，成为博比如，上例分钱博弈中，双方的策略cl组合“乙第一阶段选择‘借’，第二阶段选择‘打’;甲第二阶段选择’分”’虽然是整个博弈的一个纳什均衡，但这个策略cl组合中乙的策略cl要求乙在第三阶段单人博弈构成的子博弈中选择的 “打”不是该子博弃的一个纳了卜均衡，因此根据子博弈完美纳什均衡的定义判断，这个策略cl组合不是子博弈完美纳什均衡。这也是上述纳什均衡策略cl组合不稳定的根源。第十五页，共69页。策略组合“乙在第一阶段选择‘不借’、如果有第三阶段选择则选择不打;甲如果有第二阶段选择选‘不分”’，则是了博弈完美纳什均衡，因为该策略组合的双方策略不但在整个博弈中构成纳什均衡，而且在两级子博弈中也都构成纳什均衡。值得注意的是，当两个博弈方按照上述子博弈完美纳什均衡策略组合行为xngwi时，实际上不会进行到博弈的第二、第三阶段，两个博弈方在第二、二阶段的行为xngwi实际上不会发生。我们称此时第二阶段甲的选择点和第三阶段乙的选择点为“不在均衡路径上”的，两博弈方的策略在这两个节点的选择称为“不在均衡路径上的选择”。我们必须强调，子博弈完关纳什均衡必须对博弈方在所有选择节点处的选择都作出规定，包括最终不在均衡路径土几的节点，不管是在均衡路径上的选择还是不在均衡路径。第十六页，共69页。我们用博弈树表示一个动态博弈，完美体育树上每一枝的末端都有两个收益值，上面代表dibiǎo参与者1的收益，下面代表dibiǎo参与者2 的收益。考虑下面的三步博弈，其中参与者1有两次行动: 433 逆向归纳法背后bihu 的理性假设第十七页，共69页。为计算出这一博弈的逆向nxinɡ归纳解，我们从第三阶段即参与者1的第二次行动开始。这里参与者1面临的选择是L’’。那么在第二阶段，参与者2预测到一旦博弈进入到第三阶段，则参与者1会选择L’’ ，这会使2的收益为 0，从而参与者2在第二阶段的选择为:L‘可得收益1, 这样在第一阶段，参与者1预测到如果博弈进入到第二阶段，2将选择L’，使参与者1的收益为1，从而参与者1在第一阶段的选择是:L收益为2, R收益为1,于是L是最优的。上述的求解过程求出：参与者1在第一阶段的最优选择是L，从而博弈结束。第十八页，共69页。但是即使逆向归纳预测博弈将在第一阶段结束，我们论证过程的重要部分却是考虑如果博弈不在第一阶段结束时可能发生的情况。比如bǐr在第二阶段，当参与者2预测如果博弈进入第三阶段，则1会选择L’’，这时2假定1是理性的。由于只有在1偏离了博弈的逆向归纳解，才能轮得到2选择行动，而这时2对1的理性假定便看似是矛盾的，即如果1在第一阶段选择了R，那么第二阶段2就不能再假定1是理性的了。但这种理解是不对如果1在第一阶段选择了R，则两个参与者都是理性的就不可能是共同知识，但这时1仍有理由在第一阶段选择R，却不与2 对1的理性假定相矛盾。第十九页，共69页。一种可能是“参与者1是理性的”是共同知识，但“参与者2是理性的”却不是共同知识:如果1认为2可能不是理性的，则1就可能在第一阶段选择R，希望2在第二阶段选择R’，从而给1以机会在第三阶段选择L‘‘。另一种可能是“参与者2是理性的”是共同知识，但“参与者1是理性的”却不是共同知识:如果1是理性的，但推测2可能认为1是非理性的。这时1也可能在第一阶段选择R，希望2会认为1是非理性的而在第二阶段选择R’，期望1能在第三阶段选择R’’。逆向归纳中关于1在第一阶段选择R的假定可通过上面的情况得到解释。不过在有些博弈中，对1选择了R的更为合理的假定是1确实是非理性的。在这样的博弈中，逆向归纳在预测博弈进行方面就会失去其大部分作用，正像在博弈论不能提供惟一wiy解并不能达成协议的博弈中，纳什均衡也对预测博弈的结果所助无几。第二十页，共69页。 44 四个经典的动态 dngti博弈例子斯塔克尔贝里1934提出一个双头垄断的动态模型，其中一个支配企业领导者首先行动，然后从属 cngshǔ企业追随者行。比如在美国汽车产业发展史中的某些阶段，通用汽车就扮演过这种领导者的角色这一例子把模型直接扩展到允许不止一个追随企业，如福特、克莱斯勒等等。根据斯塔克尔贝里的假定，模型中的企业选择其产量，这一点和古诺模型是一致的只不过古诺模型中企业是同时行动的，不同于这里的序贯行动。第二十一页，共69页。这里PQ=a-Q，是市场上的总产品Q=q1+q2时的市场出清价格，c是生产的边际成本chngbn，为一常数固定成本chngbn为0。为解出这一博弈的逆向归纳解，我们首先计算企业2对企业1任意产量的最优反应，R2q1应满足: 3企业1的收益由下面的利润函数给出：第二十二页，共69页。对上面shngmiɑn的通过求极值可得：已知q1a-c,在前面我们分析同时行动的古诺博弈中，得出的 R2q1和上式完全一致，两者的不同之处在于ziy这里的 R2q1是企业2对企业1已观测到的产量的真实反应，而在古诺的分析中，R2q1是企业2对假定的企业1的产量的最优反应，且企业1的产量选择是和企业2同时作出的。第二十三页，共69页。由于企业1也能够像企业2一样解出企业2的最优反应，企业1就可以预测到他如选择q1，企业2将根据R2q1选择产量。那么n me在博弈的第一阶段，企业1的问题就可表示为：回顾在古诺博弈的纳什均衡中，每一企业的产量chǎnling为a一c3,也就是说，斯塔克尔贝里博弈中逆向归纳解的总产量 chǎnling3a-c4，比古诺博弈中纳什均衡的总产量chǎnling2a- c3要高，从而斯塔克尔贝里博弈相应的市场出清价格就比较低。不过在斯塔克尔贝里博弈中，企业1完全可以选择古诺均衡产量 chǎnlinga一c3 ，这时企业2的最优反应同样是古诺均衡的产量 chǎnling，也就是说在斯塔克尔贝里博弈中，企业1完全可以使利润水平达到古诺均衡的水平，而却选择了其他产量chǎnling，第二十五页，共69页。那么企业1在斯塔克尔贝里博弈中的利润一定ydng高于其在古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清价格降低了，从而总利润水平也会下降，那么和古诺博弈的结果相比，在斯塔克尔贝里博弈中，企业1利润的增加必定意味着企业2福利的恶化。和古诺博弈相比，斯塔克尔贝里博弈中企业2利润水平的降低，揭示了单人决策问题和多人决策间题的一个重要不同之处。在单人决策理论中，占有更多的信息决不会对决策制定者带来不利，然而在博弈论中，了解更多的信息或更为精确地说，是让其他参加者知道一个人掌握更多的信息却可以让一个参与者受损。第二十六页，共69页。 •斯塔科尔贝里博弈b y中信息进一步的探讨在斯塔克尔贝里博弈中，存在问题的信息是企业的产量:企业2知道q1,并且重要的是企业1知道企业2知道q1。为看清楚这一信息的影响，我们把上面序贯行动的博弈稍作修改，假设企业1先选择q1 ，之后zhhu企业2选择q2，但事前并没有观测到q1,如果企业2确信企业1选择了它的斯塔克尔贝里产量a-c2，则企业2的最优反应仍是R2 q1=a-c4。但是，如果企业1预测到企业2将持有这一推断并选择这一产量，企业1就会倾向于它对a-c4的最优反应----即3a-c8—而不愿去选择斯塔克尔贝里产量a-c2，那么企业2就不会相信企业1选择了斯塔克尔贝里产量。从而这一修改过的序贯行动博弈的惟一纳什均衡，对两个企业都是选择产量a-c3----这正是古诺博弈中的纳什均衡，其中企业是同时行第二十七页，共69页。2里昂惕夫的工会gnghu模型在里昂惕夫1946模型中，讨论了一个企业qǐy和一个垄断的工会组织即作为企业qǐy劳动力惟一供给者的工会组织的相互关系:工会对工资水平说一不二完美体育，完美体育但企业qǐy却可以自主决定就业人数在更符合现实情况的模型中，企业qǐy和工会间就工资水平讨价还价，但企业qǐy仍自主决定就业，得到的定性结果与本模型相似。工会的效用函数为UW, L，其中W为工会向企业qǐy开出的工资水平，L为就业人数。假定UW,L是W和L的增函数。企业qǐy的利润函数，其中RL为企业qǐy雇佣L名工人可以取得的收入在最优的生产和产品市场决策下，假定R L是增函数，并且为凹函数。假定博弈的时序为:第二十八页，共69页。 L的具体的表达式，从而无法明确解出该博弈的逆向归纳解，但我们仍可以就解的主要特征进行讨论。首先，对工会在第一阶段任意一个工资水平w，我们能够nnggu分析在第二阶段企业最优反应L*W的特征。给定w，企业选择 L*W满足下式: 一阶条件tiojin为：第二十九页，共69页。下面的图把L*w表示为w的函数但坐标轴经过旋转以便于和以后的数据shj相比较，并表示出它和企业每条等利润线交于其最高点。若令L 保持不变，第三十页，共69页。 L保持不变，w降低时企业的利润lrn就会提高，于是较低的等利润lrn曲线代表了较高的利润 lrn水平。这张图描述miosh了工会的无差异曲线，若令L不变，当w提高时工会的福利就会增加。于是较高的无差异曲线代表了工会较高的效用水平。第三十一页，共69页。下面我们分析工会在第一阶段的问题wnt，由于工会和企业同样可以解出企业在第二阶段的问题wnt，工会就可预测到如果它要求的工资水平为w1，企业最优反应的就业人数将会是L*w1。那么，工会在第一阶段的问题wnt可以表表现在图中的无差异曲线上就是，工会希望选择一个工资水平w，由此得到的结果ji guǒw，L*w处于可能达到的最高的无差异线上。这一最优化间题的解为w*，这样一个工资要求将使得工会通过w*，L*w*的无差异曲线;相切于该点，如图所示。从而w*，L*w*就是这一工资与就业博弈的逆向归纳解。第三十三页，共69页。更进一步我们还可以看出，w‘*,L*w*是低效率的，在上图中，如果w和L处于图中阴影部分以内，企业和工会的效用水平都会提高。这种低效率对实践中企业对雇佣工人数量保持bǎoch的绝对控制权提出了质疑。允许工人和企业就工资相互讨价还价，但企业仍对雇佣工人数量绝对控制，也会得到相似的低效率解 nosa&Rhee,1989 基于如下事实为这一质疑提供了一个解释:企业和工会之间经常会进行定期或不定期的重复谈判在美国经常是每三年一次，在这样的重复博弈中，可能会存在一个均衡，使得工会的选择w和企业的选择 L都在图所示的阴影部分以内yǐ ni，即使在每一次性谈判中，这样的w和L都不是逆向归纳解。第三十五页，共69页。参与人1和2就一美元的分配进行谈判。他们轮流提出方案:首先参与人1提出一个分配建议，参与人2可以接受或拒绝;如果参与人2拒绝，就由参与人2提出分配建议，参与人1选择接受或拒绝;如此一直进行下去。一个条件一旦被拒绝，它就不再 zi有任何约束力，并和博弈下面的进行不再bzi相关。每一个条件都代表一个阶段，参与人都没有足够的耐心:他们对后面阶段得到的收益进行贴现，每一阶段的贴现因子为（1）在第一阶段开始时，参与人1建议他分走1美元的s1，留给参与人2的份额为1-s1。参与人2或者接受这一条件这种情况下，博弈结束，参与人1的收益为s1 ，参与人2的收益为1- s1 ，都可立刻拿到；或者拒绝这一条件这种情况下，博弈将继续进行，进入第二阶段。 3序贯谈判tnpn 第三十六页，共69页。（2）在第二阶段的开始。参与人2提议参与人1分得1美元的s2，留给参与人2的份额为1- s2 ;参与人1或者huzh接受条件这种情况下，博弈结束，参与人1的收益s2，参与人2 的收益1-s2都可立即拿到，或者huzh拒绝这一条件，这种情况下，博弈继续进行，进入第三阶段。（3）在第三阶段的开始，参与人1得到1美元的s，参与人2得到1-s。 1-s是外生给定的。在我们后面将考虑的无限期模型中，第三阶段的收益、将表示如果博弈进行到第三阶段即如果前面两个提议都第三十七页，共69页。为解出此三阶段博弈的逆向归纳解，首先需要计算如果博弈进行到第二阶段，参与 cny人2可能提出的最优条件。参与 cny人1拒绝参与cny人2在这一阶段的条件s2，可以在第三阶段得到s，只有在满足：再来看s2，2在第二阶段面临着在：通过向参与人1提出条件，给他之间进行选择，很明显她将选择前者。也就是说，于是ysh参与人2在第二阶段可以提出的最优条件是：第三十八页，共69页。也就知道参与人的条件，在第二阶段可以得到 1-S2* ，但下一阶段得到的 1-S2* 才会接受1-S1 。从而 cng 在第一阶段的决策问题就可归于在本阶段收入和下阶段收入S2* 之间作出选择。由于：明显小于前者，所以参与人1在第一阶段jidun提出的最优条件是S*1= 这样，在此三阶段jidun博弈的逆向归纳解中，参与人1 向参与人2提出分配方案（S*1,1-S1*，后者接受该方案。第三十九页，共69页。经济生活中有大量的委托代理dilǐ问题：有合同关系的显性委托和没有合同但是有明确委托关系的隐性委托。委托人与代理dilǐ人之间的博弈关系的核心问题是两人动态博弈。所以如何使得代理dilǐ人的行为符合委托人的利益是委托代理dilǐ理论的重要课题。问题的核心在于委托合同的设计问题，因此也被称为“激励机制设计”或者“机制设计”。更进一步的实际上是薪酬工资制度的选择。第四十页，共69页。无不确定性的委托人—代理人模型mxng 偷懒努力拒绝接受不委托委托无不确定性是指代理人的产出是努力程度的确定函数。代理人的选择激励相容约束： wS+E-S其经济jngj含义是只有代理人努力工作的报酬到达偷懒的时候的基本报酬，还有至少一个不低于能补偿努力和偷懒的负效用的增加额才可以。第四十一页，共69页。参与cny约束：拒绝接受拒绝接受接受：wE-E0接受：wS-S0 参与约束第四十二页，共69页。不委托委托委托第四十三页，共69页。数值shz例子 [12, [0,0][0,0] 偷懒努力拒绝接受不委托委托 [7，1] 第四十四页，共69页。有不确定性但可监督jind的委托人—代理人博弈 [0，0][0，0] [10-wS, 不委托高产 01 低产 09 低产 01 高产 09 努力偷懒接受拒绝委托偷懒tu 委托：01*[20-wS] +09*[10-wS]0 不委托： 01*[20-wS] +09*[10-wS]0 努力nǔ 委托：09*[20-wE]+01*[10-wE]0 不委托： 09*[20-wE]+01*[10-wE]0 因为可监督，因此代理人报酬与成果无关，只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。第四十五页，共69页。有不确定性且不可监督jind的委托人—代理人博弈 [0，0][0，0] [10-wS, w10-S] [20-w20, w20-S] [10-w10, w10-E] [20-w20, w20-E] 不委托高产 01 低产 09 低产 01 高产 09 努力偷懒接受拒绝委托只能zhnnɡ根据成果付酬，w是成果函数，而非努力程度函数。不确定性对代理人利益、选择有影响。第四十六页，共69页。努力： 09*[w20-E]+01*[w10-E] 01*[w20-S]+09*[w10-S] 接受： 09*[w20-E]+01*[w10-E]0 委托： 09*[20-w20]+01*[10-w10]0 激励相容约束促使代理人努力的激励相容约束、参与约束，以及委托人选择委托的条件参与约束对于委托人来说，就是要根据上述两个条件，以及E、S的值，选择最佳的工资水平w20和w10，或者它们的差额w20 -w10 委托witu人委托witu条件第四十七页，共69页。选择报酬和连续努力水平shuǐpng的委托人—代理人博弈 Image模型mxng的条件描述：努力成果不确定而且不可监督，而且委托人可以选择报酬函数、代理人在连续区间选择努力水平e的委托－代理模型mxng。代理人的机会成本U,努力有负效用是单调递增的凸函数C=Ce。代理人的产出是e的随机函数Re; W=wR,委托人只能看到产出R，不能知道努力e，所以只能跟根据产出R设计薪酬制度。这样，委托人的利润：R-W＝Re-w[Re] 代理人的利润：w-c= 但是这个e*不一定ydng是代理人根据自身利益最大化作出的选择，也就是同时e*满足：就意味着两者的利益完全一致，代理人的行为就符合委托人的利益最大话。委托人按照参与约束和激励相容条件设计报酬函数，就可以达到均衡状态。第四十九页，共69页。委托人希望的代理人努力水平（满足参与约束）激励相容约束：参与约束：第五十页，共69页。一个委托代理dilǐ的例子：店主和店员的问题商店的利润是均值为0的随机变量店员的负效用，是店员的努力程度；机会成本为1。店主采用的报酬计算公式店员的得益d 现在xinzi的问题是：店主需要确定AB的水平，以使这种工资制度成为一种有效的激励！第五十一页，共69页。参与约束：当店员风险中性时符合其最大利益,店主选择下限店员的期望得益为：这意味着店员的努力程度是提成比例的正函数。下面看店主：店主所给出的工资gngz应该是店员参与约束下限：代入得益公式得：，期望得，易求得则店主的最优激励工资gngz计算公式是实际上是一种承包或者租赁经营制！第五十二页，共69页。45 wnmi 现在我们对前一节所讨论的博弈类型加以丰富。和在完全且完美信息动态博弈中相同，我们继续假定博弈的进行jnxng分为一系列的阶段，下一阶段开始前参与者可观察到前面所有阶段的行动。与上节分析的不同之处在于完美体育，本节我们每一阶段中存在着同时行动。将看到，这种阶段内的同时行动意味着本节分析的博弈包含了不完美信息。此类博弈和前一节所讨论的博弈又有着很多共同特性。这种模型又被称为“有同时选择的动态博弈模型”第五十三页，共69页。我们将分析以下类型的简单博弈，并称其为完全非完美信息两阶段博弈: 2参与者3和4观察到第一阶段的结果，然后同时从各自的可行集A3和A4中选择行动a3和a4; 许多经济学问题都符合以上的特点，包括对银行的挤提、关税和国际市场的不完全竞争以及工作竞赛如一个企业中，几个jǐ 这种博弈的求解仍然是逆推归纳法为主的求解方法，核心仍然是子博弈完美纳什均衡。但由于在某阶段同时选择策略，所以不是阶段性的单人最优化问题，而是一个静态博弈问题。第五十四页，共69页。还有很多经济问题可通过把以上yǐshng条件稍加改动而建立模型，比如增加参与者人数或者允许同一参与者在一个以上yǐshng的阶段多次选择行动。也可以允许少于四个的参与者:在一些应用中，参与者3和4就是参与者1和2。我们解决此类问题使用的方法，仍沿用了逆向归纳的思路，但这里从博弈的最后阶段逆向推导的第一步就包含了求解一个线;给定第一阶段结果时，参与者3和4在第二阶段同时行动的博弈，而不再是前一节求解单人最优化的决策问题。为使问题简化，本节中我们假设对第一阶段博弈每一个可能结果a1, a2，其后参与者3和4之间的第二阶段博弈有惟一的纳什均衡，表示为第五十五页，共69页。如果参与人1和2预测到参与人3和4在第二阶段的行动将由给出则参与人1和2在第一阶段的问题就可用以下的同时行动博弈表示: 1参与人1和2同时从各自的可行集A1和A2中选择行动a1和a2; 假定a*1,a*2为以上同时行动博弈惟一的纳什均衡，我们称a*1, a*2）为这一两阶段博弈的子博弈完美解。此解与完全且完美博弈中的逆向归纳解在性质上是一致的。如果参与者3和4威胁在后面的第二阶段博弈中，他们将不选择纳什均衡下的行动，参与人1和2 第五十六页，共69页。 1银行的挤兑jǐdu博弈两个投资者每人存入银行一笔存款D，银行已将这些存款投入一个长期项目。如果在该项目到期前银行被迫对投资者变现，共可收回2r，这里DrD2。不过，如果银行允许投资项目到期，则项目共可取得2R，这里RD。有两个时间，投资者可以从银行提款:在银行的投资项目到期之前或者在到期之后。为使分析简化，假设不存在贴现。 C、两个在到期后提，各得R第五十七页，共69页。如下图所示：第五十八页，共69页。从日期2开始先考虑kǎolǜ日期2的标准式博弈，由于明显的RD,也就是说2R-DR。我们可以得到这个博弈的纳什均衡（R,R）。由于rD并且由此可得2r-Dr，这一由两阶段博弈变形得到的单阶段博弈存在两个纯战略纳什均衡:1两个投资者都提款，最终收益情况为两个投资者都不提款，最终收益为R,R。从而，最初的两阶段银行挤提博弈就有2个子博弈完美解。第五十九页，共69页。前一种结果可以解释为对银行的一次挤提。如果投资者1相信投资者2将在日期1提款、则投资者1的最优反应也是去提款，即使他们等到日期2再去提款的话两人的福利都会提高。这里的银行挤提博弈在一个很重要的方面不同于第1章中讨论的囚徒困境:虽然两个liǎnɡ ɡ博弈都存在一个对整个社会是低效率的纳什均衡;但在囚徒困境中这一均衡是惟一的并且是参与者的严格占优战略，而在这里还同时存在另一个有效率的均衡。从而，这一模型并不能预侧何时会发生对银行的挤提，但的确显示出挤提会作为一个均衡结果而出现。第六十页，共69页。模型假设：1雇员ii=1,2的产出函数为为雇员努力水平，为随机扰动。服从分布密度，均值为0的随机变量。雇员努力的负效用函数为 2产量高的雇员得到高工资，产量低的得到低工资 3两雇员在已知雇主宣布的工资奖金制度zhd下，同时独立选择各自的努力程度。第六十一页，共69页。雇员gyun选择雇主决定了工资以后，雇员同时决定努力nǔ l程度：一阶条件这是雇员所选择努力nǔ l程度必须满足的基本条件。 maxmax 第六十二页，共69页。利用条件tiojin概率的贝叶斯法则：代入得：两雇员情况一样，对努力程度chngd的选择也相同，即：，这样就得到：这就是两雇员之间的静态博弈纳什均衡。若进一步假设，那么第六十三页，共69页。雇主ɡ zhǔ选择由于雇员之间博弈的均衡是对称均衡，因此双方赢得竞赛的机会都是05，假设雇能得到其他工作机会提供的得益是，则保证雇员接受工作的基本条件是：此即“参与约束”。由于在雇员接受工作的前提qint下，雇主必然尽可能压低工资，因此约束条件可取等号：于是得到：设上述参与约束条件满足，雇主的利润函数为第六十四页，共69页。雇主的期望利润为，因此雇主有如下的最优化问题：上述雇主决策可转化为促使雇员的努力nǔ l程度满足：一阶条件为：代入两雇员的最优努力nǔ l水平决定公式得到：符合雇主利益而且有激励作用的奖金水平只于工作成绩的不确定有关，进一步的，与产出函数hnsh随机影响因子的方差正相关。第六十五页，共69页。 46 动态dngti博弈分析的问题和扩展讨论 461 逆推归纳法的问题wnt 逆推归纳法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则和得益d y情况等都非常清楚，并且各个博弈方了解博弈结构，相互知道对方了解博弈结构。这些可能有脱实际的可能在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难对博弈方的理性要求太高，不仅要求所有博弈方都有高度的理性，不允许犯任何错误，而且要求所有博弈方相互了解和信任对方的理性，对理性有相同的理解，或进一步有“理性的共同知识” 第六十六页，共69页。 462 颤抖手均衡jnhng和顺推归纳法颤抖手均衡：是由塞尔腾提出的一个思想，它是理解有限理性的博弈方在动态博弈中偏离子博弈完美纳什均衡行为最重要zhngyo的思想之一，也是精练子博弈完美纳什均衡的一种。 10, 第六十七页，共69页。顺推shn tu归纳法 0，0 1，3 0，0 3，1 VanDamme 博弈 3，1 0，0 2，2 2，2 0，0 1，3 Ds 博弈方2Van Damme 博弈策略形第六十八页，共69页。 463 蜈蚣博弈b y问题 98,9897,100 98,101100,100

Copyright © 2012-2022 完美体育版权所有
电话：400-123-4657 手机：13800000000 传真：+86-123-4567 E-mail：admin@gzcanna.com
地址：广东省广州市天河区88号
粤ICP备17070116号

扫一扫关注完美体育

免费咨询投诉建议