完美体育3完全且完美信息动态博弈

Classification

完美动态

400-123-4657

传真：+86-123-4567
手机：13800000000
邮箱：admin@gzcanna.com
地址：广东省广州市天河区88号

完美体育3完全且完美信息动态博弈

发布时间：2023-01-31 07:27:30 丨浏览次数：547

　　3.1 完全且完美信息动态博弈的特点与解法（本章所说的动态博弈都是指完全且完美信息动态博弈）本章所说的动态博弈都是指完全且完美信息动态博弈）动态博弈的表示方法—— ——扩展型 3.1.1 动态博弈的表示方法——扩展型动态博弈涉及博弈的参与人多个阶段的选择和选择的顺序问题，一般难以用策略型表示，而多用扩展型——也称博弈问题，一般难以用策略型表示，而多用扩展型——也称博弈 —— 。树——表示（有限博弈） ——表示（有限博弈）表示以仿冒与反仿冒为例。以仿冒与反仿冒为例。一些名词：一些名词：参与人和行动顺序：参与人和行动顺序：结点：决策结——参与人决策的点；结点：决策结——参与人决策的点；终点结 ——参与人决策的点支付向量：先行动的人的支付排第一，支付向量：先行动的人的支付排第一，后行动的人的支付排第二...... 第二信息集：在完全且完美信息的情况下，处于某一节点的参与信息集：在完全且完美信息的情况下，处于某一节点的参与人对这个结点之前的信息都是了解的。人对这个结点之前的信息都是了解的。所有的信息集都是单结的。结的。路径：仿冒，不制止，路径：第一阶段 A 仿冒，第二阶段 B 不制止，第三阶段 A 仿冒，制止。仿冒，第四阶段 B 制止。

　　的反应函数。即厂商 2 的反应函数。再考虑博弈的第一阶段，再考虑博弈的第一阶段，一阶段厂商 1 选择产量时肯定能够预测到厂商

　　三个部分分别是本国消费者剩余，三个部分分别是本国消费者剩余，本国企业利润和税收收入。将 hi

　　例：国际间最优关税博弈假设：假设：两个国家 1、2，两个国家各有一个企业 1、2 生、，、产同一种商品用于内销和出口。产同一种商品用于内销和出口。企业 i 生产 hi 供内销和 ei 出口。 i 国市场的需求函数是： Pi = Pi (Qi ) = a − Qi , i = 1,2 国市场的需求函数是：

　　这个结论表明，子博弈纳什均衡结果是消耗系数的函数。这个结论表明，子博弈纳什均衡结果是消耗系数的函数。实际上，那么，实际上，如果 δ A ≠ δ B ,那么，谁更有耐心，谁就可以再博弈那么谁更有耐心，中占有优势。中占有优势。

　　因为 MfMp,这样政府没有积极性兑现 0 通胀的承诺，而是这样政府没有积极性兑现通胀的承诺，会选择制造通胀以降低失业。会选择制造通胀以降低失业。又因为私人部门是理性的，又因为私人部门是理性的，因而不会相信政府的 0 通胀承诺，会根据政府的货币政策相应调整其通胀预期，承诺，会根据政府的货币政策相应调整其通胀预期，这样最终政府的相机决策的结果是不变的失业率和通胀。终政府的相机决策的结果是不变的失业率和通胀。例：股市政策与股市波动。股市政策与股市波动。

　　t 这就是两企业在给定税率 t1， 2 情况下在第二阶段静态博弈的纳什均衡解。弈的纳什均衡解。如果没有关税，则相当于古诺模型，如果没有关税，则相当于古诺模型，在国内国外两个市场上双方都得到产量（）。场上双方都得到产量（a-c）/3。关税的存在使两企业的成本发生了变化，关税的存在使两企业的成本发生了变化，保护了本国企业打击了外国企业。业打击了外国企业。现在分析第一阶段两国关税博弈。现在分析第一阶段两国关税博弈。两个国家制定关税率以最大化本国社会福利： t1,t2 以最大化本国社会福利：

　　假设店员是风险中性的，参与约束即简化为：假设店员是风险中性的，参与约束即简化为：

　　就参与约束对 e 求导得 e=2B.(提成比例越高，店员越努力提成比例越高，店员越努力) 提成比例越高努力条件下，在满足店员参与约束 A B[ 4e η ] − e 2 ≥ 1 条件下，店主的

　　这个概率就很小。在这种情况下，这个概率就很小。在这种情况下，参与人 1 就会选择 D 以确保一单位的支付。保一单位的支付。另外，另外，即使参与人 1 相信所有参与人都选择 A，但它并，不一定能够相信参与人 2 相信所有参与人都选择 A。在这种。情况下，的明智选择。情况下，选择 D 都是参与人 1 的明智选择。这个逻辑对所有参与人都是成立的。这个逻辑对所有参与人都是成立的。所以，在参与人很多时，所以，在参与人很多时，子博弈精炼纳什均衡可能不是对现实的准确描述。对现实的准确描述。

　　四、有不确定性且不可监督的委托-代理模型有不确定性且不可监督的委托代理模型博弈的扩展型为：博弈的扩展型为：在这种情况下，在这种情况下，委托人无法确定高产或低产是代理人努力的结果还是自然随机影响的结果，力的结果还是自然随机影响的结果，因而不能根据代理人的努力程度而只能根据结果支付报酬。努力程度而只能根据结果支付报酬。在这种不对称信息情况下，委托人必须设计一种机制使代理人努力工作。委托人必须设计一种机制使代理人努力工作。假设代理人和委托人都是风险中性的。假设代理人和委托人都是风险中性的。代理人的努力工作的激励相容约束是：代理人的努力工作的激励相容约束是：

　　政策一旦制定后，老百姓可能会根据政策相应的调整行为，政策一旦制定后，老百姓可能会根据政策相应的调整行为，由于老百姓的行为发生了改变，由于老百姓的行为发生了改变，这样原先制定的政策可能就不再使政府最大化（目标），因而政府可能就没有积极性真不再使政府最大化（目标）因而政府可能就没有积极性真，

　　给定私人部门的预期通涨率，给定私人部门的预期通涨率，政府选择货币政策最大化效用函数：函数：

　　解最优化问题，得到政府短期的最优通涨率为：解最优化问题，得到政府短完美体育期的最优通涨率为：

　　根据逆向归纳法，根据逆向归纳法，每个人都会选择 A。但是如果参与人。很多的话，这个结果就值得怀疑实验经济学的结果）得怀疑（。这很多的话，这个结果就值得怀疑（实验经济学的结果）这。是因为，行动时，是因为，在参与人 1 行动时，选择 A 以得到 2 的支付需要它相信 n-1 个参与人都选择 A，在人数很多时可能性就下降。，在人数很多时可能性就下降。比如，比如，即使每个参与人选择 A 的概率 P 非常就近于 1，但，显然，很大时， n-1 个参与人都选择 A 的概率就是 Pn-1.显然，当 n 很大时，显然

　　，得到将（4）代入（2）得到 y = y 。也就是说，政府企图通过）代入（），也就是说，制造一定的通胀以降低失业的做法由于私人部门正确的预期到了并相应的调整其行为（比如说投资、雇佣工人等）期到了并相应的调整其行为（比如说投资、雇佣工人等），最终结果是失业依然如故，而通货膨胀上去了。最终结果是失业依然如故，而通货膨胀上去了。

　　在代理人选择了接受并偷懒的情况下，在代理人选择了接受并偷懒的情况下，委托人选择委托的条件是：件是：

　　努力，表示代理人偷懒，努力，1 表示代理人偷懒，且努力的负效用等于努力水平的数值，即 E=2,S=1 ；努力和偷懒时的工资分别为 w(E)=4,w(S)=2。这样，。这样，

　　通胀？那么为什么政府不选择 0 通胀？因为 0 通胀不是动态一致的，这个承诺是不可信的。这个承诺是不可信的。

　　e 通胀承诺，假定私人部门相信了政府的 0 通胀承诺，给定 π = 0 ，这时

　　3.3.3 讨价还价博弈一、三回合讨价还价 A、B 两人就如何分享 10000 元现金进行谈判。谈判规则如、元现金进行谈判。，B 下：1、A 提出分割比例（S1,10000-S1）、提出分割比例（，表示接受或不接 2、如果 B 拒绝 A 的方案， B 提出分割比例 2,10000-S2)，的方案，提出分割比例(S 受；、则， A 表示接受或不接受；3、如果 A 拒绝 B 的方案，则 A 提出表示接受或不接受；、的方案，最后的分割方案(S，（每回合消耗系最后的分割方案，10000-S)，B 只能接受。每回合消耗系，只能接受。（数为 δ ） A● 出 S1 B● 不接受,出 S2 接受

　　3.1.3 动态博弈的解法：逆向归纳法动态博弈的解法：从上面的例子中可以看出动态博弈的适合的解法是逆向归纳法（：从博弈的最后一个阶段参与纳法（backwards induction）从博弈的最后一个阶段参与）：人的行为开始分析，逐步倒退回前一阶段相应参与人的行人的行为开始分析，逐步倒退回前一阶段相应参与人的行一直到第一阶段。为......一直到第一阶段。一直到第一阶段逆向归纳法的逻辑基础：动态博弈中先行动的参与人，逆向归纳法的逻辑基础：动态博弈中先行动的参与人，在前面阶段选择行为时必然会考虑后行动的参与人在后面阶段中的行为选择，中的行为选择，只有在最后一阶段的参与人才能不受其他参与人的制约而直接做出选择。与人的制约而直接做出选择。而当后面阶段的参与人的选择确定后，前一阶段的参与人的行为也就容易确定了。确定后，前一阶段的参与人的行为也就容易确定了。逆向归纳法排除了不可信的威胁或承诺。逆向归纳法排除了不可信的威胁或承诺。讨论：讨论：助学贷款

　　作为对比，我们看看这种相机决策的结果：作为对比，我们看看这种相机决策的结果：将通胀率（）代入（）并用（）将通胀率（4）代入（1）并用（2）消去 y 得到政府的短期效应水平为：效应水平为：

　　相反，如果政府实施单一规则的货币政策，相反，如果政府实施单一规则的货币政策，保证实施 0 通胀政府实施单一规则的货币政策政策，则效用水平（大于短期最优的效用水平）政策，则效用水平（大于短期最优的效用水平）为：

　　在第二阶段选择了“不分” “ 为，如果 B 在第二阶段选择了“不分” A“打”的威胁是，不可信的。不会遵守承诺，不可信的。这样 B 不会遵守承诺，A 也不会愚蠢到依靠一个不可信的威胁冒险将资金借给他。不可信的威胁冒险将资金借给他。由于纳什均衡不能排除参与人策略中不可信的威胁和承诺，由于纳什均衡不能排除参与人策略中不可信的威胁和承诺，因而是不稳定的，因而是不稳定的，在分析动态博弈时不能给出一致性的预测。所以动态博弈中的需要寻找新的均衡概念（子博弈精炼所以动态博弈中的需要寻找新的均衡概念（纳时均衡）。纳时均衡）

　　二、无限回合讨价还价 t=1,3,5...,A 出价 B 选择是否接受，t=2,4,6....B 出价，A 选择是否选择是否接受，出价，接受。接受。对于无限回合博弈来说，根据（对于无限回合博弈来说，根据（Shaked&Sutton,1984）,从）从第三回合开始和从第一回合开始结果应该是一样的，因为都是 A 第三回合开始和从第一回合开始结果应该是一样的，选择是否接受。。。出价 B 选择是否接受。。。即从 A 出价开始的子博弈等价于从。 t=1 开始的整个子博弈。开始的整个子博弈。假定在出价，能够得到的最大份额最大份额是因为对假定在 t ≥ 3 ，A 出价，A 能够得到的最大份额是 S.因为对 A 来说， t 因此， B 来说，期的 S 等价于 t-1 期的 δS ，因此，在 t-1 期只会给 δS 份支付为（额给 A，自己得到 1- δS ，支付为（ δS ，1- δS ），；来说，因为对 B 来说，t-1 期的 1- δS 等价于 t-2 期的 δ (1 − δS ) ，因 A 此，在 t-2 期只会给 δ (1 − δS ) 份额给 B，，自己得到 1- δ (1 − δS ) ，支付为（1- δ (1 − δS ) ， δ (1 − δS ) ）支付为（。期开始的博弈与从期开始的博弈完全相同，因为从 t-2 期开始的博弈与从 t 期开始的博弈完全相同，A 期得到的份额也应相同，在 t-2 期得到的份额与它在 t 期得到的份额也应相同，即： 1- δ (1 − δS ) =S，，即： S =

　　在选择努力的情况下，代理人接受合同的参与约束是：在选择努力的情况下，代理人接受合同的参与约束是： 0.9*[w(20)-E]0.1*[w(10)-E]0 委托人知道代理人是否努力。因为给定 E,S,w(20),w(10)，，委托人知道代理人是否努力。假设代理人选择努力，委托人选择委托的条件是：假设代理人选择努力，委托人选择委托的条件是： 0.9*[20-w(20)]0.1*[10-w(10)]0

　　是自然失业率下的均衡产量，是实际产量。这里 y 是自然失业率下的均衡产量，y 是实际产量。K1 表明政府受到选民的压力不得不寻求将产量提高到高于自然律的水平上。这个效用函数表明，政府不喜欢通胀，律的水平上。这个效用函数表明，政府不喜欢通胀，但是如果通胀能够使产量提高到高于自然率的水平上，果通胀能够使产量提高到高于自然率的水平上，那么政府会在通胀和失业两者之间进行相机选择。在通胀和失业两者之间进行相机选择。引入附加预期的 phillips curve:

　　正实施这项政策；这样老百姓自然就不会相信这项政策了。正实施这项政策；这样老百姓自然就不会相信这项政策了。政策的动态一致性是指一个政策不仅要在制定阶段是最优的，而且应该在执行阶段也是最优的。而且应该在执行阶段也是最优的。 (Kydland&Prescott,1977)货币政策模型。参与人是政府和私货币政策模型。货币政策模型人部门。第一阶段：私人部门选择预期的通涨率，第二阶段：人部门。第一阶段：私人部门选择预期的通涨率，第二阶段：政府在给定的预期通涨率的情况下选择实际的通货膨胀率。以最大化自己的政策目标（失业和通胀）最大化自己的政策目标（失业和通胀）设政府单阶段效用函数是：设政府单阶段效用函数是：

　　古诺模型的纳什均衡解（，）古诺模型的纳什均衡解（2，2）不是 Stackelberg 的子博弈精

　　炼纳什均衡解。炼纳什均衡解。威胁说它选择产量，这个威胁并不是可信的。如果厂商 2 威胁说它选择产量 2，这个威胁并不是可信的。如果厂商 1 不是选择产量 2，而是选择比如说产量 3，那么，，，那么，厂商 2 的最优选择是 1.5 而不是威胁的 2。。 1 ● 2 2● 2 1.5 2 3 ● 1.5 (4.5,2.25)

　　偷懒时的参与约束仍是 w( S ) − S 0 。委托人支付受自然的影响。委托人支付受自然的影响。在代理人接受委托并努力工作时，在代理人接受委托并努力工作时，委托人委托的条件是委托的期望收益大于不委托的期望收益，委托的期望收益大于不委托的期望收益，即：

　　第二阶段：第二阶段：代理人选择是否接受合同如果代理人在第三阶段选择了努力，如果代理人在第三阶段选择了努力，则选择接受合同的条件（参与约束 Participation constraint）是: ）

　　如果代理人在第三阶段选择了偷懒，则参与约束是：如果代理人在第三阶段选择了偷懒，则参与约束是：

　　实际上是代理人接受合同的机会成本。这里 0 实际上是代理人接受合同的机会成本。第一阶段：第一阶段：委托人的选择在代理人选择了接受并努力工作的情况下，在代理人选择了接受并努力工作的情况下，委托人选择委托的条件是：的条件是：

　　与人的“共同知识（与人的“共同知识（common knowledge of rationality），即） ” 所有参与人都相信对方是理性的。所有参与人都相信对方是理性的。但是现实生活中决策者并不是完全理性的或不相信其他人都是完全理性的，不是完全理性的或不相信其他人都是完全理性的，特别是面临的长期不确定或多个参与人情况时，临的长期不确定或多个参与人情况时，因而现实中的动态博长期不确定或多个参与人情况时弈可能与子博弈精炼纳什均衡结果不一致（一般来说，弈可能与子博弈精炼纳什均衡结果不一致（一般来说，经济学理性人假设并不完全准确的，学理性人假设并不完全准确的，但坚持这一假设没有带来太多问题。多问题。为什么理性经济人假设在博弈论和行为经济学等领域受到挑战？）域受到挑战？）此外，还有一些动态博弈不适合逆向归纳法，此外，还有一些动态博弈不适合逆向归纳法，如对博弈的结构不是完全了解太过复杂的博弈，如下棋。的结构不是完全了解；太过复杂的博弈，如下棋。举两例说明：举两例说明：例 1 很多参与人的情况 1 ● A D (1,...,1) 2 ● A D (1/2,...,1/2) i ......● D (1/i,...,1/i) A n ......● D (1/n,...,1/n) A (2,...,2)

　　子博弈纳什均衡可以排除不可信的承诺或威胁。子博弈纳什均衡可以排除不可信的承诺或威胁。第一阶段选择“ 例：金矿博弈中策略组合 A:第一阶段选择“借” 第三阶段第一阶段选择，；：第二阶段“ 在整个博弈上是一个纳什均衡， “打” B：第二阶段“分”在整个博弈上是一个纳什均衡，在第三阶段“ 但是 A 在第三阶段“打”的策略在第三阶段单人博弈构成的子博弈中不是纳什均衡。子博弈中不是纳什均衡。上例中的子博弈精炼纳什均衡解是 A:第一阶段选择不借” 第一阶段选择不借” “ ，第三阶段“不打” ：第二阶段“不分” ；第三阶段“不打” B：第二阶段“不分” 。上例中，第二阶段和第三阶段的行为实际上不会发生，上例中，第二阶段和第三阶段的行为实际上不会发生，称第的选择节点为“ 二阶段 A 的选择节点和第三阶段 B 的选择节点为“不在均衡路径上” 。衡路径上” 一个子博弈精炼纳什均衡必须对参与人在所有节点上的选择都作出规定，包括最终不在均衡路径上的选择。择都作出规定，包括最终不在均衡路径上的选择。

　　按照逆向归纳法，最后均衡结果是 1,1）但是对比 100，（）按照逆向归纳法，。（， 100）的结果，这个结果太令人失望了。）的结果，这个结果太令人失望了。现在，假设参与人 1 选择了 A，参与人 2 接着应该怎么，行动？行动？ —选择 D？根据逆向归纳法应选择 D，但是同样根据逆向归？，纳法，的情况，纳法，不应该出现参与人 1 选择 A 的情况，那么是否继续适用逆向规纳法？用逆向规纳法？可能是他期待与你合作， —选择 A？参与人 1 选择 A 可能是他期待与你合作，？因而你

　　3.1.2 可信性与纳什均衡的问题纳什均衡在动态博弈中不再适用。因为:承诺和威胁的可信性纳什均衡在动态博弈中不再适用。因为承诺和威胁的可信性问题。问题。

　　例：开金矿博弈 B 有一价值 4 万元的金矿缺一万元资金。A 有一万元资金。万元的金矿缺一万元资金。有一万元资金。 B 承诺如果 A 将资金借给他，金矿开采后收益对半分成。问将资金借给他，金矿开采后收益对半分成。是否应该借给她？题：A 是否应该借给她？如果博弈进行到第二阶段，的合理行动是“不分” 如果博弈进行到第二阶段，B 的合理行动是“不分” 承诺，是不可信的。考虑到这一点，在第一阶段选择“不借” 是不可信的。考虑到这一点，A 在第一阶段选择“不借” 。

　　即商店的营业利润全部归店员，而店主收取-3 单位的承即商店的营业利润全部归店员，而店主收取包费或租赁费，其实质是一种承包制或租赁制。包费或租赁费，其实质是一种承包制或租赁制。

　　3.4 有同时选择的动态博弈模型有同时选择的动态博弈模型在博弈的某个阶段存在参与人的同时选择有同时选择的两阶段标准模型：有同时选择的两阶段标准模型： 1、四个参与人、 2、第一阶段是参与人 1、2 的选择阶段，他们同时在各自的、、的选择阶段，策略集中分别选择 a1、a2；、； 3、第二阶段是参与人 3、4 的选择阶段，他们在看到参与人、、的选择阶段， 1、2 的选择后在各自的策略集中选择 a3、a4；、、； 4、各参与人的支付取决于所有参与人的策略 ui=ui(a1,a2,a3,a4). 特点：在各个阶段参与人同时行动，但整体是仍是动态博弈，特点：在各个阶段参与人同时行动，但整体是仍是动态博弈，核心均衡概念仍是子博弈精炼纳什均衡，核心均衡概念仍是子博弈精炼纳什均衡，分析方法仍是逆向归纳法。归纳法。

　　讨论：由于 A 处于强势地位，处于强势地位，在第三回合， A 讨论：在第三回合，肯定会提出 S=10000, 因而最后双方的支付是[10000（1 − δ δ 2 ）（，10000（ δ − δ 2 ）]，因而最后双方的支付是，（，越大，双方最终的支付取决于消耗系数 δ 。 δ − δ 2 ）越大，A 所得越（越大。小，B 越大。当 δ =0.5 时， δ − δ 2 有最大值 0.25。。处于强势地位，这表明虽然在博弈中 A 处于强势地位， B 可以跟 A 耗时间” 但 “耗时间” ，不得不“花钱买太平” 也取得一定份额。这样 A 不得不“花钱买太平” 让 B 也取得一定份额。只有当 A ，完全不怕拖时间（的争夺是毁灭性的（完全不怕拖时间（ δ =1）或者 B 的争夺是毁灭性的（ δ =0）时， A 才不需花钱买太平。才不需花钱买太平。现实中的一些经济纠纷就是这样。现实中的一些经济纠纷就是这样。

　　在代理人接受委托并偷懒时，在代理人接受委托并偷懒时，委托人委托的条件是委托的期望收益大于不委托的期望收益，的期望收益大于不委托的期望收益，即：

　　假定私人部门是理性预期的，假定私人部门是理性预期的，会根据政府的货币政策调整预

　　e * 期通涨率，期通涨率，预期通涨率等于 π 。将 π = π 代入政府的反应

　　函数得到均衡的通货膨胀率为：函数得到均衡的通货膨胀率为：得到均衡的通货膨胀率为

　　3.2 子博弈精炼纳什均衡 3.2.1 子博弈子博弈（：由一个动态博弈第一阶段以外的某阶段子博弈（subgame）由一个动态博弈第一阶段以外的某阶段）：后续博弈阶段构成的，初始信息集和开始的后续博弈阶段构成的开始的后续博弈阶段构成的完美体育，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，要的全部信息，能够自成一个博弈的原博弈的一部分，称为原博弈的一个子完美体育博弈。原博弈的一个子博弈。练习：开金矿博弈，练习：开金矿博弈，仿冒与反仿冒子博弈必须有初始信息集。因此，子博弈必须有初始信息集。因此，非完美信息动态博弈可能没有子博弈。分割子博弈时不能改变参与人的信息结构）（分割子博弈时不能改变参与人的信息结构没有子博弈。分割子博弈时不能改变参与人的信息结构）（ 1 ● u 2● l 子博弈不能分割任何信息集：子博弈不能分割任何信息集：割任何信息集 1 ● u 2● l ● L R L ● r l ● R d ● 2 r ● L R

　　两企业的边际成本为 c，无固定成本。则企业 i 用于内，无固定成本。销的产品的成本为 chi，出口的成本为 ceitjei。其中 tj 为另一个国家的进口税率。一个国家的进口税率。博弈顺序是：、、博弈顺序是：1、两个国家同时制定关税 t1,t2。2、然后企业 1、2 根据关税率 t1,t2 同时决定各自的内销和出口产量、 h1，e1 和 h2，e2. 逆向归纳法。逆向归纳法。先求第二阶段企业的策略。先求第二阶段企业的策略。两个企业在假设关税为 t1、 t2 情况下选择各自的内销和出口产量以最大化利润：情况下选择各自的内销和出口产量以最大化利润：

　　五、选择报酬和连续努力水平的委托-代理模型选择报酬和连续努力水平的委托代理模型假设代理人可以在连续区间内选择努力水平 e，代理人，

　　接受合同的机会成本是 U，努力的负效用是努力水平的单调，递增的凸函数 C=C(e)。这样产出函数为 R=R(e).由于信息不。由于信息不对称，委托人不知道 e，支付报酬，对称，，只能根据产出 R 支付报酬， w=w(R), 即但显然 w=w(R)=w[R(e)]. 这样，委托人的支付函数为：这样，委托人的支付函数为：R(e)-w[R(e)],代理人的支代理人的支付函数是：付函数是：w[R(e)]-C(e). 激励机制设计：激励机制设计：代理人参与约束：代理人参与约束：

　　三完美体育、有不确定性但可监督的委托-代理模型有不确定性但可监督的委托代理模型代理人的努力与产出之间存在不确定性，代理人的努力与产出之间存在不确定性，但是委托人可以完全监督代理人，可以根据代理人的努力来确定报酬。以完全监督代理人，可以根据代理人的努力来确定报酬。假设有两种产出情况 20 和 10，，代理人努力时产出 20 的概率为 0.9，产出 10 的概率为 0.1；代理人偷懒时产出 20 的概率为，； 0.1，产出 10 的概率为 0.9。假设 R(0)=0,其余假设与上一模，。其余假设与上一模型一样。型一样。博弈的扩展型为：博弈的扩展型为：自然对高产低产的选择不影响代理人的支付，自然对高产低产的选择不影响代理人的支付，代理人与前一模型没有不同，其努力的激励相容约束仍是

　　是 4e-e2-1，求导得使店主利润最大化的店员努力：，求导得使店主利润最大化的店员努力： e*=2 这样, 这样 B=1

　　代入参与约束并求期望得：将 e*=2，B=1 代入参与约束并求期望得：， A8B-4=1 因而，因而，A=-3,B=1完美体育。。所以，店主的最优激励工资制度是：所以，店主的最优激励工资制度是：

　　第三回合：提出最后的分割方案（，双方支付第三回合：A 提出最后的分割方案（S,10000-S）双方支付），是（ δ 2 S , δ 2 (10000 − S ) ）

　　期望利润为 4(1 − B )e − A . 店员的支付函数是：店员的支付函数是： A B[4e η ] − e 2 。这样，这样，店主必须确定 A、B，使这种工资制度成为一种、，有效的激励。有效的激励。参与约束：参束：

　　非常劳民伤财，则打官司的威胁就是不可信的。如果打官司非常劳民伤财，则打官司的威胁就是不可信的。情况就是：情况就是：

　　所以，承诺或威胁是否可信对于博弈的结果有很大的影响。所以，承诺或威胁是否可信对于博弈的结果有很大的影响。由于存在可信性问题，由于存在可信性问题，纳什均衡不再是动态博弈的适合的均衡解。衡解。看第三种情况。第一阶段选择“ 看第三种情况。策略组合 A:第一阶段选择“借” 第三阶段第一阶段选择，；：第二阶段“ 是一个纳什均衡。 “打” B：第二阶段“分”是一个纳什均衡。证明：的策略， “ 是最佳选择；证明：给定 A 的策略，B“分”是最佳选择；的策略，第一阶段借，给定 B“分”的策略，A 第一阶段借，第三阶段打是最佳选 “ 分的关键，择（第三阶段打不需要实施，但是它是保证 B 分的关键完美动态，因第三阶段打不需要实施，的策略必须包括第三阶段打的策略）而 A 的策略必须包括第三阶段打的策略）但是这个纳什均衡不具有稳定性不具有一致预测性。但是这个纳什均衡不具有稳定性不具有一致预测性。这是因有一致预测性

　　是领先厂商，设市场中有 1、两家厂商生产同样的商品。、2 两家厂商生产同样的商品。厂商 1 是领先厂商，先选择策略— 是追随厂商,根据厂商先选择策略—产量为 q1，厂商 2 是追随厂商根据厂商 1 的产量选择最大化的产量为 q2。市场的总产量为 Q=q1q2.设市场出清设市场出清是总产量的函数：价格 P 是总产量的函数：P=8-Q。两厂商都无固定成本，边际成。两厂商都无固定成本，本相等，本相等，c1=c2=2。。运用逆向归纳法求解运用逆向归纳法求解。逆向归纳法求解。的情况下，首先考虑后行动的厂商 2。在看到厂商 1 的产量为 q1 的情况下，。最大化其支付：厂商 2 的选择产量 q2 最大化其支付：

　　这里，都是努力程度。这里，E,S 都是努力程度。第三阶段：第三阶段：代理人选择努力水平代理人努力的条件（激励相容约束（代理人努力的条件（激励相容约束（Incentive compatibility constraint）)：）：

　　3.3.4 委托代理理论委托-代理理论委托-代理问题：委托代理问题：代理问题委托人委托代理人完成某项工作。委托人的收益与代理人的行为委托人委托代理人完成某项工作。有密切关系，因而委托人需要监督代理人。有密切关系，因而委托人需要监督代理人。但监督会遇到信息不对称的情况，使得监督可能是困难的。在信息不对称情况下，对称的情况，使得监督可能是困难的。在信息不对称情况下，委托人如何设计激励机制（机制设计）（使得代理人的行为符合自己托人如何设计激励机制机制设计）的最大利益，就是委托代理问题的核心代理问题的核心。的最大利益，就是委托-代理问题的核心。根据信息不对称的具体情况，我们分以下几种情况对委托根据信息不对称的具体情况，我们分以下几种情况对委托代理问题进行讨论。代理问题进行讨论。一、无不确定性的委托-代理模型无不确定性的委托代理模型假设代理人的产出是其努力程度的确定性函数。这样委托人假设代理人的产出是其努力程度的确定性函数。根据产出就可以确定代理人是否努力工作，不存在监督问题。根据产出就可以确定代理人是否努力工作，定代理人是否努力工作不存在监督问题。因委托-代理问题就变为委托人选择一份合同，代理问题就变为，此，委托代理问题就变为，委托人选择一份合同，代理人选择是否接受合同，并决定其努力水平。是否接受合同，并决定其努力水平。

　　子博弈精炼纳什均衡（子博弈精炼纳什均衡（subgame perfect Nash equilibrium)，，如果：它是原博弈的纳什均衡；（1)它是原博弈的纳什均衡（（2）如果：它是原博弈的纳什均衡；）它在每一个子博弈上（都构成纳什均衡。都构成纳什均衡。也就是说，一个策略组合是子博弈精炼纳什均衡，也就是说，一个策略组合是子博弈精炼纳什均衡，当只当它在每一个子博弈（包括原博弈）上都构成一个纳什均衡。在每一个子博弈（包括原博弈）上都构成一个纳什均衡。

　　从上例来看，从上例来看，有同时行动的动态博弈的基本解法仍是逆向归纳法，只不过在完美体育各个阶段是静态博弈，纳法，只不过在各个阶段是静态博弈，可以用效用最大化发求解纳什均衡。求解纳什均衡。

　　3.5 逆向归纳法和子博弈精炼纳什均衡的问题逆向归纳法要求“所有参与人是理性的” 逆向归纳法要求“所有参与人是理性的”且这是所有参

　　求一阶条件得：求一阶条件得： q1*=3. 因而 q2*=3－3／2＝3／2.此时市场价格为 3.5，双方的支付分别－／＝／此时市场价格为，是 4.5 和 2.25。。单位产量，子博弈精炼纳什均衡解释厂商 1 在第一阶段选择 3 单位产量，厂单位产量。商 2 在第二阶段选择 1.5 单位产量。请比较古诺模型的纳什均衡解。请比较古诺模型的纳什均衡解。

　　进行合作？进行合作？ —选择 A？现在不清楚参与人 1 选择 A 是因为他是非理性？的，还是因为它想与你合作，因而选择 A，看看参与人 1 到还是因为它想与你合作，，底是什么意思？底是什么意思？的行为的具体含义， —选择 D？由于不知道参与人 1 的行为的具体含义，保险起？见，选择 D。。 ...... 所以，所以，逆向归纳法没有为某些非理性的行为出现时参与人如何选择提供解释。何选择提供解释。

　　都成立，因而有联立方程组：由于上面两式对 i=1,2 和 j=1,2 都成立，因而有联立方程组：

　　Fudenberg Kreps and Levine(1988)将偏离行为解释为将偏离行为解释为是由于有关“支付函数” “ 的信息不确定性造成的，也就是说，是由于有关支付函数” 的信息不确定性造成的，也就是说，实际的支付函数不同于原来认为的支付函数（实际的支付函数不同于原来认为的支付函数（比如在蜈蚣博弈中，参与人并不清楚对方选择合作的概率），从而参与人弈中，参与人并不清楚对方选择合作的概率）从而参与人，在观测到未曾预料到的行为时应该修正有关支付函数的信息。 Selten 从捍卫逆向归纳法的角度出发，认为只要参与人从捍卫逆向归纳法的角度出发，在每个信息集上犯错误的概率是独立，在每个信息集上犯错误的概率是独立，即不会犯系统性错误，那么不论过去的行为是否符合逆向归纳法，参与人都应那么不论过去的行为是否符合逆向归纳法，该继续使用逆向归纳法，因而提出了颤抖手均衡概念(以后再该继续使用逆向归纳法，因而提出了颤抖手均衡概念以后再介绍)。介绍。

　　因此，委托人的任务就是如何设计委托-代理合同使代理因此，委托人的任务就是如何设计委托代理合同使代理人的努力水平等于 e*. 的激励相容约束为：使代理人选择努力水平 e*的激励相容约束为：的激励相容约束为

　　一个具体的例子（店主和店员）一个具体的例子（店主和店员）和随机因素的函数：假设店主的收益是店员努力 e 和随机因素的函数：

网站首页

关于完美体育

产品中心

完美动态

成功案例

荣誉资质

技术支持

联系我们

在线留言

最新公告：

友情链接：