完美体育

咨询热线

400-123-4657

Classification

完美动态

400-123-4657
传真:+86-123-4567
手机:13800000000
邮箱:admin@gzcanna.com
地址:广东省广州市天河区88号
当前位置: 完美体育 > 完美动态

完美体育3完全且完美信息动态博弈

发布时间:2023-01-31 07:27:30 丨 浏览次数:547

  3.1 完全且完美信息动态博弈的特点与解法 (本章所说的动态博弈都是指完全且完美信息动态博弈) 本章所说的动态博弈都是指完全且完美信息动态博弈) 动态博弈的表示方法—— ——扩展型 3.1.1 动态博弈的表示方法——扩展型 动态博弈涉及博弈的参与人多个阶段的选择和选择的顺序 问题,一般难以用策略型表示,而多用扩展型——也称博弈 问题,一般难以用策略型表示,而多用扩展型——也称博弈 —— 。 树——表示(有限博弈) ——表示(有限博弈) 表示 以仿冒与反仿冒为例。 以仿冒与反仿冒为例。 一些名词: 一些名词: 参与人和行动顺序: 参与人和行动顺序: 结点:决策结——参与人决策的点; 结点:决策结——参与人决策的点;终点结 ——参与人决策的点 支付向量:先行动的人的支付排第一, 支付向量:先行动的人的支付排第一,后行动的人的支付排 第二...... 第二 信息集:在完全且完美信息的情况下,处于某一节点的参与 信息集:在完全且完美信息的情况下,处于某一节点的参与 人对这个结点之前的信息都是了解的。 人对这个结点之前的信息都是了解的。所有的信息集都是单 结的。 结的。 路径: 仿冒, 不制止, 路径:第一阶段 A 仿冒,第二阶段 B 不制止,第三阶段 A 仿冒, 制止。 仿冒,第四阶段 B 制止。

  的反应函数。 即厂商 2 的反应函数。 再考虑博弈的第一阶段, 再考虑博弈的第一阶段, 一阶段 厂商 1 选择产量时肯定能够预测到厂商

  三个部分分别是本国消费者剩余, 三个部分分别是本国消费者剩余 , 本国企业利润和税收收 入。 将 hi

  例:国际间最优关税博弈 假设: 假设:两个国家 1、2,两个国家各有一个企业 1、2 生 、 , 、 产同一种商品用于内销和出口。 产同一种商品用于内销和出口。企业 i 生产 hi 供内销和 ei 出 口。 i 国市场的需求函数是: Pi = Pi (Qi ) = a − Qi , i = 1,2 国市场的需求函数是:

  这个结论表明,子博弈纳什均衡结果是消耗系数的函数。 这个结论表明,子博弈纳什均衡结果是消耗系数的函数。 实际上, 那么, 实际上,如果 δ A ≠ δ B ,那么,谁更有耐心,谁就可以再博弈 那么 谁更有耐心, 中占有优势。 中占有优势。

  因为 MfMp,这样政府没有积极性兑现 0 通胀的承诺,而是 这样政府没有积极性兑现 通胀的承诺, 会选择制造通胀以降低失业。 会选择制造通胀以降低失业。 又因为私人部门是理性的, 又因为私人部门是理性的,因而不会相信政府的 0 通胀 承诺,会根据政府的货币政策相应调整其通胀预期, 承诺,会根据政府的货币政策相应调整其通胀预期,这样最 终政府的相机决策的结果是不变的失业率和通胀。 终政府的相机决策的结果是不变的失业率和通胀。 例:股市政策与股市波动。 股市政策与股市波动。

  t 这就是两企业在给定税率 t1, 2 情况下在第二阶段静态博 弈的纳什均衡解。 弈的纳什均衡解。 如果没有关税,则相当于古诺模型, 如果没有关税,则相当于古诺模型,在国内国外两个市 场上双方都得到产量( ) 。 场上双方都得到产量(a-c)/3。 关税的存在使两企业的成本发生了变化, 关税的存在使两企业的成本发生了变化,保护了本国企 业打击了外国企业。 业打击了外国企业。 现在分析第一阶段两国关税博弈。 现在分析第一阶段两国关税博弈。两个国家制定关税率 以最大化本国社会福利: t1,t2 以最大化本国社会福利:

  假设店员是风险中性的,参与约束即简化为: 假设店员是风险中性的,参与约束即简化为:

  就参与约束对 e 求导得 e=2B.(提成比例越高,店员越努力 提成比例越高,店员越努力) 提成比例越高 努力 条件下, 在满足店员参与约束 A B[ 4e η ] − e 2 ≥ 1 条件下,店主的

  这个概率就很小。在这种情况下, 这个概率就很小。在这种情况下,参与人 1 就会选择 D 以确 保一单位的支付。 保一单位的支付。 另外, 另外,即使参与人 1 相信所有参与人都选择 A,但它并 , 不一定能够相信参与人 2 相信所有参与人都选择 A。在这种 。 情况下, 的明智选择。 情况下,选择 D 都是参与人 1 的明智选择。 这个逻辑对所有参与人都是成立的。 这个逻辑对所有参与人都是成立的。 所以,在参与人很多时, 所以,在参与人很多时,子博弈精炼纳什均衡可能不是 对现实的准确描述。 对现实的准确描述。

  四、有不确定性且不可监督的委托-代理模型 有不确定性且不可监督的委托 代理模型 博弈的扩展型为: 博弈的扩展型为: 在这种情况下, 在这种情况下,委托人无法确定高产或低产是代理人努 力的结果还是自然随机影响的结果, 力的结果还是自然随机影响的结果,因而不能根据代理人的 努力程度而只能根据结果支付报酬。 努力程度而只能根据结果支付报酬。在这种不对称信息情况 下,委托人必须设计一种机制使代理人努力工作。 委托人必须设计一种机制使代理人努力工作。 假设代理人和委托人都是风险中性的。 假设代理人和委托人都是风险中性的。 代理人的努力工作的激励相容约束是: 代理人的努力工作的激励相容约束是:

  政策一旦制定后,老百姓可能会根据政策相应的调整行为, 政策一旦制定后,老百姓可能会根据政策相应的调整行为, 由于老百姓的行为发生了改变, 由于老百姓的行为发生了改变,这样原先制定的政策可能就 不再使政府最大化(目标) ,因而政府可能就没有积极性真 不再使政府最大化(目标) 因而政府可能就没有积极性真 ,

  给定私人部门的预期通涨率, 给定私人部门的预期通涨率,政府选择货币政策最大化效用 函数: 函数:

  解最优化问题,得到政府短期的最优通涨率为: 解最优化问题,得到政府短完美体育期的最优通涨率为:

  根据逆向归纳法, 根据逆向归纳法,每个人都会选择 A。但是如果参与人 。 很多的话,这个结果就值得怀疑 实验经济学的结果) 得怀疑( 。这 很多的话,这个结果就值得怀疑(实验经济学的结果) 这 。 是因为, 行动时, 是因为,在参与人 1 行动时,选择 A 以得到 2 的支付需要它 相信 n-1 个参与人都选择 A,在人数很多时可能性就下降。 ,在人数很多时可能性就下降。 比如, 比如,即使每个参与人选择 A 的概率 P 非常就近于 1,但 , 显然, 很大时, n-1 个参与人都选择 A 的概率就是 Pn-1.显然,当 n 很大时, 显然

  ,得到 将(4)代入(2) 得到 y = y 。也就是说,政府企图通过 )代入( ) , 也就是说, 制造一定的通胀以降低失业的做法由于私人部门正确的预 期到了并相应的调整其行为(比如说投资、雇佣工人等) 期到了并相应的调整其行为(比如说投资、雇佣工人等) , 最终结果是失业依然如故,而通货膨胀上去了。 最终结果是失业依然如故,而通货膨胀上去了。

  在代理人选择了接受并偷懒的情况下, 在代理人选择了接受并偷懒的情况下,委托人选择委托的条 件是: 件是:

  努力, 表示代理人偷懒, 努力,1 表示代理人偷懒,且努力的负效用等于努力水平的 数 值 , 即 E=2,S=1 ; 努 力 和 偷 懒 时 的 工 资 分 别 为 w(E)=4,w(S)=2。这样, 。这样,

  通胀? 那么为什么政府不选择 0 通胀?因为 0 通胀不是动态一致 的,这个承诺是不可信的。 这个承诺是不可信的。

  e 通胀承诺, 假定私人部门相信了政府的 0 通胀承诺,给定 π = 0 ,这时

  3.3.3 讨价还价博弈 一、三回合讨价还价 A、B 两人就如何分享 10000 元现金进行谈判。谈判规则如 、 元现金进行谈判。 ,B 下:1、A 提出分割比例(S1,10000-S1) 、 提出分割比例( , 表示接受或不接 2、 如果 B 拒绝 A 的方案, B 提出分割比例 2,10000-S2), 的方案, 提出分割比例(S 受;、 则 , A 表示接受或不接受;3、如果 A 拒绝 B 的方案,则 A 提出 表示接受或不接受; 、 的方案, 最后的分割方案(S, (每回合消耗系 最后的分割方案 ,10000-S),B 只能接受。 每回合消耗系 , 只能接受。 ( 数为 δ ) A● 出 S1 B● 不接受,出 S2 接受

  3.1.3 动态博弈的解法:逆向归纳法 动态博弈的解法: 从上面的例子中可以看出动态博弈的适合的解法是逆向归 纳法( :从博弈的最后一个阶段参与 纳法(backwards induction) 从博弈的最后一个阶段参与 ) : 人的行为开始分析, 逐步倒退回前一阶段相应参与人的行 人的行为开始分析 , 逐步倒退 回前一阶段相应参与人的行 一直到第一阶段。 为......一直到第一阶段。 一直到第一阶段 逆向归纳法的逻辑基础:动态博弈中先行动的参与人, 逆向归纳法的逻辑基础:动态博弈中先行动的参与人,在前 面阶段选择行为时必然会考虑后行动的参与人在后面阶段 中的行为选择, 中的行为选择,只有在最后一阶段的参与人才能不受其他参 与人的制约而直接做出选择。 与人的制约而直接做出选择。而当后面阶段的参与人的选择 确定后,前一阶段的参与人的行为也就容易确定了。 确定后,前一阶段的参与人的行为也就容易确定了。 逆向归纳法排除了不可信的威胁或承诺。 逆向归纳法排除了不可信的威胁或承诺。 讨论: 讨论:助学贷款

  作为对比,我们看看这种相机决策的结果: 作为对比,我们看看这种相机决策的结果: 将通胀率( )代入( )并用( ) 将通胀率(4)代入(1)并用(2)消去 y 得到政府的短期 效应水平为: 效应水平为:

  相反,如果政府实施单一规则的货币政策, 相反,如果政府实施单一规则的货币政策,保证实施 0 通胀 政府实施单一规则的货币政策 政策,则效用水平(大于短期最优的效用水平) 政策,则效用水平(大于短期最优的效用水平)为:

  在第二阶段选择了“不分” “ 为,如果 B 在第二阶段选择了“不分” A“打”的威胁是 , 不可信的。 不会遵守承诺, 不可信的。这样 B 不会遵守承诺,A 也不会愚蠢到依靠一个 不可信的威胁冒险将资金借给他。 不可信的威胁冒险将资金借给他。 由于纳什均衡不能排除参与人策略中不可信的威胁和承诺, 由于纳什均衡不能排除参与人策略中不可信的威胁和承诺, 因而是不稳定的, 因而是不稳定的 , 在分析动态博弈时不能给出一致性的预 测。所以动态博弈中的需要寻找新的均衡概念(子博弈精炼 所以动态博弈中的需要寻找新的均衡概念( 纳时均衡) 。 纳时均衡)

  二、无限回合讨价还价 t=1,3,5...,A 出价 B 选择是否接受,t=2,4,6....B 出价,A 选择是否 选择是否接受, 出价, 接受。 接受。 对于无限回合博弈来说,根据( 对于无限回合博弈来说,根据(Shaked&Sutton,1984),从 )从 第三回合开始和从第一回合开始结果应该是一样的, 因为都是 A 第三回合开始和从第一回合开始结果应该是一样的, 选择是否接受。 。。 出价 B 选择是否接受。。。 即从 A 出价开始的子博弈等价于从 。 t=1 开始的整个子博弈。 开始的整个子博弈。 假定在 出价, 能够得到的最大份额 最大份额是 因为对 假定在 t ≥ 3 ,A 出价,A 能够得到的最大份额是 S.因为对 A 来说, t 因此, B 来说, 期的 S 等价于 t-1 期的 δS , 因此, 在 t-1 期只会给 δS 份 支付为( 额给 A,自己得到 1- δS ,支付为( δS ,1- δS ) , ; 来说, 因为对 B 来说,t-1 期的 1- δS 等价于 t-2 期的 δ (1 − δS ) ,因 A 此, 在 t-2 期只会给 δ (1 − δS ) 份额给 B, , 自己得到 1- δ (1 − δS ) , 支付为(1- δ (1 − δS ) , δ (1 − δS ) ) 支付为( 。 期开始的博弈与从 期开始的博弈完全相同, 因为从 t-2 期开始的博弈与从 t 期开始的博弈完全相同,A 期得到的份额也应相同, 在 t-2 期得到的份额与它在 t 期得到的份额也应相同 , 即 : 1- δ (1 − δS ) =S, , 即: S =

  在选择努力的情况下,代理人接受合同的参与约束是: 在选择努力的情况下,代理人接受合同的参与约束是: 0.9*[w(20)-E]0.1*[w(10)-E]0 委托人知道代理人是否努力。 因为给定 E,S,w(20),w(10), , 委托人知道代理人是否努力。 假设代理人选择努力,委托人选择委托的条件是: 假设代理人选择努力,委托人选择委托的条件是: 0.9*[20-w(20)]0.1*[10-w(10)]0

  是自然失业率下的均衡产量, 是实际产量。 这里 y 是自然失业率下的均衡产量,y 是实际产量。K1 表 明政府受到选民的压力不得不寻求将产量提高到高于自然 律的水平上。这个效用函数表明,政府不喜欢通胀, 律的水平上。这个效用函数表明,政府不喜欢通胀,但是如 果通胀能够使产量提高到高于自然率的水平上, 果通胀能够使产量提高到高于自然率的水平上,那么政府会 在通胀和失业两者之间进行相机选择。 在通胀和失业两者之间进行相机选择。 引入附加预期的 phillips curve:

  正实施这项政策;这样老百姓自然就不会相信这项政策了。 正实施这项政策;这样老百姓自然就不会相信这项政策了。 政策的动态一致性是指一个政策不仅要在制定阶段是最优 的,而且应该在执行阶段也是最优的。 而且应该在执行阶段也是最优的。 (Kydland&Prescott,1977)货币政策模型。参与人是政府和私 货币政策模型。 货币政策模型 人部门。 第一阶段: 私人部门选择预期的通涨率, 第二阶段: 人部门。 第一阶段: 私人部门选择预期的通涨率, 第二阶段: 政府在给定的预期通涨率的情况下选择实际的通货膨胀率 。 以最大化自己的政策目标(失业和通胀) 最大化自己的政策目标(失业和通胀) 设政府单阶段效用函数是: 设政府单阶段效用函数是:

  古诺模型的纳什均衡解( , ) 古诺模型的纳什均衡解(2,2)不是 Stackelberg 的子博弈精

  炼纳什均衡解。 炼纳什均衡解。 威胁说它选择产量 ,这个威胁并不是可信的。 如果厂商 2 威胁说它选择产量 2,这个威胁并不是可信的。 如果厂商 1 不是选择产量 2,而是选择比如说产量 3,那么, , ,那么, 厂商 2 的最优选择是 1.5 而不是威胁的 2。 。 1 ● 2 2● 2 1.5 2 3 ● 1.5 (4.5,2.25)

  偷懒时的参与约束仍是 w( S ) − S 0 。 委托人支付受自然的影响。 委托人支付受自然的影响。 在代理人接受委托并努力工作时, 在代理人接受委托并努力工作时,委托人委托的条件是 委托的期望收益大于不委托的期望收益, 委托的期望收益大于不委托的期望收益,即:

  第二阶段: 第二阶段:代理人选择是否接受合同 如果代理人在第三阶段选择了努力, 如果代理人在第三阶段选择了努力,则选择接受合同的条件 (参与约束 Participation constraint)是: )

  如果代理人在第三阶段选择了偷懒,则参与约束是: 如果代理人在第三阶段选择了偷懒,则参与约束是:

  实际上是代理人接受合同的机会成本。 这里 0 实际上是代理人接受合同的机会成本。 第一阶段: 第一阶段:委托人的选择 在代理人选择了接受并努力工作的情况下, 在代理人选择了接受并努力工作的情况下,委托人选择委托 的条件是: 的条件是:

  与人的“共同知识( 与人的“共同知识(common knowledge of rationality),即 ) ” 所有参与人都相信对方是理性的。 所有参与人都相信对方是理性的。但是现实生活中决策者并 不是完全理性的或不相信其他人都是完全理性的, 不是完全理性的或不相信其他人都是完全理性的,特别是面 临的长期不确定或多个参与人情况时, 临的长期不确定或多个参与人情况时,因而现实中的动态博 长期不确定或多个参与人情况时 弈可能与子博弈精炼纳什均衡结果不一致(一般来说, 弈可能与子博弈精炼纳什均衡结果不一致(一般来说,经济 学理性人假设并不完全准确的, 学理性人假设并不完全准确的,但坚持这一假设没有带来太 多问题。 多问题。为什么理性经济人假设在博弈论和行为经济学等领 域受到挑战?) 域受到挑战?) 此外,还有一些动态博弈不适合逆向归纳法, 此外,还有一些动态博弈不适合逆向归纳法,如对博弈 的结构不是完全了解 太过复杂的博弈,如下棋。 的结构不是完全了解;太过复杂的博弈,如下棋。 举两例说明: 举两例说明: 例 1 很多参与人的情况 1 ● A D (1,...,1) 2 ● A D (1/2,...,1/2) i ......● D (1/i,...,1/i) A n ......● D (1/n,...,1/n) A (2,...,2)

  子博弈纳什均衡可以排除不可信的承诺或威胁。 子博弈纳什均衡可以排除不可信的承诺或威胁。 第一阶段选择“ 例:金矿博弈中策略组合 A:第一阶段选择“借” 第三阶段 第一阶段选择 , ; :第二阶段“ 在整个博弈上是一个纳什均衡, “打” B:第二阶段“分”在整个博弈上是一个纳什均衡, 在第三阶段“ 但是 A 在第三阶段“打”的策略在第三阶段单人博弈构成的 子博弈中不是纳什均衡。 子博弈中不是纳什均衡。 上例中的子博弈精炼纳什均衡解是 A:第一阶段选择 不借” 第一阶段选择 不借” “ , 第三阶段“不打” :第二阶段“不分” ; 第三阶段“不打” B:第二阶段“不分” 。 上例中,第二阶段和第三阶段的行为实际上不会发生, 上例中,第二阶段和第三阶段的行为实际上不会发生,称第 的选择节点为“ 二阶段 A 的选择节点和第三阶段 B 的选择节点为“不在均 衡路径上” 。 衡路径上” 一个子博弈精炼纳什均衡必须对参与人在所有节点上的选 择都作出规定,包括最终不在均衡路径上的选择。 择都作出规定,包括最终不在均衡路径上的选择。

  按照逆向归纳法, 最后均衡结果是 1,1)但是对比 100, ( ) 按照逆向归纳法, 。 ( , 100)的结果,这个结果太令人失望了。 )的结果,这个结果太令人失望了。 现在,假设参与人 1 选择了 A,参与人 2 接着应该怎么 , 行动? 行动? —选择 D?根据逆向归纳法应选择 D,但是同样根据逆向归 ? , 纳法, 的情况, 纳法,不应该出现参与人 1 选择 A 的情况,那么是否继续适 用逆向规纳法? 用逆向规纳法? 可能是他期待与你合作, —选择 A?参与人 1 选择 A 可能是他期待与你合作, ? 因而你

  3.1.2 可信性与纳什均衡的问题 纳什均衡在动态博弈中不再适用。 因为:承诺和威胁的可信性 纳什均衡在动态博弈中不再适用。 因为 承诺和威胁的可信性 问题。 问题。

  例:开金矿博弈 B 有一价值 4 万元的金矿缺一万元资金。A 有一万元资金。 万元的金矿缺一万元资金。 有一万元资金。 B 承诺如果 A 将资金借给他,金矿开采后收益对半分成。问 将资金借给他,金矿开采后收益对半分成。 是否应该借给她? 题:A 是否应该借给她? 如果博弈进行到第二阶段, 的合理行动是“不分” 如果博弈进行到第二阶段,B 的合理行动是“不分” 承诺 , 是不可信的。考虑到这一点, 在第一阶段选择“不借” 是不可信的。考虑到这一点,A 在第一阶段选择“不借” 。

  即商店的营业利润全部归店员, 而店主收取-3 单位的承 即商店的营业利润全部归店员, 而店主收取 包费或租赁费,其实质是一种承包制或租赁制。 包费或租赁费,其实质是一种承包制或租赁制。

  3.4 有同时选择的动态博弈模型 有同时选择的动态博弈模型 在博弈的某个阶段存在参与人的同时选择 有同时选择的两阶段标准模型: 有同时选择的两阶段标准模型: 1、四个参与人 、 2、第一阶段是参与人 1、2 的选择阶段,他们同时在各自的 、 、 的选择阶段, 策略集中分别选择 a1、a2; 、 ; 3、第二阶段是参与人 3、4 的选择阶段,他们在看到参与人 、 、 的选择阶段, 1、2 的选择后在各自的策略集中选择 a3、a4; 、 、 ; 4、各参与人的支付取决于所有参与人的策略 ui=ui(a1,a2,a3,a4). 特点: 在各个阶段参与人同时行动, 但整体是仍是动态博弈, 特点: 在各个阶段参与人同时行动, 但整体是仍是动态博弈, 核心均衡概念仍是子博弈精炼纳什均衡, 核心均衡概念仍是子博弈精炼纳什均衡,分析方法仍是逆向 归纳法。 归纳法。

  讨论: 由于 A 处于强势地位, 处于强势地位, 在第三回合, A 讨论: 在第三回合, 肯定会提出 S=10000, 因而最后双方的支付是[10000(1 − δ δ 2 ) ( ,10000( δ − δ 2 )], 因而最后双方的支付是 , ( , 越大, 双方最终的支付取决于消耗系数 δ 。 δ − δ 2 )越大,A 所得越 ( 越大。 小,B 越大。当 δ =0.5 时, δ − δ 2 有最大值 0.25。 。 处于强势地位, 这表明虽然在博弈中 A 处于强势地位, B 可以跟 A 耗时间” 但 “耗时间” , 不得不“花钱买太平” 也取得一定份额。 这样 A 不得不“花钱买太平” 让 B 也取得一定份额。只有当 A , 完全不怕拖时间( 的争夺是毁灭性的( 完全不怕拖时间( δ =1)或者 B 的争夺是毁灭性的( δ =0)时, A 才不需花钱买太平。 才不需花钱买太平。 现实中的一些经济纠纷就是这样。 现实中的一些经济纠纷就是这样。

  在代理人接受委托并偷懒时, 在代理人接受委托并偷懒时,委托人委托的条件是委托 的期望收益大于不委托的期望收益, 的期望收益大于不委托的期望收益,即:

  假定私人部门是理性预期的, 假定私人部门是理性预期的,会根据政府的货币政策调整预

  e * 期通涨率, 期通涨率,预期通涨率等于 π 。将 π = π 代入政府的反应

  函数得到均衡的通货膨胀率为: 函数得到均衡的通货膨胀率为: 得到均衡的通货膨胀率为

  3.2 子博弈精炼纳什均衡 3.2.1 子博弈 子博弈( :由一个动态博弈第一阶段以外的某阶段 子博弈(subgame) 由一个动态博弈第一阶段以外的某阶段 ) : 后续博弈阶段构成的, 初始信息集和 开始的后续博弈阶段构成的 开始的后续博弈阶段构成的完美体育,有初始信息集和进行博弈所需 要的全部信息,能够自成一个博弈的原博弈的一部分, 要的全部信息,能够自成一个博弈的原博弈的一部分,称为 原博弈的一个子完美体育博弈。 原博弈的一个子博弈。 练习:开金矿博弈, 练习:开金矿博弈,仿冒与反仿冒 子博弈必须有初始信息集。因此, 子博弈必须有初始信息集。因此,非完美信息动态博弈可能 没有子博弈。 分割子博弈时不能改变参与人的信息结构) (分割子博弈时不能改变参与人的信息结构 没有子博弈。 分割子博弈时不能改变参与人的信息结构) ( 1 ● u 2● l 子博弈不能分割任何信息集: 子博弈不能分割任何信息集: 割任何信息集 1 ● u 2● l ● L R L ● r l ● R d ● 2 r ● L R

  两企业的边际成本为 c,无固定成本。则企业 i 用于内 ,无固定成本。 销的产品的成本为 chi,出口的成本为 ceitjei。其中 tj 为另 一个国家的进口税率。 一个国家的进口税率。 博弈顺序是: 、 、 博弈顺序是:1、两个国家同时制定关税 t1,t2。2、然后 企业 1、2 根据关税率 t1,t2 同时决定各自的内销和出口产量 、 h1,e1 和 h2,e2. 逆向归纳法。 逆向归纳法。 先求第二阶段企业的策略。 先求第二阶段企业的策略。两个企业在假设关税为 t1、 t2 情况下选择各自的内销和出口产量以最大化利润: 情况下选择各自的内销和出口产量以最大化利润:

  五、选择报酬和连续努力水平的委托-代理模型 选择报酬和连续努力水平的委托 代理模型 假设代理人可以在连续区间内选择努力水平 e,代理人 ,

  接受合同的机会成本是 U,努力的负效用是努力水平的单调 , 递增的凸函数 C=C(e)。这样产出函数为 R=R(e).由于信息不 。 由于信息不 对称, 委托人不知道 e, 支付报酬, 对称, , 只能根据产出 R 支付报酬, w=w(R), 即 但显然 w=w(R)=w[R(e)]. 这样,委托人的支付函数为: 这样,委托人的支付函数为:R(e)-w[R(e)],代理人的支 代理人的支 付函数是: 付函数是:w[R(e)]-C(e). 激励机制设计: 激励机制设计: 代理人参与约束: 代理人参与约束:

  三完美体育、有不确定性但可监督的委托-代理模型 有不确定性但可监督的委托 代理模型 代理人的努力与产出之间存在不确定性, 代理人的努力与产出之间存在不确定性,但是委托人可 以完全监督代理人,可以根据代理人的努力来确定报酬。 以完全监督代理人,可以根据代理人的努力来确定报酬。假 设有两种产出情况 20 和 10, , 代理人努力时产出 20 的概率为 0.9,产出 10 的概率为 0.1;代理人偷懒时产出 20 的概率为 , ; 0.1,产出 10 的概率为 0.9。假设 R(0)=0,其余假设与上一模 , 。 其余假设与上一模 型一样。 型一样。 博弈的扩展型为: 博弈的扩展型为: 自然对高产低产的选择不影响代理人的支付, 自然对高产低产的选择不影响代理人的支付,代理人与 前一模型没有不同,其努力的激励相容约束仍是

  是 4e-e2-1,求导得使店主利润最大化的店员努力: ,求导得使店主利润最大化的店员努力: e*=2 这样, 这样 B=1

  代入参与约束并求期望得: 将 e*=2,B=1 代入参与约束并求期望得: , A8B-4=1 因而, 因而,A=-3,B=1完美体育。 。 所以,店主的最优激励工资制度是: 所以,店主的最优激励工资制度是:

  第三回合: 提出最后的分割方案( ,双方支付 第三回合:A 提出最后的分割方案(S,10000-S) 双方支付 ) , 是( δ 2 S , δ 2 (10000 − S ) )

  期望利润为 4(1 − B )e − A . 店员的支付函数是: 店员的支付函数是: A B[4e η ] − e 2 。 这样, 这样,店主必须确定 A、B,使这种工资制度成为一种 、 , 有效的激励。 有效的激励。 参与约束: 参束:

  非常劳民伤财,则打官司的威胁就是不可信的。 如果打官司 非常劳民伤财,则打官司的威胁就是不可信的。 情况就是: 情况就是:

  所以,承诺或威胁是否可信对于博弈的结果有很大的影响。 所以,承诺或威胁是否可信对于博弈的结果有很大的影响。 由于存在可信性问题, 由于存在可信性问题,纳什均衡不再是动态博弈的适合的均 衡解。 衡解。 看第三种情况。 第一阶段选择“ 看第三种情况。策略组合 A:第一阶段选择“借” 第三阶段 第一阶段选择 , ; :第二阶段“ 是一个纳什均衡。 “打” B:第二阶段“分”是一个纳什均衡。 证明: 的策略, “ 是最佳选择; 证明:给定 A 的策略,B“分”是最佳选择; 的策略, 第一阶段借, 给定 B“分”的策略,A 第一阶段借,第三阶段打是最佳选 “ 分的关键, 择(第三阶段打不需要实施,但是它是保证 B 分的关键完美动态,因 第三阶段打不需要实施, 的策略必须包括第三阶段打的策略) 而 A 的策略必须包括第三阶段打的策略) 但是这个纳什均衡不具有稳定性不具有一致预测性。 但是这个纳什均衡不具有稳定性不具有一致预测性。这是因 有一致预测性

  是领先厂商, 设市场中有 1、 两家厂商生产同样的商品。 、2 两家厂商生产同样的商品。 厂商 1 是领先厂商, 先选择策略— 是追随厂商,根据厂商 先选择策略—产量为 q1,厂商 2 是追随厂商 根据厂商 1 的产量 选择最大化的产量为 q2。市场的总产量为 Q=q1q2.设市场出清 设市场出清 是总产量的函数: 价格 P 是总产量的函数:P=8-Q。两厂商都无固定成本,边际成 。两厂商都无固定成本, 本相等, 本相等,c1=c2=2。 。 运用逆向归纳法求解 运用逆向归纳法求解。 逆向归纳法求解。 的情况下, 首先考虑后行动的厂商 2。在看到厂商 1 的产量为 q1 的情况下, 。 最大化其支付: 厂商 2 的选择产量 q2 最大化其支付:

  这里, 都是努力程度。 这里,E,S 都是努力程度。 第三阶段: 第三阶段:代理人选择努力水平 代理人努力的条件(激励相容约束( 代理人努力的条件(激励相容约束(Incentive compatibility constraint)): ):

  3.3.4 委托 代理理论 委托-代理理论 委托-代理问题: 委托 代理问题: 代理问题 委托人委托代理人完成某项工作。 委托人的收益与代理人的行为 委托人委托代理人完成某项工作。 有密切关系, 因而委托人需要监督代理人。 有密切关系, 因而委托人需要监督代理人。但监督会遇到信息不 对称的情况,使得监督可能是困难的。在信息不对称情况下, 对称的情况,使得监督可能是困难的。在信息不对称情况下,委 托人如何设计激励机制(机制设计) ( 使得代理人的行为符合自己 托人如何设计激励机制 机制设计) 的最大利益,就是委托 代理问题的核心 代理问题的核心。 的最大利益,就是委托-代理问题的核心。 根据信息不对称的具体情况,我们分以下几种情况对委托 根据信息不对称的具体情况,我们分以下几种情况对委托代理问题进行讨论。 代理问题进行讨论。 一、无不确定性的委托-代理模型 无不确定性的委托 代理模型 假设代理人的产出是其努力程度的确定性函数。 这样委托人 假设代理人的产出是其努力程度的确定性函数。 根据产出就可以确定代理人是否努力工作,不存在监督问题。 根据产出就可以确定代理人是否努力工作, 定代理人是否努力工作 不存在监督问题。因 委托-代理问题就变为 委托人选择一份合同, 代理问题就变为, 此,委托 代理问题就变为,委托人选择一份合同,代理人选择 是否接受合同,并决定其努力水平。 是否接受合同,并决定其努力水平。

  子博弈精炼纳什均衡( 子博弈精炼纳什均衡(subgame perfect Nash equilibrium), , 如果: 它是原博弈的纳什均衡; (1)它是原博弈的纳什均衡 ( (2) 如果: 它是原博弈的纳什均衡; )它在每一个子博弈上 ( 都构成纳什均衡。 都构成纳什均衡。 也就是说,一个策略组合是子博弈精炼纳什均衡, 也就是说,一个策略组合是子博弈精炼纳什均衡,当只当它 在每一个子博弈(包括原博弈)上都构成一个纳什均衡。 在每一个子博弈(包括原博弈)上都构成一个纳什均衡。

  从上例来看, 从上例来看,有同时行动的动态博弈的基本解法仍是逆向归 纳法,只不过在完美体育各个阶段是静态博弈, 纳法,只不过在各个阶段是静态博弈,可以用效用最大化发 求解纳什均衡。 求解纳什均衡。

  3.5 逆向归纳法和子博弈精炼纳什均衡的问题 逆向归纳法要求“所有参与人是理性的” 逆向归纳法要求“所有参与人是理性的”且这是所有参

  求一阶条件得: 求一阶条件得: q1*=3. 因而 q2*=3-3/2=3/2.此时市场价格为 3.5,双方的支付分别 - / = / 此时市场价格为 , 是 4.5 和 2.25。 。 单位产量, 子博弈精炼纳什均衡解释厂商 1 在第一阶段选择 3 单位产量, 厂 单位产量。 商 2 在第二阶段选择 1.5 单位产量。 请比较古诺模型的纳什均衡解。 请比较古诺模型的纳什均衡解。

  进行合作? 进行合作? —选择 A?现在不清楚参与人 1 选择 A 是因为他是非理性 ? 的,还是因为它想与你合作,因而选择 A,看看参与人 1 到 还是因为它想与你合作, , 底是什么意思? 底是什么意思? 的行为的具体含义, —选择 D?由于不知道参与人 1 的行为的具体含义,保险起 ? 见,选择 D。 。 ...... 所以, 所以,逆向归纳法没有为某些非理性的行为出现时参与人如 何选择提供解释。 何选择提供解释。

  都成立,因而有联立方程组: 由于上面两式对 i=1,2 和 j=1,2 都成立,因而有联立方程组:

  Fudenberg Kreps and Levine(1988)将偏离行为解释为 将偏离行为解释为 是由于有关“支付函数” “ 的信息不确定性造成的, 也就是说, 是由于有关 支付函数” 的信息不确定性造成的, 也就是说, 实际的支付函数不同于原来认为的支付函数( 实际的支付函数不同于原来认为的支付函数(比如在蜈蚣博 弈中,参与人并不清楚对方选择合作的概率) ,从而参与人 弈中,参与人并不清楚对方选择合作的概率) 从而参与人 , 在观测到未曾预料到的行为时应该修正有关支付函数的信 息。 Selten 从捍卫逆向归纳法的角度出发,认为只要参与人 从捍卫逆向归纳法的角度出发, 在每个信息集上犯错误的概率是独立, 在每个信息集上犯错误的概率是独立 , 即不会犯系统性错 误,那么不论过去的行为是否符合逆向归纳法,参与人都应 那么不论过去的行为是否符合逆向归纳法, 该继续使用逆向归纳法, 因而提出了颤抖手均衡概念(以后再 该继续使用逆向归纳法, 因而提出了颤抖手均衡概念 以后再 介绍)。 介绍 。

  因此, 委托人的任务就是如何设计委托-代理合同使代理 因此, 委托人的任务就是如何设计委托 代理合同使代理 人的努力水平等于 e*. 的激励相容约束为: 使代理人选择努力水平 e*的激励相容约束为: 的激励相容约束为

  一个具体的例子(店主和店员) 一个具体的例子(店主和店员) 和随机因素的函数: 假设店主的收益是店员努力 e 和随机因素的函数:

Copyright © 2012-2022 完美体育 版权所有
电 话:400-123-4657    手 机:13800000000   传 真:+86-123-4567    E-mail:admin@gzcanna.com
地 址:广东省广州市天河区88号
粤ICP备17070116号

扫一扫关注完美体育

免费咨询 投诉建议
网站地图