完美体育

咨询热线

400-123-4657

Classification

完美动态

400-123-4657
传真:+86-123-4567
手机:13800000000
邮箱:admin@gzcanna.com
地址:广东省广州市天河区88号
当前位置: 完美体育 > 完美动态

【精品】三章完全且完完美体育美动态博弈

发布时间:2023-02-19 17:23:44 丨 浏览次数:996

  第三章完全且完美动态博弈博弈种类: 静态, 动态; 完全信息, 不完全信息; 完美信息, 不完美信息 3.1 动态博弈的表示法和特点 动态博弈根本特征是各博弈方不是同时的, 而是先后、 依次进行选择或行动。 信息不对称: 后行为的博弈方有更多的信息帮助自己选择行为。 具有较多信息就一定有较好结果并不总是成立; 单人博弈, 两人博弈 完美博弈与不完美博弈 3.1 .1 阶段和扩展形(扩展式) 表示 各博弈方选择行动有先后次序, 各博弈方的选择行动会形成依次相连的时间阶段, 因此, 动态博弈中一个博弈方的一次选择行动常称为一个“阶段” (stage) 。 动态博弈中也可能存在几个...

  第三章完全且完美动态博弈博弈种类: 静态, 动态; 完全信息, 不完全信息; 完美信息, 不完美信息 3.1 动态博弈的表示法和特点 动态博弈根本特征是各博弈方不是同时的, 而是先后、 依次进行选择或行动。 信息不对称: 后行为的博弈方有更多的信息帮助自己选择行为。 具有较多信息就一定有较好结果并不总是成立; 单人博弈, 两人博弈 完美博弈与不完美博弈 3.1 .1 阶段和扩展形(扩展式) 表示 各博弈方选择行动有先后次序, 各博弈方的选择行动会形成依次相连的时间阶段, 因此, 动态博弈中一个博弈方的一次选择行动常称为一个“阶段” (stage) 。 动态博弈中也可能存在几个博弈方同时选择的情况, 这时这些博弈方的同时选择构成一个阶段。 一个动态博弈至少有两个阶段。 动态博弈又称“多阶段博弈” (multistage games) , 又称 “ 序 列 博 弈 ” ( “ 序 贯 博 弈 ” )(sequential games) 。  通过选择节点、 从选择节点出发表示博弈方各种可能选择的线段, 以及博弈终端处的得益数组表示动态博弈的方法。 这种表示法称为“扩展形” (“扩展式” ) , “博弈树” 。 扩展式可以反映动态博弈中博弈方的选择次序和博弈的阶段, 因此是表示动态博弈的最佳方法。 因此, 动态博弈有时被称为“扩展式博弈”(extensive form game) 枝 信息集 ABAB仿 冒不 仿 冒( 0, 10)( -2, 5)( 2, 2)( 10, 4)( 5, 5)制 止不 制 止仿 冒不 仿 冒制 止不 制 止仿 冒 和 反 仿 冒 博 弈 扩 展 形 3.1 .2 动态博弈的基本特点 动态博弈的策略和结果 静态博弈: 博弈方一次性同时选择的行动(行为) 就是博弈方的策略, 这些策略的策略组合,以及所对应的各方得益, 就是博弈的结果。 动态博弈: 动态博弈博弈方决策的内容, 也是决定博弈结果的关键, 不是博弈方在单个阶段的行为, 而是各博弈方在整个博弈中轮到选择的每个阶段, 针对前面阶段的各种情况作相应选择和行为的完整计划, 以及由不同博弈方的这种计划构成的组合。 这种计划就是动态博弈中博弈方的“策略” 。  动态博弈的结果:首先是指各博弈方上述类型的策略构成的策略组合。其次, 是各博弈方的策略组合形成的一条联接各个阶段的“路径” (path) 。最后, 实施上述策略组合的最终结果, 落实到上述路径终端处得益数组中的数字。 在一个动态博弈中, 博弈的结果包括双方(多方) 采用的策略组合, 实现的博弈路径和各博弈方的支付(得益) 。  动态博弈的非对称性 先后次序, 且后行动者能观察到此前选择行动博弈方的选择行动, 地位是不对称的。 [同样存在, 信息综合症]。 3.2 可信性(可信度) 和纳什均衡的问题 所谓可信性是指动态博弈中先行为的博弈方是否该相信后行为的博弈方会采取对自己有利的或不利的行为。 后行为方将来会采取对先行为方有利的行为相当于一种“许诺” , 而将来会采取对先行为 方不利的 行为 相 当 于一种“威胁” , 因此我可将可信性分为“许诺的可信性” 和“威胁的可信性” 。 乙甲借不 借( 0, 10)分不 分( 0, 4)开 金 矿 博 弈( 2, 2) 开金矿: 3.2.1 相机选择和策略中的可信性问题 动态博弈中, 博弈方的策略是他们自己预先设定的, 在各个博弈阶段, 针对各种情况的相应行动选择的计划。 这种策略实际上没有强制力,而且实施起来有一个过程, 因此只要符合博弈方自己的利益, 他们完全可以在博弈过程中改变计划。 我们称这种问题为动态博弈中的“相机选择” (contingent play) 问题。 相机选择的存在使得博弈方的策略中, 所设定的各个阶段、 各种情况下会采取行为的“可信性” (credibility) 有了疑问。 乙甲借不 借( 0, 10)分不 分( 0, 4)开 金 矿 博 弈( 2, 2) 开金矿: 乙甲乙借不 借分不 分打不 打法 律 保 障 不 足 的 开 金 矿 博 弈( 1, 0)( 2, 2)( -1, 0)( 0, 4)乙的策略: “第一阶段借, 当甲第二阶段选择不分时, 第三阶选择打” , 甲的策略“第二阶段无条件分” , 构成纳什均衡。 内 在不稳定性: “ 不可信的” incredible“空头威胁” ( emthreats)乙甲乙借不 借分不 分打不 打有 法 律 保 障 的 开 金 矿 博 弈( 1, 0)( 2, 2)( 1, 0)( 0, 4)  先来后到:1122进不进(0,1 0) (0,1 0)进不进打不打打不打(-3,6) (5,5) (-3,6) (5,8)先来后到博弈先来后到不可信博弈 3.2.2 逆推归纳法(逆向归纳法) 逻辑基础: 动态博弈中先行动的理性的博弈方, 在前面阶段选择行动时, 必然会考虑后行动博弈方在后面阶段中将会怎样选择行动完美体育, 只有在博弈的最后一个阶段选择的, 不再有后续阶段牵制的博弈方, 才能直接作出明确选择。 而当后面阶段博弈方的选择确定以后, 前一阶段博弈方的行动也就容易确定了。  方法: 从动态博弈的最后一个阶段开始分析,每一次确定所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段, 那么这个阶段及以后的博弈结果就可以肯定下来, 该阶段的选择节点等于一个结果终端。 我们甚至可以用不包括该阶段与其后所有阶段博弈的等价博弈来代替原来的博弈。 方法:就是从动态博弈的最后一个阶段或最后一个子博弈开始,步向前倒推以求解动态博弈的方法. 乙甲借不 借( 0, 10)分不 分( 0, 4)法 律 保 障 不 足 开 金 矿 博 弈 的 等 价 博 弈( 2, 2)乙甲借不 借( 0, 4)( 1, 0)法 律 保 障 不 足 开 金 矿 博 弈 的 等 价 博 弈 开金矿:  先来后到:112进不进(0,1 0) (-3,6) (0,10)进不进打不打(-3,6) (5,5) 先来后到博弈  逆推归纳法把多阶段动态博弈化为一系列的单人博弈, 通过对一系列单人博弈的分析, 确定各博弈方在各自选择阶段的选择, 最终对动态博弈结果, 包括博弈的路径和各博弈方的得益等作出判断, 归纳各个博弈方各阶段的选择则可得到各个博弈方在整个动态博弈中的策略。 逆推归纳法确定的各个博弈方在各阶段的选择,都是建立在后续阶段各个博弈方理性选择的基础之上, 因此自然排除了 包含不可置信的威胁或承诺的可能性, 因此得出的结论是比较可靠的, 确定的各博弈方的策略组合是稳定的。 3.3 子博弈和子博弈完美纳什均衡 3.3.1 子博弈 定义: 子博弈即能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段, 它必须有一人初始信息集, 且具备进行博弈所需要的各种信息乙甲乙借不 借分不 分打不 打有 不 可 信 的 威 胁 和 诺 言 开 金 矿 博 弈 的 子 博 弈( 1, 0)( 2, 2)( -1, 0)( 0, 4) 乙甲乙借不 借分不 分打不 打有 不 可 信 的 威 胁 和 诺 言 开 金 矿 博 弈 的 子 博 弈( 1, 0)( 2, 2)( -1, 0)( 0, 4)乙甲乙借不 借分不 分打不 打有 不 可 信 的 威 胁 和 诺 言 开 金 矿 博 弈 的 两 级 子 博 弈( 1, 0)( 2, 2)( -1, 0)( 0, 4) 3.3.2 子博弈完美纳什均衡 定义1 :各博弈方的策略构成的一个策略组合满足, 在整个动态博弈及它的所有子博弈中都构成纳什均衡, 那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡” 。如果在一个完美信息的动态博弈中, 定义2: 如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡, 则称该策略组合为一个“子博弈完美纳什均衡” 。 满足条件: 1 .既是纳什均衡,从而具有策略稳定性; 2.又不能包含任何的不会信守的许诺或威胁,  Subgame perfect Nash equilibrium 子博弈精炼纳什均衡(Selton, 1 965) 泽尔腾 目 的: 将不可置信的威胁策略的纳什均衡从均衡中剔除, 从而给出动态博弈结果的一个合理预测。 与纳什均衡的根本不同之处: 能够排除均衡策略中不可信的威胁或承诺, 因此是真正稳定的。 子博弈完美纳什均衡本身也是纳什均衡, 是比纳什均衡更强的均衡 注意点: 第一:在动态博弈中强调要求各博弈方的策略对每阶段每种可能的情况都设定一个行动方案; 第二:在分析动态博弈时,必须始终假定和强调所有博弈方都有是理性的和不会犯错误. 海盗分金 五个海盗要分配抢来的1 00枚金币, 第一个人提出 一种分配方案, 如果同 意这种方案的人达到半数, 那么 提议通过, 否则 提议的人就被扔进大海, 由剩下的人再进行同 样的过程。 假设五人提议的次序给定, 金币 不能分割 , 而且海盗的本性让他们觉得, 如果对自 己的收益没有影响, 则 很乐意看到 别 人被扔进大海,这时, 理性结局应该什么样的? 逆向归纳法: 我们用I=1 ,2,,5表示按顺序先后提议的五个参与者, xi表示每个人获得的金币数。 如果只剩下2个人(4和5) , 则4会建议x4=100, x5=0。 如果剩下3个人, 则3会建议x3=99, x4=0, x5=1 如果剩下4个人, 则2会建议x2=99, x3=0, x4=1 , x5=0 博弈开始, 1 会建议x1=98, x2=0, x3=1, x4=0, x5=1. 博弈结束。 子博弈完美均衡。 3.4 几个经典动态博弈模型 3.4.1 寡头的Stackelberg模型---动态的寡头市场产量博弈 寡头市场两厂商, 一方强一方弱完美体育, 决策内容是产量 产量由较强的一方先进行选择, 较弱方则根据较强一方的产量选择自己的产量 领先企业1 , 追随企业2 决策内容: 产量的选择, 无数个, 扩展式, 得益函数(支付函数) 策略空间都是中的所有实数 最大限度产量, 企业生产能力中较低的一个水平 同古诺模型惟一区别只是两博弈方的选择是先后而不是同时 厂商1 是领头企业, 厂商2追随者, 生产同质产品, 先后决定各自的产量; 产量分为q1 、 q2, 总产量Q= q1 + q2 P是产品价格= 市场出清价格, P是所有厂商生产的总产量的减函数, 即: P= P(Q)= a-Q= 8-Q, 说明当一个厂商增加产出时, 它不仅对自己的产出降低价格, 而且同时降低价格的行为被所有别的厂商接受; 两厂商的生产都无固定成本, 且每增加一单位产量的边际生产成本相等C1 = C2= 2 生产q1 、 q2产量的成本为2q1 、 2q2;  U1= q1P(Q)-C1q1= q1[8-(q1+q2)]-2q1=6q1 q1q2 q1q1 U2= q2P(Q)-C2q2= q2[8 (q1+q2)] 2q2=6q2 q1q2 q2q2 采用逆向归纳法: 先分析第二阶段厂商2的决策, 厂商1 的q1 已决定, 并且厂商2知道q 1 , 即对厂商2来说相当在给定q 1 的情况下求使其U2实现最大化的q2, q 2满足: 6 q 1 2q 2= 0q 2= 3-q 1 / 2 厂商1 在选择q 1时已知道厂商2按上式确定其产量, 则将q2代入: U1 =6q 1 - q 1 q2 - q 1q 1 = 3q 1-q 1q 1 / 2 q2 = 1 .5 q 1= 3U1= 4.5 U2= 2.25 p= 3 3.4.2 劳资博弈 里昂惕夫(Leontief, 1 946) : 代表劳资双方的工会和企业之间的博弈 该博弈模型假定工资完全由工会决定, 企业只是根据工会要求的工资高低决定雇佣工人的数量。 工会追求的目标: 工资率, 就业数 企业: 假设收益利润函数, 企业只有劳动成本, 总成本( )R LW L×, 假定博弈过程: 先由工会确定工资率, 再由企业据以决定劳动数 假定工资率和雇佣数是连续可分的, 因此双方都有无限多种选择。 工会和企业的得益分别是效用, 利润( , )u W Lu=( , )W L==( )R LW L×(, )u W L( , )W L 3.4.3 讨价还价博弈Bargaining 议价 三回合讨价还价 两个人1 , 2 分享1 0000元 规则: 1 提出方案, 2接受, 结束; 拒绝, 继续进行 2提出方案, 1 接受, 结束; 拒绝, 继续进行; 1 提出方案, 2必须接受, 结束。 谈判费用, 利息损失等, 消耗系数 第一回合: 1 S1, 1 0000-S1;2 S2, 1 0000-S2;3S1, 1 0000-S1S , (100002,(10000S;(01)22)S),10000SS2S 121出 S1 接 受( S1,10 000-S1)不 接 受 ,出 S2 接 受不 接 受 ,出 S[S2,(10 000-S2)][2S,2(10 000-S)]图 3.11 三 回 合 讨 价 还 价 博 弈 3.5 有同时选择的两阶段动态博弈 博弈中存在在同一阶段有两个或两个以上博弈方同时选择的情况; 不是完美信息完美动态, 介于完美信息和非完美信息间。 案例: 银行挤兑的成因和预防 假定一银行, 只有两存户 各存1 00万, 银行的全部资金就是这200万。 银行拿总数为200万的这笔钱做投资。 项目 完成投资收回280万,银行全部偿还给存户 , 每个存户 得到1 40万。但未到期抽回存款, 则只能收回140元, 银行只有拿出1 40万付给储户 。 客户日 期两种: 日 期1--未到期; 日 期2到期 如果双方同时提前抽调存款, 每人只能得70万; 如果双方期满支取存款, 每人可得140万; 如果只有一方提前支取, 那么他得到原来的存额1 00万, 而银行被迫提前抽回投资完美体育, 可动用资金只有1 40万, 而另一储户期满时来兑现其存款时, 银行就要破产, 他只能得到40万的补偿; 储户乙不抽1 00,40抽回抽回储户甲不抽银行挤兑----日期1储户乙不抽1 80,1 00抽回抽回储户甲不抽银行挤兑----日期270,70 40,1 00 下一日期1 40,1 40 1 00,1 80 1 40,1 40 储户乙存款不存1 ,1 不存储户甲存款银行挤兑----第一阶段储户乙到期提前0.8, 0.8提前储户甲到期银行挤兑----第二阶段1 ,11 ,1 下一阶段1 , 0.60.6, 1 1 .2, 1 .2 储户乙存款不存1 ,1 1 ,1不存储户甲存款银行挤兑----第一阶段1储户乙存款1 , 1不存1 , 1不存储户甲存款银行挤兑----第一阶段21 ,1 1 .2, 1 .21 , 1 0.8, 0.8 3.6动态博弈分析的问题和扩展讨论 3.6.1 逆推归纳法的问题 只能分析明确设定的博弈问题, 要求博弈的结构, 包括次序、 规则和得益(支付) 情况等都非常清楚, 并且各个博弈方了 解博弈结构, 相互知道对方了解博弈结构。 逆推归纳法不能分析比较复杂的的动态博弈。象棋博弈。 遇到两条路径利益相同的情况时逆推归纳法也会发送选择困难。 惟一最优选...

  完美体育

  完美体育

Copyright © 2012-2022 完美体育 版权所有
电 话:400-123-4657    手 机:13800000000   传 真:+86-123-4567    E-mail:admin@gzcanna.com
地 址:广东省广州市天河区88号
粤ICP备17070116号

扫一扫关注完美体育

免费咨询 投诉建议
网站地图