完美体育完全且完美信息动态博弈--动态博弈的扩展式表示法

Classification

完美动态

400-123-4657

传真：+86-123-4567
手机：13800000000
邮箱：admin@gzcanna.com
地址：广东省广州市天河区88号

发布时间：2022-12-06 16:06:18 丨浏览次数：519

　　现实中的许多决策活动是有先后顺序的，往往是依次选择行为而不是同选择行为，而且后选择行为的博弈方能够看到先选择行为博弈方的选择内容，所以后面博弈方的决策要受到以前博弈方决策行为的影响，每一个博弈方都会根据在决策时所掌握的全部信息来作出自己的最优策略。也就是说每个博弈方的策略是决策者在决策时所掌握全部信息的函数。比如下象棋，双方相继行动，每个人在每一时刻的决策都是前面一系列决策所掌握信息的函数。又比如房地产开发选择、拍卖活动中的轮流竞价。依次选择与一次性同时选择有很大差异，因此这种决策问题构成的博弈与静态博弈有很大的不同，我们称它们为“动态博弈”( Dynamic Games)或“序贯博弈”( Sequential- Move Game)。

　　在动态博弈中，各博弈方不是同时而是先完美体育后选择行为，每个博弈方要考虑的问题是如果我采用这个策略，对方会采取怎样的应对策略（你来我往）。我采取的这个策略将如何影响我自己及对手未来的策略选择完美体育，这一特点使得动态博弈在表示方法上采用扩展式方法来描述和分析动态博弈。

　　动态博弈的扩展形也称为“博弈树”。动态博弈各个博弈方的选择行为有先后次序，第一个行动选择对应的决策节称为“初始节”，每一个选择节点所包含的所有信息叫做“信息集”。各博弈方的选择行为会依次形成相连的博弈阶段，因此动态博弈中博弈方的一次选择行为常称为一个阶段。动态博弈中可能存在几个博弈同时选择的情况，这时这些博弈方的同时选择也构成一个阶段。一个动态博弈至少有两个阶段，因此动态博弈有时也称为多阶段博弈。

　　同矩阵表示法相比，扩展式所“扩展”的主要是博弈方的策略空间，即某个博弈方在什么时候行动。每次行动时有哪些策略可以选择，以及知道哪些关于博弈的信息。由于扩展形可以反映动态博弈中博弈方的选择次序和博弈的阶段，因此它是表示（阶段数和博弈方可选行为数量较少的）动态博弈的最佳方法。正因为动态博弈常用扩展形表示，因此有时也被称为“扩展博弈”。我们给出一个定义和一个定理：

　　定义1：如果一个动态博弈有有限个信息集，每个信息集上博弈方有有限个行动选择，则称该博弈为有限博弈。

　　定理1：如果一个动态博弈是有限博弈，则该博弈至少存在一个混合策略纳什均衡完美体育。

　　我们设有一家企业的产品被另一家企业仿造，如果被仿造企业采取措施制止，仿造企业就会停止仿造，如果被仿造企业不采取措施制止，那么仿造企业就会继续仿造。对被仿造企业来说，被仿造会造成经济损失，因此采取措施制止仿造是符合自身利益的，但制止仿造要付出代价，因此在遭仿造时是否应该制止要酌情考虑完美动态。对于仿造企业来说，仿造不被制止能获得很大利益，但如果被制止被处罚也会损失惨重，因此是否仿造也要仔细分析。所以，这两个企业在仿造和制止仿造的问题上，存在着一个行为和利益相互依存的博弈问题，而且是一个动态博弈问题。

　　假设仿造最多进行2次，该动态博弈可以用下图的扩展形表示。图中收益数组的第一个数字是仿造企业的得益，第二个数字为被仿造企业的得益。

　　并不是所有动态博弈都可以用扩展形表示。因为有些动态博弈的阶段很多，或者博弈在一个阶段有许多可以选择的行为（树杈太多），这些时候扩展形表示动态博弈就会很困难，或者根本就不可能。例如对弈是动态博弈，但因为它不仅博弈阶段很多，而且每个阶段的可能选择也很多，因此很难用扩展形表示。这时动态博弈直接用文字描述和数学函数式表示更恰当。

　　完全且完美信息动态博弈对博弈的条件作了相当格的要求，因而是一种十分理想化的博弈。对于完全且完美信息有限次动态博弈，我们有如下定理

　　定理2：一个有限次完全且完美信息博弈至少有一个纯策略纳什均衡。（注意区分与定理1的区别）

　　动态博弈的许多特点和静态博弈不相同，而且这些特点对于动态博弈的分析有相当重要的影响。

　　在静态博弈中，每个博弈方只有一次选择行动的机会，所以“策略”就是这个唯一的选择或行动,“策略”与“选择”及“行动”都是等价的。在动态博弈中，各个博弈方的选择和行为不仅有先后之分，而且一个博弈方的选择很可能不是只有一次，而是有几次甚至多次，并且在不同阶段的多次行为之间有内在联系，是不能分割的整体。因此在动态博弈中，研究某个博弈方某个阶段的行为，或者将各个阶段的行为割裂开来研究是没有意义的。动态博弈博弈方决策的内容，不是博弈方在单个阶段的行为，而是各博弈方在整个博弈中轮到选择时的每个阶段，针对前面阶段的各种情况作相应策略的完整安排，以及由不同博弈方的这种行动安排所构成的策略组合。动态博弈的“策略”就是指这种整体的策略安排计划，因此在动态博弈中,“策略”与“选择”及“行动”是不等价的。

　　在“仿造和反仿造”博弈中，仿造企业A“在第一阶段仿造，如果第二阶段B制止，第三阶段就不仿造，否则第三阶段继续仿造”被仿造企业B“第一阶段A仿造时第二阶段不制止，第三阶段A继续仿造时第四阶段制止”，分别是该动态博弈中两博弈方的各一个完美体育策略。当我们把动态博弈理解成各博弈方之间以这样的策略进行博弈对抗时，在形式上似乎与前一章讨论的静态博弈就一致起来了，此时，两博弈方之间的动态博弈也可以用得收矩阵表示，矩阵行列完美体育分别代表两博弈方上述意义上的策略，称其为动态博弈的“收益矩阵”或“策略形”。

　　和静态博弈相比，动态博弈的结果是指各博弈方上述类型的策略构成的策略组合，并不是具体的收益。例如在仿造和反仿造博弈中，仿造企业A与被仿造企业B采用前述策略构成的策略组合。而且，动态博弈的结果是各博弈方的策略组合形成的一条连接各个阶段的路径，即一连串在时间上有依次顺序的行为选择。在仿造和反仿造博弈中会看到“第一阶段A仿造，第二阶段B不制止，第三阶段A仿造，第四阶段B制止”，在该博弈的扩展形图上形成了一条连接每个阶段的路径。最后，动态博弈的结果是选择上述策略组合的最终结果，即具体的得益。给A和B各带2个单位的得益，就是上述路径终端处得益数组中的数字完美体育。因此，在一个动态博弈中，博弈的结果包括双方(或多方)采用的策略组合、实现的博弈路径和各博弈方的得益三个方面。

　　在动态博弈中，由于各个博弈方的行为选择有先后次序，且后选择的博弈方能观察到此前先选择的博弈方的行为，因此动态博弈中各博弈方在地位上具有不对称性，先选择的人可能得到的好处，比其他后选择的人得到的好处要多，我们把这种情况叫作“先动优势”。这一点与所有博弈方一次性同时选择的静态博弈明显不同。此外，在动态博弈中，各个博弈方关于博弈的信息也是对称的。一般来说，由于后选择的博弈方有更多的信息帮助自己选择，可减少他们决策的盲目性，因此在信息方面处于较有利的地位，其所得到的好处，可能比其他先选择的人得到的好处要多，我们把这种情况叫作“后动优势”。不过后行动和具有较多信息未必一定比先行动和具有较少信息的博弈方有利。

网站首页

关于完美体育

产品中心

完美动态

成功案例

荣誉资质

技术支持

联系我们

在线留言

最新公告：

友情链接：