手机浏览器扫描二维码访问
子博弈完美均衡(subgameperfectequi1ibrium,spe)
子博弈完美均衡(spe)是纳什均衡(nashequi1ibrium)的一种强化形式,专门用于动态博弈(dynamicgames),特别是那些包含多个决策阶段的博弈。spe要求在**每一个可能的子博弈(subgame)**中,策略都必须是一个纳什均衡。
1.子博弈完美均衡的定义
一个策略组合构成子博弈完美均衡,当且仅当它在博弈的每一个可能的子博弈中都形成纳什均衡,即:
?玩家在每一步都必须选择最优策略,不论游戏是否已经按照这个路径进行。
?通过**逆向归纳法(banet)**来求解spe。
spe解决了纳什均衡可能包含不可信威胁的问题。例如,在某些博弈中,某些威胁在理性情况下根本不会被执行,而纳什均衡可能会包含这些威胁。而spe要求策略在所有子博弈中都合理,因此排除了这些不可信的威胁。
2.spe的求解方法:逆向归纳法
求解子博弈完美均衡的主要方法是逆向归纳法(banet),步骤如下:
1.从最后一个决策节点(终局)开始,找出最优策略。
2.回溯到前一个决策节点,在考虑后续最优策略的情况下,找到当前的最优选择。
3.依次回溯,直到回到博弈的起点,最终得出整个博弈的最优策略组合,即spe。
3.经典案例分析
(1)讨价还价博弈(Rubinsteinbargaininggame)
场景:
?两个玩家a和b协商如何分配1oo元。
?a先出价,b可以接受或拒绝:
?接受:按a的分配方案执行。
?拒绝:进入下一轮,由b出价,但总金额减少(如因折现或时间成本,变为9o元)。
?这个过程可以继续,直到某一方接受提议。
解法(逆向归纳法):
1.在最后一轮,b必须接受任何非零金额,因为否则大家都拿不到钱。
2.在倒数第二轮,a知道b在下一轮会接受,因此a会给b最少的钱,以确保自己利益最大化。
3.依次回溯,最终得出spe,a在第一轮出一个合理的价钱让b接受,而b接受,因为等待对b来说更不划算。
(2)进入威胁博弈(entrydeterrencegame)
场景:
?新企业e考虑进入市场,已有企业I可以选择降价竞争(Fierce)或维持高价(acmodate)。
?如果e不进入,I赚15,e赚o。
?如果e进入:
?I选择降价,I和e都亏损-1o。
?I选择高价,I赚1o,e赚5。
解法(逆向归纳法):
1.最后一步:如果e已经进入市场,I的最优策略是维持高价(因为降价会亏损)。
2.回溯:e知道I不会真的降价打压,所以e会进入市场。
九界之中,实力为尊。她天生极品仙骨,修为独步天下。却不料在晋升之际,惨遭背叛,被削成人彘,挖出仙骨,自爆惨死!再次醒来,已是一千年后。变成破落王朝的废材九公主,人人可欺。而前世害她之人,已成为高高在上的凌霄女帝。统率人界,威震九州!浴火重生,凤啸沧溟!这一世,她定要让那些伤害过她的人,血债血偿!只不过,传说中令九界重生后她成了魔尊的掌中娇...
六分钟我们投降啦。你们投胎吧。来,哥哥教你吊打职业。你来教哥哥该用什么姿势。嗯,排好队来,我很忙!...
从末世重生的男人韩烈,在路边捡回了白胖宠物小包子一枚。又因为原本打算当宠物养的包子有了空间,于是便打算培养小包子战斗,好长长久久的养下去。某从异世穿越而来的包子表示,养父大人很强大,丧尸怪物们很丑陋...
人生若能重来,那一定是天大的福气加惊喜,而若是带着金手指重来,那代表的不光是福气和惊喜,更多的是吊炸天的节奏,诸颜奕就获得了这样一个吊炸天的机会。带着前世的记忆和一个神秘的空间,重生了。从此,遗憾不再是遗憾,只有幸福永相随。从此,医世中掀起惊涛骇浪,翻手为云覆手为雨。从此,只要她在的学校都会成为荣耀传奇的学术场所。重生8o医世学霸女神...
末世医学教授穿成修真界小废物,三步喘气,五步咳血,随时要嗝屁。更惨的是她的身份尴尬。人生的叫人,妖生的叫妖,而弃养她的渣爹是人,早死的娘是妖,所以她是俞幼悠把自己毛绒绒的尾巴塞回裙底,警告你提...