登陆注册
3751100000015

第15章 警察与小偷博弈:没有纯策略均衡下的混合策略

(第一节 警察抓小偷的故事

在我们儿时玩的“剪刀、石头、布”的游戏中,每个小孩选择出剪刀、布还是石头应该是随机的,不能让对方知道自己的策略,甚至是策略的倾向性。因为在这种警察与小偷的博弈中,并没有一种纯策略均衡,只有混合策略均衡,而混合策略是参与者在各种备选策略中采取随机方式选取的。

在西部片里,我们常能看到这样的故事:

某个村庄只有一名警察,他要负责整个村的治安。村子的两头住着全村最富有的村民A和B,A和B需要保护的财产分别为2万元、1万元。某一天村子来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知了。

因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在A家看守财产,而小偷也选择了去A家,小偷就会被警察抓住;若小偷去了警察没有看守财产的B家,则小偷偷盗成功。

一种最容易被警察采用而且也更为常见的做法是,警察选择看守富户A家,因为A有2万元的财产,而B只有1万元的财产。

这种做法是警察的最好策略吗?答案是否定的,因为我们完全可以通过博弈论的知识,对这种策略加以改进。

实际上,警察的一个最好的策略是抽签决定去A家还是B家。因为A家的财产是B家的2倍,小偷光顾A家的概率自然要高于B家,不妨用两个签代表A家,抽到1号签或2号签去A家,抽到3号签去B家。这样警察有2/3的机会去A家做看守,1/3的机会去B家做看守。

而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗,即抽到1号签或2号签去A家,抽到3号签去B家。那么,小偷有2/3的机会去A家,1/3的机会去B家。这些数值可以通过联立方程准确计算出。

此时警察和小偷所采取的便是混合策略。所谓混合策略,是指参与者采取的不是唯一的策略,而是其策略空间上的概率分布。最常见的混合策略就是猜硬币游戏。比如足球比赛开场时,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下时朝上的一面是正面还是反面。由于硬币落下是正是反是随机的,概率都是1/2,因此猜硬币游戏的参与者选择正和反的概率都是1/2,这时博弈达到混合策略纳什均衡。

再比如我们儿时玩的“剪刀、布、石头”游戏,对每个小孩来说,自己采取出“剪刀”“布”“石头”的策略应当是随机的,不能让对方知道自己的策略,甚至是策略的倾向性。一旦对方知道你出其中某个策略的可能性增大,你在游戏中输的可能性就增大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。

明显可以看出,这类博弈与我们之前谈到的囚徒困境博弈有一个很大的差别,就是没有纯策略均衡,只有混合策略均衡。所谓纯策略,是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。

当每个博弈参与者都有优势策略时,纯策略均衡是非常合乎逻辑的。你有一个优势策略,你可以采用;假如你有一个劣势策略,你应该避免采用。同样,你的对手也会采取这样的措施。但是通过上面警察抓小偷博弈我们看到,并非所有的博弈都有这样的优势策略,哪怕这个博弈只有两个参与者。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,只能采取混合策略加以均衡。对于任何一方来说,此时不可能有纯策略的占优策略。

这就是纳什于1950年证明了的纳什定理。而零和博弈中没有纯策略纳什均衡点,而只有混合策略均衡点,混合策略均衡点下的策略选择是每个参与者的混合策略选择。

博弈大智慧

当每个博弈参与者都有优势策略时,纯策略均衡是非常合乎逻辑的。你有一个优势策略,你可以采用;假如你有一个劣势策略,你应该避免采用。

(第二节 谁来打电话

通常情况下,遭遇“警察与小偷”博弈时,双方采取混合策略的目的是为了战胜对方,是一种对立者之间的斗智斗勇。但实际上,你与别人合作的时候,也会发生混合性策略博弈。

如果甲正在和乙通话,突然电话断了,而话还没说完。这时每个人都有两个选择,马上打给对方,或等待对方打来。注意:如果甲打过去,乙就应该等在电话旁,好把自家电话的线路空出来,如果乙也在打给甲,双方都只能听到忙音;假如甲等待对方打电话,而乙也在等待,他们的聊天就没有机会继续下去了。

一方的最佳策略取决于另一方会采取什么行动。这里又有两个均衡:一个是甲打电话,而乙等在一边;另一个则是乙打电话,而甲等在一边。

博弈论中有一个结论:纳什均衡点如果有两个或两个以上,则结果难以预料。对于这个出现了两个纳什均衡点的打电话博弈,我们该如何从博弈论中求解呢?

事实上,博弈论在这个打电话问题上的解决办法看起来很笨,即用投硬币的方式来决定自己是不是应该给对方打电话。根据前面给出的条件,两人这种随机行动的组合成为第三个均衡:如甲打算给乙打电话,有一半机会可以打通(因为这时乙恰巧在等甲打电话),还有一半机会发现电话占线;假如甲等乙打来电话,那么,同样会有一半机会接到电话,因为乙有一半机会主动给甲打电话。

由于双方主动拨打电话的可能性为50%,所以平均来说要尝试两次才能成功接通。当然,这个“笨办法”并不是博弈论的错,而是就策略而言只好如此。

博弈论对这种混合策略的传统解释是,局中人应用一种随机方法来决定所选择的策略。这种解释在理论与实践中均不能令人满意。约翰·查里斯·哈萨尼对此提出了更确切的解释方法。

哈萨尼认为,在现实博弈中,每一种博弈的形势都受到一些微小的随机波动因素的影响。在标准的博弈模型中,这些影响表现为微小的、独立连续随机变量,每个局中人的每一个策略均对应一个随机变量。这些随机变量的具体数值仅为相关局中人所知,这种知识即成为私有信息;而联合分布的则是博弈者的共有信息。哈萨尼把这称为“变动收益博弈”。

在变动收益博弈中,各随机变量的数值影响着每一个博弈者的收益。在适当的技术条件下,变动收益博弈所形成的纯策略组合与对应无随机影响的标准博弈的混合策略组合恰好一致。实验证明,当随机变量趋于零时,变动收益博弈的纯策略均衡点转化为对应无随机影响的标准型博弈的混合策略均衡点。

变动收益博弈理论对混合策略均衡点提供了具有说服力的解释:局中人只是表面上以混合策略进行博弈,但实际上仍是在各种略微不同的博弈情形中以纯策略进行博弈。

所以,在生活中遇到这类问题时,我们只能按照惯例或者随机应变。一种解决方案是,原来打电话的一方再次负责打电话,而原来接电话的一方则继续等待电话铃响。这么做有个显而易见的理由:原来打电话的一方知道另一方的电话号码,反过来却未必是这样。另一种可能性是,一方可以免费打电话,而另一方不可以(比如你是在办公室,而他用的是住宅电话)。

通常情况下还有另一种解决方案,即由较热切的一方主动再打电话,如一个“煲电话粥”成瘾的家庭主妇对谈话的热情很高,而她的同伴就未必如此,这种情况下通常是前者再打过去。再如恋爱中的男女遇到这种情况,通常也是由主动追求者再打电话。

由此看来,基于变动收益博弈理论,在生活中遭遇由谁来打电话这类无法用理性得出最佳策略的问题时,按照惯例或随机应变不失为比较稳妥的选择。

博弈大智慧

基于变动收益博弈理论,在生活中遭遇由谁来打电话这类无法用理性得出最佳策略的问题时,按照惯例或随机应变不失为比较稳妥的选择。

(第三节 随机策略不是章法,胜似章法

天宝十四年底(755年),安禄山假托承旨征讨杨国忠,起兵15万造反,派遣叛将令狐潮率重兵包围了雍丘(今河南杞县)。为了保卫雍丘,守将张巡留1000人守城,自己带领1000精兵,打开城门冲出。张巡身先士卒,冲进敌阵猛砍,而兵士也个个奋勇。叛军做梦也没想到张巡敢冲出城,被杀得措手不及、人仰马翻。

为了尽早攻下雍丘,令狐潮于第二天指挥士兵架起云梯攻城。张巡率领士兵把用油浸过的草捆点着后抛下城去,登城的叛军被烧得焦头烂额,非死即伤。此后的60多天里,只要一有机会,张巡就突然率兵出城攻击,打得叛军不知如何应对。

在与叛军作战的过程中,张巡用计夺取了叛军的大量粮食和盐,但粮盐虽足,城中箭矢却已消耗得差不多了。于是张巡让兵士扎了许多草人,给它们穿上黑衣。一天晚上夜色朦胧,张巡命令兵士用绳子把草人陆陆续续地缒下城去。城外叛军见这么多人缒城而下,纷纷射箭,一时间箭如飞蝗。射了半天,叛军发觉不对劲,因为他们始终没听到一声喊叫声,而且又发现一批刚拉上城去,另一批又缒下来。派人前去探查以后,他们方知所射的都是草人。在叛军大呼上当之时,张巡已收获1万多支箭矢。

为了储备足够的箭矢,第二天深夜,张巡又把外罩黑衣的草人从城上放下去。叛军发现后,又乱射了一阵,结果发现又是草人。以后每天夜里,张巡都是如此,城外叛军渐渐知道是计,也不再拿箭去射。于是,张巡决定发起总攻。

一日,张巡把500名勇士趁夜色缒下城去,勇士们奋勇突进敌营。叛军一点儿准备也没有,立刻大乱。接着,叛军的营房四处起火,混乱中也不知死了多少士兵。最后,张巡率军直追杀出10余里,大获全胜。

上面这个故事中,叛军刚开始发现用箭射的都是草人,以后当城墙上缒下东西,仍用箭去射是对的,但后来上当的次数多了,他们就乐观地以为再次缒下来的东西肯定还是草人,结果张巡就缒下真人将他们杀得落花流水。故事中张巡采用的这种方法就是警察捉小偷博弈中的随机策略。

在与对手博弈时,随机策略看似不是章法,但却胜似章法。因为在博弈中,大家都是理性的人,一方采取某种策略,另一方都会进行理性推测,进而作出相应的回应。此时,如果采取随机策略,让他摸不清你的行动规律,便可巧妙战胜对手。

采取随机策略的关键就是要让你的策略具有不可预测性。《吕氏春秋·淫辞》中记载了这样一个故事:

战国时期,宋康王异常暴虐。凡群臣中有来劝谏的,都被他找理由撤职或者关押起来。臣下也因此对他更加反感,经常非议他。宋康王十分苦恼地对宰相唐鞅说:“我处罚的人已经不少了,为什么他们还是不畏惧我呢?”唐鞅于是献计说:“您所处罚的都是一些犯了法的人。惩罚他们,没有犯法的好人当然不会害怕。如果您要让您的臣子们害怕,就必须不区分好人坏人,也不管他犯法还是没有犯法,随便抓住就治罪。这样的话,大臣们就知道害怕了。”

唐鞅的建议虽然缺德,但却不能不说是把握了随机策略的精髓——不可预测性。能够预测的惩罚,大臣总会想方设法地加以规避,而无法预测的惩罚,却是防不胜防的,因而也是更令人心惊胆战的。要记住,实施不是章法、胜似章法的随机策略,诀窍就在于不可预测性。

博弈大智慧

在博弈中,大家都是理性的人,一方采取某种策略,另一方都会进行理性推测,进而作出相应的回应。此时,如果采取随机策略,让他摸不清你的行动规律,便可巧妙战胜对手。

同类推荐
  • 会说话好办事

    会说话好办事

    社会虽然错综复杂,人事虽然盘根错节,但是我们依然可以透过纷繁的万象寻找到办成事的有效方法。只要会说话,这就是你成事的通行证。“三寸之舌,强于百万雄兵;一人之辩,重于九鼎之宝”为《战国策》开卷之语。好口才不仅仅是语言的措辞,事件的描述,更多的是沟通艺术的融合,考验着我们的智慧和驾驭整体形象的能力。会说话,你便能以少胜多,以弱敌强。扭转乾坤,以不变应万变。
  • 职场武林外传

    职场武林外传

    电视剧《武林外传》中的同福客栈就是一个古代版的企业办公室,里面有抠门的女老板佟湘玉和来自五湖四海的小职员——酸溜溜的书生吕秀才、会偷懒的小杂役郭芙蓉、爱偷吃的厨师李大嘴、擅长拍马的跑堂白展堂,还有职场“实习生”莫小贝……他们能在老板娘的带领下,把业务经营下去实在不容易。
  • 无戏言——写给中国玩家的人生逆袭指南

    无戏言——写给中国玩家的人生逆袭指南

    本书通过讲述11位中国游戏界大佬的人生逆袭故事,向正以各种状态生存着的中国玩家们展示出另一片天地——如果你想,玩转人生并非只能online。
  • 关于自然和社会的格言

    关于自然和社会的格言

    大自然是一朵易变的云,永远是一样的,而又从来不是一样。它将同一个思想铸成无数形式,正如一个诗人将一个寓意写成二十个寓言。而生活就是一场戏,每个人都演绎着属于自己的那个角色,并为自己的角色谱写着一个个华丽的乐章。看《关于自然和社会的格言》,让我们从名人的警句中领略自然的风光,从自然中品读人生的真理;同时还可从名人的格言里看社会中的万象,让我们从各种形形色色的社会生活中体味出人生的真谛!
  • 东灵

    东灵

    80后灵灵,在某网站神秘文化栏目做编辑。一天,栏目组来了位神人,声称他预见中国会发生毁灭性的大地震。此人穿着邋遢怪异,更像是个精神病人。灵灵询问他的依据,他却滔滔不绝地讲起《易经》、五行、天人感应……在这位神人及赵教授的指点下,灵灵开始思索从神话、《易经》、风水、占卜、天人感应、玛雅文明、萨满、炼金术、塔罗、星相、末日预言等东西方神秘智慧到多重宇宙、薛定谔的猫、波粒二重性、正能量、暗物质等前沿科学所蕴含的生命启示。
热门推荐
  • 仙争路

    仙争路

    道之所在,虽千万人吾往矣;义之所当,千金散尽不后悔;情之所钟,世俗礼法如粪土;兴之所在,与君痛饮三百杯!张轩被炼尸宗抓走,张轩爱上了妖族元婴修士,张轩灵根莫名其妙被取走了一条,张轩被大能算计......张轩的一生都在与天争命,与仙争道!但他从未放弃一个朋友,从未屈服于各种压力,从没有忘记心中的......她......他追寻大道,可是当他蓦然回首时,才发现自己走过的路,就是大道!这是一个小人物励志的故事,我会争取写出不一样的味道。人品第一,每天更新,偶尔爆发。烦请您推荐,收藏。本书已与起点签约,请您放心阅读!本书稍微慢热,请您耐心阅读。会越来越精彩的。
  • 妃你不宠:拽妃,给我站住!

    妃你不宠:拽妃,给我站住!

    什么!戴上男友家的祖传戒指后就昏倒,还被风老头给丢到了一个不知名的国家去,穿越成十二岁小娃子!五年后,某女突发奇想,去考场晃了一圈结果就晃回了一个新科状元,!悲催的是,她不就是泡了泡皇家温泉,就被那腹黑皇帝逮到,还要答应他三个要求!哪有这种事?这皇帝一脸腹黑,一定不是好人!情节虚构,请勿模仿!
  • 快穿之男神不好当

    快穿之男神不好当

    欧阳诺从来不知道世界上还有这样的一款游戏,强大的能带你闯进任何的世界。他不过就是玩了一下妹妹的游戏,然后就莫名其妙的被一个系统给坑了。系统君:欢迎来到宅腐集中营,我是一一零号系统。欧阳诺:什么鬼?(作者:快上车,老司机要开车了,简介无能,喜欢腐的可以一看。)
  • 客户忠诚之路

    客户忠诚之路

    中信银行信用卡中心与具有丰富信用卡市场研究经验的香港中文大学合作,开展“客户关系管理”项目,通过借鉴香港同业的成熟经验、先进管理理念和方法,在中信银行信用卡中心内部建立起一整套先进的客户关系管理体系。
  • 盗墓史

    盗墓史

    本一庸碌人生,因回家迁坟祭祖,却发生接连怪事,祖坟中的棺中棺,爷爷突然死亡,尸体埋葬后却莫名消失,原祖坟墓地发生诡异变化,这是人为还是无法解释的诡异,在寻找线索的同时,似乎陷入了一个无法言语的古老诅咒里……
  • 神医邪妃

    神医邪妃

    凌飞雨,一名现代女医生,稀里糊涂穿越到大宇王朝,拜个残疾师父,古今结合一下,居然成神医了!只是,为什么一走出药王山庄就好像全天下的男人都是自己的情人一样?难道自己现在用的身体曾经是一个妓女的?狂傲不羁的某王爷对她不屑,哼!她要好好整治一下社会形象了!情节虚构,请勿模仿!
  • 演说的秘密

    演说的秘密

    这将是一本非常简洁的书,阅读起来将非常地轻松……上篇——恐龙格鲁的故事。本篇讲述了一个美好而感人的故事,由小恐龙格鲁带你进入神奇的恐龙世界,感受奇迹由何成就!下篇——恐龙格鲁的训练。本篇把演讲成功的秘密归为四个商数:智力商数、情感商数、体力商数和心灵商数!每个商数中有一些关键的法则,所有提及的法则都将成为你致胜的法宝。最英勇的人也一定是最信仰法则力量的人。
  • 恶魔总裁,诱妻入局

    恶魔总裁,诱妻入局

    他被蛇咬,她立马贴上嘴唇吸出毒血,她美好天真,他完美霸道,这场邂逅来得太突然太美,在她无邪的笑容后,却不知这一切都是他的刻意安排,他深情的眼眸中燃烧着复仇的火焰。这一刻,宠她上天,下一刻,令她万劫不复。天堂和地狱,那是她和他的距离……他要撕碎她的羽翼,让她坠入他的黑暗领域。
  • 三生引魂盏

    三生引魂盏

    引魂盏引不来的亡魂,归去楼归不去的相思。等不来你,那么,六道轮回,我去找你。
  • 蒙娜丽莎的温柔陷阱

    蒙娜丽莎的温柔陷阱

    "依赖的时候有多安逸,失去的时候就有多痛苦。林一彤,我掉进了你的温柔陷阱。"一幅世界名画<蒙娜丽莎的微笑>,一次说走就走的旅行,一场突如其来的灾难,一个邂逅的穿越。来到了最不喜欢的明朝。现代傲娇女与腹黑特工的江湖之旅开始了......他说他是她哥哥,可她却爱上他,当她遇上另一个爱她的人时,他却说他也爱她!这个温柔陷阱是他设给她的吗?