登陆注册
18999900000024

第24章 最优化策略(5)

由此,纳什均衡状态下丈夫的混合策略是(2/3,1/3),妻子的混合策略也是(2/3,1/3),混合纳什均衡为{(2/3,1/3),(2/3,1/3)}。

比如,如下的一个博弈中,由画线法可得到(中,左)和(上,右)两个纯策略纳什均衡。那么它有没有混合策略纳什均衡呢?奇数定理有助于我们判断,该定理说:几乎所有的有限博弈都有有限奇数个纳什均衡(包括混合策略均衡)。因此,当我们找到偶数个(比如这里的两个)均衡时,则至少还应存在一个混合策略均衡。

有一些读者一看到这个博弈,首先就想到直接为参与人的每个策略赋予一个概率。习惯的做法是(注意,以下的做法是错误的!):

假设张三选择上的概率为P,选择中的概率为q,选择下的概率为1-p-q。张三选择p,q使李四的各策略下的预期赢利是无差异的,即:

李四选左的预期赢利:

2×p+3×q+1×(1-p-q)=1+p+2q

李四选中的预期赢利:

2×p+1×q+0×(1-p-q)=2p+q

李四选右的预期赢利:

4×p+2×q+3×(1-p-q)=p-q+3

各策略预期赢利无差异意味着有:1+p+2q=2p+q=p-q+3,可解出:p′=5/3,q′=2/3。这个答案显然是错误的,因为作为概率的p′怎么可能大于1呢?

到这里,实际上我们已经不需要再探讨李四的混合策略了,因为错误已经很明显。问题是,为什么会有错误呢?

原因是:我们未能在求解混合策略均衡前剔除劣势策略。

观察这个博弈,可发现对于张三来说,“下”是“上”的严格劣势策略,即张三是永远不会选择“下”的——这相当于采取“下”的概率为0,所以再求混合策略的时候我们必须先对“下”这样的劣势策略赋予0概率,或者剔除掉该策略。

读者可能还有一个问题:我们赋予策略“下”一个概率1-p-q,为什么计算出这个劣势策略得到的概率不会为0呢?原因是,给定张三选下,李四选择左、中、右的赢利是不一样的,而实际上既然张三不会选下,李四的预期赢利里实际上就不应包括(下,左或中或右)的情况,所以,写出李四的预期赢利根本就是错的,自然得到的关于策略“下”的选取概率更是错的。

好了,现在我们来介绍正确的做法:首先应当剔除张三的“下”;而这一轮剔除之后读者们会发现,对李四而言,“中”相对于“右”的劣势策略,应该剔除“中”。

对于这个博弈,混合策略的求解是容易的:假设张三选上的概率为p,选中的概率为1-p;李四选左的概率为q,选右的概率为1-q。

然后写出张三两种策略的预期赢利:

1.若他选上:2q+4(1-q)=4-2q

2.若他选中:3q+2(1-q)=2+q

令两式相等,得到4-2q=2+q→q=2/3,1-p′=1/3再写出李四两种策略的预期赢利:

1.若他选左:0p+4(1-p)=4-4p

2.若他选右:2p+3(1-p)=3-p

令两式相等,得到4-4p=3-p→p′=1/3,1-p′=2/3整理一下结果,对于上面的博弈,正确的混合策略均衡应该是:张三以1/3的概率选择上,以2/3的概率选择中,以0概率选择下;李四以2/3的概率选择左,以0概率选择中,以1/3的概率选择右。这一混合策略均衡可写为:{(1/3,2/3,0),(2/3,0,1/3)}。

存在多重均衡的博弈往往也存在混合策略,那么无纯策略均衡的博弈有没有混合策略呢?根据前面提到的奇数定理,可以推断一个博弈若没有纯策略博弈,那么至少会存在一个混合策略。

再看赌硬币博弈,在前面我们已经知道它没有纯策略纳什均衡,现在我们来求它的混合策略。

假设小孩甲选正面的概率为P,选背面的概率则为1-P;小孩乙选择正面的概率为q,选背面的概率1-q,则1.小孩甲选正面的预期lq-(1-q)=2q-12.小孩甲选背面的预期赢利:-1q+(1-q)=1-2q令2q-1=1-2q,有q=0.5,1-q′=0.51.小孩甲选正面的预期赢利:1p-(1-p)=2p-12.小孩甲选背面的预期赢利:-1p+(1-P)=1-2p令2p-1=1-2p,有p′=0.5,1-p=0.5由此我们得到两个小孩各自都有混合策略(0.5,0.5)。每个小孩都以50%的概率随机出正面,以50%的概率随机出背面。混合纳什均衡为:{(0.5,0.5),(0.5,0.5)}。

这说明,有些博弈虽然没有纯策略纳什均衡,但是却存在混合策略纳什均衡。在现实中,有很多对抗游戏都类似于这种博弈,比如猜拳行令,或者我们儿时玩的“剪刀·石头·布”游戏。

利用随机性进行博弈

世界是不确定的,不过人们总是不大喜欢随机事件,因为其难以预测,无法掌控。通常我们认为随机的序列杂乱无章,是没有用处的。比如,给你一串随机生成的数字,2134398990376540421126……这样一个随机序列会有用处吗?你大概会说没有。但是如果结合到博弈的混合策略,我们会发现它确有用处。

南方有些地方,喝酒时常有行拳的习惯。行拳的人每人可伸出1~5个指头,叫出0~10中的一个数字,如果一方叫出的数字正好是两人伸出的指头数量之和,而另一方未能同样准确叫出,那么一方就胜利,另一方就失败,失败者会被罚酒。

在这样一个博弈中,你应该怎样出拳和叫拳昵?如果你老是叫同样的数字出同样的拳,或者只简单地变化,那么你那聪明的对手就会发现你的规律,然后战胜你(虽然他不是每每可以胜你,但却可以输少赢多)。为了不让对手发现你的规律,一个聪明的办法是事先准备一个随机序列,然后按照这个随机序列来选择你的策略——当然,这个随机序列不能被你的对手知晓——由于这样做是没有规律可循的,对手就难以通过抓规律来战胜你。

又如伊拉克战争中美军试图炸死萨达姆的例子。面临美军的轰炸,萨达姆可能会想到躲到最安全的掩体中去;但是,他马上也会意识到,其实美军也会把最安全的掩体当做重点目标,于是他应当躲在并不那么安全的地方——俗话说“最危险的地方也是最安全的地方”——但是,他又凭什么认为美军不会推测到他的这种想法呢?最后,实际上他会发现这样想下去只是无穷的循环,只要他无法猜透美军的策略,他自己的策略也就很难确定。最好的解决办法也许就是抛硬币或者利用随机数据表来确定该躲在哪里。这看起来不可思议,然而却确实是一个理性人应该做的。

曾经有人说:有时候,解决问题的最好办法就是不去想怎么解决问题。这句话用在博弈的混合策略上是最恰当不过的。当你跟朋友玩“剪刀·石头·布”的游戏时,无论你怎么想,都不会得到一个最优的纯策略。这种游戏的最好玩法也许就是根本不要去想下一次该出什么,脑袋里突然出现某个策略,那选取它就行了。没有理由,也不需要理由。

股市的寓言

下面这个关于股市的寓言故事,在我看来某种程度上也反映了随机的好处。我们会发现,人们分散决策而导致的随机性质的策略组合是股市良好运行的前提,一旦人们持有相同预期而将行为收敛到某一特定的策略(组合)上,对股市反而是灾难性的。

本故事改编自一篇严肃的学术论文。所以,读起来要动点脑筋。

话说茫茫大海,有一鸟岛,岛上住着麻雀和猫头鹰。麻雀数目众多,几近于无限,而猫头鹰则比较少,大概几千只的样子。鸟岛的经济水平虽不算高,却也老早老早就有了一种叫做“鸟元”的货币在流通,现在又大力引进电脑,正准备与国际接轨,一步到位,进入最先进的互联网时代。

不知从何时起,麻雀之间开始流行一种翻牌游戏。每次游戏前,玩家把一鸟元扔进一个称为“股市”的盒子中,换取两张牌,一张上面写着“买”,另一张写着“卖”。游戏开始,每位麻雀任取一张牌覆在桌面,然后同时翻开,计算买牌和卖牌的比例,据此从股市中分钱。举个例子,假如翻出80张买牌,20张卖牌,那么每个出卖牌的麻雀可以拿到80/20=4鸟元,而每个买家只能拿20/80=0.25鸟元。买牌和卖牌的比例,鸟儿们叫“股价”。

这里有个小问题:如果大家都出买牌或都出卖牌,怎么办?麻雀们规定,这时所有钱都给一个叫“做市商”的麻雀。谁当做市商,每次游戏前由抽签决定。

这个游戏,最早是几个特有开拓精神的麻雀,到极西海边的米猴岛做生意时,当做搞活经济的诀窍学来的。刚开始只在小圈子里玩,输赢也不大,有人赔钱,自然也有人赚钱。但好消息总是比坏消息传得快也传得广。闲谈议论中,“有人玩股市赚了好多钱哟!”等传言,刺激着越来越多麻雀们的神经,不断有新的鸟儿投入这游戏,输赢的数目也随之扩大。有几只鸟在股市中大赚其鸟元,成了百万富翁。还有消息称,西边米猴岛就是靠玩股成了世界首富。这些刺激着鸟儿们的玩股激情,并使其进一步高涨,越来越多的麻雀卷了进去。

随着电脑和互联网的引入,参加股市的鸟儿们达到了空前规模。投入股市的鸟元达到了天文数字,几近于无穷大。每只鸟儿,自然都期待着同样巨额的、天文数字级的输赢。可是,奇怪的事情发生了:开牌出来,买牌和卖牌的比例差不多相等,股价差不多刚好等于1。刚开始还以为是巧合,然而不仅头一次是这样,第二次是这样,第三次还是这样……以后次次开牌,股价总是接近于1,没什么大起伏。雀儿们不了解这其实只是大数定理的必然结果,于是就去找猫头鹰求助,看有没有什么赢钱的妙方。

猫头鹰看起来都是很有学问的样子。它们的书房里堆满了大部头书籍,有经济计量学、时间序列模型、技术分析理论等。其中不少书,听说还是一些猫头鹰特意从极西米猴岛专门引进的,就连在米猴岛也只有学问高深的大口唾们才看得懂的著作,十分地了不起。对这些,麻雀个个望而生畏,佩服莫名。

自然,猫头鹰们也很高兴麻雀们来求助,使它们的高深学问有机会派上用场。收点顾问费或咨询费当然在所难免了,不过麻雀们花这点小钱,倒是心甘情愿的——猫头鹰们许诺,可以指导它们在股市上获得数十倍甚至数百倍的回报。猫头鹰讲了许多米猴岛大口唾们如何在股市上神机妙算、大展身手的事迹,都是麻雀们前所未闻的奇闻,听得它们血脉棼张,目瞪口呆。许多猫头鹰还指出,它们与米猴岛的某个或某些大口唾很有私交,曾经共喝过同一个自来水管子里的水。

一时间,鸟岛上每一个猫头鹰都成了大口唾,背后都跟着一大拨儿雀儿,每个雀儿都坚信自己选定的顾问不仅是国内顶尖,而且是国际一流。

开牌的日子快到了。曾经信誓旦旦的猫头鹰大口唾顾问们,发现自己仍然不知道怎么去猜股市翻牌的结果。不过牛皮已经吹了,顾问已经当了,咨询费已经收了,总没有临场退缩的道理,何况也不能显得自己太没学问。于是,在开牌的头天晚上,它们悄悄儿躲进书房扔硬币。如果正面朝上,就告诉信徒们出买牌,否则出卖牌。麻雀们对各自猫头鹰顾问信之不疑,当然照做不误。

开牌之后有人欢喜有人愁。赢了的麻雀自然欢欣鼓舞,觉得咨询费没有白交。输了的呢,发现猫头鹰也不是个个都有真才实学,只好埋怨自己跟错了鸟,赶紧换一个猫头鹰做顾问。如此几轮下来,每次都淘汰一批猫头鹰顾问。雀儿们从经验中发现,有些猫头鹰的预测次次都对,确有过鸟的才华;有些则很普通,没什么了不起,甚至还不如麻雀自己猜对的次数多。

有一个叫“学问”的麻雀,它的顾问是一个名叫“瞎撞”的猫头鹰,已经连续10次做出了准确预测。学问先生在麻雀中也算一只有知识的鸟,年轻时曾修过一点概率统计。它知道,在一个充斥着偶然性的世界里,什么都有可能,判定真伪必须联系概率进行,这就要用到假设检验的办法。于是,它决定利用严格的科学的假设检验法,来看看瞎撞先生是否真有鸟所不及的预测才能。

它郑重地温习了一遍概率统计课程,先做出它的零假设:瞎撞先生确实在瞎猜。然后看这个假设能否被推翻。学问先生计算道,根据零假设,瞎撞先生在买和卖两种可能性之间任择其一,猜中一次的概率是1/2,连续10次猜中的概率则是1/2的10次方,即1/1024。它满意地发现,这只是个几率低于1%的极小概率事件,几近于不可能。于是根据概率统计书上的教导,零假设便在千分之一的显著性水平上被推翻。换言之,我们可以在99.9%以上的信心水准上,接受反面的假设:连续10次做出准确预测,不可能是瞎猜的结果!

学问先生的科学检验传开后,麻雀们都相信,现在这些顾问们的预测才能,是已经被实践和科学检验过的、颠扑不破的真理。

同类推荐
  • 人生怎样耐得住寂寞

    人生怎样耐得住寂寞

    寂寞其实是对内心的一种砺练,耐得住寂寞才不会被生活所操纵,才会掌握人生的主动权。本书教你直视寂寞、忍受寂寞、搏击寂寞、享受寂寞,让你拥有灿烂的每一天和在人生中取得辉煌的成就。
  • 这样做女人最幸福

    这样做女人最幸福

    幸福是女人一生追求的目标,世上的女人无不梦想拥仃美满的婚姻、和睦的家庭、幸福的生活、成功的事业。
  • 让学生自我激励的66个故事

    让学生自我激励的66个故事

    励志就是勉励自己勤奋向学,集中心思致力于某种事业。志,就是心愿所往,心之所向,是未表露出来的长远的打算。汉代班固《白虎通·谏诤》里“励志忘生,为君不避丧生”的话,讲的就是这个意思。励志是一门学问,这门学问应该从小学起,终生不辍。
  • 情商与影响力(第3版)

    情商与影响力(第3版)

    在竞争日益激烈的今天,情商与影响力越来越为人们所重视。本书从培养习惯、缔造个人魅力入手,通过精辟入理的分析、具体典型的实例,为读者打造个人影响力提供了一些简单实用的方法,帮助读者在模拟的情境中走出对幸福、成功的迷思,获得完美人生。作者在第3版中,对情商的构成因素以实际案例为背景,面向应用进行了解释,提出以下概念:情绪弹簧、情绪单级化、情绪免疫力,等等。还增加了职场成功与不太成功的案例,帮助读者创造和谐的职场氛围与个人生活。
  • 新时期青少年心理与心态读本

    新时期青少年心理与心态读本

    青少年时期是人生的转变期。在这个重要的生长发育期,青少年很容易产生焦虑、封闭、偏执、叛逆等问题。这本谭棋介编著的《新时期青少年心理与心态读本》,反映的正是青少年存在的各种心理问题。《新时期青少年心理与心态读本》主要讨论应该以怎样的心态应对这些问题,才能够使青少年健康地成长,并获得人生的成功。
热门推荐
  • 天川破

    天川破

    纷争不断的乱世,群雄并起,契约之力的争锋对决,谁又能更胜一筹,在这片神奇的土地上书写自己的霸气传奇?下一个傲立于强者之林的人又会是谁?
  • 行到水琼,莫看云起

    行到水琼,莫看云起

    在纠纠缠缠中过去的时光,莫水琼和顾云起是否最后能真正的应了那句最好的“行到水穷处,坐看云起时”?
  • 纨绔逆袭

    纨绔逆袭

    别人网恋的对象如花似玉郭江龙网恋的对象却像如花好心帮邻居试试家里的玻璃是不是防弹的却被当成驴肝肺高中时想来一场世纪求婚,“老婆”挺着肚子来祝贺警花同志,是他让我踩着他的身体过去的,与我何干美女,想夺走我爸家产的唯一办法就是嫁给我老天爷,你为什么要给我一副万人迷的脸蛋,我恨你
  • 银瑶落

    银瑶落

    本书已完结,因为个人关系不能更新。非常抱歉
  • 狡女痞男攻心计

    狡女痞男攻心计

    她明明身份特殊,却故意隐瞒;明明答应了父亲进他的公司工作,却千方百计想要算计自己的父亲和异母姐姐。但是却没想到她的身份暴露的这么简单,不但被对头公司那个花花公子痞子看穿,居然还被他以此威胁——算了吧,她可是坏人,什么威胁不威胁,不过是她利用他,导演了一出好戏罢了!
  • 山道

    山道

    本书分“山道”和“品味”两部分,顾名思义,也就是谈自己对“山”和“味”的感觉,并把这感觉及时地抒写出来。尽管自己深知,要达到“使一个爱欲的幻想,容纳到柔和轻盈的节奏中”(沈从文·《论徐志摩的诗》)的境界是那么的遥远,但也更深知“不积跬步,无以至千里;不积小流,无以成江海”的道理。于是,也就思考了,也就抒写了。
  • 大秦商

    大秦商

    清末民初,陕西首富赵家以茶盐起家,富甲天下,然而当此内忧外患之时,赵家也面临着分崩离析的危局……这是一部百年世家的风云变幻,更是一部历史的大画卷。
  • 指点文明礼仪(实用生活文库)

    指点文明礼仪(实用生活文库)

    本书分礼仪导入、礼仪讲解、礼仪指南三个板块,从和父母相处、握手、同学之间相处等方面向读者介绍礼仪常识。
  • 现在,我们这样做教师(语文卷)

    现在,我们这样做教师(语文卷)

    本书分语文教师成长的基本理念、语文教师成长的个案叙事两个部分,内容包括:语文教师成长的现实意义、语文教师成长的操作模式等。
  • 新与旧·长河(沈从文小说全集·卷十一)

    新与旧·长河(沈从文小说全集·卷十一)

    该卷本收录《新与旧》《主妇集》《长河》三个子集。《新与旧》是沈从文的中篇小说集,1936年由上海良友图书印刷公司首次出版,体现了在那个神秘血腥的湘西世界里,新时代的变迁,旧时代的烙印,通过一个沉重的故事展现一个新旧交错的纷纭时代。