登陆注册
21532200000023

第23章 有趣的大数据运用(1)

大数据下的地震预测

实现准确预测需要一些真实的因素。我们必须掌握足够多的历史数据来识别模式——与这些模式相关的事件必须始终发生。

而且我们必须有区分疑似事件和真实事件的能力,即众所周知的排除误报。但是,仅仅是准确预测还远远不够。要让预测派上用场,我们还必须具备根据预测及早并快速采取行动的能力。

比如,当地震真正发生的时候,相关数据会非常清晰地表现出来,例如地动山摇。而且一旦其威力够大的话,停电、爆炸、有毒气体溢出、火灾爆发都可能出现。当然,到那个时候,也就不再需要大量的计算机和天才科学家们来预测灾祸了。

所以数据要起到效用,当下的数据必须预先与过去的数据进行匹配,而且要给我们留下足够多的行动时间。如果在地震发生的前几秒才完成匹配的话,也就没什么作用了。我们需要足够多的时间得出结论、调动各方资助力量并疏散群众。而且,我们必须具备快速分析数据的能力,只有这样,数据分析才能发挥效用。试想一下,假如我们拥有足够多的数据,它们能让我们提前一天预测到地震的发生,而我们却花费了两天时间进行数据分析,那这些数据和我们的预测结果就起不到什么作用了。

因此,从本质上来说,准确预测地震既是大数据的机遇又是挑战。单纯拥有数据还远远不够。我们既要掌握足够多的相关数据,又要具备快速分析并处理这些数据的能力,只有这样,我们才能争取到足够多的行动时间。越是即将逼近的事情,越需要我们快速地实现准确预测。不过,在某种程度上,这种预测适用于收益递减规律。就算我们能在瞬间完成对预测地震所需的海量数据的分析处理,如果没有留下足够的时间将群众调离危险区域,这种分析就没什么意义。

2012年10月22日,6名工程师因为在预测地震时误导村民,均被判处有期徒刑6年。这次地震发生在2009年的意大利拉奎拉镇,300名村民因此丧生。那么,大数据能帮助地质学家实现更好地预测吗?

每年,世界各地约有7000次里氏4.0或更高级别的地震发生。

地震测量有两种,一是著名的里氏震级,二是更现代的矩震级。

前者是依据地震所含的能量定级,而后者是通过地震所释放的能量认定地震等级。预测地震的时候,有三个关键问题必须找到答案:何时、何地、何种震级?

在《庸医游戏》中马修·玛贝认为,虽然地震有预兆,但是我们仍然无法通过预兆可靠、有效地预测地震。相反,我们能做的就是尽可能地为地震做好准备——它的发生频率远比我们想象的要大得多。这些准备包括在设计、修建桥梁和其他建筑的时候就把地震考虑在内,并且准备好齐全的地震应急包,一旦发生大地震,这些基础设施和群众都能有更充足的准备。

我们知道,地震是由构造板块相互挤压造成的——构造板块则是偶尔会漂移的陆地板块。这种板块挤压发生在地球深处,而且各个板块的相互运动复杂难懂。因此,有用的地震数据来之不易,而要弄明白是什么地质运动导致了地震,基本上是不现实的。

归根结底,准确地预测地震,即回答何时、何地、何种震级这三个问题,需要掌握促使地震发生的不同自然因素,以及揭示它们之间复杂的相互运动的更多、更好的数据。

大数据的关键之处正在于此:预测不同于预报。科学家能预报地震,但是他们无法预测地震。1906年旧金山发生地震,导致3000余人伤亡,而其何时会再次遭遇这样的地震?其实,科学家们只能预报某个地方、某个具体的时间段内发生某级地震的可能性。例如,他们只能说未来30年,旧金山湾有80%的可能性会发生里氏8.4级地震,但他们无法完全确定地说出何时何地会发生地震,或者发生几级地震。这就是预测和预报之间的差异。

不过,虽然准确预测地震还有很长的路要走,但是黑暗中尚有一线光明,那就是,科学家已经越来越多地为地震受害者争取到几秒钟的时间了。

传统的地震探测仪需要花费3000美元甚至更多,而如今基本的地震探测只需通过连接至标配计算机的廉价的探测仪就可实现,甚至只需通过使用如今很多移动设备内置的动作感应功能就可实现,而这些功能原本是为了导航和游戏设计的。

斯坦福大学的“地震捕捉者网络”由参与分布式地震检测网络的大约200个志愿者的计算机组成。有时候,这个监测网络能提前10秒钟提醒可能会受灾的人群。也许10秒钟看上去不长,但是却很重要,因为这意味着你是搭乘运行的电梯还是走楼梯,是走到开阔处去还是躲到桌子下面。

“地震捕捉者网络”就是一个会生成大量数据的廉价监测网络的典型例子。以前,要捕捉和存储如此多的数据耗资巨大,但是,近期的技术进步使得这些数据的捕捉和存储成本大大降低。

有时候甚至比过去便宜了9成都不止。

是什么方便了我们的出行

10年前,大学生吴中亚第一次来到北京旅游。他带着激动的心情,打算参观故宫、天坛、颐和园、圆明园和众多的博物馆。

不幸的是,下火车后他和同伴走散了。两个人都没有手机,没法联系上,钱也在同伴身上,吴中亚傻眼了。同伴对北京很熟悉,所以此前吴中亚根本没做什么准备,他是想一路和同伴一起的。

现在,他要一个人到他们定好的旅馆与同伴会合。该怎么办呢?

他一个人很费劲地研究着地铁线路,好半天之后,他放弃了,决定还是问路。北京的大爷大妈们很热情地给吴中亚指路,“你往东走200米,在那个胡同那儿往南拐,再乘坐……”“你往北走,那边有一个天桥,你走到天桥北边然后往西,再坐……”吴中亚从来都不知道东南西北,面对各位大爷大妈的热情和不一致的指导,吴中亚还是不知道该怎么办。最后,吴中亚在报刊亭买了份地图,终于解决了问题。

地图真是一种非常有用的东西。吴中亚在地图上查看了公交和地铁的线路,顺利地找到了旅馆。地图上,每条地铁线路的颜色都各不相同,还可以在上面看到线路交叉的站点,如此一来,要知道在哪里换乘,就很容易了。可以说,就因为一份地图,弄清楚怎么走路突然之间变成了一件轻而易举的事情。

10年后,吴中亚再次到北京旅游。马虎的他出行前又没怎么规划,这次他有了经验,一下火车就买了份地图。他在地图上找了很久,还是没找到他要去的那个地方在哪里。没办法,他直接叫了一辆出租车。出租车司机是个新手,碰巧吴中亚要去的那个地方他完全没听说过。吴中亚一听急了,准备下车,司机却毫不着急,让他稍等。然后,司机不慌不忙地从口袋里拿出手机,依次打开了GPS定位功能和电子地图软件,将吴中亚要去的地方输入软件里,软件很快生成了一条线路,然后司机很顺利地根据线路开到了目的地。

吴中亚的这两次经历,告诉了我们什么呢?

第一次经历,吴中亚开始虽然有大爷大妈给他指路,却还是怎么都搞不清楚路线,后来借助一份地图就搞清楚了。因为大爷大妈非常口语化和个性化的指路,对于置身陌生城市的吴中亚来说,还是很难量化成具体线路,而地图犹如一份完整的有关公交、地铁、建筑的数据,有着非常精细的描绘和统一的量化标准。只要弄清楚地图是怎么查看的,吴中亚找到旅馆的可能性就大了很多。可是,为什么第二次经历,吴中亚还是拿着那份地图,却找不到位置了?因为随着中国各地经济建设的迅猛发展,各个城市的面貌在迅速发生着变化,地名也一样。可能一夜之间,很多老地方、老店铺消失了,很多新地标、新建筑诞生了,而地图的发行从勘察到印制要经历很多个环节,这些环节让地图永远跟不上城市的变化。而出租车司机使用的地图完全不一样,它是互联网地图。互联网地图具有实时性,哪个地方的线路和地名有了变化,网络地图上就可以直接呈现出来。

现在,出门前和路途中的人们问路越来越少,很多人都直接通过手机地图查询到目的地的线路。而且,手机地图已经越来越超出传统地图的功能定义。比如百度地图,既具有查地点路线、卫星导航等几乎“不值得一提”的常规功能,更具有一些超乎想象的便利功能,比如百度地图可以告诉你附近哪里有公厕、快餐、自助取款机和加油站,可以告诉你离你300米的某个商场正在举行一场女装三折特卖、楼下的餐厅在搞中餐六折大促销、1000米远的写字楼里有家公司在招聘员工、楼上有一套房子在招租、某某街道刚发生车祸并有某帅哥在现场发回的照片等等。细加辨别,不难发现,百度地图有个非常重要的特质就是:百度是在做一个微地图,以满足用户方方面面的需求,包括各种生活细节的服务。从总体功能上看,百度地图不再着眼于地图线路及覆盖范围,更不是侧重于导航,而是用大数据来支撑细分的本地生活服务。

电子地图相对于传统地图最大的优势是什么呢?答案自然是大数据。大数据是手机地图的绝对优势,数据量的大小直接决定了地图的详细程度和能够提供服务的多少。而且,电子处理的是全互联网数据。截至2014年12月,百度地图仅以导航为例,每天数十亿次用户的定位请求和响应转换成位置信息,实现了智能导航基础上的生活服务本地化。作为最具优势的主流生活服务平台,百度地图已容纳60余家数据合作伙伴,提供500多万生活服务类数据,日均定位请求超过35亿次。在此背后,除了预订酒店、电影票、餐馆之外,还包括附近的团购、优惠、外卖等,用户都能通过手机完成。

像百度地图这样借大数据为用户提供便利的软件还有很多,这些都是大数据时代给个人带来的便利。人们将各种新的信息发布到各个大数据平台上,而更多的人在分享着这些数据带来的便利。大数据时代,每个人都在创造着数据,每个人都在享受着大数据创造出的便利。

大数据帮了******

大数据看似枯燥无味,但很多时候,它会成为赢得一场“战争”最有力的武器。

2012年,美国总统******仰仗其大数据分析团队,击败竞争对手成功连任。好奇的人们想知道,到底大数据在选战里起到了怎样的作用?

在这次总统大选前,******能不能赢得连任充满变数。

从政绩上来看,******并没有做到之前承诺的将美国全国的失业率控制在7.4%以下;从选战的过程来看,竞争对手罗姆尼比******口才好,演讲水平也相当高超,公开辩论中,两个人不分上下;从对民众要求变革的呼应来看,临选前的民意调查,多数被调查者认为罗姆尼关于未来的见解更令人欣赏;从历来决定胜负的竞选资金投入来看,对手所花的费用比******多1亿美元。

这一切都说明,******要继续留在白宫似乎非常困难。但出人意料的是,******还是赢了罗姆尼。

后来人们普遍认为,让******赢得选举不是靠运气,而是仰仗他的竞选团队成效卓著的数据分析能力。******团队的竞选总指挥吉姆·梅西纳表示,在整个竞选过程中,******的每次活动都是以数据作为支撑,而对多种来源的数据进行搜集、整理、分析和运用,确保了以数据为基础的决策。

收集大量数据的工作是******团队在连任竞选两年前进行的,他们将民主党零散的选民数据汇总在一起。在考量了重要性和费用支出的前提下,******团队的数据专家们针对目标选民和拟开展的活动开发了不同的预测和分析模型。如对每一个群体的选民都进行建模,进而预测他们的政治意向。所建立的模型可以根据实际情况进行动态调整,这样提高了分析的精准性。当时,数据分析专家在俄亥俄州获得了约2.9万人的投票倾向数据,这是一个巨大的样本,占选民的1%。这个数据样本可以准确了解每一类人群和每一个地区选民在任何时刻的态度。******团队的一名成员表示,他们可以通过复杂的数学建模来找到目标选民。当第一次电视辩论结束后,选民的投票倾向会发生改变,团队通过相关数据分析就可以立即知道什么样的选民改变了态度,什么样的选民仍坚持原来的投票选择。在竞选过程中,他们筛选出目标选民并和他们接触,定向地说服他们,无疑这样的筛选就离不开数据的支持。

在连任竞选中,******团队充分信任数据分析,恰到好处地利用各种场合来争取选民。在每一次动员活动和公开辩论前,******团队都能根据受众的特点选取其最关心的议题,精心准备、博得支持。动员渠道和互动方式的选择也为目标选民量身定做。

同类推荐
  • 经济学常识1000问

    经济学常识1000问

    作为如今社会上使用频率最高的词汇之一,“经济”当之无愧——几乎无人不知无人不晓,经济学更是大行其道,成为最热门的研究领域,科学不是具体的事物,而是抽象的学问。一门科学,必有一套自己的概念和体系,有自己独特的方法。古代大臣们对经济问题的真知灼见,也许有不世之功,但不系统、不规范,都不是经济学。经济学这门学问,是对人类各种经济活动和各种经济关系进行理论的、应用的、历史的以及有关方法的研究的各类学科的总称,是20世纪的显学,其根本作用是富国裕民。照理说,这样的学问一定历史悠久,可是,正相反,经济学是一门相对年轻的科学。
  • 美国需要什么样的中国

    美国需要什么样的中国

    一本堪比《货币战争》的时政金融畅销书,全新角度呈现中美间远未结束的没有硝烟的金融战争。著名军事专家戴旭、著名政治经济评论家马耀邦鼎力推荐:我希望更多的读者乃至中国最高领导能够看到这本著作。美国究竟怎样操纵世界,怎样操纵中国?中国究竟怎样一步步陷入美国的圈套?中国究竟能否在美国全球围剿中成功突围?著名经济学家余云辉秉笔直书,大胆建言,对中国目前的经济困境和解决方案进行了敏锐的分析。
  • 赤裸裸的未来

    赤裸裸的未来

    全书主题聚焦于未知与未来,但论述绝非建立在想象之上的空中楼阁,其间穿插着大量事例,或基于客观现实,或依据科学推测,生动有趣。?塔克尔通过大量的访谈和调查,约见各领域的权威人士,积累了极为丰富的素材,提取了他们有关现实的观点和对未来的预期,为我们展开了有关未来社会各领域的翔实可信的图景,讲述的虽是前沿科技主题,内容却平实亲和。这是世界上最接地气的未来学著作,适用于犯罪研究、灾难预测、恋爱求职、躲开流行病、赌场赢钱、广告营销等各领域。本书系《世界是平的》和《大数据时代》的最新姊妹篇!全球中英文同步出版。《大数据时代》作者肯尼思·库克耶等13位世界顶尖未来主义者全力推荐!
  • 百姓不缴糊涂税:财税专家汪蔚青的税务普及书

    百姓不缴糊涂税:财税专家汪蔚青的税务普及书

    每月发工资要缴个税;买东西不知不觉缴了增值税;买个外国货要缴关税;投资理财不小心,冷不防也要多缴很多税……国家征税就像高速公路收取过路费,我们使用不同的交通工具、采取不同的行进路线,最后缴纳的过路费会存在很大的差异。既然纳税和死亡一样无法避免,那么税务知识就不应该成为一种稀有知识,仅为少部分人掌握,而应成为每一个现代人都有所了解的常识。不懂税,必然多缴税,与其到时候为此付出巨额学费,不如来提前学习吧!
  • 中小企业如何做账

    中小企业如何做账

    本书充分考虑中小企业做账时可能会遇到的种种问题,并以会计核算知识为主体,适量、适度地引入了企业做账经常会用到的会计核算、报表编制等知识技能,结合运用大量图表案例说明,进行了详细的讲解,帮助财务人员解决实际问题。
热门推荐
  • 惜离别

    惜离别

    上帝会用亚当的助骨制造一个夏娃,却不会告诉你她在哪!直到她从你身边路过,上帝才笑着问:“看,那是你的助骨,怎么样?”淮南一直觉得说的就是他跟橘生的故事。
  • 中原大战

    中原大战

    中原大战指在中国国民党北伐以后,左派领导人汪精卫联合西山会议派,和地方军人阎锡山、冯玉祥、李宗仁、张发奎联合发起,挑战蒋中正中央政府的内战。中共方面亦称为蒋冯阎战争,或蒋冯阎李战争。中原大战历时7个月,双方动员兵力110万人以上,支出军费5亿元,死伤30万人,战火波及20多省。
  • 星际大陆

    星际大陆

    她是精灵族女王,傲视群雄。他是魔族帝皇,天才绝艳……当十万年光阴飞逝,他们的相遇又会给星际大陆带来怎样的变故?当封印之门开启之日,迫害大陆的御魔重新降临,谁会做这场灾难的英雄?
  • 神策天道

    神策天道

    小六界天道湮灭,天地灵根大损,末法时代降临,六界不在相通,人间守护者蜀山为救六界万亿生灵,集全派弟子之力,启动上古绝阵,强行破开天道壁障,打开虚空隧道,送蜀山三千年来最有天赋剑修奇才进入大千世界······一代剑修奇才带着蜀山众宝,在大千世界开启了一代强者崛起之路······佛道、儒道、仙道、魔道,诸道皆修!大道三千,殊途同归,不成圣,终究蝼蚁而已!
  • 指点江山球动天下

    指点江山球动天下

    平凡少年包一凡,借助神奇戒指,呼风雷于球场,品美女于人生,广阔天地尽在点拨之间,捣国内,摧海外,称霸宇内之间。无数魂牵梦绕的夜晚,几许伤心欲绝之晨昏。当他拿球那一刻,你就会隐隐听到了天边传来的滚滚雷声和天空中飞鸟腾空的阵阵尖叫。当他微笑的瞬间,侬将被那深浅有度,张驰有型,老少咸宜,随心所欲和高潮迭起所折服。《指点江山球动天下》,人生需要传奇,你就在创造传奇,或者成为传奇的一部分。最后套用一句欲死欲仙的广告词来推荐本书:whereamazinghappen.
  • EXO,微凉

    EXO,微凉

    我叫安初一,我的前半辈子,跟朴灿烈紧紧连在一起,不知不觉中,他为我做了太多事,慢慢的,我已经离不开他。我的下半辈子,跟好多人有关,他们给我塑造了刻骨铭心的青春,其中最重要的情节,就是他,边伯贤。我们从一见面就拌嘴,到后来的互相心动,再到最后的分开,都是那样的清晰;跟他在一起的段日子,是我这辈子最满足的时光。多年后,我仍然记得,那个雪地,他回头望着我时候的那个眼神,那样温暖,那样美好……
  • 危机经营

    危机经营

    本书介绍了企业抗危自救的六大举措,主要包括正视影响、应对“寒冬”、强化内功、把握契机、危机预警、坚定信心。
  • 天天恐怖

    天天恐怖

    在这个繁华的世界上,科技发达的今天。总会有一些事情是科学无法解释的。我的职业是帮助客户处理一些事情。那些听起来让人头皮发麻的事件,就是我和我的团队从容应对的工作。而此刻,那些的事情正在发生............
  • 可爱总裁爱上我

    可爱总裁爱上我

    妹妹是我唯一的希望,然而这时候,一个女人闯进了我的生活!
  • 妈咪的情人

    妈咪的情人

    寻欢的他,失恋的她,一起走进房。他是金主,她是情人,一个为钱一个为色。七日狂欢,激情不再,他们以为不会再遇。