[百道网张炳剑专栏]当我还是淘宝网的一名高级运营时,曾经有人问我,全中国比基尼卖得最好的是哪几个省?我不假思索地回答说,肯定是广东和海南岛。但当我看到淘宝上比基尼的销售数据时,我惊呆了,卖得最好的省居然是新疆和内蒙。这是我第一次切身感受到数据“发声”的魔力。
当下互联网界最为热门的词汇是什么?大数据!这个最初来源于天文学和基因学的词语,如今不仅成为人们口耳相传的热门话题,也正在成就一连串创业热点,将实实在在改变人们的生活。
近日,“大数据商业应用第一人”、牛津大学教授维克托·迈尔-舍恩伯格领衔的大数据权威研究之作《大数据时代》引进出版。书中向人们揭示大数据将给人类生活、工作与思维带来的大变革,予人颇多启示。
大数据的核心是预测,指的是将数学算法运用到海量的数据上来预测事情发生的可能性。借助大数据,亚马逊可以帮我们推荐想要的书,谷歌可以为关联网站排序,Facebook知道我们的喜好,而LinkedIn可以猜出我们认识谁。同样的技术还可以运用到疾病诊断、推荐治疗措施,甚至是识别潜在犯罪分子上。一个大规模生产、分享和应用数据的时代正在开启。
为什么是“大数据”?
我们正面临着一个数据爆炸的年代。科学家推算,2013年世界上存储的数据将达到1.2泽字节。如果把这些数据存储在只读光盘上,这些光盘可以堆成五堆,每一堆都可以伸向月球。互联网使得信息的记录和保存成为自然而然的事情,而在物联网的推动下,物体都将会用信息来记录,也就是说,未来每个物体都会有信息。而这些信息都将以数据的形式保存,给我们带来无限的惊喜和意外。
当我还是淘宝网的一名高级运营时,曾经有人问我,全中国比基尼卖得最好的是哪几个省?我不假思索地回答说,肯定是广东和海南岛。但当我看到淘宝上比基尼的销售数据时,我惊呆了,卖得最好的省居然是新疆和内蒙。这是我第一次切身感受到数据“发声”的魔力。
2012年2月,《华尔街日报》发表文章《科技变革即将引领新的经济繁荣》,文中罕见地做出大胆预见:“我们再次处于三场宏大技术变革的开端,它们可能足以匹敌20世纪的那场变革,这三场变革的震中都在美国,他们分别是大数据、智能制造和无线网络革命。”
为什么是“大数据”?最早提出“大数据”时代到来的是管理咨询公司麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
那么,什么是“大数据”呢?科学的定义就是巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的资讯。但是,现在它越来越成为一个带有文化基因和营销理念的词汇,又同时反映出科技领域中正在发展中的趋势,这种趋势为理解这个世界和作出决策的新方法开启了一扇大门。
维克托在他的《大数据时代》一书中说:“大数据就是我们可以在更大规模的数据上做到更多我们无法在小规模数据基础上完成的事情。”他前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。
因此,关于大数据价值的核心的逻辑是,这种背景下,在商业、经济、政府及其他领域中,决策行为将日益基于数据和分析而作出,而并非基于经验和直觉;而在公共卫生、经济预测等领域中,“大数据”的预见能力也已经崭露头角。
“大数据”让政府变得更有效
大数据时代,未来引导政府前进的将是基于实证的事实。基于数据说话,将使政府更有效率、更加开放、更加透明。
在《大数据时代》中,维克托意识到了大数据对于提高政府工作效率的重要性。他举了一个防治流感的例子,向我们展示了大数据在公共卫生领域是如何促进政府工作的。流感对于当时的美国人来说是一件大事。美国人对于流行病学的各种调查就是掌握不了流感的规律,后来他们想到从2万多家药店的销售记录中,把这个数据拿来分析。结果发现,一般在全国流行性感冒的前两周,药店的感冒药增加得比较快。也就是感冒药增加得比较快的两周以后,全国的流行性感冒来了,通过对这个数据的分析,当时美国的相关部门就可以提前增加对流行性感冒预防的措施。
而类似的例子其实很多,比如政府通过大数据来找出最容易发生火灾和井盖爆炸的地点。针对纽约因沙井盖内部失火而频频发生的井盖爆炸事件,提供电力支持的联合爱迪生电力公司向哥伦比亚大学的统计学家求助。当时负责这一项目的团队通过使用所有数据而非样本,发现了沙井盖爆炸的106种预警情况,并利用这些数据预测了次年会出现问题的沙井盖。
事实上,自奥巴马当选美国总统以来,美国政府已经把“大数据”上升到了国家战略的层面。奥巴马政府甚至投资2亿美元启动“大数据研究和发展计划”,希望增强收集海量数据、分析萃取信息的能力。另据一份报告显示,英国政府也通过高效使用公共大数据(Big Data)每年节省了330亿英镑。这个数字相当于英国每人每年节省500英镑。如今,在国家层面,大数据已经成为继边防、海防、空防之后,第四个大国博弈的空间。
海量数据里透露不易察觉的商机
大数据在商业中的应用所起到的作用更是显而易见。在《大数据时代》中,维克托告诉我们,当有了数据还有使用方法的时候,我们最不能忽视的就是大数据时代的大数据公司,比如Twitter这样的数据提供者,还有将数据进行分析基于数据分析能力的公司,还有一类便是基于非常出色思维的公司。而维克托特别说的一点是,大数据时代,超大型公司占据规模优势,而小公司则独具灵活性,处在中间的公司要么进行转化,要么面对更加残酷的竞争,直至破产。
关于大数据领域最经典的案例再也不是老掉牙的“啤酒与尿布”,而是来自一位美国少女。据称,美国一名男子闯入了他家附近的Target店铺(美国一家零售连锁超市)。“你们怎么能这样!”男人向店铺经理大吼到,“你们竟然给我17岁的女儿发婴儿尿片和童车的优惠券,她才17岁啊!”店铺经理不知道发生了什么,立刻向来者道歉,表明那肯定是个误会。然而,经理没有意识到,公司正在运行一套大数据系统。但高潮是,一个月后,这个愤怒的父亲打来电话道歉,因为Target发来的婴儿用品促销广告并不是误发,他的女儿的确怀孕了。
在这个案例中我们看到,数据的力量,不仅让商家提升了自己的业绩,还让客户为之心甘情愿买单。据悉,Target创建了一套女性购买行为在怀孕期间产生变化的模型。他们注意到,妇女会在怀孕大概第三个月的时候买很多无香乳液。几个月后,她们会买一些营养品,比如镁、钙、锌。公司最终找出了大概20多种关联物,这些关联物可以给顾客进行“怀孕趋势”评分。不仅如此,如果用户从他们的店铺中购买了婴儿用品,Target在接下来的几年中会根据婴儿的生长周期情况定期给这些顾客推送相关产品,使这些客户形成长期的忠诚度。事实上在商业零售领域,诸如沃尔玛、Tesco等巨头已从数据中获得了巨大的利益,也因此巩固了自己在业界的长盛不衰。
而在互联网行业中,大数据更是为电商、广告商们提供了丰厚的回报。雅虎于2008年初便开始启用大数据技术,每天分析超过200PB的数据,使得雅虎的服务变得更人性化,更贴近用户和客户。它与雅虎IT系统的方方面面进行协作,包括搜索、广告、用户体验和欺诈发现等。AOL也设立了300节点的服务器集群,将在其下属系列网站(如AOL.com、Huffington Post、MapQuest等)中每天500TB的用户浏览信息收集起来,分析和预测这些用户的行为,以便有针对性地为每个月1.8亿独立用户进行个性化广告服务。
海量数据的挖掘、分析和应用,可能会成为未来颠覆生活和工作的重要推动力。比方说亚马逊以前需要依赖专业的书评人员来推荐书籍,而现在完全可以通过大数据运算来替代专业书评人员,这就是大数据带给商业的变革。
“大数据”带来的冲击实质是思维的变化
维克托认为,大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。而这种生活方式的改变是源于思维上的变化,最惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。也就是说只需要知道是什么,而不需要知道为什么。
初听起来也许觉得作者太过于绝对,而且很大程度上挑战了我们一贯固有的思维模式,但是在文中作者就大数据时代的特性充分阐释,并告诉我们为什么现在的“大数据”应该是这样。而我们可能关心的部分,又为何不那么重要,或者需要等待更久去实现。
比如以美国的民航业为例,美国民航的正点率非常高,它是如何做到的呢?原来美国交通部开放了全美航班起飞、到达、延误的数据,这当然是海量的。公布之后,有人就利用这些数据开发了一个航班延误时间的分析系统,并向全社会免费开放。
通过这个可视化的软件,任何人都清楚地看到:晚点最少是哪个航空公司,晚点最多的是哪个航空公司,一般晚点多少时间;在各个航线上,哪个晚点最多,哪个晚点最少,哪个正点率最高,它把这些排列出来,一目了然。如此,人们并不需要知道这当中的基于数学模型而建立的大量换算,只需要享受这一便利即可。
事实上,大数据在生活当中的应用已经遍地开花,在这本《大数据时代》中列举了上百个例子,如乔布斯通过大数据辅助癌症治疗,通过智能手机上的应用程序来监测病人的身体颤动,甚至如丹麦癌症协会通过大数据来研究手机使用是否致癌,还有微软这样的公司来分析病患的再入住率等。
金融行业则通过大数据来鉴别个人的信用风险,快递领域通过数据来确定行驶路线,减少等候时间,商场通过大数据发现产品之间的关联,比如最近大家在探讨的为什么避孕套和口香糖要放到收银台附近。大数据时代,一切的一切都存在着可能,而这一切的改变我们也正在体验之中。
发表评论前,请先[点此登录]