大数据痛与通
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字:大数据 smarty:/if?>
- 发布时间:2014-08-12 12:16
大数据有大能量。它对经济增长意义重大——“在美国,仅在零售业和制造业,大数据分析就有潜力将GDP提高3250亿美元。”这是分析师们给出的令人心动的估算。在全球经济增势放缓甚至疲态尽显而亟须新的增长点之时,人们把希望的目光投向了有望担此重任的大数据。
务实而精明的企业家们在被对大数据的热情和激情围绕的同时,仍然保持着理智和清醒。他们需要的远不止天花乱坠般的对大数据前景的描述,他们更需要被说服要不要尽快转变为数据驱动的企业,被指导大数据究竟该如何应用到自己的企业中,被展示大数据能带来的实打实的好处。
不能回避的现实是,大数据也有痛点,这些痛成为了令人烦恼的绊脚石。而所谓“通则不痛”,这些痛皆有“良医”给出了通的好方子。大数据效益则成为最直接也最有力的论据。解剖每一个实施经验,会发现企业家所需要的答案皆包含于其中。于理智,于情感,他们都无法再抵抗大数据的诱惑。
投资大数据有准则
在接受《财富》的采访时,喜达屋国际酒店集团首席品牌官菲尔·麦卡维蒂这样形容大数据:“在我们最古老的酒店里,总经理办公室和前台之间有一条通道。通过这条通道,总经理可以看到每一个新入住的客人,然后像迎接老朋友一样迎接他们。我认为大数据就是21世纪的这条通道。它让我们更了解客人,为客人提供他真正所需的服务。”
Matt Asay,NoSQL数据库技术领域最知名的公司之一MongoDB公司的副总,曾感叹道:“大数据的吸引力就像万有引力一样,如此强烈让人无法逃避,人们按捺不住冲动想要开展相关项目。”
不止一个大型企业的CIO公开表示过,大数据为公司节省了大笔金钱——1%的效率提升带来了数百万美元的开支缩减,销售情况与客户数据库的有效映射带来了10%的销量增长……这些令人垂涎欲滴的数据与Bain&Company公司的调查结果是一致的:采用大数据分析的公司遥遥领先于竞争对手——在本行业内财务状况位于前25%的可能性增大一倍;做出决定的速度快四倍;可实现三倍的执行效果;使用数据支持决策的可能性高两倍。
于是乎,企业纷纷有所作为。Gartner的一项调查表明,接受调查的企业中有64%表示正在部署或者计划部署大数据项目。然而,令人尴尬的是,56%的受访者对如何从大数据中获取价值感到迷茫,23%的受访者对大数据的确切定义存在疑惑。
“大数据热并不意味着任何企业都要迫不及待地跳进大数据浪潮。”在Infinitous Global Services公司总监Jamal Khawaja看来,大数据的采用是一项长期而多学科融合的工作,这对企业的平台、服务和内部投资能力而言,都是不小的考验。
根据多年企业研究的经验,他给出了判断企业是否处在上马大数据最佳时刻的四个标准:在商业智能(BI)方面已有一定的积累,手中的数据量已达一定规模,企业文化认可,具备充足的人才储备。
“只有对已有数据处理得当,才能从分立的数据流中找到解决问题的方法。衡量是否对数据处理得当有两个标准:一是带来了更高层次分析所需的专业技能,二是获得了一定的财务效益。”Jamal Khawaja细说开来,“历史数据集中的相关数据可以带来很多机会,如排除运行异常。在进行大数据投资之前,必须清楚地意识到大数据投资与其他的投资不同,它不是由已有的、显而易见的问题驱动的,你无法得到大数据投资的标准的投资回报率或净现值模型,而且预期的回报也不是显而易见的。可以说,大数据的投资本质上是机会主义的。因此,必须有相应的企业文化接受这一点。数据科学家等专业人才的重要性就不用说了,他们从数据中提取价值的方法令人眼花缭乱。”
如果审视完毕,觉得信心满满,可以践行大数据项目了,仍然不可掉以轻心。来自Informatica公司的高级经理Myles Suer指出,不少大数据项目实际上只是之前已有BI项目的“换汤不换药”版本,申请人员这么做只是为了确保资金到位或项目得到批准,这就意味着项目论证必须严谨。
“此外,我们需要提防过去在IT方面犯的错误重现。”Myles Suer表示,IT经历了三个大的发展阶段:本地系统、ERP、BI/大数据,“ERP本应解决所有本地解决方案的问题,但是它仅仅提供了交易信息。我们要避免BI/大数据重蹈覆辙。否则,CIO很可能会听到CEO/CFO的抱怨——积累的数据并没有让公司赚到更多的钱。用大数据把交易系统、BI和规划系统连接起来是一个可行的方法,这样有希望为公司带来更多利润。”
先会爬,再会走,才能跑。对大数据同样不能心急,也不能急于求成——实施大数据好比参加一场高奖金的汽车大奖赛,要先准备好车,熟悉赛道,调整心态,适时冲刺,最后才能取得好名次。
不可忽视的风险
“如果在一片匆忙中采用大数据的方法与技术,一些公司可能会低估或完全忽略一些大数据的风险。实施大数据对公司而言相当于下了一个大赌注,无论什么时候企业都绝不能掉以轻心。了解这些风险并做好应对这些风险的计划,对想尽可能获益于大数据的公司是至关重要的。”知名IT管理咨询师Rick Delgado敲响了警钟。
在他看来,实施大数据时最大的风险是安全。系统处理的数据越多,必然数据丢失的可能性就越大。“最近发生的Target公司和可口可乐公司数据泄露事件足以说明,数据损失事故是近在眼前的,所导致的代价是巨大的。”Rick Delgado强调,对IT安全的重视是许多企业所欠缺的,这在大数据时代会导致比以前可怕得多的结果。
对隐私的担忧也是一个绕不过去的坎。它既是一个法律问题,也是一个商业问题。关于数据所有权的争论喋喋不休,尤其是涉及消费者和企业,或者企业和大数据供应商的时候。企业使用他们收集到的与用户相关的数据,可能导致一些触犯法律的后果。数据的误用可能导致诉讼、罚款,甚至进一步招来行业监管等严重的后果。一个典型的例子就是,英国NHS医院因私自将病人信息卖给保险公司而被告上法庭。另外,虽然一些违反隐私权的行为在技术上可能是合法的,但公司仍会承担声誉遭受重大打击的风险。
使用大数据另一个不容忽视的风险是,它可能使一个企业丧失敏捷性。这听起来似乎有点奇怪,因为大数据的本意应该是帮助公司更快地响应实时数据,但别忘了,大数据的不同数据集总是会被安置在使用不同软件程序的多个不同的平台里。大数据要求数据以极为高效的方式被管理、组织和存储,以便进行适当的分析,而后采取行动。如果一切杂乱无章,没有合理管理所有的输入数据,企业很容易在需要迅速行动的时候瘫痪,不快反慢。那么,毫不意外的结果就是,在“时间就是金钱”的市场竞争中,公司就失去了先发制人的机会。
除了数据管理不善,曲解数据的风险也值得注意。有了大数据,公司有时会想当然地认为它几乎可以做任何事情,但事实并非如此简单。大数据可以显示事情是怎么回事,但它不能提供事情为什么发生的解释。要得到这些解释,需要正确的分析判断,但这有时仅依靠数据本身很难做到。例如,数据显示,在一年的某个时候销售量出现井喷,但为何井喷则必须由专门的数据专家来解读,否则结论就可能是错误的,从而带来无效的行动。长远来看,曲解的数据最终会白白浪费掉企业大量的钱财。
企业如何减少这些伴随大数据而生的风险?Rick Delgado给出了应对之策:雇佣擅长管理大型数据、擅长分析和有能力得到正确结论的专业人才。在关键的岗位上有合适的人将有助于企业在需要解释数据和使用最新的大数据工具时,对数据进行有效的利用和减少错误发生的机会。企业还应该经常进行自我评估,以确保符合当前的隐私保护条例和商业法规。同样重要的是,企业必须诚实和透明,让客户知道企业如何使用了他们的数据,这将有助于得到客户的信任和忠诚。
面对潜在的重重风险,Rick Delgado仍然表示谨慎乐观:“毫无疑问,大数据可以提供巨大的好处。但公司对风险应采取实事求是的态度。没有哪项新技术或实践是无风险的,企业只要牢记这一点,就能做好准备应对挑战。”
CXO之间的和谐
Gartner表示,到2015年,会有1/4的大型公司设置首席数据官(CDO)这一职务。而根据cloudpro.com的报道,目前已有100位CDO在位,其中65%在美国,20%在英国。
Gartner这样描述CDO的职权:“他们负责跟数据相关的核心流程,主管数据,协调数据的使用。这与首席财务官(CFO)类似,CFO掌控着财务流程,让资金在企业内部合理流动。”
以走在趋势之前积极行动的美国银行为例,其CDO John Bogetta早在2011年的12月就走马上任了,这个时间点要早于大数据成为CIO开口必谈的热点。他的主要职责是数据管理和质量管控。
CDO如雨后春笋般出现,他们是否抢占了原本属于IT和CIO的专属领地呢?首席数字官(CDO)、首席技术官(CTO)和首席营销官(CMO)等CXO又需要做出哪些调整以适应大数据时代呢?
在经过大量访谈后,《哈佛商业周刊》发现了一个令人难堪的事实:CXO们并没有紧紧围绕在大数据这一核心周围,尤其是CMO和CIO的不合拍是寻求获益于大数据的企业中普遍存在的问题。
确实,各种CXO的思维方式存在差异,追求的绩效目标也各有千秋。但别忘了,有研究表明,数据驱动的企业比非数据驱动的企业“生产效率高5个百分点,利润率高6个百分点”。对一个公司而言,生产效率和利润率是最高目标。因此,CXO们必须一致对外,清醒地意识到大数据是在市场需要创新时能有效帮助决策人员筛选、分析和预测的绝佳武器。
“时至今日,技术在企业运行过程中的角色已经发生了巨大变化,这些变化就要求CXO们通力协作。”知名IT媒体人John Dodge指出。
麦肯锡消费市场分析中心首席运营官Matt Ariker给出了改善CXO各自为政局面的中肯建议:企业必须具备有效的决策框架,CXO组成的领导团队必须相互支持。这影响着将数据转化为价值的每一步,包括制定战略、选择使用场景、预算,以及部署等环节。明确需求尤为关键,这需要CMO确定与数据和分析相关的业务目标、使用场景和具体要求,CIO需要提供基于使用场景需求的可行性和成本分析,CTO提供强有力的技术支持,CFO准备好“钱包”。这些都需要在成本、时间和优先级方面进行权衡和选择。接下来组建合适的多元化的团队,将流程透明化,定期跟进,这其中有效沟通必不可少,必要时甚至需要“翻译”,让CXO能“听懂”彼此的话。比如CMO需要既了解客户和业务又具备极客思维的人来沟通,CIO需要对营销活动和业务有深刻理解的技术人员来沟通。然后,这个领导团队要循序渐进,可以先开展一些参考性的工作以测试团队协作能力和新的流程,进而推广。
能否有效利用大数据已经在许多行业里成为区分胜利者和失败者的分水岭,但企业没有捷径可以走。任何一位单独的CXO都无法独自享受大数据的成功或独自承担大数据的失败。
成功案例
NASCAR迷们在想什么?
——预测分析技术帮助NASCAR钻进了赛车迷们的脑袋
在美国,你会发现NASCAR无处不在。NASCAR,即全国运动汽车竞赛(National Association for Stock Car Auto Racing),将赛车运动带入了一个革命性的时代。NASCAR的前身是美国“全国赛车冠军联盟”(NCSCC),它将分散在各地的私人车赛归纳到联盟的掌握之下,并设立了全美第一个赛车积分制度和优胜者基金。它拥有7500万名粉丝。
为此,它使用了一系列的工具和平台,捕获、跟踪和分析比赛日中粉丝的心情。NASCAR这么做的原因是关心粉丝们在想什么,需要什么,想要什么。在比赛过程中,无论粉丝们在推特、博客、分享里面表达了什么,在NASCAR看来都是有价值的。但如果没有从这些数据中提取出信息,这些价值除了让人感受到粉丝的热情之外毫无用处。于是,NASCAR采用预测分析技术来了解粉丝们的真实想法。
NASCAR CMO史提夫·菲尔普斯表示,赛车每跑一圈,NASCAR粉丝们所发表的评论便如洪水般涌来。NASCAR可以实时捕获和分析这些评论,提取出信息,并将这些信息打包,发送给车手、公关人员、车队和赞助商。当然,NASCAR也因此与粉丝们更有效地沟通。
史提夫·菲尔普斯介绍了两个NASCAR使用大数据的场景:
场景1——通用汽车公司尝试推出一种新的雪佛兰车型,NASCAR应用情感分析技术在社交媒体上展开互动,在其粉丝与相关媒体的参与下,每分钟得到了6万条反馈信息。NASCAR从这些反馈中提取有价值的信息,并告知通用汽车公司,以便该公司基于该数据采取适当的行动。
场景2——在一次比赛中,暴雨导致跑道浸泡。NASCAR应用创新技术,在90分钟内利用空气扭紧装置使地面干燥。在社交媒体的互动里,球迷在比赛开始前一直在关注这个技术。NASCAR就有机会在准备下一场比赛场地的时候,让粉丝在社交媒体上保持对比赛的持续关注。
沃尔沃汽车的大数据“配件”
——大数据分析技术为沃尔沃汽车锦上添花
一直以来,沃尔沃的汽车互联技术遥遥领先,这使得沃尔沃在产品质量、安全性和环境保护方面都表现良好。现在,随着大数据的出现,潜在的对驾驶新服务的需求迅速增长。例如高档轿车客户希望享受到金融服务、点对点共享和基于位置的服务。而在商用领域,商用卡车、公共汽车、零配件的正常运行时间和安全性必须进一步提升。
为了满足这些新的需求,沃尔沃意识到需要大量的数据和分析。
沃尔沃通过在汽车中安装传感器和嵌入式CPU,从刹车到中央门锁系统等各种车辆使用信息,源源不断地传输到沃尔沃总部。这些数据被用来优化生产流程,以提升客户体验和提升安全性。将来自不同客户的使用数据进行分析,可以让产品部门提早发现产品潜在的问题,并在这些问题发生之前向客户预警。此外,沃尔沃还对大量的真实交通场景进行研究,至今已积累了超过6万起交通事故的第一手数据和分析结果。
基于沃尔沃最近推出的Sensus智能车载系统、汽车互联技术和云技术,车辆使用的海量数据可以进行统一收集和实时的分析处理,从而为驾乘者创造出更安全、更舒适的驾驶体验,并降低能耗,提升交通效率,推进智能梦想的实现。沃尔沃汽车车主网站(My Volvo)已于7月上旬上线,7月中旬开始,新老车主可通过网站与经销商实现车辆维修保养信息共享,2015款车型还可通过Sensus系统进行车内自动提示,实现快捷高效的CSB智能互联维修保养服务预约。
以2015款S60L为例,当这台车出售给用户并实现联网后,车辆的数据(如油耗、机油位、灯光运行状态等车辆数据)就会自动上传至云端,并且在网络开放的状态下,不断更新。一旦车辆的某个部位出现状况,如发动机警告灯亮起,车主除了会在仪表盘上看到相应指示灯,在中控屏幕上也会看到自动跳出的提示,告知车主是否需要将此情况发送至指定经销商,如选择“是”,那么这个可能存在隐患的数据就会发送至指定经销商的系统中,根据情况,经销商再向车辆发送是否需要检测的询问。此时如果车主确认,那么就可以根据提示,选择检测时间。如果车辆状况已经影响到行车安全,系统甚至会提醒车主取消驾驶行为,尽快维修。
成功案例
乐购的内外大数据战术
——大数据为乐购带来管理红利
乐购(Tesco)是世界第三大零售商,仅次于沃尔玛和家乐福。与其他零售商不同的是,它的CEO是技术专家出身。
乐购一直推崇数据的力量。它率先建立了会员卡体系——1993年,乐购采用磁条卡(以及后来的条码)来关联顾客。两年后,乐购投资Dunnhumby公司,这是一家数据分析公司。2010年,乐购收购Dunnhumby。基于这种对数据敏感的传统,乐购在大数据时代得心应手。
乐购将这种数据驱动能力应用于业务流程的各个环节,从供应链到销售和服务。实时的数据更新可以结合预测分析,通过供应链和物流网络提供早期订货警报。电子货架标签的数据可以被用来在整个美国范围内瞬时调价。
大数据分析也是乐购了解消费者购买行为的有效方式。通过实体商店、移动设备和桌面计算机的多种服务渠道,乐购的大数据策略可激发消费者的购买欲望。例如,一个消费者可以在商店中的互联网亭来预订第二天想买的东西。消费者还可以用移动设备下单,要求乐购送货上门。要想随时随地满足消费者的需求,公司不仅要了解消费者的购买模式,而且还要了解他们的购买渠道偏好和对物流的要求。
另一个例子是乐购的大数据多渠道战略。乐购持有Blinbox公司80%的股份,这是家视频点播服务提供商。Blinkbox为会员卡持有人提供定制服务,为他们提供免费的带有广告的电影和电视节目。这有助于提升广告中产品的销量。Blinkbox的创始人和首席执行官迈克尔·科米什,是乐购集团数字官,并掌管其数字娱乐服务部门。
乐购深知,如果对数据进行跟进一步的挖掘,可以换取更大收益。不过这要求乐购做出更多努力,且必须调动更多资源,采取完全不同的大数据战略,但相比单纯出售原始数据,则可获得更大收益。例如,乐购通过其拥有过半股权的消费者信息公司向零售商和大型生产商出售积分卡用户的消费信息,2010年的收益达到5300万英镑。
链接 比大数据更有趣的Little Data
在最近一次由BusinessValueExchange网站发起的推特论坛中,西蒙·托马森发布了以下一则消息:Little Data是在需要时你可以使用的与你个人相关的信息。随后,E.G. Nadhan发表了自己的看法,“Little Data为大数据提供了更多的背景,使得最终用户可以更好地使用大数据。”Little Data的概念引起热烈讨论。
在这个论坛结束后,E.G. Nadhan仔细地琢磨了下Little Data。他介绍道,当时电视里正在播放的是天气预报:“气象学较为准确地预测了全球各地的气温和湿度。这涉及对ZB数量级的数据处理和分析,这就是大数据。然而,这对我而言,信息量太大。与我紧密相关的是Little Data,我更关心我家附近的天气。对我而言,获得及时而有逻辑的Little Data很重要。”
那么,决定产生最合适的Little Data的因素是什么呢?那就是围绕个人的即时需求产生定制化的信息,这些数据包含个人需要的考虑背景的信息,能及时而且迎合个人特定的活动和爱好。下面是几个例子:当一个人在家,他会关心后院的天气,但是如果他在旅行,他会对目的地的天气感兴趣;如果他在密歇根湖上航行,他对风速和潮汐更在意;爱打高尔夫球的人会留意前一天的湿度和降水情况,因为这会影响当天的场地状况。
可以看出,对于Little Data而言,背景不可或缺。没有背景,Little Data就站不住脚而成为垃圾信息;有了背景,这些可爱的数据,使得大数据生动起来。
《哈佛商业周刊》有一篇文章这样解读Little Data:“Little Data就是与我们关系最紧密的有意义的信息。Little Data是我们对自己的认识——我们买了什么,我们认识谁,我们去了哪里,我们怎样打发时间。多亏了移动、社交和云计算技术的结合,我们比以往更容易地了解自己的行为。”《福布斯》则认为Little Data在帮助公司实现业务目标时,因为更具体更具有指向性而更容易被识别。
相比大数据,Little Data更亲切,更友好、更便宜、更少干扰,时效性是其内在价值。可以说,Little Data更生活化,而大数据则更抽象。