大数据从5%突破

  ——独家专访惠普中国区副总裁、软件集团大中华区总经理于志伟

  挖掘大数据的行业应用价值,提升获取信息的能力,注重大数据人才的培养,这样才能将大数据应用的比例从5%提升到更高。

  2013年,惠普发布了大数据解决方案平台HAVEn,这是一个能够处理所有数据类型,能够实时分析且安全的开放架构。目前,该平台在国内外的金融、电信、能源、互联网等行业中已经拥有了许多成功应用。惠普中国区副总裁、软件集团大中华区总经理于志伟表示,HAVEn的推出标志着惠普已经脱离了初始的数据汇集的阶段,步入了大数据应用的新阶段。

  行业、能力、人才

  于志伟认为,目前中国的大数据应用还处于起步阶段,而且由于行业需求、区域和人才储备等情况的差异,造成了大数据应用水平参差不齐的现象。在某些行业,用户对大数据的需求是十分迫切的,但是相当多的用户仍纠结于数据量“大”这个问题,还没有考虑结构化、半结构化和非结构化等不同类型的数据应该如何处理。

  国外的大数据应用水平已经达到很高的程度。举例来说,在美国,一个区域内的所有医院的信息都会被搜集起来用于分析,据此可预测某种疾病的死亡率。“国外的大数据应用已经走入行业,可以挖掘出行业中真正有价值的东西。虽然国内的大数据应用还停留在初始阶段,但在某些行业,比如互联网,其大数据应用的复杂程度比国外更甚,发展水平也较高。”于志伟向记者表示。

  大数据的应用要经历一个过程,不同的行业对大数据应用的需求是不同的。于志伟表示,企业在实施大数据应用时应注意以下几个问题:第一,注重大数据的行业应用价值;第二,企业要不断提升自身的能力去获得想要的信息;第三,大数据人才非常重要。“目前,我国大数据行业面临着人才严重匮乏的局面,从数据模型专家到通晓行业应用的复合型大数据人才都十分短缺,这会影响大数据应用的发展速度。”于志伟表示。

  HAVEn是一种方向

  今天,产品集成并不是难事,那么HAVEn是不是简单地将相关产品攒到了一起呢?于志伟澄清说,从HAVEn本身的标准架构来看,H代表Hadoop,表明HAVEn是一种分布式的架构,能够支持各种类型的数据,而且存储成本非常低廉;A代表Autonomy,表明HAVEn可以高效地处理非结构化信息,特别是机器语言;V代表Vertica,表明HAVEn可以实时处理和分析大量信息;E代表Enterprise Security,主要针对半结构化数据的处理;n代表的是各种在大数据平台上开发的应用。

  HAVEn是一个平台,它可以处理所有类型的信息,而且能做到实时分析,同时具有安全性。那么,HAVEn能不能代表未来大数据方案的发展方向?于志伟并没有正面回答记者的问题,而是举了一个例子,全球最大的社交媒体公司,之前采用Hadoop架构对信息进行处理。但是在半年前,它们采购了Vertica。很多人认为,Hadoop代表了大数据主流的发展方向,那么这家企业为什么会转而选择Vertica呢?最主要的原因是,Vertica可以实现实时分析。对于以广告收入为主要来源的这家企业来说,实时推送精准的广告是至关重要的,而Vertica可以实现。这家企业用Hadoop处理非实时的数据业务,而用Vertica进行实时的业务分析。虽然相比Hadoop,Vertica的采购价格略贵,但这家企业还是一次性采购了20PB。还有一家美国的知名电信公司,一次性采购了25PB的 Vertica解决方案,用于4G业务。

  “我们不去争论HAVEn是不是业界最先进的产品,但是综合上述这些已经使用了HAVEn的代表性企业的实践,HAVEn代表了一种发展方向。”于志伟分析说,“Hadoop将来会不会更全面,也能实时处理信息?有这种可能性,但需要时间。三年或五年以后,什么都可能发生,一种新技术甚至会消失。事实证明,我们的大数据平台能够解决用户的问题,而且很多用户都在使用。”

  在中国,也有用户在使用HAVEn,比如一个运营商使用HAVEn中的Vertica,分析用户的上网行为,每天分析的记录达到几十亿条。以前,这样的分析工作很难在一天之内完成,而使用Vertica,分析速度提高了60倍。另外,国内某知名能源公司采用HAVEn中的Autonomy,支持其信息共享平台。

  于志伟认为,HAVEn还只是一个大数据平台,而用户购买的是应用。因此从这个角度说,惠普提供的解决方案还不够全面。HAVEn中为什么会有一个“n”,就是表明惠普要在大数据领域开发更多的应用。惠普与全球最大的几家咨询公司合作,并在亚太和中国市场上寻找类似的合作伙伴。“行业解决方案是有区域性特征的,不可能直接照搬国外的。在一些垂直细分领域,我们一方面自己开发,另一方面也和合作伙伴共同开发解决方案。”于志伟补充说,“我们与政府合办的IT培训基地也把大数据当作一个重点。中国极缺大数据人才,我们从现在开始就要培养。这些人才今后可以为我们的合作伙伴所用,有利于我们共同构建一个良好的大数据生态体系。”

  树立行业样板

  记者在采访很多用户时,他们都表示已经认识到了大数据、云计算的重要性和可能给企业带来的收益。但是认识与接受是两回事,目前真正将大数据、云计算用于业务并取得显著经济利益的用户毕竟是少数。大数据是当前用户最迫切需要的、关系企业成败的技术,还是只是起到了锦上添花的作用?

  于志伟对于大数据的前景十分乐观:“目前在客户中,真正使用大数据的比例可能低于5%,但即使是这5%已经是巨大的客户量,而且这5%的企业都是超大型的企业和最需要大数据的企业。惠普一定是先与这些企业合作,树立大数据的应用标杆,然后再引导更多的企业加入。惠普目前在做的人才教育和培养工作,也是为了更好地普及大数据应用。我们不确定大数据市场何时会井喷,但我们会一直持续地给用户和市场更多方案、经验和信心。”

  大数据的一个典型特征就是实时处理和分析,能够实现实时处理的解决方案价格相对昂贵,而客户往往追求的是高性比的解决方案。那么,价格会不会是阻碍大数据普及的一个因素呢?Vertica是实时分析工具的一个代表,它的价格是普通企业用户能接受的吗?“相对于Hadoop大数据方案来说,Vertica的成本高相对高一些。”于志伟并不讳言,“Vertica运行于开放的硬件平台架构之上,不管是惠普自己的硬件还是第三方的硬件,即使在低端的x86平台上也可以良好运行。我们可以为用户提供灵活的选择,既能提供Vertica软件,也可以提供软件与硬件组成的整体解决方案,包括一体机。无论从整体拥有成本,还是灵活性的角度来分析,相比市场上的其他一体机或大数据解决方案,Vertica大数据解决方案还是非常有竞争力的。”

  链接

  惠普中国软件集团的四件大事

  2014年,惠普软件的整体战略相较去年不会有太大变化。于志伟表示,惠普软件在今年将主要做好以下四件事。

  第一,在大数据、云计算方面继续加强与政府的合作,同时抓好人才培养工作。

  第二,在大数据、云计算、移动应用等领域,寻找并树立更多的成功用户样板,吸引更多新客户。

  第三,关注中小企业市场。中小企业市场的一个特点是“东方不亮西方亮”,总能找到突破口。于志伟也坦承,针对中小企业用户的大数据解决方案肯定不同于大企业,但是建立一个公共服务平台提供大数据或云计算服务是有可能的。

  第四,密切合作伙伴关系。“未来,我们业务的一半与合作伙伴相关。因此,我们要与合作伙伴共同设计、推广大数据解决方案。”于志伟表示。

  本报记者 郭涛

关注读览天下微信, 100万篇深度好文, 等你来看……