大数据 没有唯一的银弹

  “大数据没有唯一的银弹,没有单一的大数据产品能够满足互联网时代的传统企业的大数据需求。”7月18日,Pivotal大中国区总经理刘伟光在接受记者采访时如是说。Pivotal公司致力于提供企业级云平台和大数据平台,由EMC、VMware、GE在2013年4月共同投资成立。

  第三平台

  企业为了提高业务弹性,快速响应业务需求,同时更灵活、高效地管理IT系统,降低成本,需要一个高度自动化的基础平台,对下打通资源池、集群、虚机等管理,对上嫁接各种中间件、数据库、开发工具,同时为上层的应用软件提供支持。这正是Pivotal的努力方向——第三平台。所谓“第三平台”是指建立在移动设备、云服务、社交网络和大数据分析的基础之上,实现云计算、大数据、社交移动化的统一管理的平台。第三平台已经成为EMC公司的发展战略,而Pivotal在EMC第三平台战略中扮演着重要的角色。

  “第三平台说起来陌生,但是其实大家每天都在使用第三平台。微信就是第三平台一个重要的典范,它集成了客户群、数据、很多新开发的应用,从最早只有通话功能,到现在的商店、卖彩票、钱包等多种应用叠加,在一个整体架构下微信不断增加新应用,并且实现数据共享和管理,是互联网级别的第三平台的典范。企业应用中也有很多第三平台。很多传统企业会把原有的业务从线下搬到线上,很多应用不再只供企业内部使用,而是要将数据、应用开放,使更多外部客户和内部员工参与这个平台数据的交互。”刘伟光进一步向记者解释说。

  “建立一个在云上的基于IaaS和PaaS的数据解决方案来简化用户的应用程序开发、维护和管理的平台是未来Pivotal的使命。”刘伟光介绍,Pivotal One是Pivotal引领下一代计算的主要平台产品,包含三条重要产品线——主要由Greenplum数据库、Hadoop和HAWQ(利用SQL语句实现Hadoop操作)组成的大数据产品线,由GemFire、SQLFire产品组合的内存数据库产品线,以及以Clound Foundry为主,支持各种应用开发平台和中间件的PaaS平台。

  Clound Foundry承上启下,对下可进行所有资源的管理,能够跟硬件资源、公有云平台、虚拟化、OpenStack、VMware进行非常有效的集成,它提供了很多对外的接口,如数据库服务、Hadoop、快速数据处理、内存计算、数据分析等。该PaaS平台同时可以支持各种应用开发平台、中间件,如Spring、MySQL、消费中间件等,提供开发技术的接口,让基于这些平台开发的软件,可以很容易实现信息和资源的共享,打通各种业务应用。它也可以支持多种数据支撑平台,如GreenPlum、Hadoop、SQL Fire、HAWQ和GemFire等,这些开发工具或者平台,或者提供分布式数据库支持,或者提供内存集群技术,可以有效集成各种数据管理和分析工具及其应用。

  数据需求多种多样

  据悉,12306是Pivotal在国内的重要客户。其GemFire内存集群技术帮助12306将数据访问速度大幅提升。借助x86技术,Pivotal将订票和查询计算任务平均分配到每一台x86服务器,替代了原有几台大型Unix 服务器,通过并行处理技术应对12306网站的业务压力,从而提升了订票的满意度。

  “过去大多是互联网公司在谈大数据,但现在不仅是银行、电信,还有很多制造企业、科研机构、公安系统都在谈大数据。数据处理需求多种多样,可能是海量数据的存储、查询,也可能需要的是实时的查询、计算,或者是高并发的计算处理,还可能是大量的数据分析,不同企业在不同阶段对应不同业务都有不同的数据处理需求。没有一种技术可以涵盖大数据真正需求的所有数据。”刘伟光告诉记者。

  Hadoop可以实现海量扩展和基础的查询,但却实现不了企业级高性能的分析和查询,这是Hadoop的局限性。MPP(大规模并行处理)数据库有很好的扩展性,但在OLTP(联机事务处理)上有一定劣势,也没有Hadoop成本上的优势。内存计算方式很快也有很多好处,但是它只适合一部分高性能并发的热点数据。NoSQL数据、非结构化数据处理也都有各自的优劣势。没有一种技术可以涵盖大数据真正需求的所有数据,只有把这些数据集合在一起才是真正的大数据。

  为了满足客户不同的数据处理需求,Pivotal今年4月推出了Pivotal大数据套件(Pivotal Big Data Suite)。该套件基于年度订购方式,提供软件、支持和维护,包括GemFire、GemFire XD、Greenplum数据库、HAWQ、和Pivotal HD,灵活地为客户提供一套大数据/快数据产品。

  刘伟光介绍,大数据套件的技术架构涵盖了数据处理领域所有的需求,包括关系型数据库、NoSQL、流计算、SQL on Hadoop、OLAP on Hadoop、OLTP on Hadoop、cache缓存、In-Memory DB、 In-Memory DataGrid、非关系型数据库等,并且这些模块之间的数据互联互通,自由流动,可以任意搭配来构建灵活的企业级第三平台数据架构。对于底层用户来说,互操作性和标准SQL的支持使得应用开发和维护人员更容易上手,学习曲线降低;使得项目和应用投产的周期缩短,风险降低。对于上层用户来说,大数据套件完善友好的界面和丰富的操作接口可以使得没有任何经验的数据分析和使用人员也能很快地进入状态,专注于业务和逻辑的分析应用。

  流动可变的许可证模式

  纷繁复杂,企业需要单独采购,用量固定,无法灵活组装整个数据架构。而Pivotal大数据套件采用流动可变的许可证模式,依年限按内核数量定价收费。“比如某客户当下有并行数据处理需求,但一年后又会有部分内存数据处理需求,那他就可以选择购买80个内核的套件许可证,今年全部用于Greenplum产品,而一年之后将其中20个用于GemFire,60个保留给Greenplum。”

  对于该套件的优势,刘伟光总结道:第一,统一定价模型,整合大数据产品,简化企业的选择和流程;第二,流动许可证模型,保证客户的大数据技术投资与灵活的部署,从容应对未知的大数据挑战;第三,套件里的每一款产品都是领先的技术,拥有众多成熟的国内外客户案例,遍布各行各业,同时这些产品之间还能够无缝地数据集成,自由流动。

  本报记者 霍娜

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: