数据湖不能成为数据沼泽

  • 来源:中国计算机报
  • 关键字:大数据,SAP HANA Vora
  • 发布时间:2015-10-09 15:22

  ——SAP HANA Vora架起SAP HANA与Hadoop之间的桥梁

  随着互联网、移动互联网的深入应用,企业数据量正在呈爆炸性增长,以至于很多企业都用数据湖来描述数据。这给企业的数据应用带来了极大的挑战。有业内人士分析说,如果不能很好地利用数据,那么数据湖就会变成数据沼泽。

  为了避免这种情况的发生,9月10日SAP在青岛举办的SAP创新业务平台峰会上宣布推出SAP HANA Vora。这是一项针对Hadoop的最新内存计算创新。SAP HANA Vora是一款全新的内存查询引擎,通过利用并延展Apache Spark运行框架,在Hadoop上提供更丰富的交互式分析功能,从而帮助用户指定准确的业务决策,让数据访问无处不在,并简化大数据的所有权。

  谈到研发SAP HANA Vora的初衷,SAP公司副总裁、数据管理部门负责人蔡坤宏(Ken Tsai)回忆说,SAP在成功推出SAP HANA内存数据平台,并引领了内存计算潮流之后,一直希望通过SAP HANA技术来强化大数据应用。这主要包括以下三个方面:

  第一,希望大数据系统可以理解商务语言,也就是说,将Hadoopl等开源架构中的非结构化数据和商业应用中的结构化数据很好地结合起来进行分析。

  第二,希望Hadoop等开源架构具有SAP HANA的分析能力。在蔡坤宏看来,尽管Hadoop推出到市场的时间并不短,但是其计算效率还不甚理想,而SAP HANA在软硬件结合方面总结了丰富的经验,如将信息直接传送给CPU从而加快计算速度。因此,让Hadoop拥有SAP HANA的分析能力意义非凡,将给用户带来高效的应用体验。

  第三,希望在开源架构和SAP HANA之间架起一座强大的桥梁,从而可以不间断地提供企业级创新。蔡坤宏认为,企业不会将所有数据搬到SAP HANA平台上,也不可能将所有数据搬到Hadoop上,因此在两者之间建立联系非常重要。

  这三个愿景,促使SAP开发了SAP HANA Vora。SAP HANA Vora不仅能够将SAP在内存计算上的创新运用到无处不在的数据上,还能够在Hadoop生态圈及其周边中提供联机分析处理(OLAP)方法。蔡坤宏介绍,SAP HANA Vora的价值主要在三个方面:

  第一,将来自企业系统和Hadoop的数据湖进行完整的数据洞察和分析,支持准确的业务决策。这是因为SAP HANA Vora用商业语义解读Hadoop数据,企业可以对商业活动形成更加完整的认识,从而做出更科学的商业决策。

  第二,让数据访问无处不在,支持数据科学的新发现。SAP HANA Vora可以在减少不必要的数据移动的情况下执行新查询,访问同样的数据,并支持企业系统数据和Hadoop数据之间的交互。

  第三,简化数据所有权,支持从单一来源访问企业数据和Hadoop数据。蔡坤宏解释说,企业可能拥有多个Hadoop应用,如果一个一个去跟HANA平台集成,效率很低,借助SAP HANA Vora却可以实现两者之间的一次性集成。

  蔡坤宏表示,SAP HANA Vora会让金融服务、电信、医疗和制造业等行业受益匪浅。比如金融服务业可以借助SAP HANA Vora将交易数据和客户历史数据结合起来分析,可以及时发现欺诈行为,防范于未然。

  值得一提的是,SAP HANA Vora只有不到30MB,部署和安装简单,用户可按需选择本地部署或SaaS服务。

  SAP HANA Vora的推出,让SAP生态圈的合作伙伴充满期待。华为IT产品线副总裁邱隆表示,SAP HANA Vora横跨了Hadoop、SAP HANA、Spark等多平台,能帮助企业快速提升数据分析能力,并对潜在市场需求做出明智的决策。他补充说,华为正在与SAP共同打造物联网和云的差异化解决方案,SAP HANA Vora将会使双方受益。

  凯捷洞察与数据业务部门全球大数据解决方案总监Anne-Laure Thieullent透露,凯捷计划将SAP HANA Vora纳入现有的洞察驱动型运营解决方案。他相信这将显著提升凯捷的客户实时分析情境数据和运营数据的能力,并为他们的业务和客户提供可靠的洞见,进而采取相应的市场行动。

  本报记者/邱燕娜

关注读览天下微信, 100万篇深度好文, 等你来看……