大数据“捕蝉” 分析在后

  在大数据分析应用市场,互联网公司的实践一直走在前列。今天,基于数据的分析、展现、抽取等各方面应用实际上已经突破了“狭隘”的大数据视角,并且,这一趋势在全面向企业级领域渗透。相对完整的、适用于企业应用的大数据解决方案已经出现,与企业业务数据库的相连更为指导新的业务需求创造了可能性。

  Power传承既有优势

  “x86+Hadoop”被认为是承载大数据应用的主流平台,其开发和应用生态系统已经得到了市场的验证,但这并不意味着大数据基础平台会呈现一种架构“通吃”的局面。

  在IBM看来,Power平台是构建大数据应用的一把“利器”。“大数据是一个跨行业的需求,不仅在互联网公司,传统企业客户,像金融、政府、电信等行业也有非常多的有关大数据的应用。” IBM大中华区副总裁及系统与科技部Power Systems总经理侯淼表示,“Power平台所具有的大内存、大Cache、多线程等技术特征,使之非常符合大数据的应用需求。”

  数据仓库、数据挖掘、业务数据库,这些都是Power平台传统的优势领域。在IBM系统与科技部大中华区Power Systems产品总监李红看来,这些既有优势为Power平台在大数据领域的应用奠定了基础。

  “首先,大数据应用需要与既有系统进行平滑、无缝的连接和交互。在此基础上,Power平台可以拓展新的需求,例如开源的非结构化数据、流数据的分析等,都可以集成到新的需求中去。在这个过程中,传统方案需要和新方案实现很好的整合,Power平台的价值进一步得到体现。此外,软件生态系统至关重要,对软件以及并发处理等场景的广泛支持(包括DB2、GPFS等)使基于Power的解决方案具备更多优势。”李红告诉记者。

  面向数据类型的解决方案

  多样性是大数据的一个典型特征,在IBM看来,面向不同大数据类型,大数据应用可分为静态批量大数据处理、实时大数据处理、数据仓库整合、数据集市构建四类,IBM面向这四类应用都有专门的解决方案。“以数据仓库应用为基础,发展出了新的大数据应用场景和需求,例如静态数据的批处理、流数据的实时分析等。 IBM的思路是提供整合的解决方案,帮助用户最终获得完整的数据价值。”李红表示。

  在静态大数据解决方案中,Power可支持Open Hadoop、 BigInsights、 Symphony 等大数据解决方案,并能够与传统数据仓库系统无缝集成。李红解释说:“Symphony专门面向计算密集型大数据应用,BigInsight在Hadoop框架上增加了安全管理、工作流等特性,并融入了IBM独特的数据分析、机器学习和文本数据分析挖掘等技术。”

  在GPS、医疗检测分析、天气预报、金融交易等应用场景中,实时数据分析不可或缺。在这方面,Power支持IBM Infosphere Streams和开源的Storm构建流计算解决方案。“PowerLinux+GPFS-FPO+Streams”的组合能够提供强大的实时数据处理功能和性能。“大内存、大网络带宽的硬件特性在实时数据分析场景中可以大显身手。”李红表示。

  作为最传统的数据应用类型,数据仓库在企业级应用中的核心地位仍是不可动摇的。 Power系统支持集中式架构,具有强大的向上扩展能力,为OLTP和OLAP应用提供了性能保障。DB2 pureScale可实现对Power集中式架构的进一步增强。

  在数据集市应用方面,列式存储以及内存存储技术可以加快数据查询的速度。DB2 BLU加速器采用内存列式计算方式,能够动态移动无用数据,在提高查询效率的同时节省存储空间。“DB2 BLU+Power”的组合正是面向传统数据仓库应用的延伸。

  本报记者 李奕

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: