数据库市场历来是厂商的必争之地,几大软件厂商来都有相关的产品。但是,对于用户而言,现在的问题不是数据库不能用,而是数据库中的数据越来越多。在如今重视分析处理数据的行业市场中,该如何迅速有效的将数据提炼出来?
中国一家上市网络公司,定期会向股东提交财务报表,但是由于数据量巨大,往往到了提交报告的前一天晚上才能把数据分析出来,这给该公司的财务部门和IT部门带来很大压力。
不过,后来该公司采用了Greenplum公司的数据仓库解决方案之后,从以往的65小时提取数据缩短到了48分钟,为数据分析工具留出了充足的时间。
Greenplum公司成立于2003年,并于2008年12月进入中国市场,2010年1月开始独立运营。公司成立的头三年内,一直在开发产品,而非开拓市场,等产品投向市场后,迅速赢得了诸如Ebay、纳斯达克,纽约证券交易所等重量级的用户,在数据分析市场占据了一席之地。
Greenplum大中华区总裁Stanley Chew丰富的IT从业经历,了解很多的用户需求。他认为,向用户提供高性能的超级数据引擎,并将强大的并行计算能力融入到大规模数据仓库分析领域中,这是Greenplum公司的即将做的,也是公司的强项。
为什么Greenplum在中国市场进入一年多,就能赢得中信实业银行、东方航空公司、阿里巴巴等大公司的青睐?Chew认为,这些大公司在行业中发展速度快,数据增长快,很看重数据分析软件。而市场中大部分的BI分析软件和数据库管理软件的通病是,对数据的管理能力很弱,往往提取、整合数据的时间比分析数据的时间还要长。
传统的OLTP(On-Line Transaction Processing,联机事务处理系统)数据库在TB级别以上数据管理中已经是捉襟见肘,采取MPP(Massively Parallel Processing)架构的数据库系统才能对海量数据进行管理。而Greenplum的做法是,将来自不同源系统的、不同部门、不同平台的数据集成到数据库中集中存放,利用强大并行处理能力提供并发支持。
Greenplum的MPP采用并行处理架构,在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力。Greenplum在扩展节点时操作简单,在很短时间内就能完成数据的重新分布。数据处理请求会被拆分为N个节点并行处理,就如蚂蚁搬家那样,每一个节点处理一部分数据的提取和整合,再归纳到成BI工具“可以读懂”的数据仓库,从而缩短了数据提取的时间。
Stanley Chew说,Greenplum不做数据仓库,也不做数据分析,它们只做数据“提取和整合”,通过准实时、实时的数据加载方式,实现数据仓库的实时更新,进而实现动态数据仓库(ADW)。基于动态数据仓库,业务用户能对当前业务数据进行BI实时分析-“Just In Time BI”,能够让企业敏锐感知市场的变化,加快决策支持反应速度。
……
关注读览天下微信,
100万篇深度好文,
等你来看……