做个健壮的数据工人

  翱旗不同于那些依赖Hadoop生态圈而生存的大数据公司,甚至不愿意将“大数据”的标签贴在自己身上。但是,翱旗所表现出的强大的数据管理能力、数据打通能力,让这家公司看起来十分健壮。

  在大数据业内,开源框架Hadoop被很多人公认为是大数据处理的事实标准,甚至也被奉为大数据的代名词,即便这种追捧有些“以偏概全”的倾向。的确,在大数据概念兴起后,一大批基于Hadoop开源技术框架的大数据公司如雨后春笋般产生,其主要的原因就在于这些公司不需要再从0开始积累,而是借助现成的技术框架就可以开发一些应用。

  但翱旗创业(北京)科技有限公司(以下简称翱旗)与那些大数据公司并不一样,首先他们完全是依托自身的技术实力自主研发出了大数据的工业产品,其次,他们更愿意做一些Hadoop生态圈做不到或者做得不够好的事,翱旗与其他大数据公司的不同之处。

  不是大数据公司而是数据公司

  翱旗CEO郑曙光表示,从来不标榜自己是大数据公司,而是自认为是数据公司,因为只要是与数据有关的需求和技术发展方向,公司都会去关注或尝试提出解决方案。

  大数据技术最早在国内被应用的初衷,其实只是国人想找一条替代数据仓库和BI的路。在那个时候,国内在数据领域还远达不到大数据定义中“4个v”的标准。

  常规接触和需要管理的数据基本上都只是数据库中的数据。“4个v”中的一个“v”是指多样化的数据类型(variety),这种多样化体现在数据被分成结构化和非结构化。

  时至今日,在企业大数据中,非结构化的数据并不占据多数,更多企业处理的大数据仍然是结构化数据,而打交道更多的还是关系型数据库,这也正是翱旗关注的重点。

  虽然当下在互联网企业对于大数据技术的应用,似乎是被谈及很多。比如借助大数据分析助力营销和提升客户满意度。但翱旗并没有选择这些应用方向,而是选择面向传统企业提供服务。

  “大量的传统企业,他们大部分的业务并不是直接面向消费者的,但他们却存在对大数据应用的需求。比如他们产生于ERP、EMS中的数据,原本都是孤立的,但新的竞争环境,要求企业的数据流转过程在不同系统间都要实现环环相扣,而不是仅局限在某个部门、某个系统中。并且,与互联网所涉及的大数据不同的是,企业内的大数据准确度很高,更需要的是数据的流动和匹配。此外,很多大型的传统企业并不会马上推翻十几年前上马的IT系统,这时就需要构建一个企业内部的数据交换标准,把来自不同源的数据进行标准化的转换,当用户提出不同的标准需求,就按他需要的标准再转换好,并提供给他。”郑曙光如是说。

  搬数据也要有个健壮身体

  对于翱旗究竟能帮用户做些什么?郑曙光提供了几个案例。

  宜昌市的电子政务系统是在2012年建设上线的。在建设电子政务系统时,宜昌市遇到了一个难题,那就是如何将宜昌市下辖的二十多个单位的数据打通。

  比如,户政管理与社保原本在数据上是没有关联的,而当一个人年龄达到一定的标准正式退休,他在当地的福利比如办理老年卡享受老年人的优惠待遇时,就需要二者数据的打通。

  开始时,宜昌市采取手工的方式来导数据,但经常会因为二者业务的变化引发了数据源的变化,从而导致数据互通时的延迟。而翱旗帮助宜昌市解决了这个问题,实现了当数据源发生变化时,可以通过监测变化做到自动匹配,以缩短甚至消除延迟。

  另外,比如某个组织机构因为不再需要某项数据从而希望删除,但这项数据正与其他数据集中在一起为某个业务提供服务,如果贸然删除会更影响数据的完整性。

  所以,这个组织机构希望在实现删除动作的同时,不干扰业务的进行。翱旗能够满足这个功能需求,并能保证在用户删除数据后,翱旗仍然拥有数据的全集。

  而在关系型数据库方面,政府类用户经常提出的需求是,不允许服务商过多接触数据库和影响数据库的运行,比如安装插件等。在翱旗,能够实现在不干预用户数据库运转的前提下,获悉数据库的变化,而这也是通过利用数据库本身的能力实现的。比如采用日志监听的方式,与应用访问数据库和使用数据库触发器相比,好处是不占用过多计算资源。

  此外对于一些用户提出的,在复杂网络环境下实现断点续传能力的需求,翱旗也能够满足。

  SaaS更合适

  在IT媒体的报道中,很多情形下云计算与大数据是不分家的。数据管理是一种服务,而只要是服务,放到云上尝试运营是当下主流的发展趋势。翱旗的服务也正在计划在云上实现商用,比如在面向政府提供的政府数据云服务、面向公众的数据交换云服务等。

  而对于云服务的模式,郑曙光为翱旗选择采用SaaS。

  “虽然PaaS会提供一些现成的功能,但这些功能可能会不完备,所以导致PaaS通常是不能独立去应用到具体服务场景,仍需要做一些开发和拼接的工作才可以。而翱旗之所以定位在SaaS层,是因为在提供云服务时,用户不需要再做太多复杂的工作,而只需要简单的配置一下就能独立应用。”郑曙光如是说。

  “比如面向企业提供数据备份、容灾、应急服务时,企业用户只需要使用翱旗提供的软件就可以直接实现。企业希望误删除的数据还能找回来,也通过翱旗软件提供的相应功能就能完成。”郑曙光表示。

  此外,翱旗服务云化的部署也更加便利和简单。用户只需执行一个脚本,就能够一次性完成安装,剩下配置工作也都是图形化的界面。比如选择实时备份还是全数据备份,只需要按选项进行勾选。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: