云上还应该有一层大数据PaaS

  开源的技术加上商业化的运营模式,这是今天很多在云计算、大数据领域创业的中国公司通常会采用的模式。在开源领域,中国厂商不是只会跟随跑,而是有智慧、有能力做一些开创性的工作,甚至可以让整个开源生态圈都为之一震,Apache Kylin就是一个典型代表。

  Apache Kylin是PB级规模的开源分布式大数据分析引擎,为Apache Hadoop等大型分布式数据平台之上的超大规模数据集提供标准SQL查询及多维分析(OLAP)能力,具有亚秒级交互式分析能力。2014年11月,Kylin被接受为Apache的孵化器项目,不到一年时间,Kylin便正式成为Apache的顶级项目之一。

  既然有了如此完美的开端,接下来的事情你一定会猜得到,Apache Kylin的核心开发团队于2016年3月创立了现在的Kyligence(上海跬智信息技术有限公司),韩卿成为公司的联合创始人兼CEO。

  公司一成立便获得了红点创投和思科的天使投资,一年后完成由宽带资本、顺为资本领投,红点中国跟投的A轮融资,同时企业级的Kylin解决方案在推出后不断迭代。

  今天的Kyligence发展得如何?在它耀眼的光环背后还有多少故事?

  开源技术+商业化运作

  最近,Kyligence可谓双喜临门:第一喜,从上千家团队中脱颖而出的Kyligence,成为微软加速器·上海黄埔一期校友企业,并于近日正式毕业;第二喜,在业内著名的Strata大数据峰会上,Kyligence发布了最新版的旗舰产品KAP(Kyligence Analystics Platform)2.4。现在的Kyligence可谓技术创新、商业拓展齐头并进。

  如今,Kyligence的客户已遍及海内外。除了服务大量互联网公司以外,Kyligenc的技术也在银行、保险、电信、制造、零售等行业广泛应用,OPPO、国泰君安、华泰证券、联想等是其中具有代表性的客户。

  韩卿认为,在基础技术领域,只有开源的技术才有长久生命力。在云计算、大数据等热门技术领域,我们看到OpenStack、Docker、Hadoop、Spark等这样的“明星”。开源的技术生态与厂商独特的商业化运作模式相结合,让我们看到了红帽等开源软件厂商的迅速崛起,以及中国越来越多围绕开源技术进行创新的初创企业。

  “开源的技术平台只是一个基础,在此之上,我们又增加了符合企业级客户需求的稳定性、安全性、可靠性等。”韩卿表示,“为了满足商业化的应用需要,我们要开发一些非开源的企业级应用特性,提供更多可替换的组件,让企业版的大数据智能分析产品具有更高的性能、可视化能力及良好的用户体验。”开源的技术内核加上企业级的产品特性,这才是符合商业化运作规律的开源软件厂商的成功之路。红帽是这样做的,现在Kyligence也是这样做的。

  从技术角度,我们很容易理解为什么开源今天能成为主流,这是因为它的开放性、快速迭代以及汇聚了所有聪明人的智慧。但从企业用户角度,他们为什么能有这么大的勇气和魄力转向开源?开源的项目多如牛毛,但是能够真正成为商业应用软件的凤毛麟角。开源的技术转变为可大规模部署的商业化软件,这中间已经经历了严格的筛选和大浪淘沙。另外,随着云计算、大数据、物联网、人工智能等诸多新应用的兴起,一些传统的闭源商业软件确实不能满足企业级用户实时处理和分析海量数据的需求,无论是性能,还是扩展性都捉襟见肘,这才给了开源技术显露峥嵘的机会。

  通常,互联网公司都是开源技术的尝鲜者,无论是在云计算领域还是大数据领域几乎都是如此。Kyligence的发展脉络也是如此,率先赢得了许多知名互联网公司的信赖和肯定。但Kyligence最终目标还是想将其独特的大数据智能分析平台引入企业级市场,在金融、电信等更多行业进行部署。在这一背景下,KAP应运而生。

  平均每半年,KAP就有一次大的版本更新。KAP在某种程度上可替代传统数据仓库。Kyligence希望在不断完善产品功能的基础上,降低大数据产品的应用门槛,让所有分析师都拥有一款趁手的工具。

  全分析平台KAP

  企业级大数据智能分析产品KAP是Kyligence专门为企业级客户设计的,提供了更快的性能、更好的设计工具和更多的企业级特性。从2016年8月正式发布到现在刚好一年时间,KAP已快速演进到2.4版本,产品整体框架更加成熟。更重要的是,KAP已从一个OLAP引擎逐渐成长为一个大数据的数据仓库标准产品。Kyligence又成功地闯过一关。

  韩卿介绍说,KAP可在PB级数据集上提供亚秒级标准SQL查询响应,支持互联网级的高并发访问,并赋能分析师以行业标准的数据仓库和商业智能方法论架构DW on Hadoop解决方案。KAP为商业用户、分析师和工程师提供了统一的分析平台,支持自助式建模,无需编程,可与主流BI工具实现无缝集成。KAP在实施效率、安全控制、性能优化、自助式敏捷BI、系统监控和管理等方面进行了全面创新和增强。

  最新的KAP 2.4有哪些特色?首先,KAP 2.4推出了KyStudio建模中心,以交互式、直观、可拖拽式的建模体验,为用户提供零门槛上手的大数据建模体验,帮助分析师对业务的认知无偏差地转化为数据模型。

  其次,KAP 2.4拓宽了用户分析场景。在大数据分析方面,用户的个性化需求明显。KAP2.4在持续提升预计算建模场景超高性能查询体验的前提下,通过无缝集成Spark等开源大数据引擎,通过查询下压,在完全支持各种SQL on Hadoop的同时,充分利用Kylin的预计算能力,提升了性能和效率,缩短了从源表导入到自助查询的时间间隔,全面支持分析师自主地探索数据的业务价值,无论是要求高并发查询性能的生产场景,还是业务探索场景,均能从容应对。

  最后,KAP 2.4还可通过全面增强智能建模功能提升企业建模效率。韩卿归纳说,KAP2.4全面提升了建模的智能性:为用户提供更丰富的语义层,赋予用户预定义复杂业务逻辑的能力;内置一键优化工具,协助用户设计出最优性价比的数据模型,降低建模的学习曲线;根据查询所需维度数,精确减少立方体构建计算量,有效缩短构建时间等。

  “KAP 2.4具有高性能和易用性,并与最新版本的Apache Kylin完全兼容,与各大主流Hadoop发行版也完成了认证测试。”韩卿表示,KAP是公司重要的发力点。

  KAP的强大能力在客户中得到了验证。以今日头条为例,Kyligence为其提供的海量大数据的交互式分析能力,可为今日头条3万亿超大规模的数据集提供亚秒级的查询服务。

  据韩卿透露,Kyligence也在做一些人工智能方面的基础性研究工作,其产品中的自动化推荐功能就与机器学习密切相关。

  站在大数据的浪尖上

  谈到中国大数据应用的现状,韩卿表示,大数据在中国市场已经渡过了最初的炒作阶段,用户逐渐明确了大数据的需求,了解了大数据的价值所在。大数据应用正慢慢走向成熟,更多地解决实际的业务问题。相比国外,中国用户的数据量大、应用场景相对复杂,并且有很多特殊的需求。Kyligence在解决了中国用户的问题后,也会把总结的经验和成果向国际社区反馈。

  Kyligence正积极地向云“移动”。今年8月,Kyligence的产品成了微软Azure HDInsight默认应用之一。此外,Kyligence与许多公有云服务商正在洽谈进一步合作的可能。“未来,整个云就是IaaS,而我们要做云上的大数据PaaS层,提供云上的大数据分析能力。”韩卿表示。

  谈到未来发展,韩卿总结了三方面:第一,深入拓展金融、电信、制造等重点行业,树立核心标杆客户;第二,通过渠道合作伙伴有效覆盖中型客户;第三,实现国际化发展,Kyligence美国分公司现已成立,将大数据智能分析产品推向美国和全球市场,这将是Kyligence下一个辉煌。

  郭涛

关注读览天下微信, 100万篇深度好文, 等你来看……