大数据是一项业务——宝宝树的大数据实践
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字:大数据,宝宝树,业务 smarty:/if?>
- 发布时间:2015-05-26 09:27
大数据的关键是如何通过最有效的数据分析手段读懂数据背后隐藏的那些信息,对业务提供指导。对宝宝树公司来说,大数据绝不仅仅是对业务的支撑,其本身就是一个业务平台,可以带来直接的经济效益。
宝宝树是中国最具影响力的母婴服务平台,为孕期和孩子在六岁以内的父母提供知识、交流、记录、购物等多元化服务。宝宝树事实上还是一个名副其实的大数据企业。
宝宝树公司COO魏小巍表示:“大数据是宝宝树最宝贵的财富之一。如果没有高效的大数据分析作为支撑,宝宝树的很多业务都难以高速发展。”
业务发展的驱动力
大数据的关键并不是比谁拥有的数据量大,而是如何通过最有效的数据分析手段读懂数据背后隐藏的那些信息,对业务提供指导。宝宝树正是利用大数据将社区流量转化为电商销量,其转化率为业界平均水平的5倍,并且通过大数据对宝宝树自身的产品(PC网站、WAP站、APP)做出针对性的指导。“我们通过精准的算法,可以让用户在最恰当的时候看到我们的电商产品广告。这就是基于大数据的精准营销,也只有这样才能真正做成不影响社区用户体验的社会化电商。”魏小巍表示。
对宝宝树公司来说,大数据绝不仅仅是对业务的支撑,其本身就是一个业务平台,可以带来直接的经济效益。“宝宝树有一支业内闻名的大数据团队BIG(Babytree Insight Group,宝宝树洞察小组)。这个团队是宝宝树重要的财富,也是宝宝树业务发展的重要驱动力。”魏小巍告诉记者。
现在一提到大数据,大家都感觉它是一个神奇的、强大的事物。虽然许多企业在评估或实施大数据项目,但是真正能将大数据与业务完美结合的却不多。“如果想在大数据方面有所作为,企业的核心团队中一定要有一个或几个人是大数据的行家,在学术方面对大数据有比较深刻的认知,并且参与所有公司核心团队的会议,从而了解公司发展的方向和战略,然后才能给出企业应用大数据的正确方向。”魏小巍认为,“企业中实际操作和应用大数据工具的大多是掌握算法、数据分析技术的专业人员。他们是权威的实际执行人员,但还需要企业的管理层给出一个明确的大数据应用方向。”
所谓方向,可以理解为如何将大数据与商业需求相结合。大数据分析不是漫无目的的。它必须事先给出一个明确的目标或者假设,比如环境污染是否会对母婴用户在产品和服务的选择上造成需求的变化。在这个前提下,宝宝树的BIG团队才能根据收集到的数据分析并得到想要的结果。
“大数据分析要建立在大胆假设的基础上。大数据分析的过程就是证明这个假设是成立还是不成立的。如果没有事先的假设,那么大数据分析就是无源之水,无本之木。另外,在建模和分析过程中,要根据实际情况随时调整假设,算法和模型的一些细节也要根据实际情况进行调整和完善。最后成型的那个算法才是最靠谱的,而且很有可能这个算法与最初的算法大相径庭。”魏小巍介绍说,“大数据分析是一项十分琐碎的、需要小步快跑的工作。”
除了利用大数据服务于商业目的以外,宝宝树还会定期将一些数据分析结果与业内分享。比如,现在宝宝树每个月都会出一本小型的白皮书,每个季度会出一本大型的白皮书,对一些行业热词进行梳理,并分享其背后的丰富内容。白皮书中的数据可以为他人的商业或其他活动提供参考。
大数据不是少数人的专利
三年前,宝宝树已经着手进行大数据处理工作,当时的主要工作是对数据进行梳理和分类,把数据结构化,为进一步的数据分析打下基础。从2013年开始,宝宝树真正把大数据作为一个内部运营平台,供所有需要的岗位员工使用,并引入新的算法,对数据应用进行升级等。
当前,数据量对于宝宝树来说并不是太大的压力。因为宝宝树通常会定期对数据进行清洗和整理,删除陈旧的数据。魏小巍称,任何数据都是有“保鲜期”的。宝宝树是专注于母婴人群的综合服务平台,“新鲜”的数据会对其业务产生深远的影响。“过期”的数据非但没有帮助,反而会形成对决策的误导。
宝宝树的大数据大致分成三类。第一类数据是注册用户的基本信息(如宝宝年龄),这类数据必须保证精准。第二类数据是UGC(User Generated Content)数据。宝宝树的根基是一家社区网站,用户在这个社区网站上交流、互动,产生了大量内容。通过对这些内容的分析,宝宝树可以更好地了解用户的需求。第三类数据是浏览型数据,这部分数据是以量取胜的。将以上三类数据摸清,分析透彻,当然也需要对母婴领域的深度理解,就可以基本锁定90%用户的需求。
在采用数据可视化分析工具永洪BI平台之前,宝宝树所用的大数据平台都是自己开发的。但在真正将大数据作为业务平台来运营后,宝宝树越来越明显地感觉到原有的大数据底层平台的效率比较低,影响了数据分析。在很多时候,业务部门想进行一次大数据分析时,服务器的负荷比较重,通常要等到夜里12点以后才能进行,而且一个项目计算下来至少需要24个小时。“在采用永洪BI平台之后,最明显的变化是大数据分析的效率大大提高。我们现在可以在任何时候启动一个大数据分析应用,而且可以很快得到分析结果。”魏小巍表示。
从技术角度来看,宝宝树亦有能力开发一个与永洪BI类似的平台。但是市场上已经有了像永洪BI这样成熟的商用工具,直接可以派上用场,节省了企业开发的人力、财力,而且可以显著改善大数据分析工作的效率,企业何乐而不为呢?
永洪BI平台的另一个优势是简单易用。数据分析的结果可以直观展现出来,让人一目了然。宝宝树公司内部相关部门的员工如果想查询某些数据,比如某一个APP与新增客户数之间的关系曲线,在永洪BI平台上只要几步简单的鼠标拖拽操作,就可以马上看到结果。“如果大数据只是给少数专业人士使用的,那么其利用率是极低的。我们希望公司的所有员工都能从大数据平台和工具中获益。这也是大数据促进业务发展的一个具体表现。”魏小巍表示。
由于宝宝树早就实现了数据的集中化,因此在引入永洪BI平台后,自身数据与永洪BI平台之间的衔接没有障碍。宝宝树出于业务需求自己开发的一些大数据应用也可以无缝地运行在永洪BI平台之上。
不过,魏小巍也指出,现在大数据的应用还是有些“雷声大、雨点小”。追逐大数据的人很多,但真正静下心来,踏踏实实做大数据落地工作的人并不多。或者说,目前大数据的应用面还相对较窄,没能完全发挥其应有的作用和能力。
专业大数据人才稀缺
大数据项目的成功实施需要两方面因素的支撑:一是大数据的平台和工具,二是人。那么,宝宝树在大数据专业人才的培养、使用方面又有哪些成功经验呢?魏小巍告诉记者,专业的BI平台只是给宝宝树提供了一个大数据的基础架构平台,更多的与业务相关的应用还是要宝宝树自己开发。因此,宝宝树自己培养和拥有一支30余人的专业大数据团队。
“数据科学家”这个新的称谓就是随着大数据的兴起而出现的。宝宝树公司也有承担类似工作的人,他们既要了解客户的需求,又要懂算法,还要会搭建数据分析模型。魏小巍表示,这些大数据的专业人员必须具备对数据的高度敏感性,要炼就一双“火眼金睛”,能够透过表面上看起来杂乱无章的数据分析出数据背后反映的深意。
大胆假设、收集数据、建立数学模型、得出分析结果,这一系列环节都需要具有相应专业知识的人去完成,而这些专业人才在某种程度上也决定了大数据项目最终能否达到预期目标。目前,中国在大数据方面最缺少的就是专业人才。大家都是在边学习边实践。这也是大多数中国大数据用户共同的现状。
本报记者 郭涛