时间走到2014年,“大数据”是个不再新鲜的概念。但各种纷繁复杂、似是而非的诠释,让大数据依然存在许多问题和盲区。作为一个跟数据打了十几年交道的人,现任阿里巴巴集团商业智能部副总裁、数据委员会会长车品觉先生深知,从“看”到“用”,再从“用”到“养”的运营数据,本身是一个复杂的过程。而行胜于言,从企业的角度来看,只有获得具备实效性的数据才是王道。
CIOI:您跟数据打了十几年的交道,能不能讲讲今天运营数据跟过去的区别?
以前,我们都是有问题找数据。而大数据时代,最核心的特质则是“用数据找机会”。我们做大数据,必须要有一个预判,那就是哪些数据是你必须要提炼出来,解决盲点的,要用数据还原真实。
CIOI:在大数据的概念刚刚普及的时候,曾有观点认为大数据是无所不能的。您同意吗?
讲一个我很喜欢讲的例子。一天早上在地铁里看到一个人穿的T恤很好看,到了公司第一件事就是打开网站搜一下,发现有一万多个结果。正在挑的时候,老板通知我开会。开会的过程中觉得很无聊,就继续用手机搜。这个时候突然跳出来一个促销广告,是我很喜欢的牛仔裤品牌,于是我就买了这条牛仔裤。
在大多数电商的后台,只会关注这个ID输入了关键词“T恤”,最后买了牛仔裤。而不会关注我刚才讲的整个环节。因此数据分析师会很困惑,因为数据解释不了用户的购买行为。而从“T恤”到“牛仔裤”中间,是存在一系列数据盲点。只有把这些盲点补齐,才能用数据还原整个消费行为过程。所以我的观点是,今天的大数据实际上是明天的小数据。随着技术的发展,物联网的发展,可以用来收集和分析的数据样本会越来越多。那个时候,数据盲点才会变少。
CIOI:您刚才举得例子是今天到处都可以看到的场景。为什么移动互联网的出现会导致这种情况发生?
这个场景看似简单,但从数据分析的角度来说却非常不简单。移动时代到来之后,原本可以收集用户完整行为数据的网站变得不再可靠,而数据还原用户行为的方式也发生了改变。
移动互联网基本上分为两种形式,一种是WAP,另一种是App。WAP的工作原理跟PC很接近,但作为主流的App就不是这样了。App数据收集的方式包括两种:一是收集用户联网时请求服务器的记录;二是在将用户的行为数据记录下来之后,适时地传给网站。但不论是什么方式,移动终端数据最终的表现是在没有账户体系的情况下,和PC的用户行为完全没有办法进行关联,这也就意味着用户的数据出现了断层。
CIOI:如果只收集无线终端的数据是不是就不会出现“断层”的问题?
并不是。PC时代,基于cookie的整套数据收集体系很成熟,但移动互联网完全不一样,App对用户的识别基于收集的机器码,但识别标准在不同的操作系统上也存在差异,这里包括操作系统本身的差异,也包括同一操作系统上版本的分化。此外很多App还会内嵌网页,这个时候往往会收集到应用本身的数据和网站浏览数据,这就使得数据变成了两份。如果没有讲一个应用内的识别用户的标记很好地进行传递,那么即使在手机端,数据也会变得不完整。
CIOI:您曾在很多场合都表达了不光要“用数据”还要“养数据”的观点,怎么理解“养”的含义?
“ 养数据”的一个重要含义,是要决定收集哪些数据。这个决定很关键,可能是公司数据战略中非常重要的一个环节。因为很多公司的做法,是有什么数据就收集什么数据,完全没有主动性,但这样做遇到一个核心问题就是,公司自主思考的能力开始缺失,对该收集什么样的数据不甚了解。事实上,在我看来,被动收集数据的行为是“收集”,而主动收集数据的行为则是“养数据”。
CIOI:哪些数据是需要“养”的?
需要“养”的数据通常有两类,一类是网站自身没有的数据,需要用户主动提供的;另一类是公司拥有的,但没有进行收集的数据。
若要收集公司没有的数据,在“养数据”时通常需要花费更多的精力和技巧。举例来说,现在国内外有很多个性化的手机购物应用,他们会根据用户的偏好进行商品的推荐,让每个人都有完全不一样的购物体验。具体的运作原理是,当用户第一次使用这些应用时,界面中会弹出一些问题,通过互动的方式来收集用户的信息数据,比如会出几款衣服,让用户挑选哪一款是更喜欢的。这样,在几个问题之后,应用就知道用户的喜好了。这类应用通常还会有另外一个特点,就是会让用户点“赞”,这个点赞的功能,就是让用户明确地告诉应用自己喜欢什么,这样用户就可以在过程中,不断地告诉应用自己的偏好。这样一来,应用就可以“养”出用户的核心数据。
对于公司有数据但没有收集的状况,则更多的是因为内部资源协调的问题和公司决策的问题。很多提供餐饮和团购类信息服务的网站,通常会有一个功能是“把信息通过短信发送到手机”,这样就不需要用户进行特别的记录,不过有些网站会记录用户的手机号,而有些网站则不会。那么,这些手机号需不需要企业存下来呢?这就是一个与业务决定和资源协调相关的问题,如果决定是记录,则必然会需要开发人员在后台进行功能的优化。如果不记录,那就会丢失这部分信息。我的观点当然是记录这些数据,也即是“养”数据,因为这不仅能够校验用户的手机号码是否有效,还能够慢慢地建立起企业与用户的社交关系。
总之,“用数据”更多的是一种方法论,而“养数据”则是一种数据战略,是基于深入业务理解的更高层次的商业决策,数据养的时间越早,积累的数据也就越多。养数据同样也是一种管理和商业艺术,在养之前,可能谁也不确定最终会出现什么后果,但一旦养成,则会产生非常大的商业价值。
王婉卿
……