推荐芬雷布的《大数据云图》

  • 来源:互联网周刊
  • 关键字:大数据云图,芬雷布
  • 发布时间:2014-02-13 08:59

  大卫·芬雷布(David Feinleib)是硅谷重要的风险投资人,他的《大数据云图》除了一般的价值外,对透视大数据有特别的价值,这种价值突出体现在芬雷布的这张闻名硅谷的“大数据云图”上。“大数据云图”,把整个大数据产业,按内在脉络组成一整张网。商业人士可以把它当作“秘籍”,从中看出有价值的投资矿脉,看热闹的人也可以找到快速成为内行的导游图。

  与许多空泛的书不同,《大数据云图》作者的眼光很“独”,是那种赌石人的眼光,这跟作者在行内的“现役”身份有关。这本书谈了大数据的方方面面,并非在所有方面都权威,它在硅谷真正权威的地方就是这张“大数据云图”。所以我们就从这张图讲起。

  看过《智取威虎山》的人,都听说过“联络图”。“联络图”把控制一个地区所需要的关键资源、关键人交代得清清楚楚,搞定了它,才能搞定各个山头,坐拥一方天下。“大数据云图”就好比这张“联络图”,当然不是要让你去当土匪,而是让你具备像投资人那样的火眼金睛,从“有钱没钱”这个专业角度,一眼看出大数据这条山脉里,哪里有矿,价值几何,该去搞定什么。

  芬雷布来北京的时候,我还没有太理解他的思路。后来我为了搞清楚这张“联络图”的门道,专门跑了趟美国硅谷,与芬雷布当面交流。现在根据他给我的解答,我来谈谈对这张神秘的“联络图”的理解。大数据云图在网上是随时更新的,我们下面的介绍以2013年4月的版本为准。

  从“大数据云图”这个视角看大数据,首先对大数据背景的看法就有自己鲜明的特色,从院士、学者或实验室角度看,Hadoop算什么东西?它不过是走向灵图解的一个过客。但这种看法需要至少15年以上的视野。而作为投资人,芬雷布坚持把Hadoop当作主脉这样一种简明的观点。因为正如当年温世仁跟李岚清说的,对商人来说,要改变世界,十年足够了。十年还不能改变世界的东西,商人根本不会理会。人工智能也许要搞一千年以上,但VC必须得把握十年以内改变世界的东西,Hadoop足够了。为此,芬雷布把投资目光主要聚焦在为开源技术提供商业支持的公司(如Cloudera、DataStax、LucidWork之类)身上。以改变世界的尺度来认识世界,这是实干家与理论家的不同。

  其次,芬雷布建立了一个他称之为“基础设施”的基本板块,来把握大数据产业的“资产”层面的诸要素,包括四个展开环节——数据分析(Cloudera、EMC等)、数据操作(couchbase、10gen等)、数据服务(亚马逊、谷歌等)、结构化数据库(Oracle、IBM的DB2、SYBASE等)。在我看来,这是指为整个大数据产业分享固定成本的承重部分。

  在这一部分,芬雷布的眼光非常“毒”,他与实验室看法不同,非常早看出服务潮流的转变,体现在对亚马逊将坐大的预见上。事实证明了他的预见。据Synergy报告显示,2013年第三季度,亚马逊获取了美国云计算市场总收入25亿中的多数份额,本身收入提升55%。Synergy估计,亚马逊第四季度云计算收入将达7亿美元,比微软、IBM、谷歌、Salesforce.com的总和还高出15%。芬雷布在几年前就预见到,亚马逊将主要赢在用WEB服务卡位(AWS)上,这与云的方向是一致的。中国搞大数据,许多还是IP时代的眼光,而非WEB时代的眼光,这点需要注意。阿里在往安卓的结构里面嵌入WEB框架,对谷歌搞“修正主义”,说明也看到了同样方向的问题。

  芬雷布第二个跟实验室眼光不同的地方,表现在对商业的理解上。他很好解释了Cloudera将走强的原因。在芬雷布看来,Cloudera只集中解决了一个问题,就是实时问题。对科学家来说,大数据用多长时间出分析结果,不是主要问题,但对客户来说就不同,Cloudera Impala帮助其他公司运行Hadoop,关键是把灵敏作为一种结果,提交给客户。以Cloudera现在的规模,随便一个中国上市公司都可以收购它,但有没有这眼光是另一回事。

  第三,“大数据云图”最出彩的部分是基础设施之上的“应用程序”板块。事实上,VC对基础设施部分,只投了很少的钱(5亿美元),而把重心全押在了应用上。这与中国大数据的做法形成鲜明对照。如果拿芬雷布的“联络图”对照中国,中国的大数据许多都在“不务正业”,将来可能骗到国家的钱、圈到国家的地,但长出什么来,不好说。让我们来看看真搞市场经济,让大数据落地,应该怎么搞。

  芬雷布称之为“应用程序”的板块是指“人类和计算机系统通过使用这些程序,从数据中获知关键信息”。但实际上,它对应的是整个大数据产业的相当于边际成本的部分,在云计算背景下,它是指面向云端轻资产运作的部分,即按“使用”(“按需”是另一角度的说法)收费的部分。

  “应用程序”板块的框架结构,由六部分组成,分别是垂直业务(BloomReach等),运营智能(New Relic、Splunk等),广告/媒体(Collective、DataXu、Metamarkets等),数据即服务,商业智能,数据分析和可视化。

  让我们来看,是一些什么样的公司活跃在这些应用领域。

  在垂直业务应用领域,像BloomReach这样的公司,帮助电子商务企业优化网站,进行大数据营销服务,以提高转化率。

  在运营智能应用领域,New Relic将营销自动化,帮助商家分析哪些客户最有价值,特别是什么活动最有可能扭转不利局面,Splunk公司帮助IT工程师分析设备生成的日志数据。

  在广告应用领域,应用服务企业帮助商家算出哪种广告最适合顾客,产生特定的广告印象需要花多少钱,近来为移动广告进行分析的公司,如Flurry,最具增长潜力。

  在数据即服务应用领域,邓白氏公司在为各种数据提供网络编程接口,值得注意的是,与原有做法(例如阿里的某些作法)不同,这样的数据源允许他人在其基础上建立APP程序。

  在商业智能应用领域,IBM的Watson是开拓和领导者(我们以前介绍过),MicroStregy和Domo的特点在把智能应用引向新的领域,前者是在移动产品上,后者是在云计算上。需要注意的是,与传统集中于企业首脑部门的BI不同,大数据的BI最终将武装到企业的神经末梢,特别是直接接触客户的部门。

  在数据分析和可视化应用领域,Tableau Software提供了互动性强且易于使用的大数据可视化软件服务,QlikTech推出了用26000家企业使用的QlikView可视化产品。这一领域目前非常活跃,社交协作功能加入数据分析和可视化服务看来是一种趋势。

  总的来说,芬雷布对大数据产业前景的展望,特别强调应用,“期待更多的大数据应用程序涌现,让消费者和企业将数据应用到工作当中”。而在基础设施方面,则会笼罩在亚马逊的阴影里,新手只能从不受它影响的领域中冒出。

  与美国的情况相比,我认为中国发展大数据产业,有几个问题需要从芬雷布的判断中得到重要启示:第一,要深入认识大数据产业分工的规律。大数据的产业框架与云计算有内在联系,不能离开云计算发展大数据。中国当前大数据发展遇到落地难,这是表象,深层问题是没有理解基础设施与应用之间,是一种基于云计算的固定投入与边际投入大分工的关系。第二,在基础设施方面,中国一些主要企业数据不开放的做法,放在全球看,正在过时。之所以不开放,根子还在对第一个问题的理解上。适应云计算的做法,要求大数据基础设施的建设思路尽早从IP思路,转向WEB思路。WEB只能是开放的。亚马逊虽然强,但在移动大数据方向上,中国有充分的创新空间。第三,在应用服务方面,要特别向美国企业学习。适应云计算的做法,是使大数据应用面向轻资产服务。现在国内大数据应用有一个不好的苗头,就是企业做着做着,变成传统BI的大数据,进而走向封闭、集中,这没有把大数据应用的真正优势发挥出来。大数据应用一定要实现面向最终需求的全员智能,做不到都是假的。

  姜奇平

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: