百度公开大数据引擎
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字:百度,大数据,引擎 smarty:/if?>
- 发布时间:2014-05-15 08:39
在近日召开的百度第四届技术开放日(下文简称开放日)上,百度首次公开了其大数据引擎的技术和细节,并称将百度的大数据能力开放给公众,这格外引入注目。
“互联网正在改变传统产业,而技术——特别是大数据技术正在改变互联网。”百度董事长兼CEO李彦宏在开放日上的致辞,不仅燃起了与会者对大数据的热情,同时燃起了大家对互联网乃至未来社会的憧憬。
从最早的零售业到现在的金融业,互联网改变传统产业的案例在我们身边越来越多。如果,这个互联网是具备大数据能力的互联网,那对我们的生活意味着什么?对原有的企业意味着什么?
传统企业坐拥大数据资源
当前,很多企业在讨论互联网化,也有很多企业正在尝试互联网化,即借助互联网的思维和模式实现转型。事实上,互联网化的企业相较于传统企业的最大区别在于,互联网企业具有更为快速的响应能力,它们可以更为快速、准确地了解对手、了解客户、推出产品和作出反应。
现在,很多产品型企业在互联网上开通官方商城,以前躲在后端、依赖经销商的它们开始利用互联网直接接触客户,直接为客户提供产品和服务。这正是传统企业主动进行互联网化的有益尝试。其实,企业在利用互联网直接向客户提供产品和服务的同时,也通过互联网直接了解到了客户的需求,从而为企业设计和改进产品提供了最快速、直接、有效的帮助。
ZARA就是一个典型的例子。它积极进行互联网化,将大数据运用于企业管理,整合店面摄像头、网上调查、销售情况等多种数据,通过大数据的分析和处理快速迭代服装设计,进行生产销售决策,提升库存管理水平。
然而,在传统企业互联网化的进程中,它们遇到的最大问题就是一方面缺乏行业基本数据,另一方面又面临着数据存储与管理的规模、数据分析挖掘技术与能力、数据智能技术与能力的瓶颈。
李彦宏表示,对大数据资源的开发利用能力正在成为国家和企业竞争力的重要体现。然而,传统企业多年来形成了诸多数据孤岛,数据智能技术与能力缺失、数据分析挖掘技术与能力缺乏、数据存储与管理的规模瓶颈一直困扰着这些企业。很多传统企业虽然坐拥大量的数据资源,却不知道如何有效利用。
拥有“智商”的百度大数据引擎
很多人都对马年春节期间在电视上看到的“春运迁徙图”印象深刻,这张图正出自百度的大数据引擎。百度通过LBS开放平台分析手机用户的定位信息,能够映射出手机用户的迁徙轨迹,数亿用户的迁徙轨迹就构成了一张实时变化的动态图。通过这张图,我们可以非常清晰直观地看到春运期间各个城市之间的人口流动情况,而且迁徙图所显示的数据结果和交通运输系统实际统计的数据非常吻合。
从搜索引擎时代到大数据引擎时代,百度14年来一直在做的事情就是对海量数据的识别、挖掘、处理、分析和利用。开放日上公开的百度大数据引擎,正是百度大数据技术的积累和综合体现。
百度高级副总裁王劲介绍,百度大数据引擎包括开放云、数据工厂、百度大脑(Baidu Brain)三大组件。开放云是大数据引擎运行的基础构件,通过分布各地的百度新一代高效能数据中心为传统行业提供超大规模的数据存储和分布式计算。在此基础上,数据工厂对行业数据进行一系列规范化处理,提供强大的数据管理和分析能力。更上一层,则是百度人工智能的精华——百度大脑。基于百度深度学习研究院的领先成果,百度大脑融合全球领先的深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了系统的学习与成长。
“现在,百度大脑的‘智商’大致与两三岁儿童相当,但是通过技术的飞跃和学习,它将来一定可以超过成年人。”李彦宏表示,百度拥有一整套从数据存储、数据管理到人工智能的领先技术,再加上积累了十几年的全网数据、用户查询数据,百度才打造出了大数据引擎。
“同时,百度将把自己的大数据能力开放出来,百度希望通过开放,让各个行业的数据输入到大数据引擎中,通过百度大数据引擎的能力帮助传统行业进行数据的应用和预测,帮助这些行业加快转型升级的步伐。”李彦宏说。
大数据创新商业模式
就像百度已经通过大数据引擎提供的“百度迁徙”、“景点舒适度预测”、“城市旅游预测”等产品一样,大数据已经逐渐走入我们的视野。而大数据在不同行业和场景的应用,将加速这一行业的变革。
王劲就分享了一个大数据在传统行业的创新应用场景:医院可以将新生婴儿的哭声存储到云端,并与百度语音库进行比对,理解婴儿每一次啼哭的不同涵义,从而协助医院和年轻的父母对新生儿进行更好的看护。其实,这只是大数据帮助医疗行业互联网化的第一步。可以想见,如果利用各种传感器搜集人的各项健康指标和生活习惯,通过大数据分析,将可以预测人在未来生病的概率,从而提前预警采取预防措施,降低疾病发生率。这样一来,医疗健康行业的商业模式将被改写。“我们希望利用大数据技术,实现流行性疾病的监测和预测,这样将为我们的公共卫生预防控制赢得宝贵的时间。”中国疾病预防控制中心副主任高福说。
事实上,保险行业的商业模式创新更离不开大数据。如果能够根据驾驶习惯、“危险程度”定制个性化的车险保单,那么保险公司和投保人均会受益。平安产险新渠道事业部副总经理孙炜介绍,平安保险正在借助百度大数据加强消费者洞察,从过去的客户分群到更精准的个人定制。更进一步,大数据将在产品设计的精算、定价、弹性曲线等环节发挥作用,这既有利于改良现有产品形态,也能实现险种创新。
开放战略棋局的关键一子
百度希望大数据引擎可以帮助中国的各个行业互联网化,实现转型升级,就意味着大数据引擎要深入到各个行业中去,了解各个行业的需求与特点,有针对性地为各个行业的企业提供大数据服务。
“百度大数据引擎的核心战略就是延续百度一直坚持的开放的平台化战略,我们将把百度的大数据能力开放给外界,只有这样,才能更好地让大数据能力服务、帮助中国的各个传统行业。这也是我们的使命。”王劲表示。
事实上,百度已经陆续开放了包括个人云服务、LBS·云服务、多媒体识别技术在内的多种技术能力为开发者赋能。此次大数据引擎的开放,更加清晰地勾勒出了百度的平台化战略。以开放的姿态拥抱开发者和合作伙伴,百度正在围绕平台化战略布局,而大数据引擎无疑是其中至关重要的一枚棋子。百度的棋局,也很有可能因为这一子定乾坤,因为它是企业,特别是传统企业互联网化过程中最对胃口、最迫切的需求。
本报记者 程彦博