大数据正在改变生活

  • 来源:计算机世界
  • 关键字:大数据,纸牌屋
  • 发布时间:2013-04-26 13:47

  前两期专栏从大数据的诞生和影响力说起,这一期接着谈大数据对生活的影响。

  可以从艺术说起。艺术缘起古代巫术,后逐渐演变成特定历史环境下的意识形态产物,算是人类精神文明的成果。艺术自有内在规律,更符合“一万个小时定律”。这个定律是说,那些卓越的人并非天生聪明,只要经过长达一万个小时的专业训练之后,才能达到某种成就和水平。

  可见,艺术更多是被制造出来的,而非是创造的。到了大数据时代,艺术作品的产生更是如此,巧妙利用数据,为产品质量服务,提高艺术的观赏性,或者推动其商业化运作。

  最近美国有一部热映的网络电视剧《纸牌屋》就是大数据的杰作。过去,电影大多是导演+编辑的才华起到决定性的作用,他们知道观众爱看什么题材,喜欢什么样的演员,然后按需定制。即便如此,也不能保障每一部作品大卖特卖。因为他们不知道用数字衡量观众喜爱度。

  这说起来怪怪的。难道说我对这个导演的喜爱度达到了95.67%?自然不是这个意思。用数字衡量的意思是,有了数字基础,一切变得更有依据了。获取数据、分析数据,再利用数据,这是对大数据的最浅显的运用。这里没有深究数据的类型、深度、结构、及时性、可靠性、处理、存储、建模等问题。

  播放该部电视剧的公司Netfilx——全球最大的付费在线视频与影碟在线租赁服务商。1997年成立时,主要的业务是会员制租赁影碟,后来发展视频在线业务。在2006年,Netfilx开放了一亿个影片评级,并举办了一场比赛,目的是为了提高影片的推荐率。这次百万美元的奖金没有白花,专业团队为它开发的程序足矣让推荐率提高了10%。

  每天,大概有3000万用户在线观看视频。正因为有了大量的基础数据,Netfilx了解每个影片之间的关系,比如说大部分观众喜欢《泰坦尼克号》也喜欢《人鬼情未了》,那么两者关联,必定带动出租率,带来更好收益。而且,在这个数据库中,每个用户的习惯,包括点击的时间段、拖拽的次数、暂定和快进的时间点等都被记录下来。

  好了,有了如此大量而精准的基础数据,为何不利用这些数据做点什么?在线视频网站的最大问题在于版权费用太高,而且片源更新不及时,受制于版权公司。为了创新,Netfilx决定自己拍一部电影,放在网站上供收费用户观看。

  Netfilx发现,喜欢观看1990年BBC版本《纸牌屋》的观众也喜欢导演大卫芬奇,同样也是演员奥斯卡影帝凯文史派西的“粉丝”。于是,这三者结合,就产生了翻拍版的《纸牌屋》,接下来按部就班,严格遵守流程化制作。

  Netfilx甚至把第一季的13集一股脑地放在网站上出来,彻底改变了电视剧播放的周期。影片大获成功。半年之后,该公司的股票上涨200%,投资的2亿美金完全收回来。

  每天,Netfilx订阅用户还会给出400万个评分、300万次搜索请求,数据在不断丰富,数据已经演变成一种财富。

  在国内电影圈也是如此。你不会以为《泰囧》是导演个人主观的创作吧?别傻了。在电影这个细分市场,只要严格按照好莱坞的叙事模式,严格遵守标准化流程作业,制作的产品不会差到哪儿去。导演徐峥就是如此做的。他知道每一分钟该说什么故事,在什么时间段“抖包袱”,埋伏笑料,最后如何煽情和结局。

  这一切均是建立在数据之上。也就是说,有了大量准确、真实、可分析的数据,足矣指导或者改变我们的现实生活。

  艺术领域如此,人的生活模式也是如此。利用计算机、数字和数学各类模型,除了商业上的预测之外,完全有理由相信,人类的大部分行为都受制于规模、模型和各类法则。在大数据时代,人的行为更加具有可预测性,人们的行为不再是以一个个孤立的事件,而是符合某种规律,要不然,电影这种纯粹精神上的产品怎么能够量身定做,精准的制造出来呢?

  现实情况是,我们正处于一个刚刚开始的阶段。这是一个站在数据、科学以及技术正在初步爆发、融合的关键点上,完全可以帮助我们规划未来的生活。

  不过,谁有权利掌握大数据,并可以左右我们生活,我们的隐私又该如何保护?这个话题下期再说。

  本报记者 吴玉征

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: