大数据及其中国愿景

  在当下的时代,数据已经变成了一种资源。它和黄金、能源一样宝贵,却又能实现反复的利用,不断刺激经济的发展。

  透过相关数据可以看到,大数据产业强劲的发展势头:目前,全球IT行业正以5.5%速度不断增长;可是,大数据产业却以40%的增幅快速成长。通过对比,我们能够认定,大数据产业可以成为全球经济发展的驱动力,成为经济发展的革新者。

  面对这个具有巨大潜力的产业,我们除了需要收集大量的数据外,还要构建一种全新的思维———我们要理解大数据本身是存在着价值的,而且我们可以把它的价值给抽取出来,为人类所用。

  大数据本身存在价值

  作为一些大数据的公司,他们对于大数据感兴趣,这到底又意味着我们从大数据中可以了解更多细节,更重要的是能让我们就这些细节不断提一些问题。换句话说,它给予我们机会,让大数据向我们讲话,这是和之前有根本性的区别,也是在现实和小数据时代相比的差别。

  其次,我们能够了解或者开始去了解不同的相关性。对于人类来讲,我们喜欢做一些自己幻想的相关性,实际上有些根本不存在,它会给我们一种安慰,就觉得好象我们是理解世界的,但是事实并非如此。在大数据时代我们可以更加谦卑的认识或者认同其实我们对于现实的了解比想象的要少,也就是说有更多东西我们在未来需要去了解、去调研、去发掘。

  通常我们不容易理解非常虚拟的或者比较飘浮的相关性,但是我们可以知道比较科学的相关性。

  在国外有一个案例,早产的婴儿通常是非常脆弱的,他们有可能会受到感染而死去,问题在于我们意识到他们被感染的时间太晚了,往往我们意识到的时候就已经来不及救他们了,但是在多伦多的一个大数据项目认为他们可以解决这个问题,他们使用了数字传感器,并且可以获得1200多个数字点,其中包含一些早产婴儿每秒的身体体征数据,然后对他们进行分析,通过这种方式才能够找到数据当中的规律,这种规律可以帮助他们预测在未来感染的可能性有多大,最后他们终于找到其中的规律。现在甚至早产儿在最早24小时里面会不会出现感染症状他们都可以分析出来,这样等于挽救了早产儿的生命,甚至是几千几万个早产儿的生命。这种模式能够显示这个早产儿有可能出现某种感染,但实际上他的生命体征波动并不是很严重,相反它的体征非常稳定,所以大多数医生根本不会注意到,但是大数据的研究可分析出这个早产儿可能存在的危险,这时候我们便可以快速地提供援助,这就是大数据给我们带来的优势———用大数据预测之前没有预测到的现象,通过这种相关性提供及时的信息。

  简单讲,大数据甚至是等于现实当中的一种新的距离缩短,就好象科学革新一样。200多年前的科学革命与它一样的伟大,这就给我们更好的决策机会,基于更好决策基础之上,我们可以对未来做更好的预测,同时未来更好地预测就意味着将会带来新的经济价值。

  影响大数据未来前景的关键因素

  我们需要数据,因为它是原材料。此外,还需要一种思维,我们需要理解大数据本身是存在价值的,我们可以把这个价值抽取出来。中国实际上有一系列的条件,可以让我们进行大数据方面的发展,我们需要对其进行分析。在专业知识方面,已经有非常好的数学和计算机科学的教育;在数据方面,中国有一点是其他任何一个国家都没有的优势———规模。接下来,我们到底有没有足够的思维和意识?在你组织内部,一些未来企业家、年轻人他们是否具备大数据的思维,能不能理解到在大数据当中是存在可以不断重复利用的价值?

  Google的无人驾驶汽车是大数据车辆,它可以在驾驶过程中收集数据,并且可以对它进行一秒钟几百万数据的运行处理。它还可以利用收集的数据,例如道路的宽度、车流量的情况等,制造地图,让无人驾驶车辆驾驶到目的地。

  既然大数据有这样大的经济驱动和这么大的经济价值,我们怎么样获得这些大数据,或者使大数据发挥作用,这已经是全世界都提出的问题。到底能做什么让大数据能在政策角度发挥它的作用,在此有一些政策方面的建议。

  第一、进行分享。大数据最大的挑战就是在一个组织或者公司内部,数据通常都是分离的,一个部门的数据不允许另一个部门来获取,甚至有的时候,一个部门根本不知道另一个部门有他们需要的数据,这点是非常糟糕的。因为在大数据时代里,我们是可以从数据结合中获得大量价值,并且把数据的资源结合在一起来实现这种规模性,所以如果我们能鼓励数据的分享,能建立强大的规则以及激励政策让不同部门实现公司内部或者组织内部合作将会更好。

  第二、开放性。对于大数据来讲,为了让它起飞我们需要非常大的潜力,需要进行数据内部发觉,但是没有任何人、任何一个组织或任何一个公司会把所有好的概念或者关于他们拥有的好的数据能够进行开放,通常都是让别人进入到你的数据当中来使用时,才会发现未被发觉的价值,但这是存在挑战的,因为如果一个公司花几百万去搜集这些数据,在经济方面,它如何让另一家公司在使用这些数据获得经济价值时,对它进行经济补偿?所以我们需要建立数据市场,创建一些数据所有权或者数据产权方面的东西。公共部门有大量数据,如果这些数据能够开放,不光能给社会带来更多知识,同时还可以实现大数据行业的发展,非常准确的数据源正是我们所需要的,数据可以转为非常强大的经济补贴来协助大数据活动的开展,也可以进行法定,要求一些由政府资助的项目的大数据可以向社会和组织开放。

  第三、信任。很大一部分数据是关于个人的,很多人会担心个人隐私,担心个别公司甚至一些国家会随时滥用自己的个人数据。如果这个问题没有得到成功的解决,人们肯定就不再相信大数据,会停止提供他们的数据,那么大数据未来的前景堪忧。所以我们要认真对待这个问题,并且在这方面制定非常严格的规则来保护隐私,同时对规则进行执行,让人们感到数据是安全的,同时我们要对大数据方面有一些限制,使社会的福利得到保持,并且能实现对于社会的一些安全。

  所以分享、开放和信任是能够促进大数据未来前景发展的三个关键因素,这也是我们的经济和社会在未来几年的关键,全世界范围都是如此,有了强大的政策框架,基于这三点基础,大数据将会快速取得成功,并将为我们带来强大的、新的,能够看到未来的远景。

  (以上内容系根据维克托·迈尔-舍恩伯格教授在“2014云上贵州·大数据国际年会”上的演讲整理而成)

  大数据专家 维克托·迈尔-舍恩伯格

关注读览天下微信, 100万篇深度好文, 等你来看……