大数据的崛起:趋势、机遇与挑战

  • 来源:互联网周刊
  • 关键字:大数据,移动带宽,云存储
  • 发布时间:2013-12-27 13:49

  随着社交网络的逐渐成熟,移动带宽的迅速提升,云计算、物联网应用愈加丰富。更多的传感设备、移动终端接入到网络,由此产生的数据及增长将比历史上的任何时期都要多,都要快。“大数据”时代悄然而至。

  掘大数据之宝藏

  提及大数据,大多会围绕几个角度:一方面是它的海量性;另一方面是快速数据处理能力;另外就是数据的多样化。通过一些结构化的数据,企业ERP、商务平台、非结构化视频图片、收集到的各种数据、互联网交互数据,各种各样的数据种类给大数据技术提供了一个很好的发展平台,因为大数据的强项就是处理更多的数据种类,并快速把数据进行分类存储、挖掘以及提取它的价值。

  大数据因其巨大的商业价值和市场需求正日益成为推动信息产业变革的新引擎。面向大数据市场的新产品、新技术、新服务、新业态正在不断涌现。大数据时代的到来已经不是一种单纯的理念思路,而是一种不可逆转的趋势了。

  首先,大数据能够产生价值。无论是在日常生活中还是企业生产里,都需要通过数据的收集和处理来做出决定,以最大化的满足个人或者客户的需求,而大数据理论的特点就在于这一过程的高效性、简易性甚至实时性。通过大数据的处理,可以完成对于系统或是结构化数据的实时更新,从而完成最快速度的决策,这毫无疑问将为社会进步创造巨大的价值。

  其次,大数据具备不可替代性。随着信息社会的发展,信息量将以爆炸的速度进行膨胀增长,在这个过程中无论科技具有怎样的发展方向,对于大规模数据的处理将始终占据工作和科研中重中之重的位置,而无论是云计算还是其他的执行方式,都只是对于这一思想的具体实现和有力支撑,而不可能从根源上替代大数据这一体系的存在价值。

  最后,大数据具备充足的生命力。无论是社交网络的广泛推广,还是诸如苹果、谷歌等企业对于大数据发展的不断推动,大数据的整体发展形势都会像滚雪球一样越来越大。而同样的,调查表明,有超过80%的公司代表认为大数据理论的发展将对公司的商业分析等过程起到有效的帮助,这一点有力地证明了大数据具备充分广阔的生长空间。

  大数据不仅影响着人们生活的方方面面,更重要的是它给企业带来的改变。据Gartner预测,企业数据将在五年内增加800%,其中80%是非结构化数据,大部分来自团体、社区,以及社交网络的非业务数据。面对如此规模的数据,对于有准备的企业来说这无疑是一座信息金矿,能否将海量数据转换为有价值的信息,将成为未来企业的决胜法宝。

  开源 大数据的制胜法宝

  大数据蕴藏的商业价值不可小觑。对于当今的企业而言,数据就是一种重要的战略资产,如果能够正确评估其商业价值并且迅速行动起来,将会在未来的竞争中占得先机。然而,传统关系型数据库的技术擅长处理结构化数据,对于未来企业中占绝大多数的非结构化数据却无从下手。此时,大量新技术应运而生。

  大数据获得动力,关键在于开放源代码,帮助分解和分析数据。以Hadoop为代表的一系列开源技术,成为大数据存储、处理和分析的主力军。各大IT巨头瞄准开源技术,纷纷推出各自的大数据战略。Hadoop作为其中的最受关注的技术,已逐渐走向商业化的道路。不可否认,Hadoop的确是一款非常出色的处理大数据的开源工具。除了Hadoop之外,还有很多优秀的技术和工具如雨后春笋般成长起来,包括开源语言R、NoSQL数据库和非结构化数据存储解决方案等,也已成为大数据舞台上不可或缺的成员。

  开源是灵感的汇集,凝聚了全世界范围自由开发人的思想结晶;开源,是无界的合作,没有地理位置的阻隔,没有商业条款的羁绊。纵使开源不是为商业化而生,但事实证明开源却有着商业化应用不可比拟的优势。

  现在的商业智能和企业搜索的专有应用程序都没有“坐以待毙”。商业智能增加了更多类似搜索的功能,并且搜索还取代了很多商业智能功能。但是在几年前,专有解决方案似乎是最安全的方法,而开源解决方案似乎更具风险。而现在,很多公司开始看到,因为开源项目独立于企业财务决策,他们对于保护其长期投资更具后劲。此外,很多企业发现他们更容易获得、培训和留住开源人才,因为,他们可以深入代码。

  何以解大数据存储之惑

  也许,人们对大数据的印象很多是从存储容量的廉价性而来。但实际上,企业每天都在创造大量的数据,而且越来越多,而人们正在努力地从浩瀚的数据海洋中寻觅有价值的商业情报。另一方面,用户还会保存那些已经分析过的数据,因为这些旧数据可以与未来收集的新数据进行差异化分析,依然有潜在的利用可能。

  大数据应用的一个主要特点是实时性或者近实时性。比如,如果警察拦住一辆车,想得到这辆车的相关信息,那么这对时间的要求是越快越好。类似的,一个金融类的应用,能为业务员从数量巨大种类繁多的数据里快速挖掘出相关信息,能帮助他们领先于竞争对手做出与交易相关的决定。

  随着大数据应用的爆发性增长,它已经衍生出了自己独特的架构,而且也直接推动了存储、网络以及计算技术的发展。毕竟处理大数据这种特殊的需求是一个新的挑战。硬件的发展最终还是由软件需求推动的,就这个角度来说,可以很明显地看到大数据分析应用需求正在影响着数据存储基础设施的发展。

  数据通常以每年50%的速度快速激增,尤其是非结构化数据。随着科技的进步,有越来越多的被传感器采集的数据、移动设备产生的数据、社交多媒体产生的数据等等,所以数据只可能继续增长。因此大数据需要非常高性能、高吞吐率、大容量的存储设备。

  当下,云存储的方式在欧美市场上的应用很广泛,大数据用云的形式去交付有两个典型:面对好莱坞的电影制作商,这些资源是黄金数据,如果不想放在自己数据中心里,把它们归档在云上,到时再进行调用;此外,越来越多的企业将云存储作为资源补充,提高持有IT资源利用率。

  结语:

  大数据可以用在各行各业,某些行业因为大数据的引入可能带来前所未有的发展。那么针对国内市场而言,具体哪些客户更倾向于大数据呢?第一类客户是电信业,电信行业拥有海量且价值连城的数据;第二类客户是金融业,金融行业的客户需要对大数据的非常准确把握,由于其目前面临着前所未有的挑战,需要提高业务的类型,提高客户的黏度和创新,所以使得金融行业需要对业务本身进行挖掘和使用,这就涉及到了大数据;第三类客户是零售业,包括在线的零售电商都在使用大数据对客户的行为进行挖掘追踪,实现交叉销售,提升客户体验。此外,感兴趣的行业还包括娱乐、媒体、地产行业等等。

  抓住大数据所带来的机遇也需要解决一些棘手的问题。如隐私、安全、知识产权、可靠性都是急需解决的问题。企业不仅需要投入人才和技术,还需要对流程、结构进行优化,以适应大数据的需求。

关注读览天下微信, 100万篇深度好文, 等你来看……