互联网+赋予大数据无尽想象
- 来源:IT经理世界 smarty:if $article.tag?>
- 关键字:互联网+,大数据 smarty:/if?>
- 发布时间:2015-08-12 09:20
深入挖掘大数据资源的潜力,“互联网+”才能水到渠成。
无论是国人关注的环境保护领域,还是硅谷最热的数据淘金生意,在互联网+重构传统产业的今天,大数据都扮演着打破固定思维,重塑传统商业模式的角色。
环保大数据的狭义与广义
在江苏省地图上轻点鼠标,可以看到秸秆焚烧的实时画面,GPS定位,地点精准;再移动,可以看到了国(省)控重点企业的详细信息,包括地址、法人、联系方式、各项排放数据等。除此之外,地名、道路、水系等都进行了集成,点到哪儿就可以看到哪儿的环境信息。
“1831将传统的环保小信息系统集成在一起,减少重复投资,实现数据共享,让云计算和大数据发挥数据挖掘价值的可能。”在江苏省生态环境监控系统1831创始人何春银的心中,各种数据信手拈来,“1831总共集成了江苏省1043家国控省控重点污染源、252个水质监测站、188个空气监测站、375个辐射监测点、143个机动车监管站、509条机动车监测线……总共集成了25.5万个节点数据。它就像一个CT,像一个扫描图像,像一个心电图,24小时不断感知着承载着5.9万亿元经济总量、10.26万平方公里的江苏全境,反映全省的环境安全与健康的程度。”
1831是GIS(地理信息系统)、GPS(全球定位系统)、RS(遥感技术)的有机融合,大到城市,小到街道的任何环境信息都可以在地图上呈现。前文提到秸秆焚烧的画面,则是由巡查人员手中的传感器实现的,传感器可以随时拍摄任何与环境有关的信息,这些信息会实时传送到1831平台。从某种意义上来说,1831提供了让人人成为传感器的机会。
各种环境信息和要素的展示还只是最基本的功能,1831更强大的应用在于其分析功能。1831每天可以根据各地的环境数据综合判断各地的环境质量状况,大到各市,小到区县,都可以采用四色预警模式对各地的环境质量进行实时监控。除了综合判断和分析各地区的环境质量外,还可以对各种单项指标进行查看,比如可以单独分析某一地PM2.5的变化情况、二氧化硫的排放情况,还可以分析其变化和排放的趋势。
太湖流域水环境监控平台是1831最初的蓝本,也是1831发展最完善的一个应用平台。按照高标准、全覆盖、最先进的要求,对国家考核断面、水质、饮用水源地水质、蓝藻遥感监测等16项进行综合监测,有360度全天候动态影像,可以实时调取影像、实时查看水环境变化情况,如有异常,会自动提示超标。
太湖流域监控平台除了具有上述基于地理信息的查看功能外,还可以实现视频实时监控,系统支持十几个视频同时播放。特有的“飞行”功能,可以展示3D效果的太湖流域。在太湖监控平台上可以对蓝藻暴发进行预警,主要通过矢量图和影像图,进行情景模拟。此外,还可以通过卫星遥感技术捕捉的画面,对蓝藻进行提取,分析每个月暴发的情况,蓝藻暴发的频率和趋势。“互联网+环保=1831。目前1831还只集成了狭义的环保大数据,也就是环保工作本身产生的数据,但诸如政策、法规、工程、气象等广义范畴的与环保相关的数据最终都会反映到环境上。所以,当互联网+环保的时候,它产生的无论是狭义环保大数据,还是广义环保大数据,都有利于我们分析当下的环境质量,并追溯它的根源,有利于我们不断去认识环保、重视环保,改善我们的环境质量,享受蓝天白云和干净的食物。”何春银说。
大数据淘金
张溪梦的新名片上印着Growing IO公司CEO,这是一家专注大数据应用的创新企业,而仅仅4个月之前,他的身份还是LinkedIn全球商业分析部总监。
2010年,张溪梦以“数据科学家”的身份加入LinkedIn,负责基于数据挖掘的产品开发。“LinkedIn是我工作过的公司里最依赖数据的。”张溪梦说,LinkedIn的所有业务都基于数据模型——LinkedIn.com上的用户增长和体验生成大量数据,LinkedIn根据这些数据开发新产品为用户提供新产品和服务,这些新产品和服务又进一步刺激增长,增加客户黏度。这是LinkedIn最基本的业务模型,维系这三点反复作用并在其中流动的正是数据。张溪梦领导的部门叫商业分析部,他解释为“负责所有和钱相关的分析”,直接支持产品、销售、市场推广、开发、运营五大业务部门。
“中国的大数据产业正处于最好的时代。”从硅谷的数据科学家到回国创业,张溪梦看好的正是产业风口,而让他做出这一判断的,是美中两国大数据产业发展的不同阶段。2014年,美国的企业级大数据公司有1900多家,而2013年这个数字是890多家,一年时间翻了一番,说明美国的大数据产业已经进入了精细化运营时代。不过,这种精细化分工也产生了一些困扰——在LinkedIn工作的时候,张溪梦的团队往往需要打通二三十种不同的数据库或者解决方案,这让企业数据很难高效整合。中国的企业级市场对大数据已经有强烈的认知,但目前执行层面的公司并不多,而且因为过去的包袱少,可以采取跨越式的方法吸收新型技术,一次性解决美国企业可能需要若干部门线性解决的问题。
“过去十几年,我一直在美国做数据分析——市场分析、产品分析、销售分析、运营分析。这个过程中有很多痛点,一直没有人解决。比如数据的收集没有规范,导致分析师和数据工程人员花大量时间做数据清洗,应该几分钟或者几小时完成的事情往往需要几周,浪费很多资源。”这也使得很长一段时间里,KPI报表、商业智能都是只提供给公司高层参考决策的工具。“数据从采集开始,经过清洗和整理,存储到数据仓库或者Hadoop集群里,然后再抽取出来,先做数据可视化,然后经过商业智能,再去做各种数据模型,最后产生出预测和决策……这个过程需要很多系统和人才的协同合作才能实现,非常昂贵。”
张溪梦创立的Growing IO公司产品方向,就是针对网站和手机客户端开发的端到端的分析系统。特别是从数据采集开始,一方面帮助数据工程人员节省大量数据清洗的时间和步骤,一方面快速直接地将数据分析结果展示出来,去掉了中间冗长的流程。“比如传统企业要做电商网站的分析,过去可能需要几个星期的时间,现在几分钟之内就可以实现。”张溪梦希望能够重新建立数据分析的规则,让企业里的所有人都能实现数据驱动,特别是基于互联网或者移动端的小企业或者传统中小企业,也拥有大企业的数据分析能力。
在他看来,实现“互联网+”的目的就是通过数据将各种的人、物体、事件关联起来,让资源流动,把不平衡变成平衡,让整个社会更有效率。
文/孙泠