大数据,大预测
- 来源:PC电脑王 smarty:if $article.tag?>
- 关键字:大数据,微软 smarty:/if?>
- 发布时间:2014-08-15 15:52
大家都知道,微软在世界杯结束后炫耀了他们的预测结果:16 场淘汰赛预测正确 15 场,准确率达 93.75%。小组赛准确率为60%,48 场成功预测 29场。这是一个令人兴奋的成绩,也让不少人捶胸顿足,如果跟着Bing买足彩早就发家致富了,下次世界杯赌球了有指路明灯,那就是大数据!
这是大数据时代的威力吗?笔者倒觉得不必太过兴奋,球队毕竟有强弱之分,微软的大数据预测只是把大概率事件进行了进一步细分,同时加上自身不错的运气,这才交上了一份看似惊人的答卷。其实仔细研究一下微软的预测就会发现其中的运气成分,比如说半决赛巴西对阵德国,微软给出的预测结果是这样的,巴西获胜机会49%,德国获胜机会51%,实际上这就是一场五五开的比赛,结果德国7比1狂胜巴西。我们再来看微软唯一失手的比赛:三四名决赛,巴西获胜几率63%,荷兰获胜几率37%,这给我的感觉是这样的预测并没有根据杯赛进行过程中各队的状态变化进行及时调整,太过依赖过往数据。说到底,超高的预测成功率,实际上源自淘汰赛并无冷门出现。
实际上,谷歌、百度等搜索引擎都对世界杯进行了预测,并且都号称使用了大数据预测模式,其中百度下的功夫应该是最深的,其预测模型涉及到19972名球员和1.12亿条数据,包括百度搜索数据、球队和球员基础数据、赔率市场数据等,所分析的球队不仅包括207支国家队,还囊括了欧洲、南美、亚洲等联赛俱乐部及低级别球队信息。为提升预测准确率,百度大数据研究院搜索了过去5年内全世界987支球队的3.7万场比赛数据,并与博彩公司合作引入数据……不过数据越多并没有带来越准确的结果,百度的预测败给了微软,实际上,败给的是运气。相比之下,微软和谷歌的预测倒显得比较淡定,基本上以吸引眼球为主要目的,所以关于预测这件事,噱头的成分非常大,大家千万别认真,更不要把大数据当做先知,足球依然是圆的,不确定性才是它最大的魅力。
预测一直以来都是大数据最大的噱头,用大数据来预测比赛其实意义并不大。我们更希望看到的是大数据在环境保护、疾病预防、生活改善等方面的预测。如果大数据能够预测海啸与地震,能够预测流感爆发,哪怕能够预测明天上班的道路会不会拥堵,这样的预测一定会比预测球赛更靠谱也更有意义。
执行主编 李天逸