数欲静而风不止 明略数据

  • 来源:快公司
  • 关键字:明略数据,大数据,Facebook
  • 发布时间:2016-01-28 10:29

  得数据者得天下。打天下还需数据关联挖掘的精兵悍将。明略数据就是这样一支高手云集的大数据新军。尽管公司成立时间不到两年,尽管各路“挖数队伍”已风起云涌,但被称为“中国版Palantir”的明略数据以清晰战略方向和市场定位持续发出声音,实力让人不容小觑。

  Palantir曾帮助美国政府追捕基地组织首领奥萨马·本·拉登——与政府合作而获得稳定业务,备受投资者青睐。目前其估值为200亿美元,在美国市场仅次于打车应用Uber和短租服务Airbnb。不过,声称对标Palantir的中国公司越来越多。那么,明略数据如何一枝独秀地走在大数据风口上最前方?

  因反欺诈而生

  斗智斗勇是最强的实战磨炼。赴西天取经的唐僧师徒,正是多次伏魔降妖后才修成正果。

  明略数据董事长吴明辉创办明略数据的想法脱胎于秒针系统的一场场“战役”中。吴明辉早期创办的秒针系统是第三方营销数据技术公司。

  作为广告效果监控的“中立第三方”,秒针系统的团队要熟悉层出不穷的作弊手段,练就“火眼金睛”,以制定反作弊的规则。“这跟警察抓小偷的技能是相通的,”吴明辉说,反广告点击欺诈的过程,其团队掌握了庞大数据分析和处理的“十八般武艺”,并萌发了为政府和大企业分析、处理数据的创业念头。2014年初,吴明辉创办了明略数据。

  有趣的是,Palantir的创办也是源自反欺诈的历练。在Palantir于2004年成立之前,在线支付系统PayPal曾经深受欺诈问题的困扰。

  为了防止犯罪分子利用PayPal洗钱,这家公司的工程师不得不开发了一套软件来应对可疑的资金转移,再由分析师对筛选出来的交易一一进行排查。但随着交易量的增加,人工排查的方式已经无法赶上犯罪分子变化手段的速度。

  之后,PayPal便再次开发了新工具——通过匹配用户过去的交易记录,以及现在的资金转移情况来查找可疑账户并进行冻结,并以此避免了数千万美元的损失。而在PayPal被eBay收购之后,被誉为硅谷投资教父的彼得·蒂尔(Peter Thiel,PayPal的创始人兼Facebook早期投资人)想到,PayPal的这一防诈骗技术可以为政府提供服务。于是,他牵头创办了Palantir。

  与聪明的坏家伙斗,其乐无穷。无论明略数据还是Palantir,都是生来具备“道与魔博弈”的基因,并在后天习得如何在亿万数据大军中“擒贼擒王”。

  玩转猫鼠游戏

  有些多年悬案被宣布告破后,人们会好奇:这些旧案子怎么还能水落石出呢?

  “数据的核心是连接,”吴明辉说,数据不是信息,而是有待理解的原材料。孤立无序、种类繁多的数据本身不具备价值,只有将数据统一、关联起来,才能发掘信息,发挥价值。

  事实上,现代人每天都会产生很多数据,包括散落在不同的APP里的痕迹:微信记录你的聊天记录,百度地图记录你的位置,然后可能支付宝记住你的购买,“这些数据一旦整合起来,就能对特定的人有360度的理解,”吴明辉说,如果针对消费者,就可以知道他需要什么,然后卖东西给他——这是广告做的事情。“而我们现在跟公安合作,对每个人进行全方位理解之后,可以初步判断他是不是坏人,是不是嫌疑犯,或者说他有没有作案动机。”

  与传统的事后追查案件所不同,大数据能够预判“贼胆和贼心”,防患于未然。目前,明略数据与某省公安机关达成了战略合作关系,协助以大数据防止罪行。也就是,敌未动,我先动——提前把坏分子逮起来了。“福尔摩斯做的事情是发现蛛丝马迹,说到底就是做数据挖掘,”吴明辉说,其实国内每个城市,每个公安的领域,都有一位福尔摩斯式的查案高手,明略数据就是要把这位“超级探长”的智慧呈现在数据系统里,让机器学习神探的思维方式。

  我们的产品架构层级灵活,在存储、计算、展示层都有标准API接口,可以根据不同警种客户的需求进行定制化,帮助客户体验到大数据技术对公安业务的价值。

  Palantir的经历也说明了数据处理的难度和复杂。尽管CIA、FBI等情报机构掌握着成千上万个数据库——其中包括为数众多的财务数据、DNA样本、语音资料、录像片段以及世界各地的地图,但要在这些数据之间建立联系,却是相当的耗费时间。

  如何从浩如烟海的数据中快速找出有价值的线索,提前掌握恐怖份子可能发动袭击的消息——这些都是Palantir为情报技术部门所解决的难题。

  数据驱动未来

  要成为无敌神探,背后是难以想象的数据量运算。“明略数据所处理的数据,是计算7亿网民任意两个之间关系,或者任意几个之间的关系;除了人与人之间的关系,还有人与事物、事物与事物、人与信用卡、信用卡与信用卡之间等等关系。”数学学霸吴明辉摊开两手说,用“错综复杂”这个词根本不足以说明这些关系。例如,国内60%电信运营商的基站运输器数据,都在其数据平台上,说白了,手机用户所有的轨迹都会被获知。目前,他们手上要处理的电话通话记录就达到几万亿条之巨。

  同时,明略数据需要积累各个领域的专业知识。“例如,光是公安、税务、金融这几个,每个领域的数据挖掘、分析模型,都各有特点,必须由各领域数据专家理清需求,最后抽象化、系统化,”吴明辉补充说,在做数据整合清洗的过程中,有很多数据残缺,好些数据不知道当年是谁做的,也不一定有说明。“如何用最小的成本,把数据归集在一起并格式化,统一把非结构的数据应用起来,实在是一个非常大的挑战。”

  数据深耕如此之难,以致领域开拓速度并不快。Palantir在公司成立后6年内,唯一的客户是美国情报机构。

  直到2010年,Palantir迎来首个非政府客户摩根大通,助其查找那些企图盗取客户账号的欺诈者。同时,摩根大通还将Palantir的产品用于问题房产的定价——基于当地经济信息得出结论,从而避免了劣质的房产贷款所造成的不良后果。后来,美国银行、桥水联合基金,以及美国证券交易委员会都在使用Palantir的技术。

  金融也是明略数据除了公安以外的第二个主攻领域——切入点是“金融安全”。“目前,我们在给中国银联商务进行整体的刷卡数据分析、轨迹分析,还有交易的预测等。”吴明辉说,做好这些基础工作后,未来会产生庞大的商业价值。“你想一想,支付宝的触角已经延伸多长了?数据化的中国银联商务也可以做到。”此外,明略数据也跟部分银行开展征信方面的合作。

  明略驱动数据,数据驱动未来—未来已来。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: