数据助力“打假”

  • 来源:信息方略
  • 关键字:阿里巴巴,知识产权,邵晓峰,互联网
  • 发布时间:2015-01-13 16:02

  2014年12月18日,阿里巴巴集团发布了《2014淘宝联动警方打假报告》,报告指出,2014年淘宝与公安机关联合破获假货及侵犯知识产权案件18个集群,涉及案件1000余起,打掉200多个制售假的窝点,抓获犯罪嫌疑人近400人。就在5天后,阿里巴巴又向外界展示了线上线下打假的成果。公开表示,大数据是他们打假的关键所在,指出发布线上线下联动打假是未来的趋势。

  阿里巴巴首席风险官邵晓峰对媒体公布了一个数字,10亿元人民币,这是阿里巴巴从2013年1月1日至2014年11月30日在消费者保障以及打假方面投入的资金总数。

  作为一家互联网企业,阿里巴巴有一套基于互联网的打假模式。而这套打假模式中,最关键的就是大数据。通过智能图像识别、数据抓取与交叉分析、智能追踪、大数据建模系统等技术,将假货从10亿量级的在线商品中捞取出来。

  想必了解阿里巴巴的人都知道,以前,阿里排查假货信息靠的是关键词的搜索。但是这样的做法工程量很大,相比之下,准确率却很低。因为这样的弊端,阿里巴巴的安全技术人员一直努力做新的开发,后来升级为语法语义分析,在引入了机器学习算法后,取代了人工排查,做到了全网的数据监控和检索。这样的改变使得日处理信息量达到了2亿以上。

  之后在2013年,阿里巴巴建立起的图片侵权假货识别系统,通过对图片算法技术实时扫描,识别能力超过国外很多大牛的软件。

  而商标识别算法通过检测图片中部的局部Logo来识别商品的品牌,进而对商品的真假做出判断。目前,淘宝手机各类违规假货的图片在100万左右,系统每天用这些样本和商品进行比对,每天调用超过3亿次这个时候可能有人要问了,如果既没有盗用品牌名称,也没有上传具有明显Logo的图片,那是不是就可以成为漏网之鱼了呢?

  这种情况下,通过用户上传的评价截图,大数据也可以发挥作用,发现这种售假的异常行为。也就是说,及时卖家在店铺中不描述品牌,大数据依旧能从消费者的评价中找到蛛丝马迹。

  “大数据打假系统是在不断进化的,随着数据的丰富变得越来越聪明。”阿里巴巴安全部自身总监倪良表示,发退货、登陆IP、商品文字、图片描述,交易,消费者评价、维权,权利人投诉,甚至是社交媒体数据等16个维度和特征的数据在被提取和交叉分析后,从中剥离出涉假信息……当一切都被能被记录和对比分析时,售假者的行为就会被追踪,变得无处可藏。

  大数据对于现在企业来说已经不是什么高深不可测的新技术了。很多企业都在利用大数据分析销售行为,获得销售数据,以此来达到给管理层决策提供技术支持。言及大数据,很多CIO想到的只是如何支持决策。这就是很多传统企业在利用IT技术方面非常刻板的一面。

  阿里巴巴这样一家互联网企业,用大数据告诉我们,打假其实很容易。大数据在这两年异常火热,我们的企业是否应该从淘宝的做法中,找到大数据的别样用途?

  闻莱

关注读览天下微信, 100万篇深度好文, 等你来看……