“AI+”时代下的网络安全

  在12月13日举办的谷歌开发者大会上,谷歌云首席科学家李飞飞正式宣布在北京成立谷歌AI(人工智能)中国中心。无独有偶,阿里云在上个月的云栖大会广东分会上宣布在广州设立阿里云研发中心,并招募1000名云计算和人工智能工程师。百度更是倾全公司之力押注人工智能,做出ALLIN的姿态。随着谷歌、微软、Facebook以及国内的BAT等巨头竞相布局人工智能领域,科技公司对于AI人才的争夺战进入白热化阶段,也使得人工智能技术开始渗入到各行各业的实际运作中,“AI+法律”、“资管AI”等新概念层出不穷。在机器学习和人工智能等新技术的驱动下,网络安全行业也开始迈入AI时代。

  “网络黑产”的挑衅

  在当前万物互联的时代下,网络安全问题日益凸显。2016年10月21日,黑客控制了一批感染Mirai病毒的物联网设备,攻击了Twitter、Paypal等一些知名的国际网站,引发“半个美国网络瘫痪”的安全事件。2017年5月,WannaCry勒索病毒在全球范围内爆发,100多个国家和地区超过10万台电脑遭到了蠕虫式攻击,大量学校、银行、医院的服务系统因此陷入瘫痪……

  网络空间常见的攻击方式如恶意软件、电信网络诈骗、流量作弊、分布式拒绝服务(DDos)攻击等,这些攻击轻则造成用户隐私泄露或财产损失,重则影响企业正常运作甚至危及国家安全。而诸如此类的攻击背后多是一条条分工明确、组织专业的黑色产业链,称为“网络黑产”。据测算,目前仅国内“网络黑产”从业人员就超过150万,市场规模已达到千亿元级别。网络安全行业面临严峻的挑战。

  针对网络攻击行为,传统的网络安全防御思路大多以边界隔离结合规则策略为主,即在网络空间为安全防护对象划分出边界,基于专家经验总结的规则把攻击挡在边界外面,只要守住边界就算成功抵御了攻击。然而,这种单点防护体系在万物互联的今天已经不那么有效:一是随着移动互联网和物联网的发展,大量设备接入到网络,传统意义上的边界已不复存在;二是传统防护体系假设所有攻击方式都是已知的,基于规则策略难以应对未知威胁或其他高级持续性攻击。

  更为重要的是,对于规则策略的强依赖必然引入大量需要人工干预的工作,当攻防发展到一定阶段后,安全防护工作将退化成一项劳动力密集型作业。

  “AI+”助力网络安全

  近几年在科技界最热门的关键词中,“人工智能”位居榜首。“AI+”模式给很多领域都带来了颠覆性的创新和变革。在网络安全领域,AI可以帮助我们从更高的视角、更广的维度去发现异常、捕获威胁,实现威胁与入侵的快速感知和响应,这是传统的单点安全防护所做不到的。我们需要做的是在网络和设备上部署足够多的探头,用于对各类行为数据的记录、存储和分析。理论上数据规模越大,维度越丰富,训练出来的AI模型的适应性就越强。

  网络边界的消除让安全厂商能够更方便采集到各个维度的数据,如设备日志、程序行为、网络流量等。仅根据单一维度的特征或许不能完全确认是否存在威胁,但结合其他维度数据进行关联分析后能够得到可量化的预测结果。这种模糊性决策是AI模型的优势,使得识别未知威胁成为可能。

  以移动端恶意软件识别为例,据阿里巴巴钱盾反诈实验室统计的数据,2017年全网平均每天新增的APP数量近10万,如果按传统的动静态分析结合人工抽取特征码的方式,需要30人以上规模的技术团队才能勉强支撑日常分析需求。如果引入机器学习或深度学习等人工智能技术,只要参与训练的样本规模足够大,标签足够准确,98%以上的黑样本都能被AI引擎自动识别,技术人员只需要关注AI引擎输出的灰样本的打标,系统整体识别效率至少提升10倍以上。目前钱盾反诈实验室在反病毒能力上的投入只有6名技术人员,得益于他们早期搭建的一套名为“无量尺”的深度学习智能检测系统。近期在安卓手机中活跃的DowginCw病毒,就是通过这套系统首次监测并成功拦截的。

  据风险投资公司CB Insights统计的数据显示,从2016年开始,“人工智能”和“网络安全”在文章中同时出现的频率迅速攀升,说明两者越来越紧密地结合已经是不争的事实。从投资的角度,擅长将网络安全与AI两大技术相结合的创业公司也备受资本市场的青睐。从2012年至今,全球AI相关投资最热门的领域中,网络安全领域以13%的投资比例稳居第一。仅2017年前两个月就发生了三起大型科技公司收购“AI+网络安全”初创公司的事件,其中包括亚马逊对于Harvest.ai的收购。据悉,Harvest.ai的核心技术是基于AI实现信息泄露行为的识别和阻断,亚马逊此次收购的目的正是利用该技术增强其云服务平台AWS的安全功能。

  构建“AI+网络安全”生态体系

  数据是“AI+网络安全”发展的核心驱动力。创新工场创始人兼CEO李开复认为,BAT等巨头公司积累了海量的互联网大数据,做人工智能有先天优势,但是他们没有生态系统,数据不会向行业共享。如今,这种情况正在悄悄地发生改变。

  据统计,电信网络诈骗平均每年造成的经济损失超过100亿元,成为目前整个社会最普遍的安全问题之一。如果要实现彻底根治,需要安全企业、运营商、银行机构、公安部门以及政府主管部门的共同参与。一方面是因为诈骗场景已经渗透到生活的各个角落,同时诈骗手法也在不断升级;另一方面是电信网络诈骗背后已形成了完整的黑色产业链,仅仅基于某个机构自身生态内的数据构建的安全能力与其对抗是远远不够的。2017年,互联网巨头们在反诈骗领域动作频频,其中阿里巴巴与广东移动、腾讯与上海公安分别签署了战略合作协议并成立联合反诈实验室,旨在通过数据、人才、技术等方面的互通,共同推进“AI+网络安全”生态体系的建设。

  从行业技术发展来看,腾讯通过“安全态势感知系统”等五大安全应用系统,基于大数据和深度学习技术,形成了一套基于AI的“事前”-“事中”-“事后”全链条反诈体系。

  而阿里巴巴针对电信网络诈骗推出的“钱盾反诈AI大脑”,除了依托内部大量业界顶尖的AI人才和强大的云计算能力等先天优势外,在数据方面更是汇集了外部运营商、银行等行业的数据支持和内部阿里自有业务安全能力。这使得其在打造以打击诈骗号码、“伪基站”、钓鱼网站为代表的反诈骗能力时表现得更加游刃有余。以诈骗号码识别为例,利用特征工程对号码进行多维度画像时,普通AI模型最多能提取到十余个维度的特征,而钱盾反诈AI大脑的核心恶意号码检测模型—DeMalC系统能够抽象出多达190个特征,对未知号码的识别准确率达到91.86%。其中原因除了运营商的数据支持外,更多的是源自阿里体系内的电商、支付、物流等业务在业务风控、身份认证等领域所积累的安全能力。

  以产业链对抗黑色产业链

  任何技术都是一把双刃剑。AI技术给网络安全带来福音的同时,也开始被运用于新型的网络攻击。2017年3月,绍兴市公安机关破获全国首例利用人工智能犯罪大案。案件中的黑客团伙搭建了一个图片验证码识别服务平台,用于突破互联网公司设置的验证码安全体系,黑色产业链中的其他团伙通过这个平台从事非法撞库并盗取账户的行为。为了提高验证码识别率,黑客团伙利用深度学习技术训练识别模型。据估算,该平台被打掉以前,平均每年提供验证码识别服务超过1000亿次,牟利达1300多万元。

  可以预见的是,随着各种AI开源框架的普及,“网络黑产”利用AI技术为安全领域制造的麻烦会越来越多。然而在安全领域,所有技术必然是在攻防之间不断演进的。所谓打铁还需自身硬,AI技术的发展不可能因为被“网络黑产”非法利用就停滞不前,不论是安全厂商还是普通企业,唯一的出路是不断推进安全技术的建设和创新,加强自身的安全防护体系。

  “魔高一尺,道高一丈”。如果把技术比作武器,那么我们面对的“网络黑产”就是一支装备精良的部队。作为安全厂商,需要转变思维,利用AI技术等现代化装备武装自己,同时要避免各自为战,加快安全生态建设和资源、技术等方面的互通,以产业链对抗黑色产业链。只有产业链中的所有合作伙伴共同参与,为整个行业生态构建立体化的安全屏蔽,才能对“网络黑产”形成有效的防御。

  文/如凌

关注读览天下微信, 100万篇深度好文, 等你来看……