近几年,人工智能技术发展的如火如荼。就在前不久,两年一度的世界计算机视觉领域顶级会议ECCV2020的各项挑战赛结果出炉。其中,在图像分类赛中,阿里安全的高效AI分类技术超越三星、深兰科技、同济大学等国内外多支队伍的同类技术,获得冠军。
目前人工智能的崛起以海量的带标签训练数据作为基石,海量数据可以保障AI模型的效果,但是数据的收集和标注需要昂贵的人力成本,进行训练则需要消耗大量计算资源。ECCV2020分类比赛的难题是,与其他比賽动辄使用十几万的数据不同,ECCV2020的分类比赛共有1000个类别,每个类别仅有50张图片作为训练数据。比赛要求选手在不使用任何预训练模型和额外数据情况下,从零训练模型。这意味着训练难度巨大,几乎是不可能完成的任务。
不过,这也正是ECCV2020为了考验参赛队伍如何对来之不易的训练数据进行充分利用,促使AI神经网络进行高效学习,降低神经网络训练过程中的人力和计算资源消耗,也就是说,参赛队伍要打造一个高效能、低成本的分类AI。
阿里安全图灵实验室算法工程师夜清介绍,阿里安全智能算法团队从三个技术方向进行了突破:利用随机抽取的两张训练图像,使用数据增强并进行拼接,最大程度丰富训练样本资源;设计独特的神经网络结构,加入显著性特征模块挖掘样本的特点,提升分类性能;利用分层语义结构,让AI模型更好地挖掘数据,实现更好的学习效果。
阿里安全图灵实验室资深算法专家华棠认为,高效AI分类技术极大程度上解决了计算资源消耗和数据标注的人力成本问题,为自动驾驶、物体识别、智慧城市等领域提供了新的思路和方法。
在线下新零售场景中,对于新上架的一件商品,原来AI工程师们需要从不同的角度、光照条件和位置拍摄,收集几千甚至上万张图片并进行标注,用于训练模型,才可以保证AI模型能充分学习到该商品的特征。而在阿里安全提出的方案下,商品图片数量缩减到50张以下,就能保证模型的识别能力。
“我们的方法还可以与自监督有效的结合,在学习更好的数据表征基础上,指导模型高效学习,获得更好的识别能力。”夜清说。
目前,阿里安全这项基于小规模图像的高效AI技术已应用在知识产权商标识别、通用商品识别和动植物保护等场景中。这类场景类别数量多,每个类别样本数量较少,而预训练任务和目标任务存在差异,预训练模型可能损害目标任务的准确率,这个方案恰恰能够解决上述问题。
“以某知名品牌运动鞋上新为例,一段时间内我们仅能获得该产品不同的配色以及商品几个不同角度的图片。在仅有少量商品展示图的情况下,通过高效AI方案,我们在新产品问世的极短时间内实现新款商品识别能力的覆盖,降低新产品被山寨和假冒的风险。”华棠说。
……
关注读览天下微信,
100万篇深度好文,
等你来看……