算法演化的摩尔定律

  • 来源:21世纪商业评论
  • 关键字:摩尔定律,商汤科技,徐立
  • 发布时间:2017-07-18 11:00

  商汤科技联合创始人、CEO 徐立博士

  AlphaGo击败柯洁,令人工智能的商业化命题再度引发热议。计算机视觉作为国内人工智能最先成熟的工业级赛道,更被外界长期视为坐拥“四个独角兽”的巨型角斗场。其中,商汤科技并非最早成立的一家,却后发制人,先后获得来自IDG资本、StarVC、鼎晖投资、万达投资、赛领资本在内的多轮投资,估值超过10亿美元。商汤科技联合创始人、CEO徐立博士告诉《21CBR》记者,公司已经在多个行业实现规模变现。

  徐立有着典型的人工智能科学家背景,在香港中文大学就读博士期间,其与导师贾佳亚教授研发的图像去模糊技术将图像清晰度提升了100倍,被视为是全球图像处理的一大突破。以研发实力闻名的商汤也一度被“学术气息”所标签化。徐立认为,人工智能还远未走向技术同质化的时代,若技术上不构成领先性和差异化,将难以跟上行业变化。对于人工智能的商业落地,商汤则自有一套驱动行业的经营哲学。

  21CBR:智能视频目前是“人工智能+安防”的行业热点,你在去年也提过类似观点,这块的市场存量有多大?

  徐立:安防一直是国家大力发展的领域,也是十三五规划的重点行业。从政府投入来看,今年也要投入2000-3000亿。传统安防领域的最大厂商,去年营业额在300多亿。所以,这块目前有足够的市场空间。

  今年的视频业务和去年的人脸识别有些类似。去年,业内都在尝试和落地人脸识别的具体应用,到今年进入相对成熟期,业务增长很快。今年,智能视频业务也在各地展开试点,整体发展正处在一个大的行业机会点上。

  视频业务何时落地,核心问题在于明确产品的商用标准。工业界的一个标准红线是评估产品是否超过所谓人眼的准确率,这也是人脸识别逐渐商用化的原因。但是视频内容的分析和人相比效果上还有差距。目前全球每天有2.5亿只安防摄像头在记录,视频数据输入达到一定规模,但在智能处理上还很欠缺,而核心算法的突破将成为最关键的落地因素之一。

  21CBR:商汤切入安防领域有哪些布局,如何构建自己的智能视频生态链?

  徐立:商汤在安防领域的产品体系分为两类:一类是成熟的业务系统,需要基于客户方的具体业务逻辑进行设计,比如怎样做多视频协调,如何做人像处理等,代表产品是SenseFace人脸布控系统和SenseVideo视频结构化系统,另一类是业务系统中的核心算法模块,包括动静态比对服务器、人群分析服务器和结构化服务器等,属于相对标准化的产品。

  举例来说,我们在视频结构化系统上做了很大突破。以往的视频结构化系统只能通过身高、性别等属性来查询视频信息,SenseVideo实现了自然语言的信息查询。我们做了1.3万人的案例测试,总共生成了9000多个自然语言构成的关键词。对于办案人员来说,通过自然语言来描述罪犯、完成案件信息的视频检索是更常见的业务逻辑,也比根据属性搜索来得更加精准,未来将是一个新的业务形态。

  目前商汤在安防市场相较领先,前十大安防厂商一半以上是我们客户,商汤为其提供标准化模块和业务子系统。同时,我们也在国内重点城市建立本地化业务。去年,商汤的智能视频业务(Intelligent Video Analytics)已占公司整体业务的40%,今年这一势头依旧良好。

  21CBR:比起发展客户,商汤似乎更擅长行业联盟,商汤的市场开拓逻辑怎样的?

  徐立:首先,无论卖什么产品,最后都要接触到甲方。但是,我一直认为,B2B企业如果要起量、要规模化,产品一定是相对标准化的。如果每次销售的方案都是定制化服务,企业的ROI(投资回报率)就会比较低。相反,集成商则可以将商汤与电信方、施工方等等连接起来,在各地做出标杆性的项目,再用标准化的形式去铺开。

  这里的标准化不是一蹴而就的,而是来自产品和项目的逐次迭代。比如前面提到的比对服务器,再往上可能是一套带着摄像头的子系统,最后则是一整套的训练部署平台。通过深入行业、做细项目,商汤不断把标准化的范围扩大,并聚合客户的需求从而形成共有需求,最终完成标准化产品的打磨过程。

  因此,商汤一直把自己定位成一个技术公司,而不是集成商公司。商汤能做的是集中力量攻破核心算法和技术。这个技术不是单点的、闭门造车的技术,而是以打通上下游的客户需求、构建产业链条来实现的。就像英特尔不直接向终端用户销售芯片,而是通过上下游的合作伙伴,比如主板厂商、主机厂商等实现笔记本电脑的销售,但用户仍然了解产品背后有英特尔领先的芯片技术,这也是商汤所追求的:做行业的赋能者。

  21CBR:业界普遍在谈AI同行业的深度结合,各家公司从技术表现来看也大致相当。对此你怎么看?

  徐立:很多人觉得,深度学习已经形成开源生态,技术没那么重要了,打通行业才是关键。这里面有一个重要前提:深度学习是否已经成熟、不会再变化了。然而,学术界目前有关深度学习的文章大部分都是工程实践型的,新的实验结果不断推翻前人做出的理论解释,指导下一代工业级应用的技术原理有待被归纳总结,人工智能距离成熟的“黑盒”还差得很远。

  例如,从近年来物体识别竞赛的结果看,识别准确率在2013-2017年之间提升了300%,基本与摩尔定律吻合。也就是说,在某些垂直领域,算法的演进已经进入摩尔定律时代,不是既有算法的变化,本质上是重新设计出一套新的引擎算法,从而形成巨大的提升空间。未来三五年间,深度学习还将迎来革命性的变化,现有的算法如果不赶上,就会被淘汰。

  至于人脸识别技术的同质化,也是有待商榷的。以抓逃为例,1:1的人像比对准确率已经远远超出人眼,但如果要在全国14亿人像库中进行1:N的实时动态比对,目前没有一家公司能够做到,更多只能在细分场景中使用,比如在某个小区里识别出外来可疑人员。而这不能算做是最优化的应用。

  因此,怎样拓展技术边界、把精度推向下一个极限,是人工智能算法迭代的核心关键。我觉得技术创业有两种可能性:第一类是通过技术上大的领先性和差异化,带来时间窗口和强壁垒。第二类则是对技术的应用看得非常准,知道在什么地方能够快速落地变现,从而走在行业前面。这两方面商汤都在努力,也有信心,最终能够在市场上形成比较大的差异化。

  本刊记者 沈玉姗

关注读览天下微信, 100万篇深度好文, 等你来看……