商汤物语:全球最大AI独角兽的雄心与优雅

  • 来源:中欧商业评论
  • 关键字:长期研究,汤商科技,演讲
  • 发布时间:2019-05-29 23:25

  一次崩溃

  2017年,胖头鱼遭遇了他25年人生中一次巨大的崩溃。他清晰地记得那天,晚上11点多,在香港中文大学附近的沙田海滨海长廊,不知不觉跑了20公里,到终点时忍不住哭了出来。

  他注意到附近一直有人待着不离开,明白对方是担心他一时想不开,心想:这里真是个温暖的地方啊。

  他太有理由苦闷了。不久前,他以清华大学电子工程系优等生身份来到港中大多媒体实验室读博,师从王晓刚教授,而王晓刚师从汤晓鸥。后者于2001年7月建立的多媒体实验室,多年来有“计算机视觉界黄埔军校”的美誉。

  第一年通常大家都不发论文,但胖头鱼想试一试,尽管并非计算机视觉科班出身,但他对自己的学习能力一直很有信心。还有一个原因是,他了解自己,如果没有什么挑战,人就会懒散起来,大不了就是论文被拒,运气好了还能减轻一下接下来的科研压力,专心做点长期研究。

  “计算机视觉+自然语言处理”的方向是一开始就定下的,实验室里研究这个方向的只有他一个,这意味着,遇到难过的坎,唯有孤军奋战。和导师王晓刚商量时,对方并没有阻拦,鼓励他说是很有价值的研究方向,但要为困难做好准备。

  在接近研究终点线的地方,困难猝不及防地降临。修改了一段代码BUG后,识别结果表现反而变差了。CVPR(全球计算机视觉顶级学术会议)提交论文的截止日就在眼前,无助、沮丧、自我怀疑在那一刻如海水般涌向他。

  胖头鱼更新了一条朋友圈,那几乎是最后的情绪出口,但内容和平日里开朗的人设实在不符,加上不愿给朋友们增添情感上的负担,他只允许这一条“存活”5分钟,5分钟后,这条朋友圈将和崩溃一道,消失在沙田海。

  5分钟足够了,底下出现了很多留言,他还收到了王晓刚发来的信息,了解情况后,导师劝慰他不用担心,并推荐了一位或许可以提供帮助的人选。

  目前,博士生三年级的胖头鱼在商汤科技的自动驾驶团队实习,并带领一支团队,和导师王晓刚,现任商汤科技研究院院长只差了两个层级,就像在多媒体实验室一样。

  商汤科技是香港中文大学教授汤晓鸥2014年创立的计算机视觉和深度学习原创技术的创新型科技公司,去年5月末,商汤宣布完成 C+轮 6.2 亿美元融资,投后估值达45 亿美元,是全球最大的AI独角兽。近期也有消息说,商汤最新估值已达60亿美元。

  公元前1650年左右的中国商汤时期,农业、手工业迅速发展,早期汉字甲骨文诞生并得到充分应用,该时期成为人类古代文明进步的重要阶段。

  这成为商汤科技名字的由来,不过,民间的另一个版本是,“汤老师”从商了,所以叫商汤。

  “汤氏”研究场

  汤晓鸥于计算机视觉领域有一呼百应的影响力,他避开媒体的追逐,几乎不接受采访,酷爱电影和“晒娃”的形象深入人心——每一次公开演讲,他都会拿电影出来类比和演示。比如《战狼》的成功证明了尊重原创是一件多么重要的事情,再比如,在一场人工智能大会上,他演示了商汤的黑科技如何把一辆汽车毫无痕迹地植入《花样年华》,“其实我最想植入的应该还是我儿子的照片,这也没有什么别的原因,因为我觉得他比梁朝伟长得还帅。我也跟他说,你不要相信人工智能,你长得这么帅,谈女朋友一定要亲自去谈。”在港中大多媒体实验室首页,汤晓鸥用儿子Samuel的照片科普人脸深度识别,一张上面标着“浓眉”“有吸引力”,对应人脸属性,还有一张上面标着“You are Samuel”(你是Samuel),对应人脸识别。

  从商前,汤晓鸥先后在香港中文大学和微软亚洲研究院(MSRA)工作。《十九年来,从微软亚洲研究院走出了他们》一文中这样定义这座微软在海外设立的首个研究院,“没有人可以绕开这个机构去谈论过去十几年的中国科技史”。张宏江、李开复、沈向洋、张亚勤等一大串星光熠熠的名字都来自那里。

  戴娟大四时经师兄介绍来到MSRA,跟随汤晓鸥实习,“有学者气”是汤留给她的第一印象。“从2004年到现在,感觉他一直没怎么变过。”刚接触人脸识别那会儿,汤晓鸥对她只有一个要求,沉下心来,读300篇论文。“他也不会来检查,但是他会跟你说,你这样做的原因是什么,不熟悉这个行业,就没办法做出更优秀的研究方向和议题。”

  实习七个月里,开头将近三个月,戴娟都把自己埋在论文堆里,当时深感痛苦,现在觉得,这个苦不能绕,也绕不开。毕业后,她拖着大大的行李箱,第一次离开大陆,进入港中大多媒体实验室,当时,20多个人里,她是唯一的女生。2005年,计算机视觉尚未成为“显学”,选择这个专业,意味着选择了纯研究的道路。

  戴娟在中国科技大学电子信息工程专业读本科时,就耳闻多媒体实验室的“口碑”,所有从实验室走出去的学生都去了美国最牛的学校,MIT、耶鲁、剑桥、哥大(作者注:哥伦比亚大学的简称)……每一个都让她心动。“汤老师会不遗余力地帮学生找最好的出口,他真的很关心自己的学生。”

  在多媒体实验室,论文分享会是每周的规定动作,大家一起读论文,互相改论文,分享要点、笔记,戴娟从师兄林达华的笔记里“偷学”了不少统计学的知识,后者是商汤科技的联合创始人。

  实验室带有强烈的“汤氏风格”,开放、包容、平等、透明。所有人共享所有算法,对新人而言,最幸运的莫过于,开始任何一项研究,都可以站在巨人的肩膀上。人与人之间的较劲,则几乎感觉不到,大家关心的是团队投中国际顶级会议的论文数量,要是有人沒中,其他人都会上去安慰。

  “我觉得汤老师的理念是,希望所有学生都能去全世界最优秀的大学。不是说一定要谁去MIT,谁去哥大,一切都是有可能的。在学术界,你要希望身边的朋友变得更好,这样无论你以后做什么,都会有更好的圈子来支撑。”戴娟离开实验室后,简历上新添了苹果公司Siri和微软Windows Phone的产品经理两个职务,去年回到“初心”商汤,仿佛穿越到了学生时代。“它是最安稳的一个地方,因为你不是一个人在战斗,遇到问题时有团队,是很厉害的一群人。”

  这种被天才包围的感觉,大水也有。去年,他所在的团队勇夺计算机视觉界的顶级竞赛之一MS COCO冠军。两年前,他定点投了商汤实习职位,大水研究的方向是目标检测,和自动驾驶中的场景改善高度匹配。

  “在这里大家不会互相甩活,会主动接活,遇到问题的时候,大家会先考虑这个事情自己是不是能直接解决掉,然后再去找其他人,而不是说我发现这个问题好像跟我没关系,就直接抛出去,看谁能解决掉,这个是我特别喜欢的一点。”

  当被问起实习生和正式员工的差别时,大水仔细想了想后答,没有。

  关于“无差别”,胖头鱼举了一个例子。算法测试是科研人员检验代码是否WORK(可以落地)的必经之路,它需要强大的GPU(图形处理器)集群——超算中心支持。商汤有14 000块单价万元以上的GPU,是亚洲规模最大的 AI 超算平台,依托深度学习训练框架 SenseParrots,支持千卡并行训练、千亿级参数模型、百亿训练样板、亿级类别分类任务。任何时间,任何地点,提交测试需求后,会进入队列,先后次序只和任务的紧急程度相关,无关提交人员的身份。“如果排队的话,最晚,也是最极端的情况,就是你白天挂上,晚上肯定能跑上。正常情况是挂上就跑了。”

  包括实习生在内,商汤的研究员人均拥有数十块GPU卡。大水说,这里的超算集群是他见过所有公司里最好的,大大加快了迭代的速度,降低了试错的代价。

  “赔本”招人

  巨大的投入隐藏在背后,超算中心特别“烧钱”。据《财经天下》报道,商汤的研究员闫俊杰博士做过估算,按下那个标有“run”(启动)字样的按钮,一次数据迭代整体花费至少50万元。CEO徐立笑称,“我们有150多个博士天天在算法平台上按‘run,训练人工智能模型。”

  我在商汤上海办公室见到了这位37岁的CEO。偌大的空间横放着两张白漆办公桌,和公共办公场地的桌子没有区别,上面是一台笔记本电脑,空旷程度让人怀疑这只是临时的办公场所。徐立穿着NIKE定制的黑色公司服,连帽卫衣和宽松运动裤的搭配,胸前印着更新后的“商汤”logo。和早前的公司logo相比,中文取代了英文SenseTime,占据了醒目位置。

  “尚简而重能”,徐立去年在公司立了一条规定,在公司内实行称谓“减负”,互相直呼其名。违规者要向公司用于青海捐助的慈善基金“充值”。他相信,这有助于铸造并保护一种开放、坦诚、纯粹的团队文化。

  计算机视觉领域的玩家几乎都有知乎账号,在这个专业人士热衷的社交网站上,自称港中大“多媒体实验室出来的学渣”的“AI观察员”称徐立是圈内的全能型选手,“写得了算法,做得了DSP(数字信号处理),三天两头出新技能。平时工作应付得得心应手(开会、写PPT、写代码、出去吃喝打球打游戏一个不误,每天回家路上看篇paper,睡觉前再来个睡前读物),不耽误每年CVPR/ICCV/ECCV(全球计算机视觉领域三大顶级会议)再投个三五篇paper,绰号中国联通(宵)。”

  徐立在港中大师从贾佳亚教授。贾佳亚2017年5月作为杰出科学家加盟腾讯优图实验室。接受36氪采访时,他称徐立是“让他非常自豪的一个学生”,“徐立是一个非常聪明的人。不只是我们组里面,他可以说是我见过的所有学生里最聪明的人之一。他能够触类旁通,从细节上理解问题。他在我们组的时候从最早需要几个月做完一篇论文到一个星期解决战斗就充分证明了他的能力”。

  2014年3月,汤晓鸥团队发布研究成果,基于原创的人脸识别算法,准确率达到98.52%,首次超越人眼识别能力(97.53%),这开启了汤晓鸥创业的决心。在此之前,受困于数据规模有限和算力不足,学界对能否突破工业红线,即计算机识别准确率高于人眼,并没有十足的把握,用徐立的话说,就像在隧道里摸黑行走,什么时候到达出口,不知道。

  商汤彻底打开了湯晓鸥对隧道外世界的想象力。在一次香港的对谈中,他说,在香港科技园主席的支持下,公司两周就在香港成立了,“过去20年的努力,都是为了这一刻”,面对台下坐着的学生,他感慨道,“都说香港错过了互联网时代,商汤要做的,是引领人工智能时代”。

  徐立自称联合创始人里“最不学术”的那个,他在很多场合说过自己加入的故事。“汤老师找到我,说我们现在做的这些事情不够有power(力量),做商汤有一个目的,形成影响力,然后做更多更大的事情。我听完之后,觉得一个人有长远的想法,能够去改变世界,真的不一样。当时我基本上没有犹豫,就说‘OK,我非常想去。”

  2015年初,汤晓鸥召集深圳和香港两地的商汤员工一起吃饭,迎接农历新年,徐立记得,当时的人连两桌都凑不满,其中还有6位联合创始人。到了3月,算上实习生,整个公司也就30多人。

  那年夏天,汤晓鸥和徐立去美国硅谷参观了几家创业公司。戴娟当时在硅谷所在的旧金山湾区工作,据她回忆,那次硅谷之行,汤晓鸥没有约重量级人物见面,反倒是约了她好多在Facebook工作的研究员、工程师朋友聊天,他好奇他们的企业文化是怎样的,甚至会问Facebook如何布置办公室,厨房长什么样子。“汤老师想知道为什么员工喜欢去Facebook工作。他就是一个研究型的学者,没有做过startup(创业公司),就先看全世界最好的startup都是怎么做的。”

  徐立用“扩招”形容2015年。2014年底获得IDG资本数千万美元的天使轮投资后,商汤开启了“大包大揽”式的人才招聘计划。几位创始人在计算机视觉领域沉浸多年,比谁都清楚人才对一家技术初创公司意味着什么。那时,AlphaGo引爆世界尚未发生,在美国,名校计算机系毕业,最聪明的都去了华尔街,投身金融业,那里意味着稳定、高收入、成功。在香港,徐立的很多同学也去了银行,人才的错配让这位年轻的CEO看到了机会。

  “我们当时就有一个判断,人工智能的战争是人才的战争,而人才是需要培养的,一般要经过3~5年的訓练。于是商汤做了两件事,一是把过去几年行业里做得比较好的人招过来,二是拦住那些刚刚毕业的博士,告诉他们不要去银行了,来这里。”

  扎克伯格说,增长是最重要的,盈利只在第二位。对成立之初的商汤而言,任何事都比不上积累人才重要。为了吸引人才,不惜血本砸钱买显卡,搭建运算平台,然后,请一堆博士过来用,一分钱没赚,净烧钱。有投资人忍不住跟徐立说,“这样下去不行,咱们不是办研究机构,要有项目落地,要回应需求,快速迭代”。徐立内心并不认同,“你想啊,在这个行业有积累,又是Top(最好)的人,我觉得,差不多就一辆巴士,最多了,这些人里有的去了微软、谷歌、Facebook……你如果把剩下的都招进来,那别人要再做同样的事的时候,会发现市场上人才真空了,就不得不从零开始培养。”

  事实上,“赔本招人”的效果比预期更好,有人从微软、谷歌、Facebook回到国内,加入商汤,当然,迎接他们的是体面的收入、公司期权,以及一种与美国科技巨头既相似又不同的创业氛围。

  2015年末,积蓄的能量开始在商业上显现,商汤在多个垂直领域拿单,合作客户不乏中移动这样的大客户,2017年宣布实现正向盈利。

  作为一枚通过了微软4轮面试和苹果公司15轮面试的学霸,戴娟比较过商汤和她的两个老东家。在她看来,微软属于成熟的大公司类型,自上而下作决策;苹果是创业型,自下而上作决策,任何人有一个好的产品想法,都可以找人一起做,在苹果公司,人们常说People follow visionaries(人们愿意追随愿景)。商汤更接近苹果模式,在内部鼓励大家提出各自的想法,再由高层去判断这些想法是否和公司的战略一致。

  戴娟目前负责的教育产品就是“自下而上”决策的典型。起初,汤晓鸥交给她的任务是编写一本人工智能教科书,经过几轮和工程院院长、研究院院长的沟通,戴娟产生了规划教育产品的想法,从教材到配套教具,再到教师培训,团队规模从3个人扩大到了近30人。

  黑羊文化

  《Facebook脸书效应》的作者曾感慨,“当我在他们的办公室里时,我时常觉得,这也许是今天这个星球上最聪明的一批年轻人,1 200个雇员的平均年龄是31岁。”这句话或许同样适用于商汤——公司2 800名员工的平均年龄是29岁。

  我试图弄清这个“人才黑洞”的形成原理,并把这个问题抛给徐立。他不假思索地给出了一个无比正确的答案,“因为我们的愿景,让人工智能引领人类进步,我们要用真正领先的技术重新定义世界……”

  这番回答显然难以令人信服,我第一次在采访中试图打断,“不好意思,我觉得其他一流公司一定也给了他们这样的愿景”。

  “是这样,但关键是你要access(接触)到所谓改变世界的东西,而不只是做一个团队里的一颗螺丝钉。另外,像谷歌模式是一个人揭竿,几个人围成一个小团队,但我们可以用100个人干同一件事,我认为这也是中国人的优势,既有规模,又有体系。我会告诉大家,我们来join(参与)一个big project(大项目),我们要做的是让技术尽快落地,去重新定义大家对世界的认知。”他已经决定要在公司设一面墙,出现在上面的产品,未必是最赚钱的,但一定要是改变了世界的。

  胖头鱼为自己建了一个网站,上面列满了华丽的履历。去年夏天,Facebook邀请他去实习,四个月里,他体会到中美在人工智能发展路径上的差异,和中国相比,美国走得更慢、更稳,中国的前进速度更快,充满试错的可能性。

  他问王晓刚等到毕业后,应该选择出国还是留在商汤,最终决定留下来。就好像当年这位导师一通一个小时的电话就让他下定决心不做金融转而研究计算机视觉一样,他相信王晓刚真的会为他未来的发展考虑,“王老师的优点是他会在给你一个任务之前,替你想这件事你愿不愿意做,他不会把浪费时间的杂事扔给你,比如帮他做个PPT什么的。己所不欲,勿施于人。”

  研究总监石建萍觉得,“汤老师的靠谱带来了‘人才黑洞”。她带领自动驾驶团队在2017年底促成了商汤和本田公司签订了为期5年的战略合作。为此,本田支付了一笔价格不菲的技术专利费用。“自动驾驶团队是一个盈利部门。”这给了石建萍底气。今年初,30岁的她位列MIT TR35,这是《麻省理工科技评论》为找出最有可能改变世界的牛人而设立的奖项,针对35岁以下的青年科技才俊,Google 联合创始人拉里·佩奇(2002年)和谢尔盖·布林(2002年),Linux 之父林纳斯·托瓦兹(1999年),Facebook 创始人马克·扎克伯格(2007年),Yahoo 创始人杨致远(1999年),Apple 设计总监乔纳夫·伊森(1999年)等,都曾是该奖的座上宾。

  “汤老师从90年代开始就一直做计算机视觉,在行业里很出名,你看整个行业的AI公司,这样阅历的创始人非常少,因为本身是一个新的行业,就是一帮志同道合的人一起出来做事情嘛。”

  石建萍记得,刚来商汤时,公司项目并不多,也没有几个客户,各自的工作按技术点,而不是行业线区分,检测、识别、分割、跟踪……“那种感觉和学校的实验室很像,连作息都是一样的。”

  汤晓鸥喜欢和学生待在一起,吃饭、爬山、游艇派对,讲一些学生们喜欢也能get到的笑话,尽管这些笑话在一些商务场合并不太容易获得所有人的共鸣,仍不妨碍他做一个学生心目中的“段子手”的热情。

  这位创始人在学习了很多大公司的文化后,拒绝了“狼性”,“‘群狼过后,寸草不生,我一直不太理解这句话,为什么狼要吃草。我们公司的文化是羊,商汤是很有同情心,很有同理心的公司。但羊也有缺点,比如说羊群效应,因此我们想做不一样的羊——黑羊(Black Sheep),去做别人没有做过的事情,甚至是别人想不到的事情。”汤晓鸥曾列出Facebook、苹果、谷歌发布AR平台的时间(分别为2017年的4月、6月、9月),而商汤切入这一领域的时间为2016年1月,因此他开玩笑将商汤比作“第一个吃苹果的人”。

  在2019年会上,他向所有人推荐了《波西米亚狂想曲》,那是一部讲述皇后乐队从无到有,从疏离到重聚,从低谷到巅峰的电影,四位充满天赋的乐队成员将生命倾注到他们热爱的音乐事业中,在世界摇滚乐历史上留下了伟大的一笔。毫无疑问,这也是汤晓鸥寄托在商汤身上的野心。

周琪

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: