格灵深瞳
- 来源:快公司 smarty:if $article.tag?>
- 关键字:格灵深瞳,美剧,Photoshop smarty:/if?>
- 发布时间:2015-03-09 09:32
让计算机看懂世界
“你在被监视着——政府有一套秘密系统,一台每时每刻都在监视你的机器。我会知道,因为它是我造的。我设计这台机器是为了侦测恐怖行动,但它却看到了一切。”美剧《疑犯追踪》的片头以男主角哈罗德·芬奇(Harold Finch)的这段旁白开始。
在片中这台机器从无处不在的监控中观察、学习,预先识别出可能的犯罪迹象,其“无所不能”的程度让人不禁后背发凉。但现实中,眼下的安防监控却远未能达到如此的智能程度。
虽然摄像头安装得越来越多,但目前常见的监控场景是工作人员面对着一块大屏幕坐着,屏幕被切分为N个小格对应不同的摄像头,即便投入100%的专注,也难免有疏漏。当然,市场上有许多“智能视频分析”公司,“这是一个存在超过10年的行业,但现阶段的智能监控和你用Photoshop抠图没什么区别——通过像素颜色的不一样判断这是否是一个人,这要求背景干净空旷,而且它只能判断出此物体在移动。”格灵深瞳公司联合创始人兼CEO何搏飞说。格灵深瞳致力于让计算机可以看懂这个世界,从彻底变革安防监控市场开始。
这家成立于去年的创业公司坐落于颐和园西边的一个古典四合院,园中垂柳池塘,好似一处观光之地。走入办公室,左侧整面墙是伦敦的街景,“因为伦敦是全世界安防监控摄像头最密集的一个城市,对智能监控的需求非常强”,何搏飞解释道。
去年秋天,决心创业的何搏飞与前谷歌研究院资深研究员、计算机视觉领域专家赵勇讨论公司方向,“赵勇列了80多个该技术可以应用的方向”,何搏飞笑道,“但我们作为一家创业公司,开始必须要专注。”于是他问若想让格灵深瞳成为计算机视觉方面全世界最好的公司,或者说要让计算机拥有无限接近于人的视觉感知能力,需要什么?赵勇的回答是海量数据,就如同谷歌的搜索引擎,系统处理的搜索次数越多,结果便越精确。哪个领域需要大规模的计算机之眼时刻运作?答案毋庸置疑。
在何搏飞眼中,这是一个规模大、痛点强的行业,尤其近些年来恶性事件频出,已有的系统识别能力有限、误报率高,“安防监控的痛点已经到了我们跟客户一讲在做什么事情的时候,对方都是迫不及待地想马上购买、马上使用的地步。”
现有的智能监控在空旷的背景中数多少人经过了某一处可以,但要是早上八点北京的地铁站呢?与普通的RGB摄像头不同,格灵深瞳使用RGB-D摄像头,能以激光实时地扫描三维空间,“即使在人头涌动的地铁站里,我们也能对所有人行动的轨迹和速度进行非常精确的跟踪,我们的准确率可以做到99%”。
何搏飞举了一个例子来说明格灵深瞳如何感知三维空间的变化:常有关于骗子在银行ATM机上安装微型摄像头和读卡器的报道,民众肉眼很难发觉,取款时其银行卡信息便被盗取了。而格灵深瞳的设备在不法分子安装读卡器后便能感知到原本的三维空间发生了细微变化,随即自动报警。
哪些是危险的、需要报警的行为,哪些是正常的变动,让机器去辨别不同的模式是基于深度学习技术。“中国人抢着买单的推搡行为有时在外国人眼里都难免被视作是打架,如何提高机器识别的准确率?这需要我们的系统有自主学习的能力,就是说将我们的系统安装在某环境里,测试一段时间后它就能辨别不同的行为。”
机器能自动识别特定行为——可能是机器自主学习或系统使用者预先设定的——好处显而易见,比如一位女生深夜走在街上发现身后有可疑人物越走越近,当她大幅度地向着监控摄像头摆臂,机器便会自动报警,无需掏手机、拨110、沟通所在位置。
另一方面,若要“倒带”去搜寻监控视频中某个特定事件的发生时刻在目前来说难度相当大。“过去的安防监控只有一个维度:时间”,何搏飞常举一个例子,“天安门每天产生的监控数据刻录成光盘比埃菲尔铁塔都高,要找某一位可疑人物在某段时间内的特定行为,怎么找?”不需要倒回去睁大双眼盯着屏幕看,格灵深瞳的技术可以设定特定三维区域,“在零点几秒后将相关的画面调出来。”
机器识别出异常的情况后,最后如何做决定还是取决于人,何搏飞强调道,“未来很长时间内该系统都不能完全取代人,最重要的决定我们还是希望由人来做,但我们的系统会极大程度地提升效率与准确度。”
前端传感器采集到的是三维数据,格灵深瞳摄设备中的处理器则将所有数据本地处理,“电脑看懂了三维数据后,传到硬盘上录下来的还是普通给人看的视频。我们将三维数据结构化,抓取的是特征,比如一个人走路的步频、步幅、摆臂姿势等。”
目前格灵深瞳已与四大国有银行中的三家签订协议,售前测试在进行中。“安防是我们最先应用自身技术的领域,它规模大到足以像搜索引擎之于谷歌一样让格灵深瞳在行业里生根,并让格灵深瞳成为一家谷歌量级的公司。而且,让老百姓生活更加安全,是非常有意义的。”何搏飞信心满满,但同时,格灵深瞳从一开始就未将自己定义为一家做安防监控的公司。坐拥数据富矿,何搏飞想到了自己熟悉的领域:零售。
安防监控数据有一定的敏感性,但零售业,尤其是西方成熟市场,热爱数据且付费意愿强烈。何搏飞透露早已接触过美国的一些零售商,探讨在其货架上安装摄像头,对消费者行为进行实时记录与分析。“关于隐私问题,我们不关注你是谁,我们只关心发生了什么,比如多少人停下、看了多久、转换率等趋势性的数据。”
此外,车,也在格灵深瞳的视野中。“未来的终极目标是无人驾驶系统,短期目标应该是驾驶辅助系统。我认为现在世界上离机器人概念最近的、需求明确且大量普及的东西就是汽车,通过计算机视觉让车看懂路面上发生了什么,怎么开,这会对人类生活产生重大影响。”
作为一家目前总员工数为三十余人的创业公司,格灵深瞳步伐飞快。明年初,格灵深瞳将在美国硅谷成立一个计算机视觉应用实验室,搜罗顶级人才;由于深度传感器的整个产业链在以色列,格灵深瞳有意收购一家以色列公司,而后在特拉维夫成立一间计算机视觉硬件的实验室。“我们想尝试走不太一样的国际化道路,从一开始就结合全球化的人才、资源、市场。”
