视频检索技术:安防大数据市场新贵
- 来源:中国信息化周报 smarty:if $article.tag?>
- 关键字:安防,信息化,管理系统 smarty:/if?>
- 发布时间:2015-07-14 11:51
伴随着计算机技术和网络技术的发展,视频检索技术已经广泛应用在视频点播、数字电视、数字图书馆、远程教育和远程医疗等领域。
视频检索主要是依赖于视频算法对视频进行预处理,通过对视频内容进行结构化处理,提取出视频内容中的有效信息,进行标记或者相关处理后,就可以通过各种属性描述进行快速检索。
因此视频检索最主要的是利用视频检测算法对视频进行结构化描述。目前已经在相应的产品中得到应用的算法主要有以下几种:行为分析算法、车牌识别算法、车辆颜色识别算法、车标识别算法、车型识别算法、人脸检测识别算法、人体特征识别算法等。其中人体特征识别又包括人的年龄、性别、身高、衣服颜色、是否戴眼镜等特征信息的识别。
视频检索
新型安防数据的分析管理
在安防领域,各地平安城市、智慧城市的建设和公共安全领域的信息化建设的推进,都产生了大量监控视频数据,伴随着高清化、智能化的安防行业发展趋势,视频数据的数量正在呈指数级地增长。然而,视频数据却又不同于安防领域的其他传统的信息数据。以往的传统信息,经过多年数据库技术的发展,已经形成了一套完善的基于信息管理系统的管理平台,可以快速准确地对所关心的数据进行检索查询,例如人口信息管理系统、报警平台、车辆管理系统等。
而视频数据目前还没有这样有效的管理系统,还不能对确实存在的数据进行方便快速的查询和使用,视频检索技术的发展就是希望能解决这样的问题。在安防领域,视频检索技术主要应用在图像侦查方面,视频数据对案件侦破的作用,也促使图侦成为一个规模很大的新的警种。视频检索的具体应用主要包括视频浓缩和特征检索,而特征检索通常需要智能分析和图像增强技术的支持。
监控视频数据所蕴含的信息密度很低,针对某一具体需求,24小时的视频数据中有用的数据也许只有几秒钟,而这几秒的数据,它的信息价值却很高。
视频浓缩技术就是用来有效提高视频数据的信息密度的,它会将视频的运动目标从背景中分离出来,然后按照时间先后和位置关系集中叠加在背景中形成新的视频,这样既能最大程度地保留环境信息,同时在时间和空间上压缩无用信息。特征检索技术是指对视频内容中目标的特征进行标记索引,然后通过对特征的描述或样图显示的特征对视频进行搜索,找出符合特征的视频片段,快速从中获取更多信息,提升效率,节省人力成本。
应用与现状
初见成效 亟待完善
我国很多的安防企业或相关机构都陆续推出了自己的视频检索系统,具体工作过程和原理都类似,第一步是对需要检索的视频数据进行采集和集中存储,以供视频检索系统快速调用,有些厂家研发了专门的设备,这些设备对硬盘里的视频数据进行快速拷贝来提高采集速度;第二步则是正式进行视频检索,其一是对数据进行浓缩摘要,浓缩后的视频数据提供给侦办人员进行人工排查,也可以用于特征检索;其二是通过用户提供的特征对视频数据进行检索。
办案人员可以通过查看浓缩视频,极大地节省排查视频的时间,当在浓缩视频中发现可疑目标时,可以通过点击视频上的目标快速打开对应的原始视频片断,进行详细查看。办案人员可以进一步通过所提供目标特征,例如人或车,目标颜色、高度、运动方向、运动速度,行人着装、步态,或者通过提供一幅样片来发起搜索。视频检索系统,首先通过高效的解码器将未解码的视频数据解码,然后通过背景建模算法分离提取出运动的目标,而后通过智能分析算法对这些运动目标的被关注特征进行提取和分析,将分析结果恰当描述,存放到数据库,与被请求搜索的特征进行比对,最后,高相关度的目标会以快照或其他方式作为结果显示出来,并可以快速定位到原始视频片段。
还有些厂商将一些运动目标的基本特征,例如目标类别、颜色、速度等信息在视频录制时就实时地进行分析,并通过这些特征对视频内容进行索引,存放在自己的设备中。这样,在需要进行特征检索的时候,只需要将用户提供的特征与视频内容的索引信息进行比对就可以定位到相关视频片段,而不需要对视频再次进行处理分析,可以有效节省分析时间。但目前不同厂商的视频内容索引和描述的标准都不尽相同,这样就会产生不同厂商之间的系统的对接和视频内容索引的共享问题,无法充分发挥系统的作用。MPEG-7标准化了对音视频特征的描述,对该问题给出了解决的指导方向,还需要针对安防视频数据的特点进一步规范和标准化。
目前我国正在应用的视频检索系统,还只能对目标的一些基本的特征进行索引和检索,当下的视频检索系统并不能完成“找到一个拿着iPhone6的女孩”这样的任务,因为受到分辨率、清晰度和视频角度等多重因素的影响,我们无法分辨出手机的型号,也不知道目标对象手上到底有没有东西;我们甚至无法判断这个目标对象是个男孩还是女孩,因为在这个流行因素快速变化的时代,一些影视作品里所表现出的令人感叹的智能分析效果,只能是为研究者提供一些研究思路和方向。
除了能对前文提到的一些目标的基本特征进行检索外,目前我们能做到的是对车量牌照信息的检索,这主要得益于车牌识别相关技术的成熟和智能交通系统的建设。
对于像人脸识别这样的任务,对于一般的监控视频,即便是高清卡口,也很难做到较高的准确率,还是要结合人工比对才能真正发挥作用,人眼可以准确分辨和识别的目标,视频检索系统却不一定能做到。达到人眼的分辨能力是目前机器视觉领域的最高境界和终极目标,所以视频检索还有相当长的路要走。看到有些产品的隐性宣传中表示,视频中的嫌疑人换了衣服、戴了帽子、更换交通工具,检索系统还能准确检索到目标,这实在令人深表怀疑。
以下所述是一个真实的案例,这也是目前视频检索技术在我国安防领域最常规的应用模式。
2013年4月,某地发生重大蒙面抢劫案件,经过专案组人员分析,认为是一起精心准备和预谋的案件,嫌疑人可能事先多次勘察过犯罪现场。为了尽快破案,当地公安局图侦大队调取了案发现场周边一周的各类监控录像,包括交通监控录像、治安监控录像和附近店铺的自有监控录像,总时长超过2000小时,希望能从中找出可疑目标,提供破案线索。
按传统的方式,几名警官同时查看视频,也需要几天的时间,通过视频浓缩技术,一名警官数小时内就能排查完视频中的可疑人员或车辆,同一名刑侦人员完成排查后会对画面中可疑人员的重复出现率更加敏感,即节省了排查时间,又降低了遗漏的概率。当过滤出可疑车辆时,通过车牌识别信息,在系统中形成车辆的行驶轨迹,给布控方案提供参考,通过车辆的行动规律,定位到了车辆长时间停留的区域,可能是嫌疑人的暂住地,再调用该区域周边的视频进行摘要排查,结合案发现场的可疑目标比对,最终锁定了嫌疑人员。
本报记者 冯霄霞