在明略数据副总裁唐日新看来,从事公安大数据的研究和应用工作是一件很辛苦的事情。之所以这样说,一方面是因为这项工作没有前人的经验可供借鉴,完全是摸着石头过河;另一方面是因为这项工作涉及到社会及人的生命财产安全,所以要求极其精准的数据服务,不能出现丝毫的冗余度。俗话说“越困难的事情就越值得去做,因为做成了会很有成就感。”目前,明略数据以及唐日新正在这样一条攻坚克难的路上踽踽而行。
如今,随着公安信息化建设的迅猛发展,公安大数据的建设和应用工作也得到了长足进步。大数据时代,公共安全部门可以通过全面采集和整合海量数据,对数据进行处理、分析、挖掘,从而发现数据的内在规律,进而为预防和打击犯罪提供强有力的支撑。
不过,做好这项工作既需要解决不同部门之间的数据孤岛,又需要高效、稳定的公安大数据平台提供保障。完成如此复杂、技术难度大的工作仅仅依靠公共安全部门本身自然不太现实,这时候就需要像明略数据这样的企业从顶层设计、平台搭建以及底层架构建设等方面为公共安全部门提供高效服务。
SCOPA系统让数据更加可视化
采访中,唐日新提到“实时、实战”是明略数据从事公安大数据研究与应用的宗旨和理念。而为了应对实战要求,明略数据也在不断完善着自身大数据的技术能力和应用范围。目前,结合具体的实战经验,明略数据可以为公共安全部门提供安全可靠、高效易用的大数据平台MDP和大数据关联关系挖掘系统SCOPA。
MDP平台解决的是公共安全部门使用大数据技术时出现的网络、主机、服务和数据安全问题。同时,还能够根据业务模型、支撑数据的不断丰富以及数据挖掘模型的不断优化,从而实现数据的可视化展现,为公共安全部门在社会管理、维稳处突、警务协同等方面提供优化的决策依据。
有了基础的大数据平台和数据化展现,数据的关联关系挖掘就显得至关重要。这个时候,SCOPA系统就派上了用场。SCOPA系统基于军工级安全的存储和尖端的运算能力、图形数据库技术和大量的预测模型和战法,能够对全量数据进行秒级运算的关联关系挖掘。最重要的是,运算的结果能够通过交互可视化方式,帮助公共安全部门快速厘清各种数据背后的复杂关系,从而为部门决策采取进一步行动提供有效的指导。
唐日新表示,其实最早的时候公共数据安全领域解决的是数据汇聚存储的问题,所以需要建设大规模的数据平台,而在平台建设过程中应该从应用部署总体架构方面去分析,也就是说平台建设要服务于顶层设计和应用愿景。
建设立体、全息的知识图谱
“由于明略本身拥有大量的社会数据,再结合公安内部的数据可以去搭建全息的知识图谱。我们希望在未来编织成一张立体的、全方位的、底层的知识图谱,这个知识图谱不光包括人、事件,还要包括其他各方面因素。”唐日新如此说道。
公安内部的数据来自于全国公安机关已建成的包括全国人口基本信息资源库、全国在逃人员信息资源库、全国出入境人员信息资源库在内的八大资源库和警综平台库等数十个内部系统库。而随着库内数据信息的持续增长,公共安全部门急需对现有信息和资源进行进一步深度挖掘和应用,并利用高效的数据治理方法整合打通数据之间的关联,根据案件发生规律和特点,挖掘数据之间的隐性关联,为案件的研判打好坚实基础。
从另一层面来讲,这种数据的关联关系挖掘需要建立合适的关系人分析、轨迹分析、案件分析等基础战法,同时要研究分析各类业务的规律特征,例如作案手法、作案人员、活动轨迹等,逐步积累业务规律与技战法,从而不断完善业务模型库和知识库。
基于立体、全息的知识图谱,可以让机器变得更加智慧化和智能化,从而形成智慧的“警察大脑”,做到更精准的预测和预警。
强化数据智能化管控和处理能力
唐日新提到,作为所有做数据工作的人来说,智能化的数据管控和处理能力是一个重要的痛点。之所以这样说,是因为预测结果与实际情况不相符的情况是所有数据服务提供商所面临的共同压力。
为了应对这个挑战就要在应用战法方面不断完善,同时需要在应用过程中不断进行机器学习和深度学习的技术迭代,从而通过更加智能化的数据处理能力提升数据预测和判断的准确性。
与此同时,这项工作与智慧警务的建设也是密切相关的。要做好这项工作,就需要一个聪明的“大脑”,而这个“大脑”,按照唐日新的理解,就是一个引擎或者发动机。如果这个引擎的效率不高,那么要想去挖掘大量人口的出行、交通、住宿以及社交等信息,就会变得很困难。
本报记者 路沙
……
关注读览天下微信,
100万篇深度好文,
等你来看……