利用区块链技术健全大数据价值流通体系
- 来源:中国信息化周报 smarty:if $article.tag?>
- 关键字: smarty:/if?>
- 发布时间:2017-09-21 10:29
数据资源是大数据产业发展的关键基础,作为大数据时代重要的生产要素和战略资产,其价值体现以数据开放和流通为前提。然而,目前数据资源在流通过程中遇到的权益体系与监管体系不完善、分级分类机制缺失,以及安全可靠保障体系不健全等问题,制约了大数据产业的健康发展。区块链作为一种新兴的信息技术,在金融、能源、农业等多个领域已被证实具有广阔的应用潜力,其去中心化、集体维护、数据不可篡改与伪造等特性,使其成为破解数据流通难题的有效工具。如何推动区块链与大数据协同发展值得深入探索与研究。
大数据价值流通过程中的突出问题
■基于数据确权的权益体系亟待建成
数据确权是指对数据的所有权、占有权、使用权、受益权和他项权利的确认、确定,是构建数据权益体系的基础与核心。一个国家对本国数据资源的控制是维护数据资产利益的关键,各国都高度重视对数据主权的保护。以美国为代表的西方国家利用技术优势实施数据霸权,通过服务全球变相收集、汇聚网络数据,威胁其他国家的数据资源所有权。我国由于基础核心技术支撑能力较弱,数据跨境流动保护等规则缺失,无法对数据资源在网络空间的传播过程实现有效监督管理,数据主权的确认及维护面临巨大挑战。同时,数据权益体系的不健全也极大阻碍了价值数据的流通,为我国数据开放、交易和隐私保护带来诸多困难。以数据交易为例,由于数据确权机制不完善,北京、上海、贵州等地大数据交易平台的数据开放进程缓慢、供需不对称,严重影响了数据的成交率与成交额。我国亟须运用网络新技术完善数据流通过程中的确权功能,同时提升维护数据主权的技术能力,避免丧失国家的信息主导权。
■面向数据资源综合管理的分级分类机制存在空白
数据分级分类管理,是指对用户数据资源按照内容属性、价值层次和重要性进行级别和类型的确定,旨在明确各类数据的使用范围与方式,并依据各类信息的价值和安全风险实施不同程度的管理和保护。实行数据分级分类管理,不仅有助于从国家层面加强对政府部门数据的统筹管理,提升政府数据共享、开放的标准化程度,从而更快地推进政府数据共享和公共数据开放工作,也有助于数据管理机构或平台制定数据流通规则,促进各行业数据的交易与交换。我国在《促进大数据发展行动纲要》中提出,在“2020年底前,要逐步实现信用、交通、医疗、卫生等民生保障服务相关领域的政府数据集向社会开放”。然而,就目前来看,我国分级分类管理体系的不健全导致数据授权机制迟迟未能建立,政府数据的开放共享进程异常缓慢,甚至引发了一系列的信息泄露案件。
■数据追溯等监管手段有待改进
数据追溯是实现大数据监管的重要功能,也是明确数据所有权的基本手段之一,依赖于数据流通路径的确定。数量巨大、来源分散、格式多样的大数据对政府监管能力是一种新挑战,若能实现对网络数据流经过程的全记录,将极大丰富对网络数据的监管功能,并为数据资源的综合管理与网络违法案件的查处提供新手段。《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》指出,利用信息技术建立产品质量追溯体系,对食品、药品、农产品等关系人民群众生命财产安全的重要产品数据形成来源可查、去向可追、责任可究的信息链条,有助于监管部门监管和社会公众查询。目前,对网络数据的非法收集、窃取、贩卖和利用行为日渐猖獗,并已形成规模巨大的黑色地下产业链。通过对数据流通路径的全记录,可在第一时间确定犯罪嫌疑人,掌握犯罪记录,推动构建形成安全有序的网络空间。
■数据资源的防丢失和防篡改功能仍不健全
防丢失、防篡改是构建数据资源安全保障体系的重要环节,直接影响着数据的真实性、可靠性及完整性。当前,政府、金融、互联网等重要领域和行业的信息基础设施承载着大量的业务数据和用户数据,保证关键数据免遭非法篡改与利用成为大数据健康发展的重要基础和关键保障。然而,实际状况却令人担忧。一方面是价值数据易丢失、易被篡改或破坏的特点依然突出,另一方面是各行业领域网络频遭黑客攻击,导致互联网平台数据被篡改和丢失事件时有发生,从而给互联网和大数据发展带来恶劣影响。比如,携程等互联网企业部分服务器数据库的备份数据曾遭物理删除;有个别地方环保部门非法篡改环境监测数据以掩盖污染事实;还有个别教育考试院工作人员篡改考试成绩数据记录等。诸如此类的案件不同程度地影响了各行业数据的真实和完整性,不利于促进数据时代经济社会的健康发展。
总体上,我国大数据安全可靠的保障体系尚不健全,重要数据资源的防丢失和防篡改能力亟待加强。
区块链是健全数据价值流通体系的有效技术保障
■共识机制推动大数据权益体系建立
在基于去中心化的分布式对等网络中,所有节点均拥有数据保存以及获取区块构建能力的权利与机会,为区块链技术赋予了强大的共识机制。这种共识机制保证了区块链体系中各个节点对区块构建及其发展的认可。基于共识机制,在数据资源产生或流通之前,将确权信息和数据资源有效绑定并登记存储,使全网节点可同时验证确权信息的有效性,并以此明确数据资产的权利所属人。通过数据确权建立全新的、可信赖的大数据权益体系,为数据交易、公共数据开放、个人数据保护提供技术支撑,同时为维护数据主权提供有力保障。对于数据资产的确权,区块链技术已经被证实是一种存储永久性价值数据的理想解决方案,目前在真实性验证、土地所有权、股权交易等场景中已得到应用。“小蚁”系统正在尝试构建基于区块链的公司股权登记系统,使区块链成为公司的股东名册以及持股信息的合法记载场所。
■全记录的区块数据可为数据监督与管理提供新手段
区块链技术本质上是一个不可篡改的、全历史的分布式数据库。在比特币等典型的区块链数据结构中,巨大的区块数据集合包含了每一笔数据交易的全部历史,能够实现对数据资源流转的全生命周期记录。该特性使得区块链技术能够实现对数据交易过程的可追溯,从而为数据在流通过程中的监管提供便利,为政府和行业部门治理非法数据使用和交易提供有效手段。区块链公司R3宣布与Axoni公司、瑞士信贷公司、联博(AB)公司,以及汇丰银行等7家公司合作,共同建立以区块链技术为支撑的高效自动化信息处理系统,用以追溯金融业不清晰、不准确的参考数据,保证金融市场的良好运营。
■加密技术和存储方式提升了数据安全保障能力
区块链技术要求系统内所有节点对已验证的数据进行存储备份。数据存储采用非对称加密算法,一方面可保证数据经过脱敏处理后才能流通,有利于突破信息孤岛,另一方面能够辨识任何改动数据的行为,使区块链数据具有不可篡改性。信息一旦经过验证并添加到区块链上,就会被所有系统节点存储,只有同时控制整个系统中超过51%的节点,才有可能对已记录的数据进行修改或删除,这就极大地提高了面向价值数据资源进行网络攻击的难度。
与此同时,如果将非对称加密算法与数据的分级分类机制有机结合,就能为网络空间数据管理带来新手段。基于区块链的比特币自2009年诞生以来不断发展壮大,当前总市值已超过100亿美元,其系统的稳定性正是依赖于强大的安全保障机制。剑桥大学博士兼研究员Greg Irving在药物开发和测试过程中,利用区块链的不可篡改性创造了一个区块链系统,防止制药公司和研究人员修改真实试验协议,从而保证了临床试验数据的安全可靠。
赛迪研究院 刘倩 蒲松涛 潘文