大数据时代 怎样做好数据的确权与合规
- 来源:中国信息化周报 smarty:if $article.tag?>
- 关键字: smarty:/if?>
- 发布时间:2018-04-25 10:48
随着社会的发展,隐私保护问题越来越受重视。所谓隐私保护就是要保护关乎个体隐私的数据。个人隐私数据之所以应该受到保护,就是因为这些数据的滥用有可能对个人造成巨大的财产甚至人身伤害。所谓隐私保护,其实就是对隐私数据的保护。一个最理想的情况是,能够在产权层面,确立相关个人作为隐私数据的合法的唯一拥有者。
数据治理规则
这就需要一个法律基础:对数据产权(包括但不局限于隐私数据)的确定,也就是数据确权。如果暂时做不到数据确权,那么至少要做到,对隐私数据实际控制者的行为要严加管束,做到合法合规。要避免,因为数据资产的错误使用,造成不必要的损失。因此,相关的数据治理规则非常重要,主要关注几个方面。
第一,数据确权。数据一旦成为资产,就一定有产权方,或者实际控制人,可以把他们统称为主人。请问:数据资产的主人到底是谁?如同实物资产一样,如果一不小心,错用了别人的资产,可能会产生严重的法律后果。对于实物资产,确权似乎不是一个问题。因为,无论是桌椅板凳,还是电脑打印机,它们在产权层面是非常明晰的。制造商独立制造了这些产品,整个制造过程跟消费者无关,制造商独享产权。制造完成后,消费者通过付费,获得了这些实物资产的产权。但是,数据的生产过程太不一样了。以电商为例,大量的消费者数据被电商平台所掌控(例如:消费者的个人信息、购物信息等),电商平台事实上在经常使用这些数据为自己的业务服务(例如,支撑电商平台自己的个性化推荐)。但是,这些数据资产的生产过程,可不是电商平台自己能够完成的。电商平台提供了“平台”,在这个平台上,消费者通过注册、浏览、订阅、购买、评论等一系列行为生产了相关的数据。因此,整个数据资产的生产过程,既有电商平台的贡献(在线场景、软硬件环境),也有消费者的贡献(注册、浏览、订阅、购买、评论)。这样的数据资产,其产权归属如何确定,其控制权应该如何治理?
第二,数据采集。大量的数据采集来自实践,但相应的数据采集过程是否合法合规?有几个基本的原则可供参考。第一个原则是“合法正当原则”。显然,非法采集的数据,通过不正当途径获得的数据,是不能采用的。第二个原则是“知情同意原则”。数据作为一种电子化记录,大量记录了关乎个人隐私(例如,姓名、手机号、身份证)或者商业机密(股权结构)的信息,因此非常敏感。采集如此敏感的信息,被采集方充分的知情、同意,并且授权,是必不可少的先决条件。第三个原则是“必要性原则”。由于数据可能涉及个人隐私或者商业机密等敏感信息,因此,数据采集应该遵循越少越好的原则。例如,一个电商平台的APP,采集用户的姓名、银行卡、手机号、地址等信息,非常必要。否则,无法完成在线支付、线下快递等必要业务。但是,如果该APP同时采集你的社交圈信息,还要看你的电话簿记录,这似乎就违背了数据采集的必要性原则。
第三,使用场景。即使企业对数据拥有100%的产权,或者合法合规的实际控制权,也不能对数据不分场景地任意使用。由于数据记录了大量关乎机构或者个人的敏感信息,因此数据资产的使用场景,要慎之又慎!因此,数据治理的一个重要工作就是定义数据的使用场景。什么样的数据,可以应用于什么场景?谁来使用?使用的前提条件?都需要认真思考,需要必要的规章制度。
第四,使用手段。接下来应该关注的是数据的使用手段。即使企业对于数据拥有了100%的产权,也确定了一个合法合规的使用场景,也要对数据的使用手段非常谨慎。因为数据记录了敏感信息,因此对数据的每次加工使用,都有泄密的风险。
第五,数据安全。由于大量数据关乎个人隐私、商业机密,因此数据安全是一个非常重要的问题。现实生活中的数据泄露比比皆是。我自己的经验是,只要孩子参加了一个课外培训班,其他同行培训机构就会跟上来。曾几何时,有租房经验的朋友也知道,只要在任何一个房地产中介留下过租房信息,很快就有更多的中介找上门来。我们的个人手机号码,如此重要的个人数据,是如何泄露的?数据安全是整个数据产业正在面临的重大问题。数据安全的保障需要必要的软件和硬件。但是,最需要的是一个合理的数据治理制度。该制度应该对数据从产生、使用、到消亡的整个链条进行严格治理。具体内容包括但不局限于:存储安全管理、用户匿名化、访问权限管理等。
价值创造与人才培养
数据资产作为一种资产的必要条件是产生可预期的经济收益,或者商业价值。但是,如何才能让数据资产创造出最大的商业价值,相应的制度保障又是什么?
孤立而纯粹的数据没有价值,哪怕是聚合在统一的数据平台上的数据资产也没有价值。数据价值的彰显必须依赖于具体的、带有不确定性的业务场景。为此,企业需要:一是寻找带有不确定性的业务场景,因为只有“不确定性”这个乱世,才有成就“价值”这个英雄的机会;二是将该业务问题转化成为一个,关于Y(因变量)和X(自变量)的数据可分析问题。从此,抽象的业务问题,变成了具体的数据分析技术问题。这是数据资产价值创造的基本套路。为此,企业的经营管理团队,都需要有数据思维的能力,尤其需要有回归分析的思想。如果业务团队缺乏数据思维能力,就无法把错综复杂的业务问题,转换成为技术团队擅长的数据可分析问题;如果技术团队缺乏数据思维能力,就无法准确理解业务需求,无法设计正确的数据产品;如果企业中层缺乏数据思维能力,朴素的数据价值观就无法在企业内部树立,回归分析标准的YX语言就难以普及;如果企业高层缺乏数据思维能力,就无法从战略的高度,理解数据资产的商业价值,将失去开拓优质数据业务战略新方向的能力,并造成企业价值在资本市场的低估。
由此可见,数据资产价值创造,是企业全员团队的事情。需要企业各个岗位的员工、管理者都深谙数据商业价值之道,并在各自的业务实践中,自觉甚至自觉地寻找可以彰显数据价值的业务机会。为此,企业需要全员的,以回归分析思想为核心的数据思维能力。由此可见,价值创造的过程,本质上是一个数据思维培养的过程,是一个全员人才培养的过程。为此,一方面需要对现有人员的数据思维能力做全面的培养提升,另一方面可以考虑在各个核心骨干的业务部门设立专门的岗位。该岗位人员的主要职责不是业务,不是数据,更不是技术,而是应该承担链接业务与数据的桥梁作用。为此,相关人员需要对业务、数据、技术都有足够的了解。对专业深度要求低一些,但是专业广度要求更高,而这样的人才就是商业分析人才。
由此可见,对数据资产的价值创造而言,数据治理应该关注的不是太过具体的业务问题。真实的商业环境千变万化,带有极强的不确定性,不可能通过一成不变的规章制度去治理。以银行业金融机构为例,站在任何一个时间点,都无法绝对准确预测,未来的商业形态会怎样?业务内容会怎样?相应的数据分析会怎样?因此,作为一个纲领性的制度设计,数据治理不应该过分关注具体业务问题。相反,应该关注人才团队的建立与培养,这才是价值创造的沃土。由于商业环境的变迁,业务形态的变化,数据价值的多样性,人们对于这片沃土上会结出什么花朵,什么果实,并不确定。但是,只要精通数据思维的人才沃土在,就一定会开出鲜艳的花朵,结出丰硕的果实。因此,培养人才,培养具备数据思维能力的人才,培养企业从上到下精通回归分析思想的人才,并为此提供科学的制度保障,这才是数据资产治理在价值创造这方面应该关注的重点。
北京大学光华管理学院商务统计与经济计量系教授 王汉生