大数据应用中的个人信息利用问题研究

  • 来源:网络空间安全
  • 关键字:个人信息,大数据,问题
  • 发布时间:2019-02-01 11:42

  摘要:随着数据数量的日益激增和其内容形式的日益多样化和复杂化以及数据处理及分析技术的新发展,开展大数据应用已成为全球共识。由于其中大量业务是面向公众的,因此个人信息的利用是必不可少的。论文分析了大数据应用中个人信息出现的新特点,并提出了个人信息利用中存在的几个亟待解决的关键问题,明确了大数据应用中个人信息利用的风险,并作出了警示。

  关键词:个人信息;大数据;问题

  中图分类号:TP309 文献标识码:A

  1 引言

  随着数据的数量激增和内容形式的复杂化以及技术的进一步发展,全球开始步入大数据时代,数据支持社会运转的能力得到了广泛的认可。各行各业都开始引入大数据思维,其应用遍布公共服务、文化、教育、经济、医疗等行业,影响到了公民生活中的方方面面。其中机构开展面向个人的服务时,无法避免的会对大数据中的个人信息开展利用。然而,个人信息的特殊性质,使得其利用成为了高风险的活动,利用不当很可能会侵犯到个人或集体的合法权益,一旦发生泄漏、滥用等恶性事件,会对当事人造成不同程度的经济、精神及人身损失。因此明确大数据应用中个人信息利用存在的问题对于保障个人信息的利用具有重要的作用。

  2 研究背景

  2.1 相关概念界定

  本节主要对大数据与个人信息两个核心概念进行了界定。大数据的概念最早从国外传入,其原英文词汇为“big data”,早期主要只强调数据体量大,而后逐渐转变为现在常用的大数据概念。关于大数据的定义,目前学术界并没有一个统一的定义,通过对现有代表性定义的分析,可得出当前对大数据的定义绝大部分都是通过描述其数据特征进行界定。Ylijoki与Porras分析了62个大数据定义中所描述的特征,发现规模性(volume)、多样性(variety)、高速性(velocity)、价值性(value)与真实性(veracity)五个维度就是目前大数据定义中特征界定的主流方向,如图1所示。

  个人信息的界定主要参照了国内外的法律与标准,其对个人信息的定义大致是从两种角度出发,一为强调信息可识别个人,二为强调信息属于可识别或已识别个人。两种定义虽然角度不同,但本质其实是相同的,都强调了个人信息可识别性这一特征。

  2.2 大数据应用中的个人信息利用的现状

  政府、企业等大数据应用者有很大部分业务都是面向公民的,因此其中对个人信息的利用必不可少。通过从各类个人数据中获取有价值的信息,并挖掘出用户的需求和喜好,对用户的需求进行多维度多层次的划分,可面向用户需求以更加灵活的方式和更加丰富的内容提供精准化、个性化的服务与推荐。然而,由于个人信息涉及到公民,一旦发生泄漏、滥用等恶性事件,会对当事人造成不同程度的经济、精神及人身损失。近年来我国个人信息犯罪事件逐年增多,性质也越发恶劣,都说明个人信息利用存在着巨大的风险。

  3 大数据应用中的个人信息利用新特点

  大数据的属性特征为个人信息的获取提供了极大的方便,也使得个人信息问题更加普遍,大数据应用中所利用的个人信息来源更加广泛,价值更高,受到侵害的几率也更高。

  3.1 个人信息的获取更加容易

  大数据环境使得个人信息的收集范围更加广泛,方法更加便捷,手段更加多样化,任何互联网利用者都能够轻易获取他人个人信息。

  一方面,个人信息的来源有了飞速增长。大数据中的个人信息也具有大数据特征,这使得个人信息的数量增多、格式多样、产生速度也十分迅速。首先,个人信息主体都有发布信息的渠道,主动发布自身个人信息的个人信息主体增加。其次,个人信息主体在社交网络上分享个人意见、享受服务、佩戴可移动设备等行为都会创造个人信息,并主动或被动披露在各种平台上。

  另一方面,个人信息的获取方式发生变化。人工收集方式被新型技术采集方式取代,信息的收集扩展到了收集社交网络、传感器、随身电子设备等实时活动数据流。此外,当需要收集某些数据的时候,既可以向数据主体直接收集,也可以利用新技术手段直接从网络及数据库中寻找,信息收集的主动性更强。

  3.2 个人信息的价值增大

  信息收集者利用大数据分析对分散于各个角落的个人信息进行整合,建立关联关系并形成完整的信息,从中挖掘出具有价值的信息,再加以利用。通过这种关联分析对分散的个人信息进行整合,数据主体的属性特征,例如个人背景、特征、习惯、行为也逐渐浮出水面,原本毫无价值的信息碎片的价值也不断提升,也越来越受到重视。此外,大数据环境中个人信息的价值不再仅停留于其基本用途,而要依靠其二次利用,信息不同于物质性的东西,每当被使用分析都会增加一层价值,随着利用过程不断地发现信息的新价值及新应用。

  3.3 隐私更易于受到侵害

  大数据技术降低了隐私受到侵害的门槛,并增加了隐私侵害所造成后果的广度和深度。大数据时代中,公民时常会在毫无意识的情况下将个人信息披露在某些平台上。由于大数据技术降低了数据存储的成本,信息控制者也无需对信息进行鉴定以决定其保存时间,大量的个人信息长期存储在数据系统或网络平台上。此外,大数据环境下数据具有极强的关联性,即使对信息进行了匿名处理,但是随着来源于多种数据源的数据的增加,原本互不相干、相互分离的数据被匹配了起来,多项个人信息共同开展识别,从而使预先的匿名化无效。

  大数据环境下个人隐私遭侵害的识别难度也比以前更大。大数据技术增强了数据之间的连接性,多种信息的联合分析成为可能,原本不具有敏感性或隐私性的数据,在与其他数据进行关联的过程中,存在挖掘出隐私内容的可能性。这一过程往往是无法预料的,因此也难以进行预防,甚至连发生之后数据主体也无法察觉和重视。即使数据主体意识到了自身的隐私被侵害,依然很难确定自己隐私在哪个环节被侵害,也很难界定是否属于侵害,无法找到个人隐私被侵犯的证据追溯到责任主体。

  4 大数据应用中的个人信息利用关键性问题

  隐私安全问题不仅为个人信息安全带来威胁,同样也制约着大数据应用的发展。

  4.1 个人信息失控

  从传统社会到互联网时代,再到如今的大数据时代,信息主体对其个人信息的控制权越来越低,个人信息生成后个人信息利用者就掌握了其使用权,信息主体的权利未得到应有的尊重。Napoleon Xanthoulis 指出,网络环境中的用户仅有选择的错觉,即使选择了撤回信息并不意味着允许用户能将其数据全部移除。Mayer-Schonberger在其著作《删除—大数据取舍之道》一书中指出数字技术已经让社会丧失了遗忘的能力,取而代之的是最完整的记忆。个人信息的失控表现在以下几方面:

  第一,信息主体对其信息的收集与利用不知情。用户在接受服务提供者所提供的在线或离线服务中,无论授权与否,其信息都会在不同程度上被收集。一些机构在收集个人信息时存在过度收集,用户既没有被充分告知其信息将被收集的状况,也没有被阐明其真正用途。个人信息利用者越来越多地按照自身需求获得资源与服务,在采集目的之外对个人信息进行利用之前,并不会再次申请信息主体的许可,甚至完全不会通知信息主体。因而信息主体很难知悉其个人信息被收集和利用的具体情况,更无法提出异议,这无疑危及到了个人信息的保密性、可控性及信息主体的人格自由。

  第二,信息主体的的生活安宁遭到破坏。当信息主体在网络中表露出其需求并被识别后,服务提供者就可以开展精确的服务推送,而信息主体对这类推送行动完全无法自主选择。且这些推送活动并不受场所的限制,其推送的范围十分广泛而且隐藏很深,悄无声息地侵入了公民的个人生活,破坏了公民安宁的生活。

  第三,信息主体无法对其个人信息进行处置。一旦个人信息被以数据化形式储存,就几乎完全被掌握在数据采集者的数据库中,数据主体实际上很难对其进行保护。在个人信息被秘密收集的同时,有可能会被秘密的共享甚至交易,然而信息主体无法对其进行监督,即使个人信息被不合规处置也无从知晓,也无法进行维权。此外,在对个人信息的大数据分析中,还有可能会产生新的信息,这些新个人信息分析和产生是超出控制范围的,信息主体没有能力控制这些新信息的产生与应用。

  4.2 个人信息被滥用

  随着行使职能与开展业务需求的变化与大数据信息处理技术的不断发展,个人信息处理者对公民个人信息的利用常常越过必要的边界,造成对个人基本权利的侵犯:

  第一,个人信息处理者对个人实施全面监控。大数据时代数据就是资产,为满足管理和业务的需求,个人信息处理者尽可能全面、完整、系统地收集公民的数据,这就使得其对公民行为全天候全方位的监控有了合理性。大数据环境中的这种全面监控就如同打造出了隐形的“数字全景监狱”,采集处理个人信息的工具遍布各个角落,面向各个群体,个人的网络与现实行为都被置于随时随地的“监视”之中。这种全面的监控无视了信息主体的隐私权,干涉了主体的自由,影响到了主体的生活。

  第二,个人信息处理者通过信息对个人未来进行预测。“预测”是大数据的核心功能之一。大数据甚至可用于对个人未来的身体状况等涉及个人隐私的信息进行预测。然而,预测个人未来的行为会对个人的名誉造成影响,甚至侵犯了信息主体的个人隐私,违背了自主原则,导致名誉无法受到个人的控制。例如大数据分析能够对犯罪等进行预测,公众也会担心自己是否会成为这种预测算法的目标。

  第三,个人信息处理者对所收集信息开展深度挖掘。个人信息深度挖掘行为侵犯个人隐私主要有两种方式。其一是利用数据深度挖掘预测信息主体的行为,影响信息主体的未来行为。在这一过程中,公民往往对其个人信息被利用的情况并不知情,这一行为不仅干涉到了用户的隐私,并有可能会影响信息主体的行为;其二是数据深度挖掘引发身份泄露。由于个人信息中蕴含着大量的价值,因此机构大多倾向于对这些数据进行二次开发。有些个人信息在依职能要求利用时并不会对个人隐私造成影响,而二次开发却会带来这种危害,从表面看并无明显的个性化特征的原始信息,通过多次的分析、挖掘,就有极大的可能准确地追溯到数据主体个人并关联出个人隐私。

  第四,个人信息遭到泄漏。在大数据时代背景之下,个人信息泄露主要有两种方式,一为外部的攻击,例如使用专业工具或者黑客,大数据一方面已成为网络攻击的显著目标,大数据环境使隐私泄露风险更大,另一方面黑客也利用大数据技术进行网络攻击,将其作为高级可持续攻击的载体,并对现有的存储和安防措施造成威胁。然而个人信息的管理者在很多情形下都未将泄露的风险通报给信息主体,因此在遭受到侵害时,信息主体得知消息的时候往往已经造成了巨大的伤害,不仅来不及采取措施及时止损,其他关联信息也有可能受到侵害;二为内部攻击,即为服务提供商对个人信息进行买卖或者作为证据提交,对个人信息恶意使用、非法买卖时有发生,甚至形成了灰色产业链。信息的非法使用是个人信息开发利用进程的一大阻碍。

  4.3 个人信息失控

  大数据应用中造成个人信息质量降低的最主要威胁之一是伪造或刻意制造的数据,数据分析的结果依赖于数据的可靠性,如果数据中存在错误,极有可能会导致错误的结论。有些情况下,数据的应用场景很明确,就可能有人为了自身利益刻意制造数据,诱导分析者得出符合其利益的结论。而虚假信息大多隐藏在大量复杂的信息中,真伪难以鉴别;威胁之二则是数据在传播中的逐步失真。其原因之一是数据采集可能会由于人工干预而引入误差,这些人为失误会造成数据的失真与偏差,最终对数据分析结果的准确性造成影响。个人信息的利用还存在着一定范围内的共享。随着传输效率的提高与传输环节的增多,个人信息失真的几率也会有所提高。此外,个人信息的直接采集者与个人信息的接收者的职能和身份均不同,其信息利用的目的也各异,因此在传输过程中往往不同程度地对信息进行加工,又加剧了失真的程度,个人信息的完整性与可靠性被降低。

  5 结束语

  个人信息利用是大数据应用中必不可少的过程,它为机构职能的实现带来了新的机遇与挑战。大数据环境对个人信息的利用带来了新变化,使个人信息的获取变得更加便利,价值得到提升,其中所包含的公民个人隐私也更容易遭到侵害。隐私安全问题不仅为个人带来了风险,同时也制约了大数据的应用。本文明确了大数据应用中个人信息利用所存在的信息失控、信息滥用与信息质量低几个关键问题,为个人信息主体和利用者提出了警示,也为研究保障大数据应用中个人信息利用的措施奠定了基础。

  参考文献

  [1] Bertot, J. C., Gorham, U., Jaeger, P. T., Sarin, L. C., Choi, H.. Big data, open government and e-government: Issues, policies and recommendations[J]. Information Polity, 2014, 19(1, 2): 5-16.

  [2] Keller S A, Shipp S, Schroeder A. Does Big Data Change the Privacy Landscape? A Review of the Issues[J]. Statistics & Its Application, 2016, 3(1).

  [3] Kim, G. H., Trimi, S., & Chung, J. H. Big-data applications in the government sector[J]. Communications of the ACM, 2014, 57(3), 78-85.

  [4] Washington, A. L. Government information policy in the era of big data[J]. Review of Policy Research, 2014, 31(4), 319-325.

  [5] Ylijoki O, Porras J. Perspectives to Definition of Big Data: A Mapping Study and Discussion[J]. Journal of Innovation Management, 2016, 4(1): 69-91.

  [6] 刘雅辉,张铁赢,靳小龙,等.大数据时代的个人隐私保护[J].计算机研究与发展, 2015, 52(1):229-247.

  [7] 侯富强.大数据时代个人信息保护问题与法律对策[J].西南民族大学学报:人文社科版, 2015(6):106-110.

  [8] 胡税根,单立栋,徐靖芮.基于大数据的智慧公共决策特征研究[J].浙江大学学报:人文社会科学版,2015, (5): 5-15.

  [9] 胡忠惠.大数据时代政府对个人信息的保护问题[J].理论探索,2015(2):103-107.

  [10] 彭华杰.大数据时代图书馆读者的隐私危机与隐私保护[J].图书馆工作与研究, 2014(12):56-59.

  [11] 薛孚,陈红兵.大数据隐私伦理问题探究[J].自然辩证法研究, 2015(2):44-48.

  [12] 杨震,徐雷.大数据时代我国个人信息保护立法研究[J].南京邮电大学学报:自然科学版, 2016(02):1-9.

  [13] 张茂月.大数据时代公民个人信息数据面临的风险及应对[J].情报理论与实践, 2015, 38(6):57-61.

  [14] Mayer-Schnberger, V. Delete: The virtue of forgetting in the digital age[M]. 2011. Princeton University Press.

  (赛迪智库网络空间研究所,北京 100846)

  孙舒扬

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: