隐私计算产业的发展及金融行业应用
- 来源:银行家 smarty:if $article.tag?>
- 关键字:计算产业,发展,金融 smarty:/if?>
- 发布时间:2024-10-26 14:20
胡 浩
隐私计算的产业图谱
目前,隐私计算市场尚处于发展的初期。从服务对象来看,在国内,隐私计算市场目前主要是一个面向企业的市场;但在美国,已经出现了通过为企业提供隐私计算服务从而间接为个人提供隐私保护服务的模式,未来很有可能出现直接为个人提供隐私保护服务的应用。
隐私计算产业生态
隐私计算的产业生态中主要包含数据需求方、数据供应方、数据流通基础设施建设方、数据交易服务方、政策规则制定方和市场监管方六方。
数据需求方是指那些需要使用数据来完成其业务目标、解决问题或支持决策的组织、个人或部门。例如,市场研究公司需要收集和分析大量的市场数据,以便提供有关市场趋势、消费者行为和竞争环境的洞察;金融机构需要收集和分析客户数据,以评估风险、做出投资决策和开展反欺诈活动;政府机构需要收集和分析人口、经济、环境等各种数据,以制定政策和规划资源分配等。
数据供应方是指那些能够提供数据资源的组织、企业或个人。数据供应方可以是数据提供商、数据中介、数据管理公司、数据科技公司等。这些组织可以收集、整理、加工和存储各种数据,如市场数据、消费者数据、环境数据、金融数据、社交媒体数据等。数据供应方可以通过不同的渠道向数据需求方提供数据,如通过API、数据集成、数据交换等方式。在数据供应链中,数据供应方的重要任务是确保数据的质量和准确性,并遵守相关的法律法规和道德标准,以保护数据的安全和隐私。数据供应方还需要不断优化数据处理流程,以提高数据的处理效率和降低成本,从而更好地满足数据需求方的需求。
数据流通基础设施建设方是指开展隐私计算平台建设的机构,如隐私计算厂商、云服务商、大数据服务商等。
数据交易服务方是指那些致力于构建和提供基于隐私计算的数据流通基础设施的组织、企业或个人。数据流通基础设施建设方可以通过构建安全的数据通道、开发隐私计算算法、提供数据安全管理和风险控制服务等方式,为数据的流通提供技术支持和保障。隐私计算数据流通基础设施建设方包括技术服务提供商、数据中介、数据安全公司、云计算服务提供商等。
政策规则制定方负责制定数据要素和隐私计算的指导意见、办法、法律法规、规章制度、指引、条例等,主要包括国务院及相关部委、行业协会、各级地方政府等。
市场监管方负责对数据要素安全合规使用的监管,主要包括网信办、各省市大数据管理局等。
隐私计算厂商图谱
目前提供隐私计算技术服务的厂商大致可以分为两大类:一类是互联网巨头,主要包括阿里、蚂蚁、微众、腾讯、百度、华为、京东、字节跳动等,这类公司运用其在互联网领域的领先地位布局隐私计算,或应用于企业内部服务,或向其他机构出售其服务;另一类是隐私计算初创公司,主要包括华控清交、富数科技、星云Clustar、数牍科技、蓝象智联、洞见科技、锘崴科技、翼方健数、冲量在线、光之树、融数联智等,这类公司专注于隐私计算赛道,已经取得了一些赛道中的技术领先优势,并服务于其他机构。
隐私计算的发展态势
技术路线百花齐放
隐私计算技术大体可分为三种主要技术路线,分别是多方安全计算、联邦学习和可信执行环境。其中,26%的企业布局了多方安全计算;52%的企业布局了联邦学习;21%的企业布局了可信执行环境。由于各类技术方案各有优势,面对用户的不同应用需求,21%的企业提供多种技术方案供用户选择。采用多方安全计算、联邦学习和可信执行环境等主流方案的企业合计约占使用隐私计算技术企业的的99%。此外,有极少量的企业采用其他隐私计算技术,如零知识证明等。
产业发展配套环境逐步完善
从产业发展的配套环境来看,相关企业和机构在学术研究、开源生态、标准体系等方面积极探索,推动着隐私计算向上蓬勃发展。
学术研究领域关注度持续提升。作为一门融合了多学科的新兴技术,发展与应用隐私计算对于技术理论的研究有较强的依赖性。2011年以来的10年间,隐私计算领域共发表论文5280篇,论文数量始终保持着不低于10%的增速逐年上升。其中,2019年的上升幅度较大,隐私计算领域每年的发文量稳步超越1000篇。可见理论研究层面对隐私计算的关注在持续增强。
技术企业积极拥抱开源生态。开源社区的知识共享和多方协同有利于加速技术升级和商业化项目落地。近两年,国内外很多大厂和创业团队都在积极开源。
配套技术标准体系日渐完善。技术的最终使命是业务应用,作为技术的载体,产品如何构建、如何落地将对用户的业务形态产生重要影响,这就需要统一规范的技术标准,为产品的可用、易用划出基线。目前,从IEEE、ISO、ITUT等国际组织到中国通信标准化协会(CCSA)、全国金融标准化技术委员会(金标委)等,均在组织力量制定或发布隐私计算相关的技术标准。
成熟商业模式还需继续孵化。隐私计算行业目前整体处于规模商用的前期。其一,隐私计算技术的效率总体来说相较于本地计算更低,难以满足大规模商用的要求;其二,若采取系统平台的形式,那么平台部署在哪里,是部署在客户本地还是第三方机构,目前也难以明确;若采用硬件或软件销售的模式,客户是否能在相应的硬件一体机或软件上进行二次开发,以更好的匹配其隐私计算需求,也未有定论。这些问题主要源自计算效率的低下和分润机制的不完善。只有不断提升隐私计算技术的计算效率,更好的满足客户应用场景的需求;并通过市场化探索,通过成本定价结合收益定价的模式,不断完善分润机制,使数据提供方、技术供应商和客户均能从隐私计算交易中获得公平的收益,才能逐渐形成成熟的商业模式。
隐私计算的金融行业应用
基于隐私计算的银行交易反欺诈
以云计算、区块链、大数据等为代表的新一代信息通信技术,正在加速金融业与信息科技的创新融合。金融科技在使支付、借贷、投资、保险等金融服务变得高效便捷的同时,也为银行业带来了申请欺诈、交易欺诈和营销欺诈等欺诈风险。申请欺诈是指在信贷申请阶段存在的恶意逾期、中介代办、内外勾结、团伙欺诈等行为;交易欺诈指第三方在客户不知情的情况下,非法利用他人账户进行的账户盗用、伪卡盗刷等行为,以及内部员工在支付和交易过程中的违规操作、骗取客户或行内资金等行为;营销欺诈是指黑产利用金融机构发放新用户红利时的推广活动漏洞,进行非正常参与、非法获取营销红利,致使金融机构遭受损失的行为。
攻击对象不确定、犯罪主体难追踪、外部欺诈风险涵盖范围广、防控难度大等原因使金融欺诈成为导致银行业受损最严重的风险之一。据国外研究机构统计,欺诈风险每年导致的银行业受损金额高达近千亿美元,国内银行每年因欺诈风险损失的金额也高达百亿元。
对于绝大多数银行机构,反欺诈的最大难题是反欺诈模型建立过程中数据来源单一,单纯依靠自身业务数据构建出的反欺诈模型识别准确度极低。随着黑色产业链的智能化与集团化发展,各类欺诈手段的特征越发隐蔽、难以察觉,且跨行业欺诈逐渐成为常态,单次欺诈行为贯穿社交媒体、银行App等多个工具,各机构的单方数据无法应对。如何在有效保护数据安全的前提下,合法合规地利用内外部数据,丰富样本数据特征维度,构建更加精准的反欺诈风控模型,提升反欺诈能力,是各类银行的当务之急。
针对银行反欺诈管理中遇到的特征维度不足、安全与利用矛盾、解决方案碎片化等困境,基于联邦学习等隐私保护计算技术的“数据+平台+模型”一体化解决方案,通过实现银行与外部机构在反欺诈场景下的跨行业数据链接,联合了金融交易特征、社交行为特征和相关人员特征等多维度特征信息构建反欺诈模型,能实现更精准有效的交易欺诈甄别,提升银行机构交易反欺诈能力。
基于隐私计算的金融风控
随着信贷市场规模的扩张,市场对信贷风控的要求也日益增加,但银行等金融机构掌握的客户信用信息不全,人行征信系统又无法完全覆盖,大量数据的控制权分散在不同部门、机构及互联网公司,“数据孤岛”问题严重,有效数据的缺失严重制约了金融机构对客户信用风险的评估。
传统的联合建模方式需要汇集双方数据到一个集中的场所,但对于银行等属于强监管行业的金融机构来说,数据绝不允许出库,这种情况就需要数据机构带着数据到银行等客户环境内建模,数据机构的数据出库不可避免,即便采用安全屋等方式,数据的传输和使用过程也存在极大的泄露风险。行业亟需一种能在金融机构和数据机构双方数据都不出库的前提下完成定制化模型构建工作的技术能力。
基于多方安全计算、联邦学习等隐私计算技术构建的金融风控模型,需要金融机构和数据机构两方/多方协作。其中,金融机构拥有用于建模的部分特征,数据结构也拥有用于建模的部分特征以及标签信息,通过多方安全计算平台,两方/多方样本首先进行样本对齐(PSI),选取对齐的样本用于模型训练,接着对两方/多方拥有的特征进行特征选择和特征工程,然后通过安全联邦机器学习算法训练出风控模型,用于后续的预测打分,并与金融业务系统对接。整个过程各方数据均不出库,也不依赖于任何第三方,进一步增强了安全性和实用性。
基于隐私计算的精准营销
线下广告主无法有效利用大型互联网投放平台,如每日头条、抖音等,大量数据源以孤岛形式存在,没有流通和充分挖掘。金融机构可以通过多方计算方式与外部数据源进行用户分层模型的联合建模,实现用户的分层与分群,并基于这些分群的结果及用户的偏好,设计相关的存客促活营销策略。
以白名单流量获客为例。首先,银行在投放前进行撞库,剔除存量用户、被拒用户。传统方式是银行开放全量客户给广告商撞库,造成用户信息泄露,安全方式是通过安全求交,实现对交集之外的用户隐私保护。其次,银行在投放时可做前置风控,通过多方安全计算平台结合运营商数据及媒体数据进行三方联合建模,降低无效投放,提高营销效能。最后,银行的样本无须出库,即可和媒体进行多方联合计算,迭代投放模型。
银行业隐私计算创新应用的政策建议
利用隐私计算技术安全合规开展数据价值变现,赋能行业生态,服务社会经济发展。银行业在助力经济转型的同时,也积累了非常有价值的数据资产,呈现出超全覆盖、超多维度、连续不间断、超大数据资产等特征。针对数据要素市场的发展,银行业可以利用自身数据的规模优势和价值优势,构建产业生态,在公共管理、交通旅游、安全监控、欺诈防控、商圈分析、金融征信等领域提供数据共享服务,释放银行业数据要素生产力,增强为社会经济发展的数据赋能能力。
加大研发投入,积极开展隐私计算关键技术研究,提前布局。隐私计算产品与其他的数据处理产品不同,其本身承载着保护隐私数据安全的重要功能,技术服务厂商与产品使用者都应谨慎对待隐私计算产品的安全性挑战,而算法协议安全、开发应用安全和安全共识正成为当前隐私计算应用亟需解决的问题。面对数据要素市场未来可能出现的重大机会,银行业应当在新赛道加大研发投入,对相关技术开展研究,提前布局,在行业竞争中占领制高点。
充分利用银行业资本优势,加快算力建设,加强异构网络的互联互通,为隐私计算的大规模应用打下良好基础。对于数据提供机构和数据应用机构而言,普遍存在与不同机构合作时需要部署不同的隐私计算平台的问题,导致系统建设重复和运营成本增加。由于不同的隐私计算平台是基于各自特定的算法原理和系统设计实现的,且目前闭源的平台很多,平台之间很难完成信息的交互,因此计算平台之间互联互通的壁垒成为了隐私计算面临的新挑战,或使“数据孤岛”变成了“数据群岛”。银行业拥有大量的数据资产,可以在隐私计算基础设施建设方面发挥重要的牵头和协调作用,促进统一的数据要素市场的形成。
利用隐私计算技术,全面提升银行业合规监管水平。通过隐私计算技术,可以整合内外部收集到的各种数据,尽可能消除申请及交易等环节的信息不对称问题。并且可在充分保障用户隐私的前提下对客户行为进行关联建模,从而更全面地了解客户、评估客户行为的合规性。基于多方数据源进行联合建模可丰富反欺诈、反洗钱等合规监管模型和知识库,对客户进行持续识别,增强反欺诈、反洗钱等风险洞察及溯源核查能力。
(作者单位:上海数据交易所)
责任编辑:孙 爽