隐私计算:护航数据价值,实现“可用不可见”
2021-10-01 科技日报
有人说:“数据是新时代的石油。”事实上,随着全球数字经济的蓬勃发展,数据的重要性已远远超过了石油。但随之而来的大数据杀熟、滥用人脸识别技术、过度索取权限等乱象,却让人苦不堪言,损害了公众的合法利益。 9月1日,我国第一部有关数据安全的专门法律——《数据安全法》正式施行,成为数据安全保障和数字经济发展领域的重要基石。该法明确提出,发展与安全并重,在强调数据安全的基础上鼓励数据应用和流通,同时鼓励相关技术的研究与应用。 作为能够兼顾数据应用与安全保护的关键技术,隐私计算被业界寄予厚望。隐私计算是什么?如何保护用户隐私?距离落地应用还有多远?在日前举办的“数据安全与隐私计算”专题研讨会上,业内专家就上述问题深入探讨,明确表示,隐私计算能够在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放,应用前景和商业价值巨大。 隐私计算让数据安全流通 数据通过流通共享与协同计算,能更好地释放其价值,大数据的井喷式发展也将带来前所未有的价值传递。但隐私保护、数据合规等监管要求,让数据拥有方陷入“不愿共享、不敢共享、不能共享”的困境。北京瑞莱智慧科技有限公司CEO田天表示,数据价值和隐私安全时常处于二元对立的状态,海量数据散落在众多机构和信息系统中,形成“信息孤岛”和“数据烟囱”,无法充分发挥数据要素的经济、社会价值。 而隐私计算则有可能成为解决这一数据困境的突破口。什么是隐私计算?中国信通院云计算与大数据研究所大数据部副主任闫树介绍,隐私计算是在保护数据本身不对外泄露的前提下,实现数据分析计算的一类技术集合。 “相比之前传统的数据协作方式,隐私计算技术开辟了一种全新的模式,在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算,实现数据的‘可用不可见’。”田天说。不过,隐私计算虽然改变了数据交互与融合的模式和形态,有效保护了流通过程中的数据安全,但仍需要配合其他技术来解决数据流通之前和之后,在权属、应用等方面的问题。 从技术机制来看,隐私计算主要包含三大技术流派:一是以安全多方计算为代表的(部分)通用多方交互协议;二是以联邦学习为代表的面向机器学习应用的多方交互协议;三是以可信执行环境为代表的基于可信硬件的中心化执行方案。 尚处大规模商业化应用前期 随着互联网数据的相关法规不断完善,各行业对企业合规数据流通的需求日益强烈,隐私计算市场也迎来了一个较大的发展期。各类机构竞相进入赛道,除了一批大型互联网公司和专精型创业团队,众多大数据、AI、区块链和传统数据安全公司也开始纷纷转型入局。 在应用侧,隐私计算的落地场景也正从强数据需求的金融、互联网、医疗和政务领域,逐步向智慧能源、智慧终端、智慧城市等更多行业延伸。 但总体来看,隐私计算市场仍处于大规模商业应用的前期,闫树也表示,目前隐私计算技术和解决方案还不够成熟,在安全、性能和数据的互联互通等方面仍存在挑战,一定程度上限制了隐私计算的推广和应用。 田天强调,在牺牲安全性的前提下进行各类隐私计算的技术没有任何意义。由于密码学上的证明安全与实际安全并不相等,尤其是一些多方隐私计算协议被应用在不符合其安全假设的场景中,因此很多假设安全的方法在实际应用中存在严重的安全性漏洞。 同时,在应用开发环境中,隐私计算也会带来很多新的安全问题,比如算法歧视,又或者被黑客投入“脏数据”“毒数据”,存在“数据投毒”的风险。闫树表示,隐私计算技术产品的安全分级标准与行业信任共识仍有待建立。 性能是隐私计算应用落地的保障。闫树介绍道,隐私计算产品安全、性能、准确性三者之间相互影响、相互抵消。目前,国内隐私计算产品在特定场景下已基本具备可用性,但在未来面临更多数据方、更大数据量、更复杂场景时,性能等指标仍有待加强。 要成为核心底座仍任重道远 在政策驱动和市场需求的共同作用下,隐私计算成为商业和资本竞争的赛道市场。信息技术研究和分析公司Gartner在其报告中将隐私计算纳入2021年最前沿的九大趋势之一,并指出到2024年,全球隐私驱动的数据保护和合规技术支出将突破150亿美元以上。 虽然隐私计算有望成为数据要素市场建设的关键基础设施,但若要真正成为核心底座,仍然任重道远。闫树认为,隐私计算未来发展需对内实现“互联互通”,实现不同平台间的互认互用,破除平台壁垒,打通数据孤岛的同时避免催生“数据群岛”;要充分释放数据要素价值仅靠隐私计算还不够,还需要加强隐私计算与AI、区块链、云计算等技术的“交叉融合”。 田天同样表示,隐私计算主要是解决数据“链接”问题,打开数据通路,让更多数据能够被使用,但实现数据价值之路,需要业务需求牵引,尤其是人工智能需求牵引。同时,面向AI的性能优化可以为隐私计算高效落地带来重大机遇,在实现跨业、跨域的数据融合基础上,深度挖掘与释放数据的最大价值。 |