隐私计算背后“隐形人”:数据安全与应用,其实是对好CP
2021-11-12 中新经纬
中新经纬11月12日电 美国马里兰州,曾有毒贩藏在废弃房屋中,用LED灯种植大麻。 警察没有证据,无法进入房间搜查。但很快他们找到办法,利用供电公司数据,分析住户用电量和用电模式,帮助锁定犯罪现场。 这是新时代的警匪故事,故事背后我们的世界早已被数据填充。 作为新时代的石油,数据不仅可以抓捕毒贩,还可以帮助提高医疗诊断准确性;帮助零售商实时掌握市场动态;帮助城市交通顺利运转…… 正因如此,从2020年起,数据作为一种新型生产要素,被写入中央文件,与土地、劳动力、资本、技术等传统要素并列为要素之一。 如同其他流转不停的生产要素,数据同样要流转起来,其价值才能真正发挥。 然而,数据在流转过程中,在产权界定、市场配置、保护模式等方面存在待解的问题,而其中的关键之一,就是如何确保隐私安全。没有这个前提,数据的价值便只能停留在纸面上。 喧嚣之外,一群从业者,正通过一把名为“隐私计算”的钥匙,让数据真正安全流转起来。 开启数据安全流转 同盾科技是国内较早布局隐私计算的科技企业,其合伙人、人工智能研究院院长李晓林教授经常用金融来说明数据流通的必要性。 “金融就是价值在时间和空间中的流通和交易,今天我贷出一块钱,现在的价值和明天的价值是不同的,数据也与之类似。例如电网数据,对电网企业本身价值有限,但如果用来做中小微企业的信用分析,价值会放大很多倍。” 在隐私计算领域,李晓林教授也被行业媒体称为“联邦学习三剑客”之一,华人教授中他在隐私计算、联邦学习、可信AI等方面积累了十多年的科研和产业经验,是国内可信AI的发起人之一。 “数据沉淀不动的话,就会过期失效,其实是一种浪费。数据一定要以某种安全方式流通起来,才能发挥他应有的价值。”李晓林教授说。 他和团队正从事隐私计算研究,这群隐私计算背后的“隐形人”,试图通过技术手段,实现数据安全流动,既能够保护个人隐私,又能够利用数据完成计算、学习、建模和推理决策。 同盾人工智能研究院联邦生态总监艾萨克,主要负责知识联邦商业化落地和生态构建,他介绍,同盾以隐私计算技术为基础,推出的工业级应用产品智邦平台,能够将数据要素保护起来,安全使用数据,切断数据转移,不需要转移原始数据,也不需要将数据汇聚到科技公司或者互联网巨头,实现了数据的安全、隐私保护,又能够发挥数据价值。 “例如,如果一家银行要放出贷款,通过智邦平台,可以借助不出本地的多方数据,从多个维度对客户进行分析,并给出信贷估分,而不用向像传统模式那样,将客户数据完全收集到后台,既增加了流程,又加大不必要的泄露风险。”艾萨克说。 智邦平台的实际落地效果,也确实证明了隐私计算技术可以帮助数据密集型商业活动提高效率。经由隐私计算,客户能够以安全的方式,安全使用更多的数据。 “以某金融集团旗下公司为例,金融行业对数据安全性要求较高,一个集团的不同分公司之间,数据都是无法共享的。借助智邦平台,同盾帮助集团母公司和子公司之间进行数据流通,最终集团子公司的营销效率提升了300%。”艾萨克介绍。 为方便多方合作,同盾在智邦平台中还加入了数据接入标准化和数据安全交换协议,可以让数据提供者轻松地进行联邦合作。 一切看起来似乎很简单,但实际上隐私计算并不是一种单一的技术,而是一套包含人工智能、密码学、数据科学、分布式系统等众多领域交叉融合的跨学科技术体系。 技术机制上,隐私计算主要包含了三大技术流派,分别是多方安全计算、联邦学习以及可信执行环境。而同盾的智邦平台,则是依托融合了隐私计算主要流派的知识联邦理论体系搭建而成。 以知识联邦理论体系为基础,同盾是国内第一家构建了隐私计算完整技术生态的科技企业。 全新框架“离子键” 李晓林教授介绍说,中国的隐私计算研究从一开始就是和国际同步甚至是领先的。 宏观层面,《网络安全法》《数据安全法》《个人信息保护法》等一系列法律的出台,倒逼企业在数据采集、使用、流通全环节中重视及投入数据保护,隐私计算行业也因此迎来重大利好。 微观层面,以互联网公司、大数据公司、金融科技公司和隐私计算创业公司为代表的玩家相继入局,共同推动隐私计算技术的发展,行业生态已经初具规模。 尽管如此,隐私计算离大规模商业化落地仍有一段距离。现阶段,隐私计算在实际应用中,如何平衡安全与性能、以何种商业模式落地,乃至监管、市场认知都面临待解的问题。 对应用方而言,隐私计算因为使用加密系统,计算速度比明文计算要慢。2021年5月,中国信通院云大所所长何宝宏在公开场合表示,2020年隐私计算整体速度比明文计算慢约25倍。 拥有十余年模式识别、机器学习、深度学习研究经验的同盾隐私计算算法组负责人Doris表示,使用隐私计算,往往意味着面临效率与安全的取舍。为了将这一影响降至最低,同盾智邦平台对数据进行分层次分等级处理,通过机器学习方式,对不同等级数据采取不同程度的技术操作。 “此外,同盾为智邦平台打造了一套全新的轻量级联邦通信框架——离子键,作为同盾知识联邦的底层基础设施,它可以大大提升联邦算法的性能,将联邦模型训练时间压缩至原来的六分之一,并能大幅减少服务器资源需求,降低联邦平台部署时间,进而全面提升交付速度。” 技术本身之外,数据本身的敏感性与脆弱性,也在影响着隐私计算的落地。艾萨克介绍说,隐私计算技术落地的前提,是要说服所有人安全共享数据。 很多时候,为了向客户说明自家产品的安全性,他要从物理安全讲到网络安全,再从数据安全讲到应用安全,甚至要给对方技术部门发去论文解释说明。 即便如此,有些客户还是会担忧,隐私计算是否真能满足他们的合规需要。现阶段,在隐私计算中,哪些数据流通、哪些必须拿到授权、拿到什么层级的授权、获取授权的法律条款怎样才是合规的,各方的理解也都有差别。 “目前为止,还没有一个真正的行业标准。”艾萨克解释说,他们能拿来说服客户的,是通过几个隐私计算的央行“监管沙盒”项目和标杆客户案例。 为此,在不断完善智邦平台同时,同盾隐私计算团队一直在积极推动相关标准的落地。 《基于多方安全计算的数据流通产品技术要求与测试方法》(修订版)、《基于可信执行环境的数据计算平台技术要求与测试方法》以及《联邦学习金融行业应用指南》等标准和规范中,都有同盾隐私计算团队成员的身影。 这也是整个隐私计算行业一直在努力的事情,共同完成市场的普及教育,推动隐私计算发展。 在竞争中持续进化 尽管仍存在障碍,但不管是从政策上、市场上、客户需求上,隐私计算的大幕都已拉开。 根据甲子光年《2021隐私计算行业研究报告》,隐私计算自2019年以来受到资本市场密切关注,截至目前获百亿美元级融资,平均每起融资数千万元。 Doris认为,如何促进隐私计算不断完善发展,业内基本已经形成共识:以面向产业竞争的市场竞争机制,在推动隐私计算应用不断落地同时,推动隐私计算技术发展。 在同盾隐私计算团队,这样的理念深入人心。例如Doris虽然是技术人员,但同样与客户交流,参与解决方案落地。 在她看来,如果只考虑算法模型,那距离隐私计算落实到产品上还有很大一段距离。为促进算法的工程化,必须和客户交流,参与项目落地。 正因如此,几年来,同盾隐私计算算法组同学们,离客户越来越近。 Doris参加的一次隐私计算客户项目中,同盾智邦平台的竞争对手包含了互联网大厂旗下平台、专门的金融科技公司等多类选手。 现场竞标中,Doris和算法组同事才发现,项目测试用的数据量级之大,超出了想象,在计算资源有限的前提下,强行接入甚至可能让系统“卡死”;最后,算法组将采用“流水线”数据读取和计算分离、bagging+boosting的方式,解决了这一问题。 项目最后十天,Doris和团队几乎住在了客户单位,每天早8点到,晚上12点回,每天及时根据客户需求调整方案。 Doris说,那是一个很难得的机会,既能够和众多实力雄厚的友商同台竞争,也能利用远超平时的数据量和丰富的业务场景,进一步完善技术和产品。 这些都是在办公室内对着屏幕难以得到的经验,而这些经验,最终都会汇聚到一起,共同推动隐私计算技术的整体进步。 李晓林教授对隐私计算未来抱有充分信心,“随着法律法规的不断完善,数据隐私保护,会像现在电脑上的杀毒软件、防火墙一样,成为相关企业的标配。” 但就像普通人不会记住杀毒软件和防火墙背后的程序员一样,大多数隐私计算从业者的名字,也注定默默无闻。 他们是行业背后的隐形人,在数据洪流中,努力保护着普通人的隐私安全,也推着大时代故事的前行。(中新经纬APP) |