根据目前市场上隐私计算技术的主要相关技术,可分为三类:基于协议的安全多方计算、基于现代密码的联邦学习、基于硬件的可信执行环境[2]
联邦学习
联邦学习是一种分布式机器学习技术和系统,包括两个或多个参与方,这些参与方通过安全的算法协议进行联合机器学习,可以在各方数据不出本地的情况下联合多方数据源建模和提供模型推理与预测服务。在联邦学习框架下,各参与方只交换密文形式的中间计算结果或转化结果,不交换数据,保证各方数据不露出。联邦学习可以通过同态加密、差分隐私、秘密分享等提高数据协作过程中的安全性。联邦学习首先由谷歌公司于2016年提出,2018年由微众银行引入国内,恰好遇到隐私保护、信息安全监管趋严,该技术很快就得到各大互联网公司、科技巨头、人工智能公司重视。
安全多方计算
安全多方计算是一种在参与方不共享各自数据且没有可信第三方的情况下安全地计算约定函数的技术和系统。通过安全的算法和协议,参与方将明文形式的数据加密后或转化后再提供给其他方,任一参与方都无法接触到其他方的明文形式的数据,从而保证各方数据的安全。安全多方计算的基本安全算子包括同态加密、秘密分享、混淆电路、不经意传输、零知识证明、同态承诺等。解决特定应用问题的安全多方计算协议包括隐私集合求交、隐私信息检索及隐私统计分析等。由于安全多方计算需要消耗大量的计算和通信资源,目前应用更加适用于小规模数据量,并且应用主要是聚焦相对简单的统计、查询等类型的计算,而基于安全多方计算的联合建模框架只能支持相对简单的机器学习模型,如逻辑回归模型等。
可信计算
可信计算指借助硬件CPU芯片实现可信执行环境(TEE),从而构建一个受保护的“飞地”(Enclave),对于应用程序来说,它的Enclave
是一个安全的内容容器,用于存放应用程序的敏感数据与代码,并保证它们的机密性与完整性。可信计算(TEE)是基于硬件和密码学原理的隐私计算方案,相比于纯软件解决方案,具有较高的通用性、易用性和较优的性能。其缺点是需要引入可信方,即信任芯片厂商。此外由于CPU相关实现属于TCB,侧信道攻击也成为不可忽视的攻击向量,需要关注相关漏洞和研究进展
同态加密
同态加密(homomorphic
encryption)是一种允许在加密之后的密文,上直接进行计算,且计算结果解密后正好与明文的计算结果是一致的加密算法。按照支持的功能划分,目前的同态加密方案可以分为”部分同态加密”(somewhat
homo-morphic Encryption)和";全同态加密"; (fully homomorphic encryption)两类。
零知识证明
零知识证明(zero- knowledge
proof)指的是证明者能够在不向验证者提供任何有用的信息的情况下,使验证者相信某个论断是正确的计算技术。零知识证明的原理在于构建一个多方协议,即参与的多方需要完成一项任务所需采取的一系列步骤,通过完成这些步骤,证明者向验证者证明并使其相信自己知道或拥有某一消息,
但证明过程不能向验证者泄漏任何关于被证明消息的信息。