隐私计算

1隐私计算是什么
2隐私计算技术路径

3隐私计算的产业生态
4隐私计算框架

5隐私计算公司
6国内外隐私计算行业现状

隐私计算是什么

国外隐私计算被定义为“ Privacy Enhancing Technologies (PETs)，即隐私增强技术。2001年，隐私增强技术概念提出，即“一套信息和通信技术措施系统，在保障系统功能的前提下，通过消除或减少个人数据或防止对个人数据进行不必要和/或不希望的处理来保护隐私。”具体而言，隐私增强技术广义，上指保护个人或敏感信息隐私性的任何技术方法，包括例如广告拦截、浏览器扩展插件等相对的简单技术。狭义上，隐私增强技术主要指互联网信息所依赖的加密基础结构，即联邦学习、多方安全计算、零知识证明等“新兴”隐私增强技术^[1]。

国内隐私计算是指在提供隐私保护的前提下实现数据价值挖掘的技术体系，而非单一技术，早期多被定义为隐私保护计算、隐私保护技术等。2016年发布的《隐私计算研究范畴及发展趋势》正式提出“隐私计算”一词，并将隐私计算定义为“面向隐私信息全生命周期保护的计算理论和方法，是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。

隐私计算技术路径

根据目前市场上隐私计算技术的主要相关技术，可分为三类：基于协议的安全多方计算、基于现代密码的联邦学习、基于硬件的可信执行环境^[2]

隐私计算

联邦学习

联邦学习是一种分布式机器学习技术和系统，包括两个或多个参与方，这些参与方通过安全的算法协议进行联合机器学习，可以在各方数据不出本地的情况下联合多方数据源建模和提供模型推理与预测服务。在联邦学习框架下，各参与方只交换密文形式的中间计算结果或转化结果，不交换数据，保证各方数据不露出。联邦学习可以通过同态加密、差分隐私、秘密分享等提高数据协作过程中的安全性。联邦学习首先由谷歌公司于2016年提出，2018年由微众银行引入国内，恰好遇到隐私保护、信息安全监管趋严，该技术很快就得到各大互联网公司、科技巨头、人工智能公司重视。

隐私计算

安全多方计算

安全多方计算是一种在参与方不共享各自数据且没有可信第三方的情况下安全地计算约定函数的技术和系统。通过安全的算法和协议，参与方将明文形式的数据加密后或转化后再提供给其他方，任一参与方都无法接触到其他方的明文形式的数据，从而保证各方数据的安全。安全多方计算的基本安全算子包括同态加密、秘密分享、混淆电路、不经意传输、零知识证明、同态承诺等。解决特定应用问题的安全多方计算协议包括隐私集合求交、隐私信息检索及隐私统计分析等。由于安全多方计算需要消耗大量的计算和通信资源，目前应用更加适用于小规模数据量，并且应用主要是聚焦相对简单的统计、查询等类型的计算，而基于安全多方计算的联合建模框架只能支持相对简单的机器学习模型，如逻辑回归模型等。

隐私计算

可信计算

可信计算指借助硬件CPU芯片实现可信执行环境(TEE)，从而构建一个受保护的“飞地”(Enclave)，对于应用程序来说，它的Enclave 是一个安全的内容容器，用于存放应用程序的敏感数据与代码，并保证它们的机密性与完整性。可信计算(TEE)是基于硬件和密码学原理的隐私计算方案，相比于纯软件解决方案，具有较高的通用性、易用性和较优的性能。其缺点是需要引入可信方，即信任芯片厂商。此外由于CPU相关实现属于TCB，侧信道攻击也成为不可忽视的攻击向量，需要关注相关漏洞和研究进展

隐私计算

同态加密

同态加密(homomorphic encryption)是一种允许在加密之后的密文，上直接进行计算，且计算结果解密后正好与明文的计算结果是一致的加密算法。按照支持的功能划分，目前的同态加密方案可以分为”部分同态加密”(somewhat homo-morphic Encryption)和"；全同态加密"； (fully homomorphic encryption)两类。

零知识证明

零知识证明(zero- knowledge proof)指的是证明者能够在不向验证者提供任何有用的信息的情况下，使验证者相信某个论断是正确的计算技术。零知识证明的原理在于构建一个多方协议，即参与的多方需要完成一项任务所需采取的一系列步骤，通过完成这些步骤，证明者向验证者证明并使其相信自己知道或拥有某一消息，但证明过程不能向验证者泄漏任何关于被证明消息的信息。

隐私计算

隐私计算的产业生态

在隐私计算的产业生态中有甲方、乙方和丙方三方^[3]。

(1)甲方表示数据使用方，主要集中在金融、政务、医疗、零售等领域。金融领域细分为银行、保险等机构，数量最多的是银行；政务以及各地政府部门的职责是实现政府各个部门间的互联互通与数据共享，提高政府效率与决策质量，加强政府各个部门间的协同；医疗领域主要有各地各级医院、药厂等。

(2)乙方表示数据源。金融类数据大多聚集在政府、运营商、银联、互联网巨头手中，主要有金融数据、医疗数据和政务数据。医疗数据储存在各地各级医院、医药公司、医保机构的系统里。政务数据表示的是工商、司法、税务、海关、学历学籍等各政府职能部门日常运行积累的数据，也包括省市政务数据共享平台与政务数据开放平台中的数据。

(3)丙方表示的是不拥有数据的服务机构，这类机构主要有隐私计算厂商、云服务商、大数据服务商等。他们服务于数据源或者数据使用方，数据可能存放在他们的系统里，但数据不属于他们。

隐私计算框架

隐私计算框架是在隐私信息全生命周期的各个环节中建立应用场景、保护需求与计算模型之间的映射关系。基于场景描述和保护需求，适应性地选择相应环节的计算方法实现相应的计算功能。从全生命周期的角度出发，隐私计算框架如图所示。

该框架面向任意格式的明文信息M，具体包括以下5 个步骤。

(1)隐私信息抽取：根据明文信息M的格式、语义等，抽取隐私信息并得到隐私信息向量I。

(2)场景抽象：根据I中各隐私信息分量的类型、语义等，对应用场景进行定义与抽象。

(3)隐私操作选取：选取各隐私信息分量所支持的隐私操作，并生成传播控制操作集合。

(4)隐私保护方案设计/选取：根据需求选择/设计合适的隐私保护方案。如有可用且适合的方案及参数，则直接选择；如无，则重新设计。

(5)隐私保护效果评估：根据相关评价准则，使用基于熵或基于失真的隐私度量来评估所选择的隐私保护方案的隐私保护效果。

隐私计算

隐私计算公司

(1)互联网巨头。当前各大互联网巨头都在将隐私计算作为其发力的方向，纷纷推出了隐私计算产品，如阿里巴巴、蚂蚁集团、微众银行、腾讯集团、百度集团、华为集团、京东集团、字节跳动等都互联网巨头

(2)云服务商。目前推出隐私计算服务的云服务商有阿里云、腾讯云、百度云、京东云、金山云、华为云、优刻得等云服务商都推出了

(3)人工智能背景的公司。如瑞莱智慧、医渡云、三眼精灵、渊亭科技。

(4)区块链背景的公司。比如矩阵元、Oasis、ARPA、趣链科技、零幺宇宙、宇链科技、翼帆数科、熠智科技、算数力、同济区块链等。

(5)有大数据背景的公司。比如星环科技。

(6)有安全背景的公司。比如阿里安全、腾讯安全、百度安全、安恒信息、神州融安、瓶钵科技、沙海科技等。

(7)软件服务商。如普元信息、神州泰岳。

(8)有金融科技背景的公司。如同盾科技、百融云创、富数科技、天冕科技、金智塔科技、冰鉴科技、甜橙金融等。

(9)供应链金融背景的公司。比如联易融、纸贵科技等。

(10) 从隐私计算出发的初创公司。如华控清交、星云 Clustar、数牍科技、蓝象智联、洞见科技、锘崴科技、翼方健数、冲量在线、光之树、融数联智、摩联科技、隔镜科技、神谱科技、同态科技、凯馨科技、煋辰数智等公司^[3]。

隐私计算

国内外隐私计算行业现状

中国隐私计算行业发展现状^[5]

从2018年开始，随着技术的发展与商业场景的丰富，中国隐私计算行业形成了互联网大厂、大数据公司、运营商、金融机构和金融科技企业、隐私计算初创企业为代表的五大类市场主要参与者。

百度、腾讯、京东、阿里巴巴等互联网巨头凭借在技术领域的积累，自 2019 年开始纷纷推出了各自的隐私计算产品。金融机构是数据流通与安全应用最主要的需求者，国有银行的研究院或是事业部也均开始了隐私计算技术的研究工作，神谱科技、平安科技、百融云创、度小满等金融科技类企业也将业务拓展到基于联邦学习平台等的隐私计算服务中。

据统计，2020年中国隐私计算行业新成立企业71家，同比增长33.96%。这些企业或是在原有厂商业务之中拓展新的技术手段和生成新的技术产品，或是利用新技术延续既有业务模块、以满足合规需求，或是完全以成熟的隐私计算技术为核心底座从事商业运营的隐私计算商家。

国外隐私计算行业发展现状^[5]

从技术发展的历程来看，谷歌、Intel 等国际领军企业开创了隐私计算产业的时代潮流。但从整体发展路径来看，相比国内企业，国际科技企业在学术研究和开源生态的建设上更为活跃；相比之下，商业化的产品形态较为局限，产业生态也尚未形成火热竞争或垄断格局。

微软研究院自2011 年开始大规模推进多方安全计算的研究，从两方安全计算入手，逐渐拓展至三方计算和不存在交互行为的多方计算。谷歌是联邦学习的引路人，自 2017 年4 月，谷歌便提出了联邦学习的概念，并于2019 年发布论文给出了可扩展大规模移动端联邦系统的描述，用于改进谷歌输入法的自动关联与推荐。Intel 的SGX 和 ARM 的TrustZone 处于TEE 硬件的垄断地位。TrustZone 在2008 年推出，而SGX 最早在 2013 年推出，二者都是随着移动手机的大发展而繁荣起来，目前市场上可信执行环境的商业化落地都是基于TrustZone 或SGX 的解决方案。

除上文提到的科技公司外，国外互联网、人工智能、区块链领域的相关企业也迅速参与隐私计算：AI 公司Zama 开源了基于全同态加密的软件库Concrete；Facebook 将基于PyToych 的隐私计算机器学习框架CrypTen 进行开源；创业公司Sharemind、Privitar 致力于搭建自研的多方安全计算平台。

参考资料：

[1]国家工信安全中心：信息技术行业：中国隐私计算产业发展报告(2020~2021)(65页).pdf

[2]计算机行业深度报告：隐私计算千亿蓝海市场加速开启-210809（14页）.pdf

[3]零壹智库：隐私计算在金融领域应用发展报告（2021）：开启新纪元（91页）.pdf

[4]李凤华、李晖、邱卫东、牛犇、邹德清等编写的“隐私计算研究进展、现状及趋势”，收录[5]在中国中文信息学会：中文信息处理发展报告（2021）（472页）.pdf

CBINSIGHTS： 2022年中国隐私计算技术与市场发展研究报告(52页) .pdf