国内大厂纷纷入局 爆火的隐私计算究竟是什么?

  大约从 2018 年开始,BAT 等国内大厂,成熟的大数据公司,甚至初创科技独角兽,都在陆续布局隐私计算。

  有媒体统计,2021 年 7 月至 10 月,仅四个月时间内,隐私计算赛道就拿到 10 亿融资。2021 年也被认为隐私计算进入商业落地的元年。

  尤其是数字经济发展驶入“快车道”,《数据安全法》《个人信息保护法》等的出台,数据安全被重点监管,又为隐私计算加了一把火。

  中国信息通信研究院发布的《隐私计算白皮书(2022 年)》显示,预计到 2025 年中国隐私计算市场规模将达到百亿元人民币。

  那么,究竟什么是隐私计算?

  “我要从南到北,我还要从东到西,我要人们都看到我,但不知道我是谁。”一名浙江大学隐私计算方向研二的学生化用崔健《假行僧》的歌词,如此形容他眼中的隐私计算。

  而在蚂蚁集团隐私计算研发工程师宋少威看来,“隐私计算是一杯冰美式,咖啡凉了,冰不曾存在。”“隐私计算并没有那么高大上,写代码、找 BUG、修 BUG 才是日常。”

  好像看懂了,又好像没有。事实上,隐私计算并不是单一的学科,而是一套复杂的技术体系,包含了硬件、密码学、分布式机器学习等多种底层技术。具体是指在处理视频、图像、文字、数值、泛在网络行为性信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,支持多系统融合的隐私信息保护 。

  隐私计算的核心价值是能够实现“数据可用不可见”、“数据不动模型动”。比如,现在电信诈骗、网络赌博高发,急需建立一个反诈平台,这就必须要有政府数据、互联网数据、银行数据,如果他们谁都不愿也不敢把自家的数据拿出来,这时候隐私计算就发挥作用了。它可以在保障原始数据不出库的情况下,通过隐私计算,安全输出计算结果。

  在现实生活中,隐私计算已经无处不在,一顿早餐支付、一次保险理赔,都有它的身影。说到底,隐私计算是保护数据安全的。对于普通人而言,随着隐私计算应用的不断拓展,个人信息也会得到更有效的保护。

  国内大厂纷纷入局

  随着数字经济驶入快车道,信息保护、数据安全越来越频繁地被提及,这也加快了科技企业在隐私计算领域的布局。近年来,阿里、腾讯、百度、蚂蚁集团、微众银行等大厂均已入局。

  当前隐私计算在全球范围内都处于攻坚阶段,行业正在通过开源开放的方式,降低技术门槛,加速技术普及。据了解,隐私计算国内外开源项目已达 40 多种。

  2019 年初,微众银行开源了全球首个工业级联邦学习框架 FATE (Federated AI Technology Enabler),并于同年 6 月捐献给 Linux 基金会,成立 FATE TSC 对 FATE 社区进行开源治理,成员包含国内主要云计算和金融服务企业。

  随后,百度先后推出了通用安全计算架构 MesaTEE 和开源联邦学习框架 PaddleFL。MesaTEE 采用了百度安全实验室提出的混合内存安全技术、机密计算技术和可信计算技术,并构建了 FaaS 通用计算架构。而 PaddleFL 则基于飞桨开源框架,为联邦学习研究人员提供了基础编程框架,并封装了公开的联邦学习数据集。

  2022 年 7 月,蚂蚁集团也宣布面向全球开发者正式开源可信隐私计算框架“隐语”,覆盖了几乎所有主流隐私计算技术路线。2023 年 3 月,“隐语”宣布产品升级,并开源了 SCQL 功能。SCQL 提供的简单易上手的 BI 分析可帮助中小机构快速解决急迫的长尾数据安全分析需求,在工业界首次实现了隐私数据从 Al 分析到 BI 分析,是隐语走向易用的重要一步。

  “由于中小机构的数字化水平处于初期,数据量属于小样本阶段,Al 机器学习的方式不必要也不具性价比,而以 SQL 语言为主要手段的 BI 分析是最具可行性的方案”,隐语开源框架负责人、蚂蚁集团隐私智能计算部总经理王磊表示。对于大规模数据场景来说,BI 数据分析也是不可或缺的重要分析手段。“从大数据到小数据,SCQL 都能满足密态数据安全分析的需求”,王磊强调。

  值得一提的是,虽然众多大厂都已入局隐私计算,但从行业发展成熟度来看,国内隐私计算市场才刚启动。

  应用层面还不够深入

  对于隐私计算的发展前景,蚂蚁集团副总裁兼首席技术安全官韦韬表现得很乐观。他坚定地看好这个赛道,还对正在该领域实习的学生说,“隐私计算未来市场几百亿,是非常好的就业方向。”同时,韦韬也强调,虽然隐私计算市场在快速发展,但在应用层面还不够深入。

  据了解,隐私计算目前在金融、医疗、政务、智能汽车、营销、工业和电信等具备大量数据基础的领域拥有较多应用,业务场景不断出现。其中,在金融领域,金融风控和获客是国内隐私计算最主要的落地场景。

  国泰君安证券报告指出,随着智能汽车行业的快速发展,智能汽车有望成为继金融、医疗和政务之后的另一大重点领域。据统计,过去 5 年智能汽车被黑客攻击的次数增长了 20 倍。一辆汽车每天至少收集 10TB 的数据,一旦隐私泄露,对人身安全和国家安全都可造成不可估量的后果。

  结合多年的从业体会,王磊在谈及隐私计算时表示,做隐私计算要沉得住气,做成一个产品三五年起。但不管隐私计算有多晦涩,技术有多复杂,投入成本有多高,它一定是这个时代最需要的技术之一。

  和许多其他 TO B 赛道一样,隐私计算这个赛道也需要不断积累,需要入局者做好长跑的准备。