首页 > 科技 > 港科大陈凯:以底层通信网络与算力为锚点,攻坚高性能隐私计算

港科大陈凯:以底层通信网络与算力为锚点,攻坚高性能隐私计算

2022 年 7 月,《麻省理工科技评论》中国正式公布了 2022 年隐私计算科技创新人物入选者。

在此次入选者中,我们看到了秉持科研实用主义的研究学者,也看到了实现技术革新的应用型人物,还有实现产业鼎新局面的行业人士,他们求新远征,不断推进技术研究与行业应用崭新面貌。我们将陆续发出入选者的独家专访,走进他们的创新成果,分享他们对隐私计算的理解与经验。

隐私计算行业的快速发展离不开数据要素市场需求与隐私保护合规要求的双重机遇,同时也面临着技术、应用标准化及安全、效率平衡的挑战。

多方安全计算、联邦学习以及同态加密等隐私计算技术,由于引入了大量加密计算和网络通信,相较于明文计算来说,其计算效率将会降大大降低。

以全同态算法为例,在通用芯片上密文运算的速度比明文运算慢了 1 万倍。这意味着,算力问题,即计算和网络通信将成为推进隐私计算规模化落地的核心限制因素之一。

作为算力网络、隐私计算和联邦学习系统领域较早一批的研究学者,香港科技大学陈凯专注于系统架构与算力加速的探索。

▲图 | 《麻省理工科技评论》中国 2022 年隐私计算科技创新人物入选者陈凯

2019 年,陈凯对业界首个联邦学习开源框架 FATE 进行了端到端的性能测量和分析,揭示其存在的三个重要性能瓶颈,率先提出了 FATE 进程间通信问题的解决方案,成为 FATE 重要开源贡献者,为解决联邦学习算力和通信问题提供了指引。

面对数据隐私保护和传输带来的加密计算和网络通信等新挑战,陈凯从实践出发、以系统和网络性能优化为锚点服务隐私计算。

坚持问题驱动,护航数据价值

数十年来,陈凯的研究方向围绕数据中心网络和机器学习系统展开。在 2012 年博士毕业于美国西北大学后,陈凯便回国至香港科技大学任助理教授。

谈到自己的科研风格,陈凯表示自己始终坚持需求导向和问题导向,希望能够借助科学研究破解行业发展难题。

“一方面,在现在这个时代大背景下,我从事的数据中心,算力网络、大数据和人工智能等技术是数字时代发展的基础架构,将其作为研究方向,能够解决实际生产和生活中的应用难题。另一方面,港科大为我们提供了优渥的科研土壤,目前我大部分研究论文在港科大的数据中心经过实验验证,并非纸上谈兵。”

▲图 | 来源:陈凯

2022 年初,陈凯领衔撰写的专著《隐私计算》正式出版。该书首次较完整地展现了隐私计算的知识体系,系统阐述了隐私计算的理论基础和关键技术,包括隐私计算的 4 个发展阶段,5 个应用平台和 9 个落地实践案例等,是市面上较早全面、系统论述隐私计算的中文著作。

提起撰写《隐私计算》专著的契机,陈凯表示与近两年全球对数据隐私关注度提升,以及自己与团队在网络通信方向的研究密不可分。

欧、美、中各国都出台了数据安全保护相关法案。数据安全、数据隐私正成为下一代 AI 落地的重要环节。而隐私计算对算力的要求非常高,相关技术涉及大量密码学、统计学运算,对于系统计算和通信性能提出了很大挑战。

“这一诉求与我之前的研究方向相契合,数据中心网络技术能够解决更大规模数据运算性能问题,从而满足隐私计算的需求。”陈凯表示。

谈及近年的科研经历,陈凯表示记忆犹新的一个案例是和学生们一同探索流量调度的研究。

流量调度是数据中心中的热点研究问题,其主要指何时以及以多大速率传输每一条网络数据流的问题。流量调度对数据中心供应商和用户都具有重要意义。

2015 年,陈凯和团队在做有关流量调度的研究时发现,前人的研究存在一个通病,即提前预设流量的大小。陈凯表示:“实际上,流量在流转的过程中还会生成,我们不能以‘上帝的视角’假设一个流量。”

为此,陈凯和团队提出了一种新的调度方案 PIAS(Practical Information-Agnostic Flow)[1],PIAS 能够在流大小未知的情况下完成流的调度,利用多个优先级队列来实现多级反馈队列调度算法,降低流的平均完成时间。

问渠哪得清如许,为有源有活水来。“做科学研究更应该从实际工作出发,从实践中发现问题。”陈凯这样说道。

搭好“地基”,驱动算力加速器

有了科研和实践的积累,恰逢“东数西算”催生算力新时代,陈凯意识到这是一个新的机遇。

算力即计算力,指的是数据的处理能力。随着信息基础设施、融合基础设施、创新基础设施在内的“新基建”火爆,算力提升也被提升至举足轻重的地位。以数据中心、智能计算中心为代表的算力基础设施,包含在信息基础设施当中。

“不解决算力和通信问题,隐私计算的大规模应用将无从谈起。”陈凯直言。在陈凯看来,联邦学习采用大量密文计算,加密后的数据计算将会产生大量的算力开销,单次模型训练与迭代的耗时将会呈现指数级增长。

相较于传统分布式学习技术,联邦学习的模型分布于不同机构、不同行业的参与方。因此,联邦学习的实际应用往往需要频繁通信以交换中间结果,加之以密态来传递中间结果,进一步降低了数据传递效率。

▲图 | 来源:陈凯

陈凯表示:“一般的数据体量在 32bit 或者 64bit ,使用加密算法或同态加密后,数据体量会增至 1024bit 或者 2048bit。所以,数据体量的增加会给计算存储和网络通信带来新的挑战和诉求。”

陈凯带领港科大 iSING Lab 研究团队[2]对 FATE 进行了端到端的性能测量和分析,揭示了其存在的三个重要性能瓶颈,包括进程间通信、数据加解密和网络传输等,为解决联邦学习算力和通信问题提供了指引。

FATE 是全球首个联邦学习领域的开源计算框架。iSING Lab 研究团队在此基础上,率先提出了 FATE 进程间通信问题的解决方案, 成为 FATE 的第一个开源贡献者。

立足联邦学习算力及通信挑战,陈凯还带领团队自研了高性能加速网络技术与自研业界首个异构加速方案,在异构算力加速、FPGA硬件加速、GPU 算力加速、网络加速、算法优化、计算引擎与调度平台上进行了大量技术创新与研究工作。

“异构加速方案实现了四个维度的隐私计算性能提升。”陈凯表示。

第一,异构算力加速方案对 GPU、FPGA、算法的缓存问题、存储以及运算资源、布线资源、模幂运算效率低等问题进行了整体优化,将同态加解密以及密态下的运算效率提升 50 余倍。

第二,创新性设计了 FPGA 实现架构,支持多达 16 个任务并行计算,配合计算引擎可支持多大 330 个模幂计算引擎,支持最高 4096 bit 位宽数据的密态运算,相较于 CPU、GPU 方案,功耗平均降低 3.5 倍,性能功耗价格比提升 7 倍。

再者,自主研发设计了高性能 GPU 加密计算方案,支持数据在加密状态下进行 AI 模型训练与推理,支持多达90个任务并行计算,支持最高 32768 bit 位宽数据的密态运算,相比于 CPU 计算实现 40-180 倍性能提升。

最后,以 RDMA 高性能网络技术优化远距离通信模块,实现高吞吐、低时延、低 CPU 负载的两点间通信,将计算节点间的网络延迟减少到原来的 25%,实现 200%-450% 的性能提升。

总结而言,异构加速方案突破了传统网络通信中算力在多点间不能有效横向扩展的瓶颈,大幅强化分布式计算的通信效率与计算能力。

如果用火箭来比喻人工智能,那么数据就是火箭的燃料,算法就是火箭的引擎,算力就是火箭的加速器。“通过提升算力,推动隐私计算行业发展是我们的愿景。”陈凯总结。

产学研融合,助推算力终落地

实现愿景的前提是行动起来,将研究的内容真正转化为生产力。陈凯带领团队研发的多项成果在谷歌、微软、华为、字节、腾讯、微众等国内外企业落地应用。

2016 年,陈凯为华为首个基于机器学习的智能网络控制系统(Network Mind)提供核心设计。2017 年为谷歌深度学习框架 TensorFlow 设计了分布式高性能网络 RDMA 并贡献到官方的TensorFlow/GDR 系统实现中,该设计已被业界广泛使用。

和众多企业合作后,陈凯意识到业界对算力性能仍有较高需求。与此同时,很多投资机构十分看好陈凯的研究成果,多重因素催生了“产学研”开花结果。

2018 年,陈凯创办了星云 Clustar,聚焦于隐私计算和联邦学习基础平台和算力技术的研发、创新和落地。

作为星云 Clustar 创始人,陈凯对星云 Clustar 的期望就是坚定做以算力为核心的隐私计算技术提供商,研发隐私计算的加速引擎,推动隐私计算行业的快速扩展与规模化。

“做研究不是纯理论研究,而是要将其应用落地。算力是数字经济时代的核心基础能力,其中蕴藏了很多值得研究的问题和机会,‘地基’搭建完成后,还要推动隐私计算在各个领域、场景持续落地。”陈凯总结道。

参考资料:

[1]Wei Bai, Li Chen, Kai Chen, Dongsu Han, Chen Tian, Hao Wang, “Information Agnostic Flow Scheduling for Commodity Data Centers”, in USENIX Symposium on NetworkedSystems Design and Implementation (NSDI), May 2015.

[2]https://ising.cse.ust.hk/

本文来自网络,不代表趣头条立场,转载请注明出处:https://www.ngnnn.com/article/4_119200.html
上一篇上半年大赚9亿,雅迪董经贵成为六安市最富有的人
下一篇英特尔将在印度设立半导体芯片制造厂

为您推荐

“阿瑟”下一站顶流,不沾陈凯歌的光,全靠演火这部剧

“阿瑟”下一站顶流,不沾陈凯歌的光,全靠演火这部剧

陈飞宇搭档张婧仪主演的青春偶像剧《点燃我,温暖你》,开播以来,连续数日热搜不断。剧集引热议同时,观众们纷纷感慨:阿瑟终于要火了!下一个新晋顶流就是陈凯歌导演的儿子?Arthur陈飞宇可谓是自带热度进入大众视野的,他是陈凯歌、陈红都的二儿子。然而在此之前,他最出圈的名场面,还是父亲贡献的“Arthur,请坐。”陈
多款重磅芯片产品亮相WAIC,为元宇宙算力“蓄能”

多款重磅芯片产品亮相WAIC,为元宇宙算力“蓄能”

2022世界人工智能大会(WAIC 2022)召开前夕,第一财经记者探访世博中心展台,华为昇腾、瀚博半导体、燧原科技等一众芯片参与者齐聚,届时将有包括国产7纳米云端GPU等重磅产品发布。目前,上海已汇聚全国40%左右的集成电路人才,最新数据显示,今年1至7月,上海集成电路产业销售额同比增长超过18%;上海已成为国内集成电路
返回顶部