星云Clustar创始人陈凯:隐私计算飓风下,如何找到趋势确定性?|甲子光年

2021-12-02 14:48:10 甲子光年 微信号 

隐私计算“卖铲人”。

2019年,为了打通数据安全交换路径,一家头部互联网银行打造的联邦学习系统正在紧锣密鼓地上线测试。然而,它们遇到了一个十分棘手的问题:使用加密数据进行计算,计算量将增加百倍,使得系统运行非常困难。

实验数据表明,如果AI在未加密模型中训练,需要10个小时,但在加密环境中训练,至少需要100小时,甚至1000小时。

AI训练的算力问题由来已久,而彼时陈凯教授领衔的香港科技大学智能网络系统实验室(iSing Lab)在高性能数据中心网络领域的学术成果近五年居亚洲第一(CSRankings排名)。于是,该机构找到陈凯教授,尝试通过高性能算力加速来解决联邦学习因使用同态加密而产生的计算压力与延时问题。

结果不负所望,陈凯教授与其创办的星云Clustar研发的高性能算力加速方案,在该联邦学习系统上实现了50-70倍的算力提升,保障了该系统的高效运转。

这是星云Clustar算力加速方案落地的一个典型案例。近两年,基于隐私计算及其算力加速能力,星云Clustar已经形成一套全栈技术服务,专注数据安全及数据价值共享难题。

而星云Clustar所处的隐私计算行业,今年正处于市场关注的焦点。数据显示,2020年市场上从事隐私计算业务的企业超过了数百家。2021年间,仅仅四个月时间内,这个赛道已经从VC基金手里融到了超10亿元人民币。

在隐私计算平台还未大规模落地,绝大多数企业都在为技术研发、产品商业化而苦苦摸索时,星云Clustar不仅构建了以平台为核心的全栈隐私计算技术,同时也在探索如何“承包”隐私计算平台落地之后的算力加速市场。

原因在于,隐私计算作为非常新兴的行业,在商业化模式方面充满了“战争迷雾”,但目前业内公认也是技术壁垒最高的需求,就是加密带来的对更高性能算力的诉求。能解决性能问题的隐私计算计算厂商,就是给所有数据淘金者卖铲子的人。无论最后谁胜出,有能力供应基础设施的人一定不会缺席。

而在当前,靠着“卖铲人”的角色,星云Clustar成为了行业内唯一一家落地了国有大行商业项目的隐私计算公司,并受到红杉中国、基石资本、招银国际、华泰创新等头部投资机构青睐。

近期,甲子光年访谈了星云Clustar创始人陈凯教授,试图了解:如何在隐私计算市场的不确定中找到确定性需求和趋势?一家隐私计算厂商为何要“死磕”算力?

1.隐私计算,变革数据流通的硬科技

甲子光年:您是何时注意到隐私计算领域的,这和您之前做的数据中心网络研究有何联系?

陈凯:过去近15年时间,我一直专注于数据中心网络相关研究,即通过高性能网络技术,来提高集群计算的算力。

研究隐私计算的契机,也是由于近两年全球对数据隐私关注度的提升。例如政策层面,欧、美、中各国都出台了数据安全保护相关法案。这些都证明,数据安全、数据隐私正成为下一代人工智能落地的重要环节。

而隐私计算对算力的要求非常高,相关技术涉及大量密码学、统计学运算,对于系统计算和通信性能提出了很大挑战。不解决这个问题,隐私计算大规模落地将受到极大制约。这一需求,正好与我之前的研究方向相契合,数据中心网络技术能够解决更大规模数据运算性能问题,从而满足隐私计算的需求。

所以,近两年我们一直在隐私计算方面加大投入,其中包括行业独有的硬件加速产品。

甲子光年:隐私计算产学研结合的十分紧密,高校孵化或具备高校背景的企业发展较为快速。您如何看待这种现象?创办星云是否有“产学研”的考量?

陈凯:从实验室做研究到发表论文,再到把论文研究成果转化为实际生产力,这是一个非常自然的过程,也是极重要的闭环。

在港科大,我们在数据中心网络、机器学习方面做了很多研究,论文在全球顶级期刊上多次发表。在成果转化上,我们之前是与谷歌、华为、腾讯等企业密切合作,开发了图灵平台等人工智能计算平台来落地。

创办星云Clustar后,产学研落地的闭环会更直接。我们将客户痛点抽象成研究问题,进而形成研究理论、成果,最终通过星云Clustar直接将研究成果落地到实际,形成解决客户问题的方案。

甲子光年:星云Clustar在您研究的领域提供了怎样的助力?可否举例说明?

陈凯:例如,我们有客户提出了一个典型需求:如何验证隐私计算平台本身的安全性,即确保平台的每一步操作严格遵照要求,以保证数据不泄露、信息不出域?

带着这个问题,团队重点研究如何设计一个安全认证系统,让用户能够全流程监控隐私计算平台的运行。同时,为了确保认证系统的客观性、公正,这个认证系统不仅能验证星云Clustar隐私计算平台的安全性,也能作为第三方系统去检验其他隐私计算平台。目前,团队已经将相关研究发表成论文,相关成果也正在落地探索中。

甲子光年:我们关注到您在第四届世界顶尖科学家论坛上分享了高性能联邦学习的研究,目前星云在这一方面有何成果?

陈凯:过去一年,我们在联邦学习底层算力方面有了更深厚的积累。据最新对比数据,星云Clustar的方案在现有的开源隐私计算平台上实现了50-70倍算力提升,性能功耗价格比提升了7倍。

在隐私计算平台的研发和落地上,我们和市场上许多优质的同行公司齐头并进,持续做创新突破。星云Clustar成为了全球最大的联邦学习开源社区FATE的 TSC Board中唯一一家第三方创企,其余4家分别为微众银行、工商银行(601398,股吧)、银联、VMware。

甲子光年:TSC Board是什么?星云Clustar在其中扮演什么样的角色?

陈凯:FATE TSC Board可以简单理解成技术决策委员会,深度影响着FATE社区以及联邦学习技术的发展。星云Clustar在其中主要为社区提供底层算力等基础设施,同时携手其他单位参与制定重要策略,特别是一些重要的行业标准,引导联邦学习技术走向落地。

2.算力,隐私计算的竞争高地

甲子光年:近两年,您观察隐私计算有哪些新趋势、新变化?

陈凯:一个直观感受是,隐私计算从今年开始逐步落地到了生产系统。

前两年,我们和大厂或金融机构聊隐私计算,客户端多是聊技术、聊前景,是创新技术了解的阶段。到了今年,客户端开始聊场景,聊需求,隐私计算开始进入客户生产系统,相关项目也开始起量。

甲子光年:您亲身感受到的客户端变化有哪些?

陈凯:比如一些在隐私计算方面应用比较靠前的金融客户,在搭建联邦学习平台的基础上,提出了明确的算力需求。这一方面,星云Clustar已有项目完整交付。

另一方面,一些尚未布局隐私计算技术的企业,正在从零到一地构建隐私计算平台。

总的来说,隐私计算相关应用正在从无到有、从慢到快。

甲子光年:也就是说,隐私计算技术正处于爆发前夜?

陈凯:隐私计算目前还在商业化初期,但大家对此期待很高。要加速人工智能发展,同时不泄露数据隐私,隐私计算技术是目前市场可见的有效实现方式之一。

甲子光年:爆发前夜,隐私计算产业竞争也十分激烈,您如何看待这种现象?

陈凯:隐私计算当前竞争已经十分激烈,行业鱼龙混杂,许多不是做隐私计算的企业,也在这股热潮中,摇身一变贴上“隐私计算”标签。不过,这也侧面说明,隐私计算具备非常广阔的前景。

目前,隐私计算被开拓的市场规模还不到1%,星云Clustar非常希望联合市场上有真正技术积累的隐私计算公司,一起把行业生态做大。

甲子光年:您认为隐私计算要实现大规模落地,还需要具备哪些条件?

陈凯:概括来说,这个行业还有几个关键问题仍待解决:

一是缺乏标准化服务或商业模式。在需求端,企业数字化进程各不相同,对隐私计算的认知程度也不一样,许多人还停留在感性认知层面,这增加了隐私计算产品落地难度。在供给端,技术深入产业、场景的know-how还在沉淀过程中。如何抽取客户的共性需求,转化为标准化产品,隐私计算企业还在摸索。

二是技术效率。隐私计算在人工智能技术的基础上,增加了大量密码学、通信技术要求,对通信和算力要求非常高。

只有当这些条件都得到满足,供需方面都有了进一步发展,隐私计算行业才会迎来大规模爆发。

甲子光年:算力将会成为制约隐私计算发展的主要原因吗?隐私计算算力目前发展如何?

陈凯:隐私计算的不断发展,算力将起到愈来愈关键的作用,它决定了我们能否将很多分散的、有隐私保护需求的数据真正使用起来。

正如在人工智能领域,如果没有英伟达的GPU算力芯片,深度学习就无法快速迭代、快速发展。同样,如果没有专精型算力平台支持,隐私计算也将面临行业发展瓶颈。

3.做数据淘金行业的“卖铲人”

甲子光年:为什么星云Clustar做隐私计算平台的同时还要“死磕”算力?这背后有什么独特的打法?

陈凯:就像英伟达既有自己的深度学习平台,又有高性能算力芯片,星云Clustar也同时打造隐私计算平台与算力加速产品,这是星云Clustar最独树一帜的地方。

隐私计算与算力业务之间存在着协同作用。隐私计算技术目前离落地更近,星云Clustar中短期的目标是实现该技术在多场景的专业化应用。与此同时,隐私计算平台所构建的客户生态,也将成为今后算力平台重要的市场基础。客户当前使用CPU、GPU承载算力,未来将逐步迁移到专业算力加速平台上。这是星云Clustar市场拓展的过程。

依托于隐私计算平台去研发算力技术,两者耦合将更紧密,优化会更彻底,这是很大的竞争优势

甲子光年:星云Clustar落地了行业唯一的国有大型银行隐私计算平台项目,您认为背后的成因是什么?对后续市场的推动意义又是什么?

陈凯:第一是产品及服务完备性。针对产业上数据“不敢用、不会用、不能用”难题,星云Clustar提供数据生态、隐私计算平台、底层算力加速的全栈能力,实现从数据接入、隐私保护、加速计算需求的全覆盖。

第二,技术层面的“人无我有,人有我优”,真正的场景化服务经验、规模优势是很重要的护城河:

一方面,星云Clustar的技术,尤其是底层算力加速能力处于行业领先水平。

另一方面,产品和场景上做得足够深入。聚焦金融领域,我们与金融科技企业深度合作,打通金融科技产业链,也会与头部的国有银行、股份制银行、互联网银行等客户直接合作。这对星云Clustar积累各类场景know-how,优化产品和工程化能力来说,是很好的机遇与平台,同时也为业务拓展提供了很强的背书。

第三是生态优势。技术生态上,星云Clustar是全球最大联邦学习开源社区FATE 的TSC Board单位,这个社区目前有700多家企业,星云Clustar会与工行、微众、银联、VMWare等“前行者”共同引领社区发展方向,探索技术应用;行业生态上,星云Clustar作为秘书长单位牵头制定了IEEE首个国际联邦学习技术标准,并担任央行北京金融科技产业联盟、工信部中国信通院TC601、信安标委等标准化组织成员,不断共建隐私计算跨平台互联互通总体、通信、协议及金融应用等系列技术标准。

总的来说,企业在生态、技术、场景、应用、服务方面笃定前行,最终都会形成直接竞争力。

甲子光年:在产品和场景做的更深,星云Clustar具体是如何做的?

陈凯:更贴近产业,与客户一起去洞察与解决场景最根本的需求和痛点。目前,星云Clustar已经联合多家国有大行和股份制银行,共同探讨技术落地方式,我们的产品也与多个部门深度合作,深入到业务环节。

在算力技术研发上,我们的实验室已经开始投入低碳算力相关技术,预计很快就会进行产业POC。在碳中和背景下,低碳算力既可以赋能隐私计算发展,又能降低功耗、保护环境。

甲子光年:什么是算力“低碳”效果,星云如何实现低碳算力?

陈凯:相较于明文计算,隐私计算的计算效率会低两个数量级。假设一个AI模型在明文中训练需要10小时,在隐私计算环境中训练则需要100小时,甚至1000小时。星云Clustar通过底层算力加速,将密码学算子引入的开销减少80%。未来,随着隐私计算成为各行各业的基础设施,按照2020年统计的数据中心2000亿度耗电量来计算,星云Clustar底层算力加速方案每年预估可以节省上千亿度电力。

甲子光年:星云Clustar接下来的发展计划是什么?

陈凯:星云Clustar的定位是一家隐私计算全栈技术与基础设施提供商。沿着这个定位,星云Clustar会有“一横一纵”的发展规划:

纵向生态上,继续以全栈隐私计算技术在场景中做深、做厚。不仅要在场景、应用层为客户提供高效易用的隐私计算服务,也要深入产业生态,积极推进技术、应用等行业标准建设,并借助广泛合作伙伴的服务场景,实现产业的深度赋能。

横向生态上,在算力加速方面加大投入,让隐私计算变得更“快”,携手市场头部企业以及云厂商等合作伙伴和用户,共同加速隐私计算落地进程,做隐私计算领域的“算力担当”。

END.

本文首发于微信公众号:甲子光年。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

(责任编辑:张泓杨 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读

        和讯热销金融证券产品

        【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。