首页 > 科技 > 和陈恂聊聊,神秘的隐私计算和下一个技术大爆发

和陈恂聊聊,神秘的隐私计算和下一个技术大爆发

作者:张小珺

软银愿景基金管理合伙人陈恂博士,一直很神秘。他很少接受采访,很少抛头露面,更少有人知道,他还是一家创业公司的联合创始人和董事长。这家叫翼方健数的公司,成立时间是2015年,甚至在他就任于软银以前。

翼方健数被外界称作“隐私计算四小龙”之一,这是从去年起火热的创投领域,但陈恂不认可这种说法。在采访中,他表达了三个反行业共识的观点:

1、虽然隐私计算很火,但未来不会有一家隐私计算公司;

2、隐私计算没有技术流派之分,唯一的选择是全都做;

3、隐私计算很多内容会走向开源。

7月,我发布了《仅仅是昨天:我们亲历的萧条、繁荣和时代》,由于他身兼双重身份——投资人和创业者——我们的聊天不自觉地滑向了他所经历的繁荣与萧条临界点。

陈恂出生于60年代末,毕业于北京大学和斯坦福大学,曾出任摩根大通高级副总裁、银湖投资董事总经理。此外,他有过两段创业。

第一段是和斯坦福导师及同学一起创办睿初科技,将实验室高尖计算技术带向商业化。他们入局时,正值美国互联网泡沫破裂后最萎靡的2002年。2007年当市场转好,该公司被欧洲光刻机巨头阿斯麦 (ASML)并购。陈出任ASML高级副总裁和全球执行委员会成员。他称自己深刻感受到,在萧条来临时创业的困境和优势。这让他能拉长时间纬度,看待我们今天所处周期。

“我一直认为有三个周期,”陈恂说,“经济有周期,技术有周期,意识形态也有周期。但是这里头往往被大家忽视的是技术周期。”这给了他第二次创业的启发。

由于陈恂热爱物理学(在高中代表中国获得国际物理奥林匹克竞赛银牌,本科就读北大物理系),他很喜欢说“逻辑地推导”、“逻辑地推演”。可以看出,他的创业也是在推导和实践一个脑海中结构化的世界。

软银愿景基金管理合伙人陈恂博士

01

上一段萧条记忆,

对人的心理造成影响

作者:现在创业环境和2015年刚开始创业做翼方健数比,变化有多大?

陈恂:创业环境变化最大的一个是资本,所谓“资本寒冬”,这个是存在的。但是,看你做的是哪个方向。像我们做的,实际是太热了。

作者:所以现在是冰火两重天。

陈恂:是的。

我第一次创业就是在最冷时开始的。2002年我和我的博士导师还有同学一起创业,真的是冷啊,bubble完全burst掉(美国互联网泡沫破裂),最低点是2002年。但说句实在话,我是真的感受到了在那个时间创业的优势。

1、人才的机会变少了,能相对容易地聚集人才。

2、冬天外面比较萧肃,没那么热闹,人心相对静一点。北欧会出大科学家、文学家,或许因为安静好做事,周遭环境没那么热闹。

3、有胆量在这时出来做事的人不多,竞争相对较弱。等到环境慢慢回暖,有人看到这事儿可以搞,我也来搞,你就永远和他之间有时间差。我比你多跑一年、两年,差距是明显的。

你等于是从经济周期的最低点往最高点,一路向上。

作者:今天和2002年那场萧条对比的话,差异大吗?

陈恂:还真不大一样。2002年,人们对未来期待是相对清楚的。因为1999年、2000年纳斯达克冲到5000点,大家都在谈,未来是什么样子?互联网啊。那个东西清楚不清楚?清楚的。那个东西是对还是不对?是对的。只不过它消耗太早,短期期待太高,有一些过分投资。2002年大家的心态更多是,我需要多少时间来消耗这个东西,等新投资起来。

我不觉得今天很多人想清楚了。我们有我们的看法,对还是不对,时间会验证。但是,我不觉得很多人今天想明白了未来到底是怎么回事,怎么发生的。而且今天没有2002年那个时候冷。

作者:听说那时候好多人跳楼。

陈恂:你说现在还有冰火两重天,那个时候是绝对的冷,没有任何一个领域是好的。我倒觉得这次和上一次最大的区别,就是因为有了上一次,从2002年开始一路高歌。这段记忆对人的心理造成影响。会有人比较主动地思考,我如果傻傻地把今天当作2002年,就会错过后面20年一路高歌。我猜想这个心态可能在,所以还有人没有熄灭掉。

还有一个因素,现在都是年轻人在做事,80后、90后,他们没经历过这个过程,尤其是中国,中国已经40年没有经历过经济周期。年轻人完全不知道经济周期是怎么回事。中国一直在用国家的力量调节,而且中国经济调节的空间一直很充裕,一旦经济周期来了,动一动,就让它回去了。每次周期来得特别快、特别短,所以没感觉。

我们这代人会说我们挺幸运,因为在我们最高产时经历了一个历史上少见的和平、繁荣的时代,一个科技大爆发的时代。

下一个来的时候估计我该退休了。但一定也会来。

02

大家说隐私计算公司火了,

可我认为未来根本不会有这种公司

作者:说说你为什么2015年要做一家数据公司(翼方健数)吧,这是你的第二段创业。

陈恂:大概在2015-2016年,我们几个人在一块聊未来是什么样子,很快就聚焦到数据会越来越重要。数据和我们所熟悉的各种东西非常不一样,它很特别。

从经济学来看:1、数据具有“非排他性”。假设我有一个数据,我给你,你也有了,我也有了;假设我有100块钱我给你,你多了100,我少了100。经济学家管它叫“非竞争性”的物品。天下绝大多数物质的东西是排他的。

2、数据有“价值的外部依赖性”。我手机里有一堆数据,经济学家能给它定价说,值多少钱吗——没有答案。数据的价值在于谁来用、用它干嘛、在什么时间点用、和什么其他数据放在一起用。这些决定了价值。和其他东西放在一起用,另外一个说法是“网络效应”。外面的东西越多,和它在一起,它的价值就越大。

3、从非经济学角度,数据特异性在于——隐含了隐私和机密。数据是真实世界的镜像。我可以通过镜像来了解人,但一个人不是在所有情况下都希望所有人真实地了解自己,这叫隐私。放到企业层面,数据蕴含了知识产权、商业机密。放到国家层面,数据涉及国家安全。所以,数据不适合裸奔。

你再想想我们熟悉的生产资料,有多少具有这些特性?金钱、土地、人才、贵金属、水、电。几乎没有。上一次出现一个具有通用性的生产要素,是资本。

作者:这些特性能说明什么?

陈恂:把这一段的思考总结成两句话就是:“原始数据不出域,数据可用不可见。”

“原始数据不出域”,这个“域”是信任域。假设我今天把数据存在这张桌子上,你和我在这个域里,我对你100%信任。这时一位穿红衣服先生来了,他不在信任域里,我们的原始数据就不能到他那去。把这件事放到实践中,小到部门,大到集团企业,再大到区域和国家——举例来说,现在全世界都在说,什么数据可以出国,什么数据不可以出国,这个域指国家。很多互联网集团在内部“断系统”、“断数据”,以独立法人为单位,这个域定义成“法人域”。

“可用不可见”的用和见的区别在于,“见”是眼睛看见就是见了,或者是能够把它拿走;“用”是算法来算,计算某个结果,来解决某个客户某个具体的问题。这个叫数据产品,就是能把数据用起来产生价值。

这两句话在某些领域已经写在法规里了,比如金融,在某些领域写在行为准则里。在我们看来,这两句话是“数据原生时代”的行为准则。

你从这两句话再往前走,又可以逻辑地推理出一些很有意思的事情——1、假设现在要用我们的数据去为那位红衣服先生服务,只有一个办法,用分布式网络让数据连接;2、结网方式必须保护数据隐私,隐私计算很重要;3、当你有一张网,就要问以下问题,谁能入网,谁能决定,什么样的验证机制,如何结网,网络资源如何分配?网络相关管理能力就自然而然出现了。我们管这张网叫“数据和计算的互联网”。我们企业在做这件事。

作者:外界将你们视作一家隐私计算公司。

陈恂:不是,这个非常关键。我们企业在做数据和计算互联互通的建设者、运营者。

隐私计算是长链条的一个环节。这个链条是数据价值释放的链条。如果一堆数据,我随便抓一个例子:某医院,院长说我要做数字化转型、智能化转型,把数据用好。要回应他的要求,有一堆事情要做。

首先是发现数据。院长说我把数据用好,他不一定知道数据都在哪。数据分布在不同系统里。

其次是数据治理。它在不同数据系统有不同标准,有的人喜欢用“数据标准化”,我认为这个词有些误导。我们一般用“数据资产化”。你需要把数据清洗,该归一的归一,该标准化的标准化,该格式化的格式化,该结构化的结构化。我们一直用的语言是:需要建立数据模型。以上两个步骤是数据的准备,我们管这个叫做“数据完成了资产化”,意思是它完成了为通用目的的相应准备,变成一个资产,可以用了。

接下来是隐私计算,要加密、脱敏、可用不可见,让别人用的时候不调用数据隐私,侵犯数据里的权利。

最后,数据产品在上面这些的基础上用好数据,做好应用,产生价值给到用户。

当你说“数据和计算的互联网”,实际上是说互联网上每两个节点之间的链接:一个是用数据的人需要的价值,一个是提供数据的人提供的数据。点和点之间的连接是很长的价值链条,而不仅仅是隐私计算——隐私计算是必要,但不充分的条件。

当然没有什么好奇怪的。大家为了简化交流和沟通,必须要做一些信息说明,要不然讲这么一大堆话也太累了,所以总得有个名字,有个标识。

作者:如果把你们的标识简化一下,你们是要运营一张网络?

陈恂:一张数据和计算的网。我们用“计算”这个词包括了三个含义:算力、算法、隐私计算,我们管这个叫IoDC(Internet of Data and Compute),数据和计算的互联网。

未来有没有一家公司是隐私计算公司呢?不可能,就像今天不会有一家公司是计算公司,可以有手机公司、芯片公司、云计算公司,但是不可能有计算公司。所以,未来我们认为也不会有隐私计算公司。

作者:如果没有隐私计算公司,未来也不会有一家数据和计算的公司,你们究竟是什么公司?

陈恂:这就涉及我们要往下挖一步。

这么大一个互联网,没有一家公司管理整个互联网。但是,有没有去组织、管理、运营某一个专有网的公司?有,所有互联网公司都是。滴滴打车是一家,当你下载滴滴App就加入了它的网。但是,这张网上只给你提供一件事,给你打车。你要想买菜,对不起,你去叮咚买菜。叮咚在运营它的一张网,滴滴打车在运营它的一张网,美团在运营它的一张网,深圳市政府在运营它的一张网。这个网和那个网之间有关系吗?不见得有关系,不见得会互联,但也许某个地方有个弱连接。

IoDC也是这样,这张网是一张公用的基础设施,全世界可能只有这么一张。但是,一个企业能够扮演的角色是,你要能把这个网用好,为某一个商业价值服务。还有一个可能性,就是卖组网需要的技术和产品。无非这是两个商业模式。互联网时代出来至少两个类型的公司,思科大赚其钱,谷歌大赚其钱。

今天,我们两件事都可以做。既可以卖基础设施和技术,也可以在上面做独特的应用。

作者:企业战略是?

陈恂:横纵发展。纵指的是垂直领域,例如医疗、金融和营销。医疗领域数据价值非常大,但是数据用不好或用不起来,因为太复杂。金融领域,监管要求越来越严。营销属于弱监管领域,但是因为营销面对个人,《个人信息保护法》对它的影响深远,所以营销也在经历一次自发的为了满足合规要求的重塑。

一横,你能想象,它是个平台化的东西,能就一些分散的长尾场景服务。

作者:隐私计算有技术流派之争吗?

陈恂:媒体上经常用技术流派这个词,我认为是不对的,武功的流派是说你软我硬,你外功我内功,但目的都是把人打倒。你如果是想做IoDC联网,你在隐私计算的流派上是什么选择?你的选择是你必须都做。

我还有一个判断,隐私计算里面很多的内容最后会是开源的。为什么?隐私计算最重要的概念是信任——有一个场景,你必须告诉我你信谁、不信谁。信任是当数据要流通,但数据又很敏感的时代的一个新维度。隐私计算的路线选择是基于信任假设来决定。你有这样的信任假设,你就要用这样的技术。最后你会发现你这个不信那个不信,技术你还得信,那怎么办?我凭什么信你?你说你是这样弄的,我怎么知道你是这样弄的?一个很重要的办法就是开源。

作者:在建设这张网的过程中,有踩过坑吗?

陈恂:我们曾经想过从2C(面向消费者)去切入,但后来更强调2B(面向企业和机构)。虽然说每个人的生活很数字化,但你有没有观察到,你的数字存在是分离、分散的。购物在京东和淘宝,打车在滴滴,它们之间只要不互通,数据就没有统一。所以,一个人的数字存在是很难打通的,而且每个消费者无法管理自己数字存在的数据。这算是一个很大的坑。

03

经济有周期,技术有周期,

意识形态也有周期,

往往被大家忽视的是技术周期

作者:你认为互联网之后,下一个技术大爆发会是数据和智能?

陈恂:我不认为有比这更大的事了。人工智能的出现不是几百年一遇,是几千年、几百万年一遇的机会。无非就是它在什么时间点爆,以什么样的形式。数据和智能永远是一体两面——你有多好的数据,我就可以给你多好的智能;你有多烂的数据,智能就有多烂。

作者:你预估大爆发还有多长时间?

陈恂:人对10年的判断永远是保守的,对2-3年的判断永远过于激进。我认为时间点会在10年之内,但是靠近10年。

作者:在人工智能的技术变革里,未来3年、5年你能看到什么趋势?

陈恂:第一,未来3年,智能的寒武纪时代会继续,会出现非常多智能的封装和表达形式,就是小模型、大模型,这种东西会越来越多,之所以叫寒武纪大爆炸,就是物种越来越多。

第二,计算会变得越来越异构。所有这些东西都是在计算,不同的模型对于计算的要求不一样,不同的应用对于计算的要求也不一样。现在对计算最大的挑战是,它高度异构。异构的意思是你为了解决某具体问题可能要CPU、GPU、NPU的某种特别组合,好像搭积木一样。这是最重要的技术趋势之一。

第三,就是数据,我们在做的这件事。数据是天生异构的。我们刚才说的那张网铺起来,让数据能流动起来。算力的最大特点和未来最重要的趋势是异构化。这意味着什么?就意味着某种计算很有可能在这个节点上最有效,能做得最好。另外一种计算,你在这个地方算不好、算不了,或者太贵,或者时间太长,可能要拿到另外一个节点上去算。

也就是说你在这张网上调用的东西不仅仅是数据,你还得调用算力,因为算力是异构的,你还得调用算法,算法也是异构的。所以,现在我们可以回到原点,对未来的判断就是两个字:异构。数据是天生异构的,算力是异构的,算法是异构的,而且是越来越多不同的种类,不同的物种。

异构的东西你要融合在一起,怎么做?结网。在一个网络里我可以调用,我可以把不同的东西组合、适配在一起。IoDC就是人工智能三要素——数据、算法、算力 –——在异构情形下高效重组的方法。

作者:现在走向下一个技术爆发的阻碍是什么?

陈恂:主要的阻碍就在于它的门槛过高,摩擦太多。交易成本可能是金钱,可能是时间,可能是人才的缺乏,可能是监管的不统一,等等等等。所有这些东西都是市场交易的摩擦力,friction。能够让它的摩擦降低,让它的交易成本降低,数据和智能就能流动起来。这是要解决的最大的问题。

把某一个非常重要的具有巨大潜力的东西的门槛降下来了,它就会爆。到那个时候,数据可以相对自由、简单地找到和使用,智能可以相对简单和便宜地产生,用到场景中,这就是人工智能真正进入我们社会经济里的图画。

作者:经历过上一个周期对你今天创业会有哪些指导?

陈恂:要相信技术的力量。我一直认为有三个周期。第一个是经济周期,通常和金融的周期绑在一起。第二个是技术周期。第三个是社会周期,是人的意识形态的周期。显然我们处在意识形态周期里的转折点,或者已经过了转折点——从“全球化”到“去全球化”的过程。

这里头容易被忽视的是技术周期。不信你去看媒体上写的内容,大家经常在聊的都是金融周期、经济周期,政治、民生上如果有大变化,大家会聊社会的周期。但是,有多少人跟你讲技术的大周期?原因也很简单,能领会这个东西的人没那么多。

作者:技术周期大于社会周期和经济周期吗?三个周期的关系是什么?

陈恂:技术周期的特点是一路往上的,是单向的,浮动的只是进步速度。社会和经济周期是有些钟摆性质的,上下起伏。这三个周期是互相纠缠,互相共生的。技术的大进步会推动经济的大发展,但往往爆发性发展之后,社会和经济会出现重整、调节、摇摆。

作者:人类历史上出现过哪几次大的技术周期?怎么判断技术周期的高潮和低谷?

陈恂:从大图画来说,是石器、铁器、能源、工业化、信息化这些大家耳熟能详的大技术周期。判断高潮和低谷不难,真正的大周期,每个人能直观感受到。离我们最近的一次技术大爆发是互联网和移动互联网。

作者:现在属于技术周期的哪个节点?

陈恂:现在在技术周期相对缓慢的准备期,是一个平缓期。它是在大爆发前的时期。相当于互联网的80年代末。

上一次技术周期的爆发互联网,它的力量已经释放出来了,能触达的经济领域也基本触达了。还有一些利基市场的机会肯定也会存在,但不是像过去那样。我们在为下一个这样类似的爆发做准备工作。

下一个爆发的是什么?一旦数据和智能的高效链接开始出现,就会爆。而所谓“高效链接”就是我刚刚说的异构要素流通的基础设施。

作者:为什么不是像互联网的70年代,而是80年代?

陈恂:因为没有那么远。这个是乐观的。

还有一点,必须知道的是90年代离现在已经30年,人类社会进步是永远在加速的。今天的10年比30年以前的10年显得更长。那个时候需要10年发生的事情今天肯定不需要。

一个一个技术完成积累、成熟,慢慢标准化、专业化,只有标准、专业的才能互联、降低门槛、减少摩擦。等这些东西都到位了,它才能爆。

作者:很多人都在议论未来到底投不投中国市场,你怎么看?

陈恂:我认为中国经济体原生的创造力是丰富、强大的。这是一个勤劳勇敢的民族。有时候在国外碰到朋友聊起天,我一天16个小时都在干工作,你也就做8小时。所谓勤劳和勤劳是有区别的。中国的创造力也很丰富。

从技术上来说,我是短期内持相对乐观的判断。你看一个东西永远是看它的需求和供应。从需求来说,中国经济的人口红利差不多用完了,外贸红利差不多用完了,必须要做所谓的供给侧改革。最重要的是提升经济效率。效率最需要的是技术和管理能力的引入。所以,从需求端看,技术需求旺盛。

从供应端看,技术的供应也应相对充沛。在过去相对“地球比较平”的时代,我们和国际接轨通畅,引入了国际上的人才,学习了国际上先进的知识和方法,经济的活跃也意味着培养了自己的能力。把这些东西放在一起,在短期内技术能力的供应是蛮充沛的。

那么,需求旺盛、供应充沛,在短期内中国技术进步是可期待的——这个短期我指的是10年。10年之后是个问号。

这里面最最关键的问号在哪,就是在跟国际的接轨这件事上能不能保持一定的畅通?技术、科学是国际化的。如果技术、科学慢慢受到的阻碍太多,甚至越来越严重,那我觉得在那个时间点也许会放缓。

所以,回答你的问题,我认为中国是长期——这个长期和我刚才用的短期是一个时间概念,10年——是看得到的,是乐观的。

作者:有什么样的可能性,最后没有按你的逻辑推演去发展?

陈恂:那太多了。未知的恐怖就在于它是未知的。

本文来自网络,不代表趣头条立场,转载请注明出处:https://www.ngnnn.com/article/4_69263.html
上一篇微软Win11 Dev预览版25174发布
下一篇史书是否说谎?或许树木年轮可以作证!|张齐兵

为您推荐

公共数据安全保护不足 隐私计算或能显著降低风险

公共数据安全保护不足 隐私计算或能显著降低风险

经济观察网 记者 沈怡然7月25日,第五届数字中国建设峰会落幕。会议期间数字中国研究院(福建)、数牍科技以及复旦大学数字与移动治理实验室联合发布的《隐私计算与公共数据开放白皮书》(以下简称《白皮书》……
返回顶部