图源:东方IC
美东时间9月1日下午四点(北京时间9月2日凌晨四点),纳斯达克闭市,英伟达股价定格在139.370美元,比前一天下降7.67%,这已经是它连续下跌的第五个交易日。
坏消息从8月26日便开始传出,在英伟达向美国证券交易委员会提交的一份报告中提到,美国政府通知英伟达,要求对公司未来向中国(包括中国香港)和俄罗斯出口的A100以及即将推出的H100芯片实施新的许可要求,而且立即生效。类似的禁令也出现在AMD(美国超威半导体)身上。
A100和H100是英伟达分别在2020年和2022年发布的高端GPU芯片,主要部署于大型数据中心的服务器中,用于云端大规模模型训练等高算力应用。
对此消息感到兴奋的,是9月1日正在参加2022世界人工智能大会(WAIC)的张凌岚,作为国内GPU公司壁仞科技COO,他告诉《IT时报》记者:“我们的终极目标就是替代英伟达,现在机会来了”。
国产通用GPU(GPGPU)是今年WAIC的“当红炸子鸡”,在八大“镇馆之宝”中占据两席,上海天数智芯的“智铠100”和上海壁仞的BR100系列芯片,均将自己的量产时间定在了年底。
9月2日,国产高端GPU厂商、“AI芯片第一股”寒武纪上涨20%,涨停封板。英伟达则披露了最新进展:获得美国政府批准,可以在明年3月前继续为服务于美国客户的产品(中国生产)提供A100,H100的时间点则推迟至明年9月。
资本市场并没有感到轻松,截至美东时间9月2日(北京时间9月3日)收盘,英伟达股价再次下跌2.08%。
国产GPU的繁荣
上海10块国产AI芯片流片点亮成功
集成电路,是上海确定的三大先导产业之一,经过多年发展,上海已成为国内集成电路企业最积聚、产业链最完整、综合技术水平最高的地区之一。数据显示,今年1~7月份,上海集成电路产业(销售额)同比增速超过18%。同时,上海“虹吸效应”明显,全国超过40%的集成电路人才汇集于此。
不难理解,为何9月1日下午举行2022世界人工智能大会芯片高峰论坛上,寒武纪、百度、昆仑芯、地平线、天数智芯、壁仞等国内新贵芯片厂商悉数到场。上海市委常委、副市长张为在致辞中表示,上海正在发挥自身优势,加快布局人工智能和芯片两大产业,截至目前,国内最大的AI计算芯片、全球算力最高的通用GPU芯片、7nm通用GPU推理芯片等10块AI芯片流片点亮成功。
其中,不少国产芯片公司直接对标英伟达。
此次入选WAIC八大“镇馆之宝”的BR100系列,是芯片 “独角兽”壁仞科技点亮的首款原创架构的国产芯片,据此前介绍,此系列芯片采用7nm制程,可容纳770亿颗晶体管,16位浮点算力达1000T以上、8 位定点算力达到 2000T 以上,单芯片峰值算力达到 PFLOPS 级别。
“在一些特定场景中,BR100系列算力数据是某国际品牌旗舰产品的1.5倍,”尽管张凌岚没有捅破窗户纸,但BR100系列“锚定”的,正是英伟达的A100。
2020年上市的A100和已发布但还未上市的H100,都是英伟达的高端独立GPU,阿里云、百度云、腾讯云、浪潮、联想等国内主要服务器厂商和数据中心都是其主要客户,因其超强算力被广泛应用于云端的AI(人工智能)模型训练和执行推理。比如今年WAIC上同样很火的另一类展品——大模型,其计算速度便高度依赖于GPU。
数据显示,英伟达在数据中心GPU市场占比超过 80%,在云端训练市场占比 90%,云端推理市场占比 60%。
近几年来,逐渐有国内公司进入GPU领域,已上市的有寒武纪、景嘉微,后起之秀壁仞科技、摩尔线程、天数智芯、燧原等,其创始团队大多来自芯片巨头。比如天数智芯的CTO吕坚平曾是英伟达全球资深GPU架构师,壁仞科技的CEO张文出自商汤。
“机会来了,我们要比计划跑得更快一点。”张凌岚告诉记者,BR100已流片回来,目前在做老化、可靠性、稳定性等一系列测试,属于风险期小规模量产阶段,这个过程业内普遍需要9个月,但壁仞希望能在年底前完成,真正开始商用量产。
以原始创新打破生态垄断
拿下英伟达剩下的10%市场
有了机会,国产GPU能彻底替代英伟达吗?
“没那么快。”被记者问及此问题时,集成电路行业协会秘书长郭奕武认为,尽管在某些局部数据、细分领域,国产芯片已经可以和国际公司平起平坐,但中国集成电路行业整体积累还不够,路还得一步步走。
AI智能芯片分为训练芯片与推理芯片两大类,英伟达是这个市场的绝对主导者。某家国产芯片公司负责人曾言:“我们能把英伟达剩下的10%拿到,就很好了。”
“欧美芯片公司经过几十年发展、成千上万的工程师科学家不断迭代开发,才有了今天的成果,我们一个初创公司,从大公司出来几个人,指望一两代产品就能超过它,我觉得梦都不应该这么做。”当日论坛上,燧原科技创始人、CEO赵立东对此有清醒的认知,中国的高性能计算芯片仍然落后于世界先进水平,最后成功与否,取决于中国公司的努力,取决于技术的创新,取决于坚持的长久。
尽管“生态”一词在各个领域被反复提及,但聚焦于集成电路,却是一道实实在在难以跨越的天堑。
赵立东强调,国产芯片厂商一定要打破国际厂商的生态垄断,而且路只有一条,便是原始创新,持续创新。
所谓高性能计算芯片的生态,是指其硬件架构和软件架构相互匹配。经过多年经营,英伟达构建了完整的技术生态,包括四层技术栈:硬件、系统软件、软件平台、应用框架。除了性能超强的芯片,英伟达为客户提供了快速实现AI模型训练和部署的软件系统,而且将主流AI算法模型通通开源,企业假如对某个AI算法缺乏积累,可以直接免费下载英伟达现成的先进模型,稍做调整就能落地应用。
“开发者都是惯性的,如果不打破这个垄断,不抛掉用惯的工具,那你的算法开发就会越来越偏向它的硬件架构,所以我们必须要在新的架构上创新,使我们有更多选择。”赵立东坦承,从成立的第一天起,燧原便选择了门槛和利润双高的云端训练芯片,其市场策略是先突破,然后再规模化,最终依靠高毛利达到自我造血、正向循环的目的。
中国是全球最大的算力市场
超九成市场却被欧美厂商垄断
英伟达、AMD、英特尔是全球GPU的三大“霸主”,但在需要超强算力的AI、自动驾驶、数据中心等细分领域,英伟达和AMD更胜一筹。不久前,英伟达发布的Q2财报显示,在其59亿美元的总营收中,数据中心已占据40亿美元,远超起家的游戏显卡。
正在人工智能、元宇宙等新赛道上发力的中国,显然是高端GPU的重要市场。赵立东指出,预计2025年中国数据量将增至48.6ZB,占全球数据量的27.8%。
据中国信息通信研究院测算,截至2021年底,中国算力核心产业规模超过1.5万亿元,关联产业规模超过8万亿元。其中,云计算市场规模超过3000亿元,互联网数据中心(服务器)市场规模超过1500亿元,AI 核心产业规模超过4000亿元。
“到2025年,智能算力的需求比2018年增长40.7倍,AI算力增长的速度超过了同期AI产业增长的速度。”寒武纪创始人陈天石以自动驾驶为例分析,云端的智能计算中心将会成为自动驾驶研发的核心基础设施。
尽管中国是全球最大的算力市场,但超过九成的市场由欧美厂商垄断。
英伟达在回复SEC的公函中指出,新的许可证政策可能影响其在华4亿美元的收入,而这只是两款高端GPU的市场份额。据国际数据公司IDC预计,云端训练芯片2025年将达到129亿美元市场规模,2020~2025年复合增长率为25%;云端推理芯片2025年将达到132亿美元市场规模,同时期复合增长率为32%。
这是一个昂贵的市场,据《经济观察报》报道,一片英伟达A100 GPU的售价要三千美元左右,公开数据统计,特斯拉已经使用了超过1万块英伟达的A100。
但正如英伟达董事长黄仁勋一贯所言,“The more you buy,the more you save(你付出越多,节省得越多)”,有媒体曾报道,英伟达的NVIDIA AI Enterprise软件可以将AI模型开发时间从80周缩至8周,这样的效率让客户难以割舍。
算力国产化大门正在打开
国产高端GPU生态正在形成
“国产芯片必须要不断更新迭代,持续开发产品,才逐渐接近世界品质,进而在某些场景上超过你的竞争对手,但这必须得有客户愿意和你一起来做这件事。”赵立东认为,目前高端GPU市场主要集中于互联网公司、智慧城市和金融等行业,芯片的性能必须在实际业务上线后,端到端测试整个过程,才能发现问题,进而不断改进,不能只看实验室数据。
好消息是,国产高端GPU的生态正在逐渐形成。
“生态好不好,看客户用不用就行了。”天数智芯的7nm通用GPU推理芯片“智铠100”也是今年WAIC的另一件“镇馆之宝”,其首款GPGPU芯片“天垓100”也曾亮相于去年的WAIC上,吕坚平告诉《IT时报》记者,截至目前,“天垓100”产品累计订单金额已经超过2.3亿,累计触达客户300多家,其中有意向签约的客户有200多家,覆盖行业超过20个,“只有客户才能帮你将硬件推到各式各样的互动场景中”。
张凌岚也透露,壁仞BR100系列芯片正在做软件调优,预计在两个月内完成,覆盖100个左右的主流场景应用。
据不完全统计,从2021年初到2022年2月底,全国至少有26个城市在推动或刚刚完成智算中心的建设。原本这些智算中心的服务器芯片、软件系统等领域仍是国外产品的天下,但现在,或许“算力国产化”的市场大门正在打开。
作者/IT时报记者 郝俊慧
编辑/ 挨踢妹
排版/ 季嘉颖
图片/ 东方IC IT时报
来源/《IT时报》公众号vittimes