黄仁勋终于揭开了全球最强人工智能(AI)芯片的神秘面纱。
北京时间3月19日(星期二)凌晨,在年度GTC大会上,英伟达(Nvidia)首席执行官黄仁勋宣布推出AI超级芯片——Blackwell GB200,将于今年晚些时候发货。
GB200采用新一代AI GPU(图形处理器)Blackwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。
此外,黄仁勋还在GTC大会推出了新一款服务软件NIM,下一代AI超级计算机、英伟达Project GR00T 人形机器人基础模型,并宣布扩大与比亚迪等中国车企合作。
“Hopper已经非常出色了,但我们需要更强大的GPU。”黄仁勋在GTC大会上表示。
当演讲结束时,黄仁勋坦言,“如果你问我,心目中的GPU是什么样子,今天的发布就是我的答案。”
他说今天他展示了什么是英伟达的灵魂。“我们站在计算科学和物理等其他一切科学的交叉点”。这是他心里英伟达的定位。
半年更新一次 AI 芯片产品,英伟达已经让 AI 迎来了新的“摩尔定律”时代。
GTC大会五大亮点速览
此次英伟达GTC大会总共有五大亮点:
- 新一代GPU Blackwell和芯片GB200
Blackwell GPU 体积很大,采用台积电4纳米(4NP)工艺蚀刻而成,整合了两个独立制造的裸晶(Die),共有2080亿个晶体管,比起前身Hopper多了1280亿个,并用传输速度达到10 TB每秒的NVLink 5.0技术来连接每块裸晶。
Blackwell GPU将作为一款名为GB200 NVLink 2的完整服务器提供给客户使用,该服务器结合了72个Blackwell GPU和其他旨在训练AI模型的英伟达部件。
而基于 Blackwell 的GB200也有巨大的性能提升,其AI 性能为20 Petaflops(每秒千万亿次浮点运算),是H100的五倍。英伟达表示,额外的处理能力将允许AI公司训练更大、更复杂的模型。
据英伟达透露,亚马逊网络服务将构建一个包含20000个GB200芯片的服务器集群。该系统可以部署27万亿参数的模型。这甚至比目前最强大的大模型(例如GPT-4)还要大得多。如果以GPT-4有1.7万亿个参数,那么GB200芯片可训练15个GPT-4。
- DGX SuperPOD超级计算机系统
另外,英伟达还推出了DGX SuperPOD超级计算机系统。DGX SuperPOD由至少8个GB200芯片系统组成,其中包括36个Grace Blackwell 200 Superchips,配对作为单台计算机运行。英伟达表示,客户可以根据自己的需求扩展 SuperPOD,以支持数万个GB200超级芯片。
DGX SuperPOD 采用了新的液冷机架规模架构,这意味着系统使用通过一系列管道和散热器循环的流体进行冷却,而不是直接基于风扇的空气冷却,效率变得更高且更经济。
黄仁勋坦言,英伟达DGX SuperPOD是一个 AI 数据中心基础设施平台,可让 IT 为每个用户和工作负载提供不打折扣的性能。在DGX SuperPOD 的助力下,业内优秀的加速基础设施可以做到兼具敏捷性与可扩展性能,从而应对极具挑战性的 AI 和高性能计算 (HPC) 工作负载,并获得行业认可的结果。
- 英伟达Project GR00T 人形机器人基础模型发布
英伟达于今日发布人形机器人通用基础模型Project GR00T,旨在进一步推动其在机器人和具身智能方面的突破。同时,英伟达还发布了一款基于NVIDIA Thor 系统级芯片(SoC)的新型人形机器人计算机Jetson Thor,并对英伟达Isaac机器人平台进行了重大升级,包括生成式 AI 基础模型和仿真工具,以及 AI 工作流基础设施。
据悉,英伟达GR00T驱动的机器人(代表通用机器人00技术)将能够理解自然语言,并通过观察人类行为来模仿动作——快速学习协调、灵活性和其它技能,以便导航、适应现实世界并与之互动。同时,Jetson Thor 是一个全新的计算平台,能够执行复杂的任务并安全、自然地与人和机器交互,具有针对性能、功耗和尺寸优化的模块化架构。该 SoC 包括一个带有Transformer Engine 的下一代 GPU,其采用Blackwell 架构,可提供每秒 800 万亿次8位浮点运算 AI 性能,以运行 GR00T 等多模态生成式 AI 模型,从而集成功能安全处理器、高性能 CPU 集群和 100GB 以太网带宽,大大简化了设计和集成工作。
黄仁勋称,由Project GR00T平台提供支持的机器人将被设计为,通过观察人类行为来理解自然语言并模仿动作,使它们能快速学习协调性、灵活性和其他技能,从而适应现实世界并在与之互动,绝对不会产生机器人起义。
英伟达表示,其正在为领先的人形机器人公司开发一个综合的 AI 平台,如 1X Technologies、Agility Robotics、Apptronik、波士顿动力公司、Figure AI、傅利叶智能、Sanctuary AI、宇树科技和小鹏鹏行等。
“开发通用人形机器人基础模型是当今 AI 领域中最令人兴奋的课题之一。世界各地的机器人技术领导者正在汇集各种赋能技术,致力于在人工通用机器人领域实现突破。”黄仁勋表示。
据悉,英伟达新的 Isaac 平台功能将在下个季度推出。
- 英伟达新一代软件服务NIM
英伟达宣布在其企业软件订阅中增加一款名为 NIM(Nvidia Inference Microservice)的新产品。NIM能让使用英伟达旧一代GPU进行推理或运行AI软件的过程变得更加简易,并允许客户继续使用其已有的数亿个英伟达GPU。
英伟达希望能吸引那些购买英伟达服务器的客户注册英伟达企业家,单个GPU每年的使用费为4500美元。
英伟达将与微软、Hugging Face等公司合作,以确保他们的AI模型能够在所有兼容的英伟达芯片上运行。开发人员可以在自己的服务器或基于云的英伟达服务器上高效地运行模型,而无需冗长的配置过程。
英伟达还表示,NIM能让AI在配备GPU的笔记本电脑上运行,而不会被局限在云端服务器上。
这场活动上,英伟达还宣布与联想合作推出全新混合 AI 解决方案——ThinkSystem人工智能产品组合的扩展,其中包括两款全新强大的8路NVIDIA GPU系统,这两款系统专为专为生成式 AI 、自然语言处理(NLP)和大模型开发而设计,以加速 AI 的实施,帮助企业和云提供商获得在 AI 时代成功所需的关键的加速计算能力,将 AI 从概念变为现实,为NVIDIA HGX AI 计算平台进入市场提供支持。
另外,全新联想ThinkSystem SR780a V3是一款采用联想海王星液冷技术的 5U 系统,电源使用效率 (PUE) 高达 1.1,通过循环利用温水来冷却数据中心系统,使客户能够实现高达40%的功耗降低,散热性能提高3.5倍,相比传统风冷系统效率更高,有助于节省宝贵的数据中心空间;新的联想ThinkSystem SR680a V3是一款气冷双插槽系统,可为配备英特尔处理器和NVIDIA GPU的复杂人工智能最大程度提供加速。
NVIDIA企业平台副总裁 Bob Pette 表示:“ AI 是一股强大的力量,它能够帮助企业从数据中发掘新的见解并提升生产力。联想全新企业 AI 解决方案与英伟达技术相结合,标志着增强 AI 计算性能的一个关键里程碑。它提供了企业可以信赖的混合系统,能够在几乎任何地方支持生成式人工智能的运行。”
- 扩大与中国电动汽车制造商的合作
英伟达在GTC大会上宣布,正在扩大与比亚迪等中国电动汽车制造商的合作。比亚迪将使用英伟达的下一代车载芯片Drive Thor,以提高其车辆的自动驾驶和其他数字功能的水平。
与此同时,英伟达汽车业务副总裁丹尼·夏皮罗表示,比亚迪将利用英伟达的技术来简化工厂和供应链,以及开发虚拟展厅。“Drive Thor将于明年进入比亚迪,”丹尼说。
英伟达还将扩大与小鹏汽车和广汽埃安旗下Hyper品牌的合作。吉利旗下的极氪汽车和理想汽车此前已表示,他们将使用英伟达的Drive Thor技术。
AI“卖铲王”还能狂飙多久?
新一代GPU Blackwell和芯片GB200还能延续英伟达高增长的“神话”吗?
众所周知,在过去一年多时间里,英伟达的A100/H100系列AI GPU可谓供不应求,占据了全球高端AI芯片市场80%的份额。
微软、Meta、谷歌母公司Alphabet、亚马逊和甲骨文等科技巨头都是英伟达的忠实客户,其中,微软和Meta 2023年在英伟达H100芯片花费了至少90亿美元。
这些科技巨头们对AI芯片的需求推动英伟达市值在过去14个月内增长了600%,最新超过2.5万亿美元,攀升成为全球市值第三大科技巨头,仅次于微软和苹果。英伟达在基准标准普尔500指数中的权重也超过了5%。
英伟达狂飙的业绩和股价,让其成为全球最受瞩目的企业之一,但这样的势头能保持多久?
跟踪半导体行业的Futurum Research 首席执行官丹尼尔·纽曼 (Daniel Newman) 此前表示:“英特尔曾经是业界的霸主。现在,很多公司正联合起来,以确保英伟达不会变得太强大。”
事实上,越来越多的竞争者正试图从英伟达手中抢夺AI芯片市场份额。
今年2月,英特尔首席执行官帕特·盖尔辛格明确表示,英特尔将制造尽可能多的AI芯片。自从其上任以来,盖尔辛格致力于推动公司进入芯片代工的业务,并承诺投入200亿美元在俄亥俄州建立新工厂。
而严重依赖英伟达芯片的OpenAI,近期也被爆出正筹集近7万亿美元的资金,来推动公司关于AI芯片等基础设施的计划。OpenAI CEO山姆·奥尔特曼(Sam Altman)表示:“事实的核心是,我们认为世界将需要更多(芯片)用于AI计算。这将需要全球在很多方面进行投资,超出我们的想象范围。”
占据英伟达AI芯片销售额40%的四大客户——微软、Meta、亚马逊和Alphabet都在开发自己的AI芯片,用于其数据中心。这意味着,未来英伟达从这四家科技巨头中获得的采购量会减少。
另一个令英伟达不安的因素在于,美国监管机构一直在积极限制向世界第二大经济体中国出口高性能AI GPU。在第一轮限制之后,英伟达为中国市场开发了其强大的 AI GPU A800 和H800的简化版本。
然而在2023年10月,美国商务部下属工业安全局(BIS)又发布一系列新的管制文件,扩大对华出口先进芯片的管制范围,涉及型号包括英伟达A100、A800、H100、H800、L40S五种GPU显卡。英伟达CEO黄仁勋则公开表示,美国新禁令将对英伟达在中国市场的销售造成重大影响,但公司仍会遵守美国法规。
外忧之下还有内患。
随着英伟达增加其最畅销GPU的产量,公司毛利率可能会被削弱。英伟达四季度财报显示,数据中心销售额的增长速度比收入成本的增长速度快很多倍。这表明推动该公司销售额增长的是定价能力,而不是销售数量的增加。随着GPU稀缺性逐渐减弱,英伟达强势的定价能力也将随之减弱。
不过,GTC大会上的黄仁勋看起来信心满满:“生成式AI是我们这个时代的决定性技术。Blackwell GPU是推动这场新工业革命的引擎。与世界上最具活力的公司合作,我们将实现AI对每个行业的承诺。”
(本文首发钛媒体App,作者|任颖文、林志佳,编辑|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
人类文明的阶段是由人类所开发的资源对象,以及,所对应的开发能力来界定的--- A. 原始人阶段:人类对资源的开发局限于摘果子和捕食等即得性能力; B. 农业文明:对有限土地的周期性、长期性的种植和畜牧式的开发能力; C. 商业/工业文明:对各种自然资源的创造性、创新性、近乎无限性的开发能力; D. 信息文明/智能文明:对虚拟资源的创造/开发能力; E. 超地球文明:人类具有了开发地球以外资源的能力; 主线:人类的资源对象和资源开发能力都在不断地演进、增加。 [握手][咖啡]