GPU供不应求下,英伟达推出超级芯片GH200巩固AI算力垄断地位|硅基世界

AGI
“生成式 AI 时代即将到来,如果你愿意的话,那将是 iPhone 时代”

英伟达创始人兼CEO黄仁勋(Jensen Huang)

英伟达创始人兼CEO黄仁勋(Jensen Huang)

受AI(人工智能)大模型热潮影响,算力需求大增。在核心GPU(图像处理器)加速计算芯片供不应求下,英伟达加速推出新一代算力更快的芯片以持续巩固“大模型军火库”地位。

北京时间8月8日晚23点,在美国洛杉矶Siggraph计算机顶级会议上,英伟达CEO黄仁勋发布一系列专为大模型打造的最新算力产品。

其中包括英伟达最新 AI 处理器GH200 Grace Hopper Superchip芯片,专为处理世界上最复杂的生成工作负载而生,今年5月起生产,预计将于2024年第二季度交付;同而且英伟达还推出一种专为简化模型部署打造的新的统一软件工具包NVIDIA AI Workbench,以及搭载全新L40S Ada GPU的新款服务器等。

“图形和人工智能密不可分,图形需要人工智能,AI 也需要图形。”黄仁勋在演讲中表示,我们用 AI 重塑计算机图形的同时,AI 也在彻底重塑 GPU。

事实上,随着ChatGPT引发AI大模型需求热潮,作为加速计算领导者,英伟达今年以来股价累计涨幅已超过210%,近三个月内涨幅就达56%,过去7年股价增长超40倍,目前市值冲破1.1万亿美元。公开数据显示,英伟达占据全球80%以上的GPU服务器市场份额,同时拥有全球91.4%的企业GPU市场份额。

据投资者服务公司穆迪今年5月份发布的一份研究报告,英伟达在未来几个季度将实现“无与伦比”的收入增长,其数据中心业务的收入将超过竞争对手英特尔和AMD的总和。但摩根士丹利策略分析师斯坦利(Edward Stanley)在最新报告中称,根据历史背景,英伟达的股价飙升处于“后期”阶段,摩根士丹利认为这标志着 AI 行业的“泡沫”。

GPU持续紧缺下,如今,英伟达产品价格已同比上涨超30%,英伟达A800单卡现货近13万元一颗,eBay上H100售价高达4.5万美元。同时,OpenAI的GPT-4大模型需要至少2.5万张英伟达A100 GPU芯片,而该公司目前至少已拥有1000万颗GPU芯片。

正如黄仁勋常说的,“你GPU买的越多,你越省钱”。主要原因是新的GPU产品能显著提升加速计算,比CPU性能更强、算力更大、功耗更低。

此次,英伟达发布全球第一款HBM3e GPU芯片——NVIDIA GH200 Grace Hopper Superchip(超级芯片),拥有72核Grace CPU和4PFLOPS Hopper GPU组成,使用高达141GB的高带宽内存HBM3e,提供每秒5TB的带宽,容量比H100 GPU高1.7倍、带宽达1.55倍。产品可以用于任何大型语言模型,降低推理成本。

不仅如此,黄仁勋这次还宣布推出新一代GH200 Grace Hopper超级芯片平台,该平台能够连接并扩展多个GPU,双GH200系统配置内存容量增加3.5倍,带宽增加3倍,包括一台具有144核基于Arm Neoverse的Grace CPU、8 PFLOPS的AI 性能和282GB最新HBM3e高带宽内存技术的服务器。如果将连接到CPU的LPDDR内存包括在内,那么整体集成1.2TB内存容量。

据悉,超级芯片将成为新型服务器计算设计的核心,可以处理更多信息并更快地访问信息,尤其是 AI 训练数据庞大,急需加速卡实现计算,在AMD、英特尔努力追赶下,英伟达正在加速巩固起 AI 算力技术优势。如果芯片能够一次性加载模型并更新它,那么 AI 训练速度就会得到提升,节省电力并加快整个过程。

GH200将在新的服务器设计中提供,GH200用高速互连技术将CPU和GPU两颗die“粘”在一起,通信速率比PCIe Gen5快7倍,而且机架装上NVIDIA BlueField-3 DPU和ConnectX-7网卡等产品,由256块GH200组成的NVIDIA DGX GH200 SuperPod,拥有高达1EFLOPS的算力和144TB高速内存,成为英伟达生成式AI时代的最新AI超级计算机。

据透露,英伟达计划销售两种版本:一种版本两个可以集成到系统中的芯片提供给客户,另一种是结合了两种Grace Hopper设计的完整服务器系统。

英伟达透露,NVIDIA GH200芯片已经于今年5月投入全面生产,预计将在2024年第二季度交付基于该平台的系统。

此外,英伟达还公布了诸多产品:

  • 面向生成式AI和大模型开发、数据科学等场景,英伟达推出搭载RTX6000 Ada GPU的全新NVIDIA RTX工作站,提供高达5828TFLOPS的AI性能和192GB的GPU内存,预计今年秋季发货。
  • 最新采用4nm定制版工艺的三款新的桌面Ada GPU NVIDIA RTX 5000、RTX 4500和RTX 4000,提供最新的AI、图形和实时渲染技术。截至目前,RTX 5000现已上市,售价为4000美元,
  • 英伟达与拥有200万用户的全球最大AI开源社区Hugging Face合作,在未来几个月内平台推出由NVIDIA DGX Cloud提供支持的“训练集群即服务”,以简化为企业创建新的和自定义生成式AI模型。
  • 推出NVIDIA AI Enterprise 4.0软件,把DGX Cloud中的所有功能放到该软件中,以及NVIDIA AI Workbench,将生成式AI模型打包放到任何终端设备或云端。
  • 具有生成式AI和OpenUSD的NVIDIA Omniverse虚拟现实技术实现升级,用于跨工具构建、模拟和协作,利用OpenUSD框架和生成式 AI优化和增强3D流程,为企业提供新的基础应用程序和服务。据悉,上周英伟达宣布与Pixar、Adobe、Apple和Autodesk共同成立OpenUSD架构联盟。

英伟达表示,上述这些新品旨在将英伟达过去十年的所有创新——人工智能、虚拟世界、加速、模拟、协作等结合在一起。

“为了满足生成式 AI 不断增长的需求,数据中心需要具有特殊需求的加速计算平台。”黄仁勋表示,“这就是世界数据中心迅速转向加速计算的原因。”

黄仁勋再次在演讲中重申,“生成式 AI 时代即将到来,如果你愿意的话,那将是 iPhone 时代”。

(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
  • 给小编加鸡腿🍗
  • 爱了爱了😁
  • 挺有深度的,不错
  • 紧跟时事,赞一个👍🏻👍🏻
  • 真不错,收藏了
  • 写的很不错,关注了
  • 都没有那么简单
  • 这么厉害的吗
  • 学到了学到了
  • 商场如战场,竞争激烈啊
  • 行业发展都是有周期的
  • 企业的发展都不是一番风顺的
  • 说的好有道理😄
  • 内容值得人们反思
  • 数据还是很详细的
  • 内容很精彩,夸一夸
  • 又学到了很多知识
  • 内容很详细👍🏻
  • 小编辛苦了
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

07:23

中国社会科学院学部委员高培勇:资本市场发展应将预期因素纳入分析监测体系,把预期管理作为监管重点落实到体制机制层面

07:20

中国科协发声:屡禁不止的奇葩论文再次敲响学风建设警钟

07:18

新一轮储蓄国债今日开售,投资者认购热情不减

07:03

英伟达据报已通知中国客户计划在7月推出修改版H20芯片

06:56

王兴兴回应“人形机器人产业泡沫化”:需求和实际情况或存在偏差,但关键在于大众的接受度

06:55

京东:若发现不符合标准的“无堂食餐厅”混入京东外卖,一经核实立即下线

06:37

云南新能源装机突破6000万千瓦

06:30

日本松下集团宣布将全球裁员1万人

06:05

国内首部中医药大模型评测团体标准发布

05:26

宝盈基金:副总经理李俊因个人原因离任

05:20

九号公司:选举高禄峰为董事长,聘任王野为CEO

05:01

中国自主可控智能发电控制系统获评国际领先

04:55

特朗普与常春藤对立升级,共和党考虑调整名校捐赠基金税率,最高或飙至21%

04:51

女子月收入4700元负债2544万申请破产,法院回应

04:41

政策暖风吹拂,优质中概股或加速“归巢”

04:38

“不能损害我们的利益”,影视业百年工会反对美电影关税

04:34

多家银行推出信用卡现金分期限时优惠,部分产品折算年化利率低至“2字头”

04:32

中国能建首个“百兆级”飞轮储能项目投运

04:27

外交部回应印巴局势升级:强烈呼吁双方以和平稳定大局为重,保持冷静克制

04:25

巴基斯坦对印度发起网络攻击,致其约70%电网瘫痪

49
34

扫描下载App