为了满足美国对华芯片出口管制要求,老黄可谓是“煞费苦心”、“刀法精湛”。
钛媒体App 1月6日消息,芯片巨头英伟达(NVIDIA)日前悄悄在官网上线英伟达RTX 5880 Ada工作站显卡,主要面向消费级和 AI 训推等专业领域应用的芯片产品。
相比旗舰级RTX 6000,英伟达RTX 5880在性能方面大幅降级,采用阉割的AD102 GPU,拥有14080 CUDA 核心,比RTX 6000的18176个CUDA核心数量减少22%,单精度浮点性能降低24%左右,整体性能减少接近1/4,实际表现或接近次旗舰性能的RTX 5000。
在此之前的2022年底,英伟达也正式推出了传闻已久、减量不减价的“中国特供版”消费级旗舰显卡——RTX 4090 D,AI 性能大降10%,售价依然是12999元起。
钛媒体App了解到,截至目前,国内已经有部分服务器代理商拿到4090D样品和测试版显卡。
而如今,英伟达在其官网正式发布RTX 5880 Ada,这表明现已开始接受客户购买该产品。值得注意的是,尽管英伟达官方没有称RTX 5880专门针对中国市场,在全球市场都有展示和销售,但鉴于整体采用与4090D一样的“阉割版”性能减配方法,因此有理由相信,RTX 5880 Ada就是旨在规避美国商务部发布的半导体出口管制限制措施的产品。
“我们成立公司就是为了做生意,努力与所有可能的人做生意。”英伟达CEO黄仁勋日前表示,该公司将继续“完美”遵守贸易法规,并为中国市场提供一套符合美国政府最新规定的新产品。他补充称,英伟达需要寻求市场的建议,这一过程正在进行中。
2023年12月6日,在美国商务部长雷蒙多(Gina Raimondo)已公开示警下,黄仁勋证实将继续为中国市场提供合规芯片产品,预计“特供”芯片将包括HGX H20、L20 PCle、L2 PCle等产品,
随后,英伟达中国在官网发布GeForce RTX 4090 D——专为应对美国“芯片禁令”而定制的版本,性能低于美国出口管制规定限制标准。
如今,英伟达RTX 5880 Ada也正式发布。规格方面,英伟达RTX 5880 Ada显卡拥有14080个CUDA内核和440个Tensor内核,主频约为2.5 GHz,具有69.3 TFLOPs的FP32计算能力和1108 TFLOPs 的Tensor性能,与RTX 6000 Ada相比FP32 和张量核心性能降低24%;显存方面,RTX 5880采用了48 GB GDDR6显存,运行速度为20 Gbps,带宽达960 GB/s,采用标准的双插槽主动冷却设计,拥有四个DisplayPort 1.4a 输出端口。
虽然英伟达没有透露RTX 5880定价信息,但预计,RTX 5880 Ada 的价格将与RTX 6000相近,售价应该在6800美元左右(约合4.83万元人民币)。
对于英伟达消费级RTX 5880和4090D显卡是否能够用于 AI 模型训练和推理,有行业人士向钛媒体App透露,显卡进行大规模 AI 训练主要看算力、显存和带宽能力,而RTX 5880和4090D在单精度算力方面整体优秀,但显存和带宽限制较多,无法训练GPT这种700TB/万亿级参数模型,但对于Llama 2-7B、13B这类小参数模型,单卡4090D就可以稳定运行,如果8张4090D结合起来,还可训练70亿-650亿参数模型。推理方面,基于Ada架构和CUDA软件,RTX 5880和4090D都可稳稳运行,尤其在 AI 图形渲染和视频生成方面属于“王牌水平”。
目前来看,英伟达RTX 5880和4090D显卡将成为国内企业极少能买到的性能强劲、能稳定运行 AI 模型训练推理的算力芯片产品。
另据《参考消息》报道称,英伟达将恢复中国“特供版”AI芯片出货,预计2024年第二季度将开始量产H20和其他数据中心领域的 AI 算力芯片。雷蒙多已表示,美国可以允许英伟达有限度地向中国出售 AI 芯片,但不允许英伟达出口最复杂、处理能力最强的 AI 芯片。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
英伟达的这一举措并不能完全解决美国出口管制政策对中国半导体产业的影响,哎,都是泪
性能相较于原版有所降低?
中国市场拥有庞大的用户基础和不断增长的需求,英伟达不会放弃
虽然这些特供版芯片的性能有所降低,但仍然能够满足很多用户的需求
小编辛苦了
通过推出特供版芯片,英伟达能够继续在中国市场销售其产品!好