文 | 大模型之家
12月9日晚间,市场监管总局发布公告,称近日,因英伟达公司涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》(市场监管总局公告﹝2020﹞第16号),市场监管总局依法对英伟达公司开展立案调查。
针对立案调查一事,英伟达方面在今日表示,“我们努力在每个地区提供最好的产品,并在我们开展业务的任何地方履行我们的承诺。我们很乐意回答监管机构对我们业务的任何问题。”
受此事件影响,英伟达当日(9日)股价大跌2.55%,市值一夜之间蒸发市值一夜蒸发889亿美元(约合人民币6460亿元),超过了一个英特尔的市值(897.54亿美元)。
美、英先后调查,英伟达并非被中国针对
英伟达作为全球GPU算力的绝对领导者,在AI大模型时代占据不可替代的地位。在AI大模型称为行业的风口的这几年,其产品作为重要的大模型训练和推理硬件设施,一直保持着“供不应求”的状态。
富国银行数据显示,2023年英伟达在全球数据中心GPU市场的份额高达98%,远远领先第二名AMD的1.2%和第三名英特尔不足1%。
其中,英伟达在中国市场的营收占其全球总收入的12.7%。2024年前三季度,英伟达在中国大陆和香港地区的营收达到115.7亿美元。
而此次英伟达被立案调查,主要依据还是公告中另一条公告,即《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》(市场监管总局公告﹝2020﹞第16号)。
2019年,英伟达高调宣布以69亿美金价格收购以色列网络设备供应商迈络思。收购完成后,迈络思成为英伟达的全资子公司。由于英伟达和迈络思均在全球具有垄断地位,该并购案对全球市场有潜在影响,因此这一交易随后经过了美国、欧盟、中国等国家和地区市场监管部门的批准。
2020年4月16日,中国市场监管总局有条件批准了这项收购,既是最后一个批准这笔交易的国家,也是决定这笔收购案是否成功的关键。市场监管总局要求英伟达在交易完成后六年内,依据公平、合理、无歧视原则继续向中国市场供应相关产品,并不得强制搭售或附加不合理交易条件。
然而,自2022年起,英伟达多次对中国市场断供GPU产品,涉嫌违反这些承诺,从而引发中国反垄断执法机构的调查。
中国的反垄断调查并非孤例。今年8月,美国司法部对英伟达启动反垄断调查,重点关注其在人工智能芯片销售中的市场支配行为。12月7日,欧盟也对英伟达展开反垄断审查,进一步强化对其在全球市场影响力的监管。
美国司法部反垄断部门负责人乔纳森·坎特指出,英伟达主导了最先进GPU的销售,使这一资源变得稀缺,影响了市场竞争格局。为了打破垄断,美国政府还通过《芯片法案》推动国内芯片生产,并提供390亿美元奖励措施。
英伟达面临的不仅是反垄断监管,还包括美国对华出口管制的重重限制。自2022年以来,美国不断升级半导体出口限制,禁止英伟达高性能GPU芯片如A100、H100及其替代产品向中国出口。这些措施不仅阻碍了英伟达对中国市场的供应,也与其在中国的经营承诺产生冲突。
虽然英伟达尝试推出特供版A800和H800芯片,但这些产品仍然受到严格的出口管制限制。更有消息称,其计划于2024年推出的H20等AI芯片量产计划也被迫中止。
华为、壁仞、摩尔线程谁是赢家?
对于英伟达自身而言,彻底放弃中国市场,意味着至少将减少15%-20%的营收与利润。随着英伟达因“反垄断”调查面临中国市场的不确定性,国产GPU厂商的崛起成为关注焦点。这不仅关系到你我平日打游戏用的PC级GPU产品,更为重要的是面向toB市场的AI加速芯片的供给。
大模型之家注意到,华为、壁仞科技和摩尔线程等企业正在以不同的方式填补这一空白,它们在硬件性能、开发生态和产业链支持等方面展开了激烈竞争。
华为昇腾A910系列芯片峰值算力高达256-280 TFLOPS(FP16),性能接近英伟达A100的312 TFLOPS。实际使用中,经过NPU算子优化后的算力达到A100的80%左右,表现较为出色。然而,华为在高速互联和开发者生态方面的短板较为明显。例如,其HCCS互联技术仅支持不到100GB/s的带宽,与英伟达NVLink的1800GB/s存在明显差距。
在软件支持上,华为受限于资源投入,短期内仍然需要追赶与英伟达多年来构建的CUDA开发生态。
壁仞科技的BR100芯片以强大的AI算力著称,16位浮点算力超过1000 TFLOPS,峰值算力达到PFLOPS级别。通过与浪潮科技合作,壁仞推出了基于BR100的“海玄”服务器集群,面向高能效AI计算场景。然而,其牺牲FP16的通用计算能力,专注于矩阵运算的策略可能限制其在多样化场景中的适用性。
壁仞在硬件算力上的领先优势显著,但在开发生态和市场应用支持上仍需努力。与华为相比,壁仞更适合特定AI任务,而非大规模通用计算需求。
摩尔线程以游戏GPU起家,在AI加速领域的探索逐步推进。其最新发布的MTT S4000智算加速卡支持多卡互联,具有48GB显存和240GB/s的片间互联带宽,主打分布式计算能力。通过自研的MUSIFY工具,摩尔线程实现了CUDA代码的迁移,试图打破英伟达生态的壁垒。
除此之外,当前国内还有很多家寒武纪,燧原、沐曦、景嘉微等企业,但在体量、技术、产业链成熟度上还与前者有差距。
尽管硬件参数接近主流国际产品,但摩尔线程在超算集群建设和软件优化上依然面临挑战。其在市场定位上更倾向中小型AI场景,与华为和壁仞形成互补,但整体技术深度尚不足以支撑大规模企业需求。
虽然从纸面参数上似乎都很接近,但是决定AI卡的性能由4个方面决定:Library、算力、显存和高速互联。不只要有基础的单卡算力,更为重要的是要支撑万卡、十万卡、乃至更大的算力集群,内存、与并行传输的能力就会受到极大考验。
而这正是英伟达所优势的领域,英伟达在高速互联技术NVLink上也具备压倒性优势,其1800GB/s的带宽远超国内竞争对手,成为超大规模AI计算集群的关键技术。
在单卡算力和互联带宽方面,国产厂商虽然不断缩小与英伟达的差距,但后者的优势主要集中在开发者生态和软件支持。早在2006年,英伟达就开始构建CUDA生态,通过高效的汇编代码和丰富的工具链,为AI运算提供了强大支持。
为了稳固自家的生态,2024年3月,英伟达在CUDA 11.6的用户许可中明确表示,禁止其他硬件平台上通过翻译层运行CUDA英伟达禁止第三方使用CUDA,针对Intel、AMD都有参与的ZLUDA等第三方项目,以及登临科技、沐曦科技等中国厂商的兼容方案。
而考虑到to B产业方面,只有华为具备稳定供货能力和强大的综合实力,未来在中国市场可能成为最大受益者。但也有服务器经销商向笔者表示,目前910B的服务器价格已经超过170万元,价格甚至一度超过英伟达服务器。
在大模型发展的道路上,我们要正视差距,才可能实现追赶与超越。未来,要在AI大模型竞争中保持全球领先,中国不仅需要在GPU等硬件技术上实现自主创新,还必须推动数据治理、应用落地和生态体系的全面发展。这不仅关乎一场技术竞赛,更是产业竞争的全局战役。
根据《网络安全法》实名制要求,请绑定手机号后发表评论