蚂蚁自研2900亿参数大模型，利用国产AI芯片训练成本降低20%

2025.03.24 04:16 · 阅读 7.1万

钛媒体App 3月24日消息，钛媒体AGI获悉，近日，蚂蚁集团Ling Team团队利用AI Infra技术开发了两个百灵系列开源MoE模型Ling-Lite和Ling-Plus，前者参数规模168亿，Plus基座模型参数规模高达2900亿，相比之下，AI行业估计GPT-4.5参数量1.8万亿，DeepSeek-R1参数规模达6710亿。同时，论文显示，蚂蚁团队在模型预训练阶段使用较低规格的硬件系统，将计算成本降低约20%，每1万亿token是成本达508万元人民币，最终实现与阿里通义Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat相当的性能。目前，相关技术成果论文发表在预印版Arxiv平台上。据相关报道，该模型在训练阶段使用的是国产AI/GPGPU芯片产品，并非完全使用英伟达芯片，但最终得到的结果与英伟达芯片（如H800）的结果相似。这是蚂蚁集团首次详细披露其在AI算力层面的进展。

US英伟达

互联网

新科技

新电子

AGI

本文内容仅供参考，不构成投资建议，请谨慎对待。

给小编加鸡腿🍗

爱了爱了😁

挺有深度的，不错

紧跟时事，赞一个👍🏻👍🏻

真不错，收藏了

写的很不错，关注了