2025.03.24 04:16 · 阅读 7.1万
钛媒体App 3月24日消息,钛媒体AGI获悉,近日,蚂蚁集团Ling Team团队利用AI Infra技术开发了两个百灵系列开源MoE模型Ling-Lite和Ling-Plus,前者参数规模168亿,Plus基座模型参数规模高达2900亿,相比之下,AI行业估计GPT-4.5参数量1.8万亿,DeepSeek-R1参数规模达6710亿。同时,论文显示,蚂蚁团队在模型预训练阶段使用较低规格的硬件系统,将计算成本降低约20%,每1万亿token是成本达508万元人民币,最终实现与阿里通义Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat相当的性能。目前,相关技术成果论文发表在预印版Arxiv平台上。据相关报道,该模型在训练阶段使用的是国产AI/GPGPU芯片产品,并非完全使用
英伟达芯片,但最终得到的结果与
英伟达芯片(如H800)的结果相似。这是蚂蚁集团首次详细披露其在AI算力层面的进展。
根据《网络安全法》实名制要求,请绑定手机号后发表评论