2024年,随着大模型应用逐渐深入以及多模态模型的快速发展,企业对算力的需求持续增加,对算力的依赖性显著提升。
从模型需求角度上看,根据Huggingface的模型下载量统计,目前模型的需求已经呈现出两级分化的趋势,数百亿级以上的强大稠密模型,以及10B以下的小模型更受欢迎。对此,智源研究院副院长兼总工程师林咏华表示:“从全球模型的发展情况来看,模型尺寸正呈现分化趋势。”
从算力的层面来看,目前仍呈现出“需求大、能耗高、效率低”的发展态势。以2020年发布的GPT-3与最新发布的LLaMA3-405B进行对比为例,尽管模型规模仅增大2.3倍,但所需算力却增长了116倍。算法的创新使算力需求一直处于高增长状态,同时,算法结构的创新也带来了MoE、模型量化、定制算子等更加复杂的计算需求。
随着技术的不断更新迭代,多元多模的技术发展也为客户的应用开发提供了更广阔的选择空间和更高的灵活性。而“百花齐放”的多样性也带来了挑战:多元算力因各家硬件架构、指令集的差异以及算子库的独立实现,导致整个生态系统割裂且难以形成强大合力。
从目前发展角度来看,当下生态的现状抬高了大模型应用的技术门槛。技术力量薄弱的传统企业用户,不仅在多元的芯片、模型中难以选择,而且即使部署成功,也存在软件框架多、易用性差等问题,也这使得后期开发使用较为困难。浪潮信息高级副总裁刘军表示,所有难题都汇总到一点——如何构建好一个可持续的AI底层生态,让多元算力更通用、更普惠,让系统的算效更高、基础模型更好用。
12 月 25 日,浪潮信息与智源研究院达成战略合作协议,共同宣布智源开源大模型通用算子库FlagGems正式接入浪潮信息元脑企智 EPAI 企业大模型开发平台, 面向大模型应用开发场景提供强大的多元算力系统支持,助力企业实现更快速、更广泛、更高效的多元算力适配与使用,大幅降低企业开发大模型应用的算力门槛,共同促进多元算力系统生态的发展。
开源开放显然是目前构建生态的最佳路径,刘军表示,开源开放是创新活力的源泉,在互联网时代,开源开放打破了过去的技术垄断,使得更多人参与到开源社区,贡献代码,贡献想法,共谋发展。而在如今的AI时代,开源开放会起到更大的、更积极的促进作用。
“具体来说,以应用为导向,以系统为核心,以开源、开放、多元多模来激发创新的活力,以系统创新全局优化来拓展创新的路径,以协同共生开放共赢的生态加速创新的落地,从而实现AI创新和AI应用的协同发展,激发AI的创新活力,开源开放是这里面的核心和源泉。”刘军强调。
FlagGems 是由智源研究院于2024年6月推出的面向多元算力的开源大模型通用算子库,在Triton 生态开源开放的基础上,面向多元算力,遵循统一的中间语言、统一的算子接口和统一的开源算子库实现路径,以大模型需求为导向,为多元算力提供开源、统一、高效的算子层生态接入方案。截至12月,FlagGems已提供超过130个大模型算子,是目前提供算子数量最多、覆盖广度最大的开源算子库。
元脑企智EPAI(Enterprise Platform of AI) 是浪潮信息为企业 AI 大模型落地应用打造的高效、易用、安全的端到端开发平台,支持主流开源与闭源大模型的应用快速开发,可实现大模型应用在跨算力平台上的无感迁移,降低多元、多模的适配与试错成本。
此次智源研究院携手浪潮信息,将FlagGems算子库与元脑企智EPAI内置的核心计算框架进行深度融合,其核心意义在于—确保大模型应用开发能够使用高性能、跨硬件、多框架兼容的算子集合,顺利跨越各类硬件架构,满足多种开发框架的需求。
“浪潮信息与智源研究院在生态上可以形成优势互补,智源研究院是AI领域的一个新兴研发机构,在重视原始创新,开源了很多的基础模型、算子库、OS(操作系统)、数据集等重要的研究成果。”刘军进一步指出,“而浪潮信息致力于为客户提供软硬件协同的全栈的AI基础设施的解决方案,在产业化落地领域,我们有着比较丰富的生态支持和实践经验。双方的合作,一方面将加速AI相关基础研究在产业侧、行业侧的落地应用,另一方面,通过在产业侧的应用效果,不断修正和优化基础研究的成果。”
据了解,在FlagGems算子库接入后,企业依托元脑企智 EPAI 大模型开发平台,可以利用针对大模型应用开发场景优化的先进算子集合,在多种算力平台上高效构建、优化和执行复杂的行业应用算法。在复杂的训练任务及实时性要求严苛的推理场景中,均能实现稳定且高效的运算性能。
此外,企业无需关心多元异构加速卡之间的软硬件差异,真正实现大模型应用在跨算力平台上的无缝开发与迁移。而开源开放的生态对于AI大模型的应用落地起到了关键作用,可以有效降低大模型落地的试错成本、创新成本,以及应用成本。(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达)
根据《网络安全法》实名制要求,请绑定手机号后发表评论