自从2022年底,ChatGPT的问世,让人工智能技术又一次站在了科技舞台的中间。随着AI大模型的不断发展,对底层支撑算力供给的数据中心也带来了更多新的要求,而IDC行业也向着AIDC方向演进。
IDC与AIDC有何不同?
当AI算力需求呈现出爆发式增长时,传统的IDC显然已经不能满足当下各行业对于智能算力的需求。而在世纪互联创始人、中关村超互联新基建产业创新联盟理事长陈升看来,AIDC可以有两层解读。一方面,AIDC是AI+DC,是人工智能计算的数据中心;另一方面,AIDC是代表了数据中心进入了加速计算的时代,即Accelerate(加速)数据中心。
而这个改变的过程中,首当其冲的就是交互界面的改变。原先,数据中心对于用户而言,IDC企业需要交付的是机柜,是底层的“风火水电”的基础设施;而在AIDC时代,用户侧只有30%的投资会投资在“风火水电”等基础设施层面,“用户70%的投资会在GPU与网络等层面。”陈升指出,“这对于IDC行业而言,可以说是‘地动山摇’般的改变。”
而随着用户对GPU、DPU等芯片需求的增加,单机柜的功率也随之变化,机柜功率也呈现出越来越高的趋势。据统计,现阶段,单机柜电力规模已经从原本的十几、几十千瓦,提升至120KW,甚至最高可达200KW,“现在一个机柜的功率,甚至可以达到过去整个机房功率的大小。”陈升如是说。
在这个过程中,加速计算显然已经成为当下炙手可热的市场之一。随着AI技术的快速发展和广泛应用,加速计算服务器在数据处理、模型训练、深度学习等领域发挥着越来越重要的作用。加速计算服务器通过集成高性能的GPU、TPU等AI加速芯片,可以大幅提升数据处理能力和计算效率,满足大规模AI应用的需求。
据统计,在过去10年间,加速算力提高了100万倍。从市场规模上看,据IDC发布的《中国半年度加速计算市场(2023全年)跟踪》报告,2023年中国加速服务器市场规模达到94亿美元,同比2022年增长104%。
而加速计算与高功率机柜带来的能源的改变,也是IDC向AIDC转变过程中重要的一环。对此,数据港相关负责人曾对钛媒体APP表示,建设“源网荷储一体化”供电系统是实现数据中心在满足AI算力需求的同时,向着低碳发展的重要举措。
目前已有多地开展相关探索,但在建设过程中受到电网运行机制的限制,源荷难以对接,需要国家、地方政府给予绿电直供、降低综合供电成本等政策支持。而对于接入电网的数据中心来说,既不能选择也无法鉴别电网输送来的电力是煤电还是风电,导致清洁能源使用率难以评估。
除此之外,AIDC与IDC时代的不同还体现在了包括计算、存储、网络、系统等各个环节的协同方面。传统IDC时代,存算分离的架构较多,而且网络是网络、机柜是机柜、系统是系统,各个板块协同比较少,而这一点,在AIDC时代将迎来改变,对此,中国工程院院士、紫金山实验室荣誉主任兼首席科学家刘韵洁院士表示,面向AI大模型时代,需要计算、网络、存储、系统协同,才能构建高性能算力底座,实现超大规模集群万卡协同。
IDC内外,网络架构是关键
AI大模型的快速发展对IDC基础建设方面的颠覆仅是“冰山一角”,要释放算力真正的价值,更好地服务于AI技术发展,算力传输的网络亦是关键所在。
如果将整个AI产业比作一个人,那么数据中心就是心脏,而网络就是血管,负责将养分输送到人的各个器官。
所以,随着各行业对AI算力的需求与日俱增,原有的互联网已经不足以满足快速、高效输送“养分”,供给AI算力需求。无论数据中心内外,网络架构也已经进入了变革的时代。
在陈升看来,在AI算力需求爆发下,现有的互联网就好比互联网发展初期拨号上网,借由电话线连接互联网一般,效率、速度显然无法满足需求。而当下,行业急需在传统互联网架构上,搭建一条新的网络通道,以满足AI算力传输需求。“大胆设想一下,AI原生世界和互联网是真正相互独立的‘平行世界’,AI不是互联网上的‘超级应用’,AI的终极目标是打造一个超越互联网的下一代全新网络信息空间。”——这是陈升对于未来网络架构范式的展望。
目前的互联网带来的是B2B、B2C,以及C2C的连接,未来的超互联时代,更多是M2M(机器之间)和A2A(数字分身之间)的连接,而他们交互的信息也不再是语言,而是token。
这条网络也必将成为未来AIDC之间的桥梁,陈升将这条桥梁比作哈利波特中的9¾车站,“它将是新一代AI原住民进入AI原生‘魔法世界’的车站入口。”陈升如是说。
对此问题,刘韵洁表示,对于算力网络而言,确定性是一个非常重要的基础,“确定性的网络可以为海量数据远距离无损传输提供关键技术支撑。”
刘韵洁指出,确定性网络首先带来的就是网络架构的变革,“因为要解决AI算力的需求,不是单一技术就能解决的,整个网络的架构都要进行系统性的设计才能解决。”刘韵洁明确,“但现有的网络架构是服务定制网络,而现在我们要将原先‘尽力而为’的网络架构,转变成一个确保所需的架构,才能满足当下算力对于网络的需求。”
与此同时,在确定性技术不断演进的过程中,还需要整个网络底层跟光通信融合,“无论是数据要素,还是大模型训练、推理,都需要具备不同宽带、不同网络的随时可定制化。”谈及未来AI发展需要的网络基础时,刘韵洁这样认为。
基于该背景,中关村超互联新基建产业创新联盟与世纪互联共同提出了超级互联(Ultra Cross Connects ,简称UCC)理念。据悉,超级互联包含ICC和DCC,即智能互联(Intelligent Cross Connects,ICC)和分布式互联(Decentralized Cross Connects,DCC)。ICC是指一个具备AI推理能力,承载各种生成式AI创新应用的智能推理应用入口;DCC是指构成数字新世界的“脑神经网络”,具有无所不在、无时不有的分布式属性。UCC不是简单的宽带升级,而一种全新的万物智能互联方式,一个让人、机器、模型和数据更紧密连接的未来世界的愿景。
陈升表示,中关村超互联新基建产业创新联盟与世纪互联希望UCC理念不仅是网络实验局,而成为新世界的实验局,“由世纪互联长期为创新公司提供后台技术支持,今天既为下一代互联网公司服务,同时也能够为像NVIDIA这样成为世界人工智能革命引擎的芯片公司服务,”陈升表示这是世纪互联接下来努力的方向之一。
而这也不是“独一份”的网络“重建计划”,钛媒体APP了解到,中国信通院也曾提出“算力服务时延圈领航者计划”,力图规范化、标准化算力网络建设。据了解,该计划在1.0标准互联网访问基础上,面向算力节点覆盖、网络时延、传输质量、统一管控等方面,联合产业界持续构建算力服务时延圈2.0标准体系,重点围绕算力服务接入、算间互联、时延地图、管控调度等方面进行标准化,统一算力时延圈定义,规范网络时延测试方法。
套用刘韵洁的一句话:原来企业只关心自己的智能化改造、网络化改造,现在整个上下游的产业价值链,如果不连通起来就会受到制约,所以在人工智能时代,行业大模型的发展就显得尤为重要。
IDC服务商迎来新机会
对于算力平台而言,底层逻辑是对算力资源的分配、调度、削峰填谷,在能效、业务、用户、性能等多维度中寻优。
而随着这一波算力产业的发展,对于IDC服务商而言,也迎来了新一轮的竞争,一方面,各大IDC服务商也争先恐后的布局算力网络和算力平台的相关产品及服务。
普洛斯目前在基础设施层面建立了全面的能效量化与观测指标。在算力平台调度的过程中,追踪基础设施的容量变化,通过建立专家、AI等技术手段动态调整基础设施的运行策略,从而支撑算力平台的快速调度。普洛斯数据中心通过智慧化的运营管理,帮助客户实现从楼栋到园区再到全国的统一管控,并结合各地的情况,更有效地支撑其在当地算力的最高发挥。
世纪互联则是在算力平台、调度、网络底层协议、AI框架、Agent等方面都有大量的投入和积累,世纪互联的目标是构建跨区域、高效、异构、可扩展的AI基础设施。
据了解,世纪互联目前在全国已经运行了多个跨区域的节点,节点间通过创新的AINet连接,实现不同品牌和型号的GPU异构算力和资源的调度协同,实现了在大模型训练、微调、推理、应用全生命周期的应用和落地,满足不同类型的客户需求。
除了IDC服务商的积极布局以外,作为算力重要载体的云计算厂商也纷纷入局算力网络建设,以中国电子云为例,中国电子云基于云原生理念设计了中国电子云专属云CECSTACK V5一体化算力平台,旨在帮助企业实现多元异构算力的统一管理和调度,并提供通用计算、智能计算和高性能计算等类型算力的一体化算力服务。
除此之外,诸如青云科技、Ucloud等众多云计算服务商也都在算力调度方面有着积极的布局。
另一方面,布局具备承接智算项目能力的数据中心也必将成为接下来各大IDC服务商的重点。
展望未来,唯有网络与机房“双管齐下”,才能让IDC更好地服务于AI产业的发展,让IDC走向AIDC。(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达)
根据《网络安全法》实名制要求,请绑定手机号后发表评论