以软件为开端的云计算行业,经过十余年发展,正变得越来越“硬”。归根究底,软硬一体能实现更低的成本、更好的效果,这也是IT产业史上不甚新鲜的轮回,而每当一次或软或硬的变革发生时,新的故事也正在写就。
2022年6月份,DPU(数据处理单元,Data Processing Unit)创业厂商大禹智芯宣布完成A轮融资,融资金额未公布,该轮融资由前海方舟旗下的智慧互联产业基金、中原前海基金和齐鲁前海基金共同投资,融资资金将用于产品研发和推广。
DPU是当下云计算行业的热词,大禹智芯自2020年6月成立以来,两年获得四笔融资,融资频率之高一方面说明了公司的质量,另一方面也证明了赛道的正确性,不论是巨头还是初创,纷纷投入DPU赛道,市场热度仍在增长。
大禹智芯创始人李爽曾任美团云总经理、阿里巴巴网络技术总监、百度系统技术委员会主席等职位,这与DPU的发展背景也很是相似,DPU始于云计算,未来却不止于此。
DPU为何诞生在公有云?
2019年,由Juniper发起人创建的硅谷创业公司Fungible提出了DPU的概念,2020年,英伟达收购Mellanox,并将BlueField产品线更名为Nvidia DPU,此外结合英特尔推出IPU(Infrastructure Processor Unit,可以理解为另一种DPU命名), 阿里云发布CIPU等行业动态,DPU成为确凿无疑的行业大势。
DPU最早落地的领域是云计算,AWS从2015年就已经探索DPU的发展,收购芯片厂商Annapurna Labs,推出Nitro芯片,虽然当时还没有“DPU”这一名字,但Nitro被公认为是DPU的早期形态,
大禹智芯对钛媒体App表示,DPU出现在公有云场景是有其逻辑的,在最初的传统IT技术设施架构里,每台或一组服务器可以提供完整的服务,基于这样的架构设计,更多考虑数据中心南北向流量(数据中心外部用户和内部服务器之间交互的流量)的交付能力。
但随着整个云化和应用部署方式的变化,应用由单机模式转变为集群模式,追求更多的横向可扩展及健壮性,整个数据中心的流量发生变化,应用不断云化以及微服务化后,东西向流量已经占据数据中心85%或者更大的比例。
基于此,宏观上服务器间的流量模型发生变化,微观上虚机和微服务间也会产生大量数据,因此应用部署要求更加灵活。
基于云计算场景,数据中心还需要提供租户隔离、客户QoS、客户网络安全性、使用远程存储等功能,要实现上述这些功能基于网络提供的服务,便催生了DPU的出现和应用。相比目前的普通网卡和智能网卡,DPU是性价比更好的方案选择。
李爽表示,“DPU出现的底层逻辑就是为了提高CPU的处理效率,释放CPU算力,同时为CPU和GPU提供基础数据服务,他们之间的关系是相辅相承。随着高效的数据搬迁能力,解耦的资源池化逐渐成为新型高性能计算架构的必要技术能力。在这两个领域,DPU均可发挥其他类型处理单元所不具备的能力。”
DPU厂商的不同路径
以目前主流的硬件创新路径来看,DPU产品研发可以分为两种:一种是传统路径,即由下而上的底层硬件创新,代表企业包括Pensando(已被AMD收购)、Fungible等。
他们把自身理解的业务场景及所对应的技术能力,先融入到芯片中,再通过芯片构建上层软件及面向客户呈现的功能。在逐渐面向市场的过程中,通过潜在客户的反馈,再次调整自身芯片能力和市场定位。
另一种是更关注实用性的路径,即从上层场景需求出发推动芯片等底层硬件的创新,代表企业包括互联网巨头AWS和阿里,大禹智芯也将自己归于这种路径。
AWS和阿里云的技术路线,与上述两家美国DPU类产品创业公司有所不同,这两家既是问题的发现者,同时也是问题的解决者,问题和需求的明确性,使他们能够有的放矢地选择技术路线并付诸实践。
由于AWS和阿里云在云计算基础设施层面面临的问题类似,所以二者技术思路也趋于一致,都把突破口定位在网络、存储和Hypervisor三个方面。
经过市场的考验,证明了在云计算场景中AWS和阿里云的DPU类产品及技术解决方案是成功的,也帮助这两家大型公有云服务提供商,在各自主要市场保持性价比和占有率。
目前看,AWS和阿里云都加强了DPU产品的广泛宣传,但均没有当做独立产品对外销售,业内人士分析,这可能有两方面的考虑,一是为了保持自身的差异化竞争优势;二是其DPU产品与自己平台紧密相关,产品化程度可能不足,因此无法更多适配其它场景。
大禹智芯并不是云计算厂商,但是其创始人团队在云计算领域有多年的工作经验,因此在实现路径上也采取了从场景到芯片的路径,根据实际需求来补充和迭代DPU产品,在从场景到功能到软件到硬件,自上而下的传递过程中,把场景化需求抽象出来形成能够复用和固化的技术逻辑,逐渐固化到硬件中。
值得一提的是,前阿里巴巴及谷歌智能网卡团队负责人蒋晓维,近日作为合伙人正式加入大禹智芯任首席科学家,负责大禹智芯的DPU芯片等研发工作。蒋晓维曾在阿里云、谷歌云和英特尔厂商任职,是第五位华人HPCA名人堂成员,据了解,他将主持大禹智芯SoC产品的定义和设计工作。
不同于AWS和阿里云,大禹智芯希望实现一个通用型的DPU产品,在其对外宣传中,边缘计算、运营商、行业用户等也是其重点关注的客户,通用型DPU是否能被市场接受,是大禹智芯接下来的考验。
此外,DPU被认为是CPU、GPU之外的第三颗芯片,老牌芯片巨头英特尔和英伟达自然没有缺席,钛媒体App了解到,英伟达的CX系列智能网卡有非常高的市场占有率和渗透率,英伟达借助CX系列的部署经验及客户反馈信息,定义了Bluefield系列产品。
英特尔则与谷歌合作共同定义了IPU SoC--Mont Evans的架构和功能,希望借助谷歌在大规模数据中心内的实际需求和宝贵经验,打造既可满足谷歌定制化需求,又能面向广泛市场的DPU类产品。
作为由下而上的典型厂商,英伟达及英特尔在芯片实现方面的能力毋庸置疑,并且,他们都很早认识到了DPU的价值,并很早就开始了产品的设计与开发,但其DPU产品的广泛使用的相关报道较少,反而是AWS和阿里云的产品真正做到了大规模使用,这其中反应的问题,也非常值得关注。
通过AWS和阿里研发并规模化部署DPU类产品的经验可以看出,第二种路径更适合DPU产品大规模商业落地,也更具备市场前景和发展空间。
悬而待解的行业难题
DPU和CPU、GPU的发展路径不尽相同,但却有同样的应用场景潜力,DPU技术来源于大型公有云场景,其在云计算场景中的价值已经毋庸置疑,大禹智芯将DPU比喻为服务器中的“前置服务器”,定义DPU为集芯片、硬件板卡、操作系统、应用软件一体化的方案。
如果从广义上定义DPU的使用场景,DPU适用于大量需要复杂网络数据处理或高性能网络数据交互的场景,DPU可改变现有网络数据处理模型,提供更大范围更高效的数据流转方式,有望在以后构建起以DPU为中心的基础设施架构。
大禹智芯对钛媒体App表示,未来,DPU产品形态还需要多样化,DPU产品形态的多样性能够更好的满足不同的云计算场景的需求,而降低DPU使用过程中的技术门槛,很大程度决定DPU产品在面向广泛市场时的普及率及渗透率。
目前DPU还没有跳出云计算场景之外,DPU厂商需要充分消化先进公有云厂商DPU类产品研发使用经验,深刻理解DPU的在云计算场景中的使用价值,才能更好明确DPU的产品定义及研发方向。
DPU更大的难题或在行业生态方面,英特尔和英伟达建立起了广泛的芯片产业生态,DPU目前还处于产业发展早期,何时脱离云计算场景之外,围绕DPU形成相对完善的生态,才算是建立了一个DPU芯片行业。
(本文首发钛媒体APP 作者 | 张帅,编辑 | 盖虹达)
根据《网络安全法》实名制要求,请绑定手机号后发表评论