CIPU面世,云计算将指向何方?

 虚拟化方案     |      2022-06-22 23:42

近日,阿里云正式对外发布了全新处理器:CIPU,并宣称CIPU未来或将替代CPU成为云计算的管控和加速中心。

CPU指中央处理器,它的规格决定了一台服务器工作效能的高低,当前的云计算基于以CPU为中心的体系架构,以软件定义的方式进行优化,在数据量暴涨的情况下已然触及瓶颈。

CIPU则是指云基础设施处理器,它能通过特定的操作系统,将阿里云再全球的200 多万台服务器变成一台“超级计算机”,为客户提供更高性能、更低价格、更可靠的云计算服务。

一家小店的运营能力,再怎么提高也有限度,两百万家小店高效协同之下,运营能力的提升可想而知。而从个体计算机的集群到“超级计算机”的诞生,也更符合云计算的定义。

可以说,CIPU从源头再造了云计算全新发展路径,这种回归源头突破瓶颈的方式,与整个现代科技的发展路径不谋而合,正如基础科学是土壤,应用技术是树木,当参天大树难以长成的时候,最需要的往往是厚植培育土壤。

01 云计算遭遇什么瓶颈?

要想更深入地理解阿里云对以CIPU取代CPU成为云计算体系架构中心的信心,还需要将之放入云计算发展历程当中来看。

在过去十多年里,云计算技术经历了两个发展阶段。第一个阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求。

企业通过分布式架构将计算能力打散到不同的机器上,解放供应链的弹性,同时引入虚拟化技术,实现分时复用,解决单个集群资源利用率相对较低的问题。

这种分布式架构让企业具备了云的基础技术能力,但没有云计算的核心生产力,比如没有达到即开即用的资源弹性、按需扩容、线性可扩展性等,难以满足规模不断扩大的业务需求。

第二阶段是资源池化技术,把计算和存储资源分离,再规模化编排和调度,提供了超大规模的计算和存储资源池。

这种通过将不同的物理资源变成虚拟化的资源,进行统一池化管理的技术,推动了公有云时代的加速到来,企业不再需要自己管理这些资源,而是由云厂商提供统一调度、统一管理和统一编排,以提高资源的利用率。

如果说分布式和虚拟化技术成就了云计算的崛起,资源池化技术则是大大降低了云计算的使用门槛。但它们都是通过软件定义的方法,基于传统的以CPU为中心的体系架构去做优化,随着数字经济的到来,“以软件定义为主”的云计算再次无法满足产业需求。

云厂商们发现管理基础设施规模越来越大,复杂度也越来越高,数据密集型的计算越来越多,一个纯软件定义的、以 CPU 为中心的云体系结构,虚拟化的代价很高,费用会不断增加,也难以实现对云计算低时延、高带宽的需求。

行业期待着、也努力着推动下一代云计算的发展。2020年之后,部分芯片巨头陆续推出了相关数据中心产品,如英伟达的DPU(Data Processing Unit,数据处理器)和英特尔的IPU(Infrastructure Processing Units,基础设施处理器),与阿里云推出CIPU一样,都是希望设计一个新的管控中心,以替换掉CPU的管控职能。

02 CIPU的破局思路

那么,这些诞生之初就被赋予了替代CPU使命的产品,是如何解决以CPU为中心的云计算所面临的瓶颈呢?

首先来看DPU。它诞生的背景是带宽与计算性能的增速失调,CPU的性能从5-10年前每年30%的增幅,到三年前大概只有每年不到3%的增幅。而网络带宽每年依旧还有35%左右的增长,这意味着,处理性能和带宽增速的比例从原来的大概1:1,变成了现在的1:10左右。

因此,DPU侧重的是数据迁移带宽能力,作为集成加速平台,DPU能够从CPU上卸载关键的网络、存储和安全任务,降低CPU的开销,直接效果是给 CPU“减负”。

再来看IPU。IPU紧随DPU之后,作用也有所类似。IPU通过专用协议加速器来加速基础设施功能,包括存储虚拟化、网络虚拟化和安全,通过把软件中的存储和网络虚拟化功能从CPU转移到IPU,从而释放CPU核心,还能允许灵活的工作负载分配,提高数据中心利用率。

因此,IPU更强调虚拟化云化能力,它扩展了英特尔的智能网卡功能,旨在应对当下日益复杂的数据中心,提高数据密集场景的计算能力。

尽管技术路径上有所区分,但无论是DPU还是IPU,都是想通过软件定义+硬件加速的方式,替代CPU成为数据中心的核心硬件。