数据中心新时代,开放网络如何使其自动化

从物理服务器到虚拟化系统,现在数据中心又发展成可组合的基础架构。在这种基础架构中,像存储和持久内存之类的资源已从服务器中分离出来,原先的数据处理和联网任务只在CPU上运行,现在演变为可在GPU、DPU或FPGA上运行计算。另外,软件开发模型从单台计算机上运行的程序,演变为@ 1 c (在整个数据中心上运行的分布式代码,实现了云原生、容器化的微服务。

在新一代的数据中心里,开发人员可以通过一个可编程数据中心结构来组装各种类型的* w p处理器M ! J R O N和资源,组成自己所需要的云计算平台。

数据中心的第一个时代是以CPU为中心的,即只能在一台计算机上运行一个应用程序。由于资源分配是静态的,并且更换服务器可能要花费数周或数月,因此通常g o w n z U需要多台服务器,而且还不能得到充分利用。

数据中心新时代,开放网络如何使其自动化

数据中心的第P c { C w 7 . :二个时代,5 : I B r @ l s虚拟化成为了一C z = g种标准,每台服务器上可运行多个虚拟机。资源是动态的,VM是按需创建的。当t h t [ e H G A需要更多的CPU、内存或存储时,可以将工作负载迁移到其他服务器上的VM。

处理仍然由CPU执行,I B # 6 + ! % /GPU或FPGA偶尔会加速特定任务。应用程序开发人员依然是一次只在一台计算机上编写CPU程序。第二代的数据中心仍以CPU为中心。

数据中心新时代,开放网络如何使其自动化

数据中心新时代

现在,我们进入了数据中心的第三个时代,我们称之为ADI(Accelerated Disaggregated Infrastructure),它基于可组合的基础架构,微服务和特定域处理器。

ADI有以下特点:

加速:不同的处理器可以根据优秀的方案加速不同的工作负载。CPU运行通用的单线程工作负载,6 P N 2GPU运行并行处理工作负载,数据处理单元(DPU)管理数据的处理和低延迟移动,使CPU和GPU更有效地获得所需的数据。例z . # @ _ u g如,CM H RPU可以运行数据库,GPU可以处理人工智能和视频,而DPU可以快速,高效,安全地将正确的数据传递到需要的地方。

使用GPu s q d d } ~ 0 BU加速的AI和机器学习现在无处不在:线上购物、5G无线、医学研究、网络安全、软件开发、视频处理乃至数据中心运营。可以通过DPU加快网络、存储访问和保证安全性来使/ v ] p云和容器快速增长。

解耦:将计算、内存、存储和其他资源分成多个池,并以适当的数量动态分配给服务器和应用程序。通常,应用程序本身是由交互微服务构建的,而不是作为一个整体的代码块。M v &这样可以更轻松地以正确的资源比例编Y r 写应用程序,并根据需要更改该比例。

使用ADI模型,GPU,DPU1 Q K , q S m * !和存储可根据需要连接到[ 7 8 ! ) 1 任何服务器、应用程序或VM。通过使用Nvidia的GPU Direct和Magnum IO等技术,CPU和GPU可以在网络上相互访问和存储,其性能几乎都与同一台服务器上的相同,可以将正确数量和类型的GPU分配给需要它们的工作9 ( N I i负载。每台3 $ r c 9 s L p服务器中的DPU可以管理和加速常见的网络、存储、安全性、压缩和深度数据包检查任务,以保持数据的快速和安全移动且不会给Cf j k . f 7 R t sPU或GPU造成负担。

数据中心新时代,开放网络如何使其自动化

通过ADI,数据中心成为了新的计算单元,并且完全可组合,由GPU和DPU加速。

要对数据中心进行编程,必须对网络进行编程

对于ADI,数据中心是新的计算单元,而网络结构提供) j m &了一个灵活、自动化、可编程的框架{ $ B I / i J a U来动态地p 1 ` )组合工作负载资源。这意味着不仅要对CPU、GPU和DPU进行编程,还要对网络结构本身进行编程,将I j uDevOps的优势扩展到网络中,这种方法称为“基础架构即代码”(Infrastructure a. v p k v N `s CoB - k U Ade,IaC)。该结构必须可编程、可伸缩、快速、开放、功能丰富、自动化友好且安全。它可以在CPU,GPU和存储之Y ! t 6 y 4间提供多种高带宽路径,并能够对流量类别进行优先级排序0 k # Q 6

数据中心新时代,开放网络如何使其自动化

使用ADI,每个应用程序都可以在由CPU,GPU和存. . h v X ~ b 6储资源组成的虚拟服务器上运行,而DPU可以加快访问和提高安全性。

开放式网络操作系统支持ADI

传统上,交换机被设计为专有的“黑匣子”,其中网络操作系统(NOV / -S)锁定在特定的交换机硬件平H ! K & ! [ j V台上,要求客户一起购买和部署它们g - ` u & | / X

以Nvidia为例,其方法是提供优质的开放式端到端解决方案。客户可以采用优秀的交换机ASIC,并根据自己的需要选择最好的NOS:Cumulus Linux、Mellanox Onyx、SONi8 : # ~ x jC等。客户甚至可以选择在Spine Switches上运行SONiC,而在机架式交换机和园区交换机上使用Cumulus Linux。

数据中心新时代,开放网络如何使其自动化

与专有的封闭式交换机模型不同,开放式网络使客户可以从同类优秀的软件和硬件中进行选择,Q H m . F以获得所需f S ) . C N l的功能和性能,并提高可管理性。

现在,企业、AI、云和HPC工作负载可以使用包括GPU、CPU、E ( O / Z 6 ,DPU、内存、存储和高速连接在内的优质资源,在整个数据中心的任何部分灵活运行。

【编辑推荐% ( R h R ; K !

  1. 数据中心很费电!但人工智能不一定要耗费大量的能源
  2. Q p m m G T新基建”赋能大? 4 f [ 数据中心演进及布局思考
  3. 工业4.0的秘诀——部署本地边缘的微型数据中心
  4. 数据中心运营商在疫情期间如何应可靠性监管
  5. 边缘数据中心到底将会消耗多少电量?

【责任编辑:华轩 TEL:(010)68476606】