开放的数据中心

  你知道吗,一辆自动驾驶汽车每天生成的数据量达到4TB,而一个人每天最多生成1.5GB的数据。这一数据量级上的差距说明什么?今天的世界,人工智能、5G连接、物联网等正成为驱动业务发展和创新的原动力。英特尔预测,数据中心流量每18个月将翻一番。面对数字世界的快速变化,一成不变的数据中心基础架构是否也应该来一次翻天覆地的革命?企业用户需要不同于以往的计算、更快速的存储和网络连接,以及更方便快捷且智能化的管理和运维。

  这场数据中心的革命由谁来领导?8月22日,一年一度的“开放数据中心峰会”在北京举行,它把众人的目光再次吸引到大规模数据中心领域。整机柜这一新的服务器架构和交付方式将给数据中心这场革命带来什么样的启迪呢?

  数据中心变革的方向

  英特尔率先做出了尝试和改变,主要体现在以下几个方面。

  第一,服务器处理器的革新。英特尔最新推出的至强可扩展处理器是具有划时代意义的一代产品。英特尔不仅在相关技术上大胆创新,而且从这一代处理器开始,英特尔改变了沿用多年的处理器产品命名规则。英特尔数据中心事业群互联网业务拓展总监Jeff Wittich表示,新一代的至强可扩展处理器是安全、敏捷、多云数据中心的基石,也是英特尔过去十年中在平台方面最大的进步。

  该系列处理器专为可信的数据服务交付而设计,可为CSP(商业服务提供商)提供以下三大价值:性能与效率的提升,敏捷和可信,实现了差异化的服务。

  第二,存储方面的创新。数据中心用户对于性能的追求是无止境的。英特尔最新推出的“傲腾”存储,其优势就体现在高性能和低延迟两方面。Jeff Wittich介绍说,英特尔“傲腾”固态盘(SSD)可以有效消除数据中心的存储瓶颈,支持更大、更经济的数据集,加速应用,降低数据中心的整体拥有成本。

  第三,网络连接的重要性日益凸显。更快的处理器平台和更高性能的存储,需要同样敏捷的网络将它们连接起来。而英特尔在硅光技术方面的突破有可能重新书写数据中心的历史。硅光技术的应用可以实现更高速的长距离数据传输,消除网络瓶颈,同时降低总体拥有成本,提高数据中心整体架构的性能。

  第四,英特尔在计算、存储、网络方面的创新,需要一个新的平台将其高效、经济地整合在一起,而英特尔整机柜设计这一基于行业标准的架构当仁不让。RSD从根本上改变了数据中心建设、管理和扩展的模式,以软件定义基础设施和云化的方法提高了数据中心的效率,降低了成本。

  Jeff Wittich指出,英特尔RSD拥有一项重要的能力,就是针对每个工作负载把物理硬件资源池中的系统动态地组合成更高效的配置,而这种“组合”的能力让数据中心管理员摆脱了手动对硬件进行重新分区的繁重工作,在计算、存储和网络资源利用率较低时,可以轻松地重新分配这些资源。举例来说,基于RSD,低延迟的英特尔“傲腾”存储和基于FPGA的定制加速器等“高价值”的资产可以按照最优化的配置按需采购,并可以得到充分共享。

  英特尔RSD采用了现代开放式RESTful API标准,使得用户不会被某个厂商的专有解决方案锁定。借助开源的英特尔RSD参考软件,OEM厂商可以在API标准之上提供自己的创新和差异化。华为、浪潮等服务器厂商都推出了基于RSD的服务器。

  据悉,开放数据中心委员会(ODCC)的天蝎Scorpio服务器工作组基于英特尔Purley平台开发了Scorpio 2.0参考板。此板卡兼容Scorpio天蝎标准,并使用两个CPU插槽,支持英特尔至强可扩展处理器和每个服务器板卡最多16个DDR4 DIMM插槽。

  天蝎标准是一个硬件的标准,而英特尔RSD是一个逻辑架构,定义了API和管理标准,让设备更好地实现互联互通。两者是互补的关系,可以非常好地融合在一起。

  RSD的机会很多

  随着计算能力、数据存储规模,以及网络流量的大幅增加,资源池化、弹性、软件定义等成为新一代数据中心建设的重要趋势。英特尔RSD针对计算、存储、网络资源进行解耦、动态池化和重构,不断提升数据中心资源池的利用效率,兼具灵活、经济、开放、易控四大特性。

  英特尔希望重塑数据中心,而基于资源池化理念的英特尔RSD指明了未来数据中心的演进方向。英特尔与中国电信、中国联通等电信运营商携手,基于英特尔RSD快速部署资源池,提升网络承载能力,推动电信运营商的云化部署,同时也为电信运营商的网络重构奠定了坚实的基础。

  举例来说,中国联通携手英特尔、九州云99Cloud和云达科技有限公司启动了基于英特尔RSD的概念验证测试项目,旨在探索下一代服务器和数据中心架构技术,同时验证英特尔至强可扩展处理器和RSD在数据中心和云基础设施方面的应用和功能,以及利用RSD技术和OpenStack开源云操作系统构建下一代云数据中心架构解决方案的可能性。目前,第一阶段的验证和测试工作已经完成,中国联通接下来还计划在RSD的硬件资源重构、裸机多品牌管理、NFV等方面进行验证和测试。

  目前,全球的许多电信运营商都在积极尝试以软件定义网络(SDN)和网络功能虚拟化(NFV)为抓手,以网元云化部署、SDN等方式构建下一代的电信网络基础设施。基于英特尔RSD的解决方案,不仅能提供基于标准的管理接口,更具有高效、便捷、高可扩展等特点,可以方便地进行功能和产品集成,因此成了构建电信级NFV基础设施的理想选择。“英特尔RSD代表了未来数据中心构建和部署的方向。通过凝聚产业链的力量,构建开放生态系统,英特尔正不断促进创新技术和解决方案的开发和应用,重塑数据中心架构,加速数据中心的转型。”Jeff Wittich表示。

  除电信运营商是英特尔RSD的“吃螃蟹者”外,Jeff Wittich认为,只要有大规模基础设施建设需求的用户,如私有云或混合云建设,都可从RSD中受益。在美国,一些银行、保险机构,以及大型企业级客户都开始尝试基于RSD构建其数据中心基础设施。另外,像基因、生物等行业希望借助新技术提高业务部署效率和应用灵活性的客户,也适合采用RSD。英特尔的数据中心里也部署了RSD。

  “无论是国外客户还是中国客户,大家对于计算、存储、网络的需求是一样的。尤其是在超大规模数据中心里,大家面临的挑战十分类似,机遇也相同。”Jeff Wittich表示,“说到差异,那就是中国的数据中心用户对于节能减排、绿色数据中心的重视程度更高,特别是中国的云计算服务提供商、大型数据中心客户。因此,我们也会与中国云服务提供商合作,希望在节能减排方面有更多的创新。”

  从客户需求出发

  今年的开放数据中心峰会与“三”有缘。第一,今年是ODCC成立三周年,“ODCC联合实验室”正式成立,这是ODCC发展历程中又一重要里程碑。第二,开放计算倡导者、天蝎标准积极实践者浪潮“连中三元”:浪潮SR系列整机柜服务器是本次峰会上唯一通过ODCC认证的服务器;浪潮公布了第一款符合天蝎标准2.5的Purley公板;浪潮推出基于天蝎冷存储标准的温冷存储节点。

  推动开放计算标准的普及,将大型互联网企业、运营商在服务器设计,以及数据中心建设和运维方面优秀的经验,在更多行业快速复制、推广和应用,将有力促进数据中心的变革,迎接数字化转型时代的到来。这不仅是全球几大开放计算标准组织的愿望,也是参与其中的各厂商努力的方向。

  今天,所有的厂商谈起技术和产品创新,都习惯说一句话——从客户的需求出发。那什么才是客户的需求?以互联网厂商为例,App应用迭代速度非常快,可能几天就会出现一个新App。为适应这一业务的需求,互联网厂商必须建立灵活、弹性、易扩展的IT架构,支持业务的快速上线、变更。而传统IT建造模式,可能几周或一两个月才能完成新系统的上线。要想改变这种状况,整机柜服务器交付模式不失为一个理想的选择。浪潮互联网行业部产品总监孙波介绍说:“传统服务器一般单日单机房最多交付300个节点,而浪潮整机柜服务器可做到单日单机房交付5000个节点,如果是双线交付,单日最多可交付一万台服务器。”

  大幅缩短服务器的交付周期,这只是消除了大型数据中心用户的一个痛点而已。若想精准地找到用户更多的应用痛点,并采取行之有效的方法将这些痛点一扫而光,就必须改变传统的产品研发模式,找到一种更加贴近用户的研发模式。浪潮建立了一种有别于OEM和ODM的新商业模式——JDM(Joint Design Manufacture,联合开发),而这一模式正好与三大开放计算组织的理念不谋而合。

  所谓JDM模式,即面向应用,融合产业链,与客户建立面向未来应用的联合定制开发与合作模式,并与客户共同将创新研发的产品推广到更多行业客户,实现从满足不同应用场景的需求到实现趋势的引领,从短期产品的成功到长期的商业成功。

  浪潮的JDM模式已经“初战告捷”。比如,今年6月在北京举行的2017 OPNFV Summit峰会上,浪潮与中国电信、英特尔联合发布了首个运营级NFV整机柜解决方案。这就是基于JDM模式的一项最新成果。该方案基于英特尔RSD、浪潮InCloudRack融合架构整机柜服务器,以及InCloud Openstack云管理平台,将承载BSS和OSS等电信关键业务系统。浪潮横向联合产业链上下游的厂商实现产品的互补,同时纵向联合用户,针对像NFV这样的具体应用场景进行贴近用户需求的研发,既可以满足用户的个性化需求,同时也打磨了通用的技术架构,一举两得。

  再比如,浪潮与百度在AI方面的合作,已经从最初单纯的产品合作向研发模式、生产模式的两端深入推进,使得硬件产品与软件算法从研发设计阶段就开始接触和磨合,让双方联合研发出的SR-AI整机柜服务器产品更符合百度的业务需求,充分发挥AI计算力和创新能力。

  对于浪潮来说,互联网公司既是客户,也是技术合作伙伴,双方的成功合作既为像AI这样的特定应用领域树立了样板,又可以把联合研发的经验和成果快速在其他领域进行复制,将JDM模式的效益最大化。

  浪潮JDM模式不仅适用于互联网、运营商等规模大、应用特殊的领域,也同样适合于普通的商业企业。与企业进行联合创新与开发,是贴近用户需求的一种具体表现。这样可以深入到用户应用的第一线,真正从消除用户的应用痛点出发,不仅仅是简单地提供产品,而是与企业共同开发、成长。这种方式对于解决用户的问题最有效,也是今后可能被厂商普遍采用的一种开发方式。

  JDM模式小试牛刀

  JDM模式是适合当今云时代需求的一种新型开发模式,它究竟与传统的OEM、ODM方式有何不同呢?

  浪潮服务器产品副总经理陈彦灵举例说:“如果是ODM模式,就必须完完全全按照客户的要求进行开发和设计,ODM模式是将成品提供给客户,若测试时发现有大的问题,再进行产品改动是比较困难的。而JDM模式是在产品设计之初,厂商就加入进来,与客户一起了解需求,共同设计,可以及时发现问题。既加快了新产品上市的速度,又可以做到满足客户的需求。这才是联合创新的本意。”

  如今在国内,厂商与客户进行联合创新的模式已经渐渐变得流行。厂商深入客户研发的第一线,双方建立联合创新实验室等屡见不鲜。

  浪潮从2009年开始涉足整机柜服务器市场至今,已迭代到第五代产品。2009年至2011年,浪潮推出前两代整机柜服务器产品,当时还没有天蝎项目组。在这个阶段,浪潮在整机柜服务器研发方面是摸着石头过河,边研发边实践。2012年天蝎项目组成立后,浪潮按照天蝎规范开发产品至今。如今浪潮已经是国内最大的天蝎整机柜服务器供应商,占市场份额60%以上。

  浪潮与以BAT为代表的互联网厂商进行JDM合作,这种方式已趋成熟,且硕果累累。陈彦灵预测,产品定制化是大势所趋,未来70%~80%的服务器都将是定制化的。与BAT等互联网企业一起联合研发,再将成功经验在传统商业领域进行快速复制。据保守估计,2016年中国天蝎整机柜服务器出货量超过4000套,形成相当规模的产业生态。

  ODCC主导制定天蝎标准是目前中国整机柜服务器的通行标准。浪潮是首批通过天蝎整机系统和管理子系统两项测试标准的厂商。这表明浪潮SR整机柜服务器符合天蝎标准,其散热、供电等部件的冗余性、整机性能及稳定性等也得到认可。

  数据中心供电迎来48V时代

  天蝎标准除了对整机柜服务器交付的模式,以及计算、存储等模块的设计提出具体要求以外,对服务器的供电、散热也越来越重视。近几年,随着人工智能、机器学习、大数据挖掘等高性能计算应用的快速增长,数据中心的设备密度逐步增加,传统的供电方式捉襟见肘。举例来说,服务器主板上不仅有CPU,还有GPU,而传统的12V供电解决方案已经显得力不从心。从48V直接为XPU供电的方式逐渐开始流行。

  48V直接到负载点的电源组件解决方案与传统的48V转12V再转1V的两阶层转换设计相比,总功率容量增加4倍,电容体积缩减到1/4,更重要的是,传输功率损耗大大降低。

  在大型数据中心里,XPU的工作电流已上升至数百安培,虽然毗邻XPU放置的大电流负载点电源架构可降低主板内的配电损耗,却无法彻底解决XPU和主板之间的互联难题。随着XPU电流的不断增加,解决负载点与XPU之间“最后一英寸”的问题已经迫在眉睫。

  48V电源解决方案并不是今天才有的,在数据中心之外的一些领域,比如给大屏供电,已经有不少成功的应用。Vicor公司在此领域已经有超过10年的积累和经验。令人感到兴奋的是,在北京举行的开放数据中心峰会上,Vicor面向数据中心领域推出了适用于高性能、大电流XPU的合封的模块化电流倍增器。所谓合封,就是将XPU与供电模块整合在一起,而不是像原来那样各自分立。合封电源方案不仅可以减少XPU插座的引脚数,还能减少从主板向XPU供电的损耗,进一步增大电流供给,让XPU展现其最高性能。

  Vicor是48V供电方案市场的领导者,其电流倍增器已经被大规模用于从48V直接为XPU供电的主板中。最新的合封模块化电流倍增器(MCM)与XPU内核都被封装在XPU基板中,其转换效率、功率密度和电源带宽的优势得到完全释放。模块化电流驱动器(MCD)置于主板上,具有高带宽、低噪声,不仅可驱动MCM实现电流倍增,还可以为XPU提供精准电压调节。Vicor已推出的合封解决方案包含两个MCM和一个MCD,可为XPU提供高达320A的稳态电流,峰值电流高达640A。

  MCM被合封在XPU的基板上,XPU所需的电流由MCM直接提供,而不需要通过XPU的插座引脚。由于MCD驱动与MCM之间的电流很小,XPU基板90%的电源引脚都可用作其他用途,从而提高系统的性能。另外,由于MCD和MCM之间的电流极大减少,其连接的损耗将减少为原来的1/10。

  48V供电方案已率先被一些互联网巨头所采用。比如,谷歌就在其数据中心服务器机架上使用了48V电源。Vicor的一个ODM合作伙伴纬颖科技的动作也很快,在今年3月举行的OCP美国峰会上展示了其48V服务器平台M1。它采用Vicor 48V直接到负载点的电源解决方案,完全可以满足新兴CPU不断增加的耗电需求。在方案展出后的几个月,已经有一个大客户在与纬颖科技商谈合作。基于48V直接为XPU供电的方案,Vicor与IBM、谷歌,以及美国、日本的高性能计算厂商保持着密切合作,中国厂商浪潮也是Vicor的合作伙伴之一。

  Vicor的48V供电方案已经发展到第四代,不过合封的产品还是第一次推出。越来越多的数据中心客户对48V供电方案表现出极大兴趣,Vicor新出的MCM3208S59Z01A6C00模块化电流倍增器和MCD3509S60E59D0C01模块化电流驱动器,给客户提供了更方便和高性价比的选择。

  随着5G的出现,通信设备芯片、路由器芯片等也需要大电流的支持,这也是48V供电方案的用武之地。另外,人工智能在中国发展迅速,它对服务器的计算能力、功率也提出了更高的要求,如果不采用像48V这样新的供电方案,整个服务器机架的功率需求将无法满足。Vicor相信,未来合封的48V供电方案会越来越流行。

  郭涛

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: