联想和冥王星之间隔着什么?——探访联想斯图加特企业级解决方案中心
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字:联想,冥王星,HPC smarty:/if?>
- 发布时间:2015-07-28 07:44
不论是光学天文望远镜,还是射电天文望远镜;不论是首次飞出太阳系的人造天体“旅行者”号,还是飞越冥王星的探测器“新视野”号,它们的背后都需要HPC对采集的科学数据进行处理与分析。甚至,HPC还可以模拟宇宙起源、预测未来太空、寻找外星文明……
联想与冥王星隔着HPC,其实可以演绎为,地球与整个宇宙之间隔着的是人类的智慧。作为“皇冠上的明珠”,HPC的发展速度在某种意义上真的可以用来衡量人类科技进步的速度。我们与冥王星,以及太阳系外太空的距离也随着HPC的发展而不断拉近。从量子到宇宙,从生命起源到外星文明,从宇宙起源到多维空间,这些人类未知的世界也都将依靠HPC的计算和分析去探索和发现。
以科技角度而言,HPC还可以广泛应用于生物信息学、航空航天、天体物理、地球物理、等离子体物理、气象、计算量子力学等基础科技领域。
那么传说中的HPC到底什么样呢?
亲历TOP500变迁
恰好在7月14日这天,笔者参观了TOP500超级计算机排名中的第497名——最新的联想Lenox,它就部署在德国斯图加特EBC创新中心。
首先,要想看到它,并不是那么简单。笔者必须在联想专家的带领下走入设置层层关卡的HPC大楼,甚至在进入机房前,联想专家还启用了人眼虹膜识别技术,才能打开数据中心的第一道大门。
其次,HPC并不是一台计算机那么简单的概念。Lenox是由15个机柜、180个节点、5040个计算核心构成的计算机集群。在技术上,它基于NextScale M5 Haswell,采用EDR InfiniBand连接,配备1个GSS22、1个GSS24和1个GSS26存储系统。也就是说,Lenox占据了15个机柜的面积,而且利用效率达到了95%,是个“小而美”的系统。
记得笔者多年前也曾经在纽约参观过当时排名TOP1的超级计算机“走鹃”(后被运送到美国洛斯阿莫斯国家实验室,现已退役)。当时,协处理器技术刚刚被广泛应用于HPC领域,因此“走鹃”的计算核心高达116640个,占据满满一层。
两次探访全球排名TOP500的HPC,笔者也首次用双眼直观地体验到科技的进步:当年的TOP1“走鹃”占地满满一整层,以超过十万个计算核心刚刚达到每秒千万亿次的运算速度,主要进行的也是美国的国家级项目研究。而如今的TOP497 Lenox,占地区区15个机柜,只有5040个计算核心,运算速度就可达到165万亿次,并且已经可以被广泛用于普通商用领域。据悉,包括日本和俄罗斯的商业客户都开始借助Lenox完成科学计算的性能指标评测。而刚刚出炉的最新TOP500排名中,TOP1“天河二号”的运算速度已经超过每秒亿亿次的级别。
撬动整个商业的HPC
阿基米德曾经说过:“给我一个支点,就可以撬动整个地球。”
回到冥王星的另一端,HPC对于商业企业的发展起到的也是四两拨千斤的杠杆作用。
不论是IDC还是Gartner,不论是市场数字还是魔力象限,我们最多见的排名恐怕要算市场排名。不过作为一家中国企业,联想刚刚在7月13日公布的全新TOP500中名列全球第五,中国第一,这一排名对于联想来说却有着完全不同的意义。
一、形成堰塞湖效应:HPC既然被誉为“皇冠上的明珠”,就证明它的技术含量不同一般。看看HPC中最先应用的技术,比如水冷、高速集群、协处理器,以及与软件应用相关的内存计算等技术,都被逐步应用到商用领域。其次,HPC的客户以国家级研究项目和重要的商业客户为主。比如联想HPC客户就来自军工、科研、政府、医疗、制造等重要领域。且HPC的应用周期远比三年一换的普通x86服务器要长得多,客户的黏性高,个性化需求强,无疑会增强其他商业客户的技术信赖。这就是技术和商业上的“堰塞湖”效应。
二、提升品牌效应:TOP500中五连冠的“天河二号”已经被看作一个国家科技综合实力的侧面体现,那么一家企业,尤其是中国企业在此次最新的TOP500排名中冲入全球第五,无疑会大大提升联想的技术形象和品牌含金量。一个PC+的联想,在收购IBM x86服务器业务后,在技术核心能力上的提升无疑让业界看到另一个维度的联想。
HPC合作生态圈
在HPC上持续投入是联想必须要做的事。
在7月13日法兰克福举行的2015年国际超级计算机大会(ISC2015)上,联想就宣布了一系列HPC领域的伙伴关系和计划,包括参加英特尔的“代码现代化实施计划”和在未来产品中采用英特尔的HPC可扩展系统框架;与Mellanox公司建立的一个新的伙伴关系,旨在加速EDR 100Gb/s InfiniBand互联和服务器技术的采用;现已在“莱布尼兹超级计算中心”投入使用的SuperMUC二期工程,以及支持青年人才参加“国际高性能计算咨询委员会 2015年国际超级计算机大会学生集群电脑计算竞赛”。
在谈到为什么专注于HPC时,联想全球战略联盟副总裁兼HPC总经理Brian Connors表示:“我们看到在全世界主流商用HPC市场上都有很好的增长机会,同时我们的全球足迹、我们对中国市场的深度了解、我们在商用市场上的传统优势,都使得我们适合那些期望与全球性企业合作的客户。我们还将通过在创新、研发、服务和伙伴关系方面进行投入来继续加快业务发展,以确保客户现在和将来都能处在HPC领域的最前沿。”
联想的技术秘密还有哪些?
据悉,EBC就是联想展现技术能力,与客户协作创新的一个重要战略部署。除了斯图加特EBC刚刚开业,联想在中国北京、美国罗利也分别建立了EBC,笔者一行算是这个EBC迎接的第一批联想的客人。
据联想斯图加特EBC技术专家Regon介绍,这个EBC不仅拥有联想全球HPC创新中心,还为中东、欧洲和非洲的企业市场提供企业级技术服务,重点在于HPC、SAP HANA、软件定义数据中心。在这里,笔者看到联想所有的企业级产品的组合展示,包括整个EBG套件,以及联想产品组合的其他部件;远程会议功能,获取全球开发专业知识;与全球合作伙伴建立联系,充分利用生态系统优势,在联想硬件上展示成熟解决方案和软件产品;与联盟合作伙伴一起演示联想端到端的解决方案,参与成员包括英特尔、艾默生、三星半导体(OEM)和Qlogic,其他合作伙伴,以及VMware和微软等。
而且,斯图加特EBC体验中心HPC专家Paul还透露,联想在西班牙还有秘密武器——MareNostrum,它部署在历史悠久的torregiron教堂,是欧洲最强大的超级计算机之一。据悉,最新的MareNostrum3.1从原先的10240个处理器增加到48896个处理器,此外还内置有84颗英特尔至强Phi协处理器,内存容量达到100.8TB存储空间达到10.5PB,运算能力则达到1.1Pflops,正承担着包括天文在内的科研项目。
“新视野”号花费了9年多的时间,飞行了48亿公里,只为清晰地看到冥王星,而这背后依靠的是HPC在内的综合科技实力。可以说,HPC代表着一个企业的技术形象,也综合展现了人类的智慧和实力。
联想HPC“走遍”欧洲
德国LRZ的SuperMUC
位于伽兴(慕尼黑附近)的莱布尼茨超级计算中心(LRZ)是高斯超级计算中心(GCS)的三大成员中心之一,其他两个GCS成员中心分别是斯图加特高性能计算中心(HLRS)和于利希超级计算中心(JSC)。6月29日,LRZ的联想高性能计算机SuperMUC第二阶段件正式投入使用,将第一阶段性能3.2Petaflops提升至6.8Petaflops。
SuperMUC为一台IBM System x iDataPlex,尽管性能提升显著,但所需的占地面积仅仅增加25%。SuperMUC第二阶段继续使用热水冷却技术,冷却系统无需使用额外的冷却器,就可以应用45摄氏度的温水带走系统热量。而且,最新处理器能够根据计算需求调整频率,再配合节能操作软件,共同将整体系统功耗降低约40%,进而大幅减少运营成本。
据悉,每年SuperMUC上平均运行150多种不同的应用程序,包括用于解决物理和流体力学难题的应用程序,以及各种科学领域的应用程序,如航空和汽车工程、医药和生物信息学、天体物理学和地球物理学等。
西班牙BSC-CNS的MareNostrum
BSC-CNS是由西班牙教育和科学部、Catalonian市政府和加泰罗尼亚科技大学(UPC)三方在巴塞罗那共同组建的一个国家级超级计算中心,已经在计算科学、生命科学和地球科学等领域展开专门的研究。BSC-CNS应用了联想MareNostrum超级计算机和西班牙超级计算网络(RES)的支持架构体系。
作为欧洲最强大的超级计算机之一,MareNostrum不断升级扩容,截至2014年,MareNostrum3.1在欧洲超算排行榜上位居第24,而在全球超算Top500上排名第57。此外,打造计算性能更为强悍的MareNostrum4将会是BSC-CNS2015年最为重要的一项任务。
除了MareNostrum,BSC-CNS还管理着由分布在西班牙全境的其他六个高性能计算节点组成的分布式网络,目前共拥有每秒135.5万亿次的运算能力。BSC-CNS的初步投资,以及后期升级超级计算机、辅助存储器系统和RES分布式节点的投入总计接近4000万欧元。
意大利 CINECA的Galileo
意大利CINECA的高性能计算资源用于支持物理、化学、天文、医药和城市规划等多个领域。尽管它已经拥有了全球排名第23位的HPC,但是CINECA还需要更小、更环保的HPC以实现更多功能,要求新HPC满足出色能效、高密度计算能力与已经验证的成熟度。
最后,CINECA部署了由联想NeXtScale System服务器和System x GPFS存储服务器组成的HPC Galileo。这是一个PFLOP级集群架构,该架构由520台NeXtScale System nx360 M5服务器组成,每台服务器配备两颗八核英特尔至强ES-2630 v3处理器,其中380台服务器还配备两颗英特尔至强 Phi协处理器7120p运算卡,能够与标准英特尔至强处理器协同工作,并使用英特尔True Scale Fabric进行互联。NeXtScale System nx360 M5服务器还采用了创新的Rear Door Heat eXchanger(背板换热器),以较低的成本带来最佳冷却能力,显著减少了环境影响和成本。
通过采用联想服务器作为全新Galileo超级计算机的核心,CINECA能够为来自大学和意大利国家核物理研究所的研究人员提供服务,并以开放访问的模式向个体研究人员开放。
本报记者 陈翔
