“天河”再夺世界第一

来源:计算机世界
关键字:天河二号,英特尔
发布时间:2013-06-26 10:09

　　6月17日，中国国防科学技术大学研制的“天河二号”（MilkyWay-2）以每秒33.86千万亿次的实测速度，摘得第41届高性能计算TOP500排行榜的桂冠。这是即两年半前“天河一号A”成为全球最快的超级计算机后，中国重返高性能计算机“世界第一”的宝座。

　　在整个TOP500榜单中，“天河二号”和“天河一号A”分别排在了第一和第十的位置，它们两个的性能就占到了全部上榜系统总性能的16.8%。

　　中国进入HPC三强俱乐部

　　“天河二号”的峰值性能可达每秒54.9千万亿次浮点运算，整个系统由170个机柜组成，包括125个计算机柜、8个服务机柜、13个通信机柜和24个储存机柜，占地面积720平方米、内存总容量1400万亿字节，存储总容量12400万亿字节，最大运行功耗17.8兆瓦。相比此前排名世界第一的美国“泰坦”超级计算机，“天河二号”计算速度是“泰坦”的2倍，计算密度是“泰坦”的2.5倍，能效比相当。“天河二号”的服务阵列采用了国防科技大学自主研发的“飞腾-1500 ”处理器，以满足诸如电子政务等应用对于安全性的要求。

　　当前，各个行业和领域对快速计算、模拟和制定更明智决策的需求持续推动着超级计算机的快速发展。超级计算机现在被用于提高天气预报的准确性、帮助探索更高效的能源、研究疾病的治愈方法、对人类基因组进行测序及大数据分析等工作。正是这种强烈的应用需求，直接带动了各国在高性能计算领域的发展。

　　中科院软件所并行软件与计算科学实验室常务副主任张云泉表示：“‘天河二号’再次夺冠，标志着中国正式加入原来由美日垄断的超级计算强国俱乐部，中美日三强争霸的格局正式形成。”

　　在本次的榜单中，一共有66套系统来自中国，在上榜系统数量上仅次于美国。美国阿拉贡国家实验室百亿亿次计算项目负责人Peter Beckman在接受美国版《计算机世界》报采访的时候表示，天河二号的成功，正是中国在高性能计算上持续投资的结果。

　　未来，“天河二号”将会安装交付给位于中山大学东校区的国家超算广州中心，除了主打传统的科学计算领域，同时还会兼顾大数据处理、云计算等应用领域。据悉，目前“天河二号”已应用于生物医药、新材料、工程设计与仿真分析、天气预报、气候模拟与海洋环境研究、数字媒体和动漫设计等多个领域，开始为多家用户单位提供超级计算服务。

　　从异构到微异构

　　一直以来，在对突破百亿亿次计算的摸索中，异构的体系架构是被认为性价比比较高的一种解决方案，特别是当超级计算机的性能与能耗不断提升的时候。不过，异构的体系架构又如同一把双刃剑，大规模并行程序设计一直以来是高性能计算中的难点，异构并行程序设计更是难中之难。

　　中国石化石油物探研究院副院长兼总工程师赵改善向记者表示，异构系统是目前构建高性价比超算系统的主要途径，或许是目前的最佳方式，在一些行业的部分应用中取得了相当好的性能，例如石油物探中的地震成像处理应用，其性价比非常占优势。但是，异构系统目前适用的应用确实不多，许多异构系统利用率不高，其中异构系统的编程难度是最重要的原因。

　　2010年，“天河一号A”成为当时世界最快计算机的时候，采用的就是CPU和GPU相结合的异构融合计算机体系结构。而“天河二号”没有延续这样的体系架构，而是在每一个计算节点上采用了至强处理器加至强融核协处理器的新型异构多体态的“微异构”体系架构。

　　天河二号副总质量师胡庆丰表示，在体系架构上的变化，主要是考虑到至强和至强融核能够使用同样指令集的。“GPGPU异构架构所适用的应用不多，系统利用率也不高，而‘天河二号’未来不光是要面向传统的科学计算领域，还要兼顾大数据、云计算这样的应用。另外，GPGPU异构体系的编程是个难点。而现在我们采用的‘微异构’架构由于支持同样指令集，所以支持通用编程模型，能够大大简化软件开发和优化的工作，这一优势是传统GPGPU异构架构所无法实现的。”

　　不过胡庆丰坦言，即便是采用了“微异构”的架构，编程方面的挑战依然存在。“我们正在和合作伙伴加强合作，通过新型的并行编程模型及框架，以及不断调优，来提升应用软件的兼容性、适用性和易用性。”胡庆丰说。

　　链接：

　　英特尔推出新款至强融核协处理器产品

　　日前，英特尔宣布推出五款全新产品，以扩展其现有的英特尔至强融核协处理器产品组合，带来更广泛的性能、内存容量、能效和外形选择。在这些产品中，英特尔至强融核协处理器7100 产品主打最佳性能，相应产品集成了61个时钟速度为1.23GHz的内核、拥有16 GB的内存容量，具有超过1.2 TFlops的双精度浮点计算性能。英特尔至强融核协处理器3100产品主打性价比优势。该产品家族集成了57 个时钟速度为 1.1 GHz的内核，可提供1 TFlops的双精度性能。此外，英特尔还为去年推出的英特尔至强融核协处理器5100产品家族增添了一个新成员——英特尔至强融核协处理器5120D，它针对高密度环境进行了优化，能够以小型主板的形态支持插座直连，构成类似刀片的系统。

　　英特尔公司还透露了代号为“Knights Landing”的第二代英特尔至强融核产品的详细信息，这一代英特尔集成众核架构产品将能够作为协处理器或主处理器（CPU）提供，并将采用包含第二代3-D三栅极晶体管技术的英特尔14 纳米制程工艺进行生产。

　　作为基于PCIe板卡的协处理器时，“Knights Landing”将处理由系统内英特尔至强处理器迁移出的工作负载（Offload Workloads），并为现有协处理器的用户提供升级路径。然而，当它作为主处理器直接安装于主板插座中时，它将发挥出CPU的作用，大幅提升计算密度和每瓦性能，同时肩负起主处理器和专用协处理器的所有职责。当它被用作CPU时，会与现有的加速器相似，能够消除通过PCIe传输数据的编程复杂性。

　　为了进一步提升处理高性能计算工作负载的性能，英特尔将在所有“Knights Landing”产品中引入可集成在其封装内的内存，以大幅提高其内存带宽。这将改善目前存在的内存带宽瓶颈问题，让用户能够充分利用所有可用的计算力。

　　本报记者汤铭

……

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容