用超级计算连接世界

  • 来源:信息方略
  • 关键字:云计算,大数据
  • 发布时间:2014-11-03 13:06

  超算的意义绝不仅仅止于世界排行榜、测试成绩,更重要的是将推进超级计算机在科研、制造等领域的实际应用。目前我国超算中心已应用于生物医药、新材料、工程设计与仿真分析、天气预报、气候模拟与海洋环境研究、数字媒体和动漫设计等领域,开始为多家用户单位提供超级计算服务。然而基于能耗、访问速度限制等等带来的质疑也是源源不断。为此信息方略/CIOINSIGHT杂志采访了中国计算机学会理事、高性能计算专委会秘书长,中国科学院计算技术研究所张云泉研究员,以下是经过编辑的对话。

  CIOI:超算的技术日趋发展,其计算结果的最终表现形式都有哪些?

  张云泉:超算的实施目标决定了它结果的表现形式,通常表现为这样几种。

  一种为科学发现,通过计算机模拟自然现象及规律,寻找机理和原理、发现规律,取得突破。例如部分科学家在做的宇宙模拟,探索宇宙形成的原因等等。这是目前非常普遍的一种应用场景,属于纯粹的科学研究。这也许不产生经济价值,但是可以通过科学发现促进人们对宇宙、自然界形成新的认知。

  第二种可以直接产生经济价值,通常表现为通过计算和模拟,指导内燃机、汽车的设计。以波音777包括下一阶段的787型飞机为例,都是通过计算机模拟来做设计的。如果用实体飞机做测试,浪费时间并且测试成本也很高。但是现在只需通过计算机进行试验,不需要把飞机造出来。飞机内部参数和性能指标非常复杂,借助计算机分布模拟机翼、发动机、流线外观、模拟驾驶控制等功能,然后进行综合评价,这样可以极大降低生产成本,缩短设计和生产周期。

  另一个很有价值的应用形式是药物设计,例如中科院上海药物所,他们通过超算来进行药物活性筛选,以前要经过成千上万次筛选和实验,可能周期是几十年,而现在可能一年就可以筛选出多种具有活性的化合物,从而加快新药物的研制,包括对癫痫病的治疗药物的研制等方面,最近都有了很大进展。此外超算也可以推动经济进步、社会创新,甚至特别是对核武器和国家信息安全都有战略意义。我们可以运用超算来模拟核爆,来代替实际的地下核实验,保障国家安全。

  CIOI:言必及大数据的今天,超算是否可以付与大数据一些实际意义呢?

  张云泉:其实在做下一代的超算计划时,已经开始讨论到与大数据相关的话题。下一代超算计划称为艾级超算系统,也就是1000个Petaflops性能的超级计算系统,现在国内研究处于100个Petaflops的阶段。美国在今年4月进行的修订中已将大数据的计算需求考虑进来。

  其实对于超算来说,很早就存在大数据,只是更多的称为海量数据。与现在通常称作的大数据,其结构、数据类型等都不同。通常科学计算中产生的大数据是根据一定的公式或算法产生的,所以其规律性会好一些。而互联网中产生的数据范围非常广,数据的种类也更多样化,表现形式越来越丰富。下一代超算也会关注大数据、数据异构等问题。大数据需要很强的处理能力且只有具备这样的能力才能使大数据具有实际价值,也才促成了所谓的大数据时代的到来。

  超算具有处理大数据的能力,但是由于其设计复杂、功耗大,计算成本偏高等条件都需要综合考虑,如果用超算来进行大数据处理也许并不划算。

  CIOI:要想实现实用价值,超算面临的最大的挑战有哪些?包括电费高昂、功耗大及可靠性、访问速度限制方面?

  张云泉:经常提到的电费问题,其实并不仅仅是超算面对的挑战。耗电量与能力也是相辅相成的,当处理能力百倍于其他计算机时,电费也许会百倍于其他计算机。但只要这个电费在可控范围内就不会构成挑战。正如美国有一些为超算中心建立的独立电站,一方面确保供电稳定,一方面节约输送成本。

  说起挑战,现在关注最多的是如何最大化降低功耗,不要过于快速增加。就如现在IT领域普遍存在的问题,降低功效、增强散热一样。

  现在为了控制功耗,国际上提出了要在20MW的范围内造出1000P机器的标准。虽然国际组织为了控制功耗设置了这样一个标准,但是目前硬件能力及水平都无法达到。现在国际很多呼声是希望提出更完善、更理性的功耗标准。所以现在机器的体系架构面临的挑战是,如何既满足功能需求又将功耗控制于20MW的界限之内,这是目前最大的挑战。另一个挑战,是如何编写可扩展的并行软件将超级计算机用得更好。

  使计算机发挥最佳水平,需要的是一个复杂的大规模应用,如果是很多小规模应用同时跑的方式就没有意义了,这与很多小机器同时跑一样。这类大型并行软件的编写难度很大,如何建模,精度、可靠性等都是需要考虑的问题。如果有了这样的硬件,没有最合适的应用也是大材小用。现在以天河二号举例说,运行很多应用满负荷运转没有问题,但是需要一个大型应用,与天河二号的处理能力相得益彰,使一个应用能跑出过去没见过的结果,找到创新性的发现,这才是挑战。

  这类应用正在开发,涉及的领域也很多。例如包括全球气候模拟,就应用在IPCC联合国政府间气候变化专门委员会(IntergovernmentalPanelonClimateChange)的研究中,美国、日本及欧洲也都选择了这一应用。

  CIOI:提及软件开发,那与此相关的挑战有哪些?

  张云泉:物理建模方面就需要精度更高的模型。以前为了降低对处理能力的需求,会将一些物理现象忽略掉。以天气预报的模拟为例,会忽略一些云的细节变化。未来的模型会更复杂,参数涉及的维度及处理方式也会更多,网格精密度的粗略与精细相差很多;对并行度要求也更高,过去可能千核并行,未来要实现十亿并行,甚至一个处理器内就千核并行,并行实现非常复杂。此外还涉及结果验证和精度保证等等。

  对于交叉人才的需求是另外一大挑战。软硬件协同也同样存在于超算应用设计,搞软件也需要了解体系架构,如何将体系架构发挥到最好就要求既要了解应用的需求,又要懂软件开发,所以人才缺乏将是很大挑战。

  软件体制改善也是我们一直在呼吁的,争取将软件的经费支持提高到整个超算专项中的30%。传统的观念中由于软件不算固定资产且在软件文化上也不够重视,所以很多软件开发存在顾虑,不愿意投入太多经费。由于超算软件开发成本更高,所以挑战更大。但是国际已有很多成功案例,一套成功的超算软件价值逾百万。但由于一些软件甚至软件模块涉及军事用途,无法从国外购买只能自己开发。

  CIOI:国外超算应用及软硬件发展起步较早、较为普及,对此我们可以有哪些借鉴及推进方式?与云计算、大数据相连是否可以衍生更多价值?

  张云泉:确实很多应用及对超算认知的观念比较超前。我最近翻译的《高性能科学与工程计算》就是由德国超算方面权威Georg Hager和Gerhard Wellein合著的全面介绍超算与应用开发的著作。华章出版社最近也在做原创系列,以前很多软硬件教材都是国外翻译的,现在我们想出版自己的科学类教材、专著,把我们自己的成果、创新发现推向国际。

  对于广泛提及的云计算来说,其对硬件特别是互联网络的要求要低于超级计算机,因此其功耗和成本也低,且更容易维护。云计算亦是超级计算的一种松散耦合形式,通过虚拟化技术可以进一步提升服务能力,实现处理能力的按需购买和使用。

  相信随着不断努力,超算及其应用不再仅仅是一个测试排名或一个世界纪录,而将在更多领域发挥价值。

  田鸽

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: