天河二号开启民用时代

  在再次位居最新TOP500排名榜首,喜获世界超级计算机(下称“超算”)“三连冠”后,“天河二号”于6月30日在广州正式投入使用,进入应用阶段。此外,“天河二号”已自7月起进行一期系统升级,预计将在明年底前完成全系统建设并投入运行。与“银河”系列定位不同的是,“天河”系列主要针对民用市场,这也意味着“高大上”的“天河二号”即将走入寻常百姓家,为社会提供服务。

  算一秒相当于全民算千年

  6月23日,在德国莱比锡举行的HPC国际会议上发布了超算的最新排名,中国国防科学技术大学研制的“天河二号”以比第二名美国“泰坦”快近一倍的速度再次问鼎冠军,荣获全球超算运算性能“TOP500项目”的“三连冠”。有美国专家预测,在一年时间内,“天河二号”还会是全球最快的超算。

  “天河二号”由16000个浪潮的节点组成,累计共有32000颗主处理器和48000个协处理器,总计有312万个计算核心。目前“天河二号”一期主机系统已调试完成并投入使用,同时还将开始二期系统的建设。国家超级计算广州中心主任袁学锋介绍,“天河二号”一期的运算速度为5.49亿亿次/秒,运算一秒相当于全中国人用计算器算一千年,待二期系统建成后,运算速度还将提高一倍,达到10亿亿次/称以上。

  在普通人看来,要提升计算机的计算能力,似乎只要把多个中央处理器(CPU)“绑”起来就行了。就好像要比10个人的小组工作快10倍,只要找100个人来就行了一样。在计算机的研发中,这一过程却复杂得多。但中国科学家只花了4年时间,就把超算的速度从每秒运算速度相当于全国13亿人连续计算88年的数据提升到了相当于全国13亿人连续计算1000年的数据。

  牛津超级计算中心主任乔·洛克利博士曾评价,虽然中国超算研究的起步较晚,但这刚好提供了一个“很高的起点”:不需要浪费资源去解决一些发展初期所要面对的瓶颈和难题。美国早在1990年就提出制造千万亿次级巨型计算机,但直到2009年,这一目标才得以实现。而仅在几个月之后,中国的计算机就达到了同样的目标。

  袁学锋认同乔·洛克利的说法,高起点的确加速了中国超算的进程。但他认为事实上中国一直不缺乏这方面的技术与人才,早在上世纪五六十年代就拥有计算机的中国在这方面的发展原本可以更快一些,只是因为基础工业的原因,“我们的芯片跟不上,才导致这方面滞后了,所以全球经济一体化也是加速进程的一个重要原因。”

  算天算地算人算宇宙

  自2013年6月研制成功后,“天河二号”在国防科技大学呆了仅仅3个月就被匆匆运往广州,从装机、调试到设备正式运行,为的就是赶在今年4月1日正式启用,“大家都很着急,希望‘天河二号’能尽快投入使用”,袁学锋感慨道,以至于广州超级计算机中心的办公大楼里除了两间会议室装修完毕外,其他办公室都是临时搭建的,甚至一些技术人员的组建也尚未完成,但这并不影响这台“超级大脑”帮助人们作出更精准的天气预报、设计更安全的汽车,或者研发更有效的药物等,它正在从各个方面直接或间接影响着每个人的生活。

  从4月1日至6月中旬,“天河二号”已经收获了来自全国各地的120多位客户,华大基因、广东工业研究院、北京大学、中核集团中国原子能科学研究院、英特尔(中国)有限公司、浪潮集团、华强文化科技集团、中国科学院计算机网络信息中心等“高大上”的企业都在其中。

  袁学锋表示,截至目前,“天河二号”已为用户提供了300多项专业服务,特别是在大型基因组组装和基因测序、生物医学、高通量药物筛选、污染治理、大型飞机设计制造、高速列车设计制造、高超声速发动机燃烧模拟等工程中发挥了重要的支撑作用。“计算的内容可以概括为算天、算地、算人、算宇宙。”袁学锋说。

  具体来说,例如中国商用飞机设计有限公司北京研究中心利用约2.4万CPU核开展了大型民机全参数气动优化设计,在“天河二号”计算6天,完成了其自身计算平台约需2年的工作量,极大地提高了工作效率。在其他应用上,汽车研发机构可使用它进行反复穆尼安全碰撞试验,减少设计误差,提高汽车的质量和安全性能,原本要使用20台汽车碰撞的试验,现在也许只需要使用两到三台就能达到最高标准。制药企业在药物研发中使用它对所有可能的分子组合进行高速测试,从而筛选出十几种甚至几十种药物进行实验。超算出现之前,开发一种新药需经过原理研究、动物实验、志愿者实验等步骤,很多东西需要在现实中大量、反复地试验,整个研制周期往往长达十余年,耗费的时间与精力可能不亚于登月工程。如今,很多基础性的实验和计算工作可以通过超算模拟完成,研制周期可大大缩减,一种新药三到五年就能研制出来,而且也不用牺牲大量小白鼠了。动漫企业和影视公司未来都将是“天河二号”的常客,因为随着4K电视的普及,对影视、动画等的精度要求都将更高,普通的计算机根本无法达到渲染要求。一些金融机构也可以使用它对股票期货的投资进行详细模拟计算,从而将行动建议精确到“几分几秒出手”。

  袁学锋解释道,实际上“天河二号”是在创造一个和物理世界完全一样的虚拟数字世界,就像美国大片《机械战警》中的测试场景一样,通过和物理世界完全一样的虚拟数字世界去测试它的速度与反应。

  普通用户每天只需24元

  此前有科学家认为,像“天河一号”这样的千万亿次级超算,由于CPU之间的相互协调需要大量能耗,普通程序未必能体现出它的强大能力,要充分发挥它的优势,所需要的计算量一定要具有相当规模,否则就是“大炮打蚊子”。这是否意味着无论运算速度还是性能都比“天河一号”强大很多的“天河二号”也不应该是普通玩家的“菜”?

  对此袁学锋并不赞同。他一直强调,“天河二号”的使用并不局限在广州地区。事实上,它还提供了24小时的网络远程应用服务。人们可以在得到超级计算中心的授权之后,从个人电脑通过互联网连接到“天河二号”,上传自己的程序,下载运算数据,从而“使有兴趣的大、中学生也可以进行课题研究”。

  只是目前来看,使用超算仍有门槛,非专业人士进入比较困难,但在袁学锋畅想的未来中,超算绝不仅仅是技术玩家的专利。

  对于酷爱科幻电影的袁学锋而言,“天河二号”的开局让他满意,但远不满足。在众多超级英雄中,他最看好小罗伯特·唐尼所饰演的钢铁侠,那个用手指在屏幕上指指点点然后设计出一套又一套帅气盔甲的超级英雄也是他的目标,只是目前尚未达成,他希望有更多民间高手能一起来实现。

  在英国曼彻斯特大学做科研时,袁学锋就开始接触3D打印,他会把一些虚拟数据利用3D打印出来做科学研究,但他发现自己的学生有时会用这些仪器打印私人自制的钥匙扣、杯子等,从那时起,他就开始有了这个想法,“天河二号”不仅只会做运算,还会配有3D打印等“一条龙”设施。

  至于费用方面,是否普通人也能用得起?袁学锋算了一笔账,按10核/小时一元钱算,普通用户如果使用一天也才24元钱,价格甚至比使用个人电脑一天的费用还要低。

  功耗大散热难缺软件

  “天河二号”在一年半内连续三次登顶TOP500,它的峰值运算速度33.86petaflop/s,短时间内其他超算难以对它构成挑战。但TOP500衡量的只是浮点计算能力,超算的基准测试排名还有解析数据的Graph500和环境影响的Green500,而“天河二号”在这两方面没有任何优势。

  一些研究人员表示,“天河二号”运营成本高,且缺乏相关软件,对研究的助益有限。“天河二号”的能力与它的实用性不成正比。

  专家表示,超算发展目前面临的首要挑战是功耗控制难导致的高成本。目前的集成水平和此前相比并没有根本性改善,以现有技术,极超级电脑的功耗会超过20兆瓦,建造费用将超过2亿美元,这将带来一系列技术和运营问题。例如“天河二号”全速运算的话,电费为每日40万人民币至60万人民币之间,一年下来仅电费一项就超过1.5亿元。如果还是按照老思路,依靠增加规模制造出极级超算,功耗可能会达到50兆瓦至100兆瓦,需要一个专门的核电站来给它供电,这样的超算显然没有实用价值。同时这样密集排列的大功率处理器,也会带来无法解决的散热问题。因此国际上公认的极级超算标准是,功耗必须控制在20兆瓦内,这就要求在制造工艺上有革命性突破。

  另一个阻碍是缺乏软件。“天河二号”迄今的投资主要用于硬件开发,客户必须自己编写程序才能使用。中国科学院计算机网络信息中心副主任迟学斌表示,“天河二号”就运算能力来说处于世界前沿,但功能仍远落后于美国和日本的超算。迟学斌表示,一些用户或需要多年甚至十年时间编写必要的代码。可靠性也是个问题,将来超级电脑并发部件将超过10亿,以现在的故障率,平均每过10至20分钟系统就会报一次硬件错误,而每次处理错误需要半个小时。这显然也是无法容忍的。

  中国计算机学会高专委秘书长、中科院计算所研究员张云泉表示,超算还面临数据的访问速度限制。现在超级电脑运行的速度愈来愈快,但现有存储器读取数据的速度却无法跟上需求,这也成为超级电脑性能提升的瓶颈。因此美国有一批教授认为应该反思超算的发展方向,改变追求峰值运算速度的模式,而注重实用价值。例如放弃通用型超算,而根据实际需求定制超算。

  “全球计算机的发展非常快,一年时间可能什么都变了。”袁学锋认为,“真正重要的还是把它们推广应用,产生实际效益。”(本刊综合)

关注读览天下微信, 100万篇深度好文, 等你来看……