HPC:离百亿亿次又进了一步
- 来源:计算机世界 smarty:if $article.tag?>
- 关键字:HPC,超级计算机,百亿亿次,系统 smarty:/if?>
- 发布时间:2011-06-29 13:20
“K”的胜利
在2010年秋季的榜单上,“天河一号”以2.56petaflop/s的性能一举夺冠。但遗憾的是它也成为了到目前为止,只在榜首位置停留一期而没能蝉联的“冠军”。来自日本的,横空出世的富士通“K ”超级计算机以8千万亿次(8.162petaflop/s)——近3倍于“天河一号”的性能挤掉了后者的榜首位置。
据悉,“K”是日语中10的16次方的缩写。排名第二到第十的超级计算机依次分别是“天河一号”、美国橡树岭国家实验室的Jaguar超级计算机(1.75petaflop/s)、中国深圳星云超级计算机(1.27 petaflop/s)、东京技术研究所的Tsubame 2.0超级计算机(1.19 petaflop/s)、新墨西哥州洛斯阿拉莫斯国家实验室的Cielo超级计算机(1.11 petaflop/s)、美国航天局艾姆斯研究中心的Pleiades超级计算机(1.09 petaflop/s)、美国能源部国家能源研究科学计算中心的Hopper超算 (1.054 petaflop/s)、法国的Tera 100超级计算机(1.05 petaflop/s)、美国洛斯阿拉莫斯国家实验室的走鹃Roadrunner超级计算机(1.04petaflop/s)。
资料显示,“K”这台超级计算机内含68544个 SPARC 64 VIIIfx处理器,每个芯片拥有8个核,总共拥有548352个核。这个数字是榜单中余下系统所含核的数量的两倍。虽然“K”的功耗达到了惊人的9.89兆瓦,但是由于性能出众,它也是榜单中能效最高的系统。
本次榜单前10名的超级计算机中,有三台是2011年新上榜,而且第一次排名前10系统的性能全部达到了千万亿次的级别。来自中国的上榜系统达到了62套,依然落后美国,后者以256套系统的数目占据了整个榜单的近半壁江山。
上榜系统中有77.4%采用了英特尔至强处理器,而且其中169套系统采用了Westmere处理器,采用AMD处理器和IBM处理器的数目分别是65和45。
这张榜变化速度到底有多快?一个数字也许能够反映出它的速度。那就是本次第500位的系统,在去年11月的榜单中还能排在262位。
据悉,基于最新款国产龙芯处理器的高性能计算机也在紧锣密鼓的研制中,能否在下一期排行中有所斩获,值得期待。
百亿亿次再进一步
自从IBM走鹃Roadrunner超级计算机突破千万亿次的计算门槛后,整个HPC业界都把目光投向了下一个“不可能完成的任务”——百亿亿次。
根据英特尔的预测,到2015年,全球高性能计算机500强(TOP500)排行榜上排名第一的系统在性能上将有望达到每秒十亿亿次浮点计算,2018年时,它将越过每秒百亿亿次浮点计算的标杆,而到2011?2020这个10年期的末期时,地球上最快的计算机的性能则有望超过每秒4百亿亿次浮点计算。“K”的出现,可以说是人类在通向百亿亿次的路上跨出了非常大的一步。
愿景总是美好的,要想达到百亿亿次的目标,所要走过的道路绝非一马平川。英特尔中国有限公司服务器平台产品经理张振宇就向记者表示,虽然高性能计算机的性能在不断提升,但是对于真正的用户而言,还面临着很多挑战。“例如构建了一台高性能计算系统,如何在有限的运维成本、能耗和占地面积等条件下尽可能优化性能,如何应对不同的应用特征所带来的计算能力、内存、带宽和网络对于整体性能的影响,这都是用户在未来HPC发展道路上需要面对的情况。”
英特尔公司副总裁兼数据中心事业部总经理施浩德(Kirk Skaugen)表示,要在未来实现百亿亿次级别的性能,不仅需要行业与政府的通力协作,还需要有开创性的技术和方式,而英特尔所倚重的就是集成众核(MIC)架构所开创的新方法。“英特尔正在进一步扩展它对高性能计算的关注,利用我们针对千万亿次以及未来百万万亿次工作负载的集成众核架构,引领行业开辟下一个领域。”施浩德说,英特尔拥有领先于整个行业的制造技术、全新的架构创新成果以及让用户感到熟悉的软件编程环境,它们都将推动逐步实现激动人心的百亿亿次高性能计算目标。
在本次TOP500的榜单中有19套系统采用GPU加速的模式,不过就目前应用情况来看,高效的软件编程模式以及出色的系统可扩展性将是跨越千万亿次计算极限,进入百亿亿次计算时代的关键要素,而MIC恰恰在编程模式方面有着其自己独特的优势。
据悉,MIC架构具有更小的内核和硬件线程,以及更宽的矢量单元。
背景资料
集成众核架构(MIC)是英特尔于2010年国际超级计算机大会上正式发布的一种众核架构,MIC主要面向高性能计算领域,完全基于x86处理器架构,因而能够很容易地进行应用程序的编程。从英特尔正式发布MIC以来,英特尔一直加紧其产品的研发工作。去年,英特尔还在日本展示了其采用MIC架构的32核超级计算加速卡。为了解决并行编程的问题,MIC采用在至强处理期的开发平台上进行扩展,从而简化了应用程序的迁移工作。
在2011年6月于德国汉堡举行的国际超级计算大会(ISC)上,英特尔演示了MIC架构的早期成果。据悉,这一开发平台已经在SGI公司和韩国科学技术信息研究院(KISTI)得到了应用,其平台和开发工具得到了初步验证。
本报记者 汤铭 邹大斌
