高性能计算,从“计算”到“服务”

  • 来源:计算机世界
  • 关键字:高性能计算
  • 发布时间:2017-10-31 11:07

  除了与计算、智能计算,如今高性能计算又有了量子计算、类脑计算、三元计算、边缘计算等,计算需求的大爆发催生了不同的计算形式。

  “在传统的计算时代,曙光做的事情相对比较简单,我们主要是做机器。现在,曙光从卖硬件到了关注服务。”中科曙光副总裁,中科院先进计算技术创新与产业化联盟秘书长任京旸在“第13届全国高性能计算学术年会”(HPC CHINA 2017)后的采访中提到。

  随着高性能计算多元化时代的到来,中科曙光从两年前开始了在高性能计算服务领域的探索。2015年11月推出了EasyOP在线运维平台,这是基于曙光Gridview集群管理体系为高性能计算领域量身打造的在线运维平台,为客户数据中心资产提供全生命周期管理服务,和7×24小时全程专家支持的自动化运维平台;实现基于“互联网+”模式下的高性能计算生态圈,为用户提供一站式高性能计算SaaS平台。

  平台成立22个月以来,已经为80多个用户提供了高性能计算运维方案。目前 ,EasyOP 监管的节点规模超过一万个,对接入集群的各个节点覆盖了超过180项的监控指标,这些指标包括硬件的、环境的、软件的、应用的等等。截止到目前,EasyOP平台已经为750万个大小作业提供了各类支持服务,其中40%以上提供了针对应用特征的优化,并在CAD、气象、海洋、物理、生物、高分子、深度学习等7个领域做了深度优化。

  近日,在HPC CHINA 2017上,曙光与中国科学技术大学(以下简称“中科大”)就建立“EasyOP高性能计算在线服务平台(安徽分中心)”(下简称“安徽分中心”)举行授牌仪式。EasyOP安徽分中心的落成,不但能够为安徽省重大工程中高性能计算基础设施的后期运维与管理提供高效的工具,还将帮助中科大降低当前和未来集群使用过程中的运维压力,有力支持安徽省新支撑体系建设的战略。

  2016年初,EasyOP平台开始为中科大的各个科学院课题组做运维服务,“一个是可以根据需求灵活定制一个运维方案,第二个是提供不同层级的专业HPC的专业运维服务。”曙光EasyOP产品总监首席运维架构师安磊说,“我们希望通过这种手段逐步把EasyOP变成面向HPC用户的综合性的管理运维跟运营平台。”

  “突破E级计算机核心技术”,构建高性能计算应用生态环境,建立具有世界一流资源能力和服务水平的国家高性能计算环境,促进我国计算服务业发展被写入“十三五”国家科技创新规划规划。

  现在有云计算、高性能计算、异构计算,甚至未来会有类脑计算、量子计算,各种丰富的计算方式可能都会融入大规模的并发集群计算体系架构中来。随着交互方式的改变,高性能计算的服务方式也在发生改变。以前大部分都是个人使用的HPC,集群放在一个小型的团体或者个人的研究所里使用。现在,慢慢衍生出来专业的超算中心提供运维的规模集群共享式的服务。“在先进计算时代、多元计算能力融合的背景下,服务能力变得尤为关键,一旦综合服务能力跟不上,就有可能给整体项目的实施造成瓶颈。”任京旸说。

  在高性能计算领域,曙光认为将会出现以下五个新的趋势。

  第一,先进计算资源的分布会向中西部地区进一步演进。随着国家解决区域之间、行业之间等诸多的不平衡,未来几年里大家可以很快看到在中西部地区计算力量的崛起,中西部地区有可能采用一些更新的技术,甚至在中西部有的拟新建的计算中心里面会看到多种计算形式的并存率先融合起来。

  第二,传统的超算中心今年有可能面临新的挑战,超算服务的新业态会随着互联网玩家的进入而产生。

  第三,多元和融合将会成为先进计算发展的主流。

  第四,人工智能、量子计算、类脑计算这些新的领域里面我们国家有可能实现弯道超车。

  第五,中国的计算能力会沿着“一带一路”向外输出。硬件、软件加服务三块融合起来,使我国的先进计算能力走向世界成为一种可能。

  宋辰

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: