曙光启动E级超算预研项目 向“每秒百亿亿次”进军

  中科曙光面向用户、合作伙伴及业界专业人士举办的大型创新分享活动——2016中科曙光技术创新大会(IDIC 2016)在京开幕。中国工程院院士、曙光公司董事长李国杰,曙光公司总裁历军,高级副总裁聂华,副总裁沙超群、邵宗有等曙光公司高管以及VMware、Intel等曙光公司合作伙伴代表先后登台,围绕“E级超算”挑战下企业级计算、存储、网络、安全、能耗等一系列问题的解决之道展开演讲,分享业界技术前沿、面向未来共话创新。中科曙光在大会上宣布,由其牵头的E级高性能计算机(简称“E级超算”)原型系统项目正式发布。

  中国E级超算“三头并进”

  作为体现一个国家综合国力和科技创新能力的重要标志,各国在超算领域的竞争也日趋激烈。尤其是在“太湖之光”把最快计算机的持续计算速度刷新到93PFlops之后,E级超算已成为当前各国竞相角逐的战略制高点。

  目前,美国、欧洲、日本等国家和地区都提出了自己的E级超算研发计划。中国也将百亿亿次超级计算机及相关技术的研究写入了国家“十三五”规划,希望在2020年左右实现这一宏伟研究计划。在国家“十三五”高性能计算专项课题中,中科曙光、国防科技大学以及江南计算技术研究所同时获批牵头E级超算的原型系统研制项目,形成了中国E级超算“三头并进”的局面。

  E级超算“原型系统研制”是在E级超算项目正式进入日程之前的预研工作。中科院计算所研究员、中国计算机学会高性能计算专委会秘书长张云泉表示,原型系统的研制可以验证一些关键的技术设想,对一些关键技术难点进行测试和改进,为最后建造全部的系统扫清障碍,避免出现大的技术错误和难题,类似的预研项目“非常必要”。

  对于E级超算系统的建设,国际上对运算速度、能耗比等都有其公认的标准。那么,国产E级超算可采取何种架构、何种技术路线?能否实现10万节点规模的扩展能力?能效比能否有所突破?历军表示,基于原型机的研制与测试,类似上述疑问的谜底将一一被揭开。

  开通“E级路线” 完成E级原型机系统

  曙光副总裁沙超群在其“E级挑战‘亿’触即发”的大会报告中对中科曙光E级超算原型系统项目的规划和研究路线进行了详细的解读。他在大会上报告了曙光预研项目的任务目标:完成E级原型机系统,验证E级机研制的关键技术和路线图,形成E级机的完整方案,为国产E级超算的研制奠定技术基础。

  按照这一目标,曙光将凭借深耕高性能计算20余年的丰富经验,在体系结构、计算、存储、网络、系统软件、系统冷却和可靠性等方面对未来E级超算的建设进行有益探索。

  在体系结构方面,曙光提出了一种超融合自适应并行处理体系结构(HCAPP)。“节点内异构架构仍是未来顶级超算的主流。”沙超群说,“先进的6D-Torus高维网络架构和层次化网络系统,使系统具有10万节点的扩展能力,可以稳定扩展至E级规模。”

  原型系统采用的存储系统,则是基于曙光承担的863课题“曙光EB级云存储系统研制”的研究成果。沙超群指出,层次多协议的高性能存储系统具有超强的EB级扩展性和支持千亿级文件的存储能力。

  在节能方面,曙光拟采用目前最高效、最先进的服务器冷却技术——全浸没式相变液冷技术。沙超群介绍说,绝缘冷媒的相变潜热是比热的一百倍,换热效率高、安全性好,冷媒与发热器件直接接触,能一次性解决全部元件的散热问题,同时能大幅提升系统的可靠性。

  超算E势力 助推全球发展

  此外,曙光E级高性能计算系统原型机,在完成E级系统关键技术验证的同时,具有良好的生态环境和广泛应用适用性。沙超群称,原型系统可以良好地支撑高性能计算、深度学习、大数据、云计算等领域应用,加快技术成果产业化应用,对我国高性能计算产业的发展有重大支撑作用。

  “随着科技的飞速发展,知识和技术创新成为经济、社会发展的主要驱动力。”沙超群指出,“曙光原型机作为工业标准的高性能计算系统,不仅可以为国家科技创新和产业转型升级提供基础设施保障,还将促进中国高性能计算产业成果走向世界,推动全球基础科学研究、工业转型升级、数字化行业发展等,为全人类进步作出贡献。”

  “大曙光”格局推动产业发展

  曙光多业务协同创新正开展得有声有色。围绕今年4月发布的“数据中国加速计划”重点布局的政府大数据、科学大数据、安全大数据、工业大数据等四类大数据业务方面,曙光的布局举措和落地在IDIC 2016上已经得到了充分展现。在政府大数据方面,曙光易通创造性地利用生物特征识别与云计算技术相结合的“身份认证云”为10亿中国人提供身份认证服务;在科学大数据方面,中科星图利用“互联网+空天大数据”增值服务撬动信息消费市场;在安全大数据方面,中科睿光致力于打造最优秀的国产云操作系统以“立足中国服务中国”……

  历军表示,随着中科睿光、曙光易通、中科三清、中科星图、联方云天等子公司的崛起,“大曙光”多元化发展道路的探索已崭露头角。

  产业链协同创新方面,在近年来与Intel、VMware等合作伙伴共同成立“关键业务系统产业联盟”、联合实验室等基础上,2016年曙光又与国内众多上下游伙伴发起“智慧城市产业联合体”,创造性地开展“麦当劳”加盟模式落地智慧城市领域。如今,这一计划已取得第一批硕果:在本次大会的智慧城市分论坛现场,聂华与4座城市的合作伙伴签署战略合作协议,曙光云计算公司常务副总裁关宏明与7座城市的合作伙伴签署连锁加盟协议。

  “以自主创新构建核心竞争力,以协同创新推动产业化发展。”曙光总裁历军表示,中科曙光一系列面向未来创新始终坚持一个主题,就是“让全社会共享数据价值”。

  相关链接

  曙光大数据技术优势

  在曙光公司大数据总经理宋怀明看来,曙光大数据技术有着如下的优势:第一,曙光的历史相对比较久,从2003年就开始涉足大数据,包括互联网数据的监控、数据分析、后端处理,曙光一直在做数据的存储分析系统,那时候规模非常大,在2004年曙光单一系统已经到500TB以上。第二,曙光大数据对行业应用的实践比较成熟。尤其在网媒和环保气象领域,曙光是和一些国家的权威机构合作,能接收到核心的数据,可以对一些国家监测机构、数据采评机构的权威数据进行分析,有应用的基础。这点跟互联网企业是不一样的。最后,曙光技术是完全自主可控的,并且充分利用完全吸收了开源技术,任何一条代码都是自己开发的,所以曙光对用户的需求响应非常快,处理用户的问题基本不会隔夜,当然也与曙光内部团队管理机制、解决问题机制有关系。同时,代码自主可控可以增强系统的可靠性。

  ■本报记者 杨光

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: