如何应对并行加速器应用来袭
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字:Intel,AMD smarty:/if?>
- 发布时间:2013-11-15 16:04
近年来,虽然Intel和AMD的CPU架构有了翻天覆地的变化,但产品综合性能提升并不明显,单核心CPU仅依靠新工艺带来的大缓存、高频率来获得的性能提升效率已接近极限,而多核心CPU由于存储机制和内存带宽的限制,应用效率也遭遇瓶颈,可以看出传统的计算架构必需作出修改。与此同时,可编程的GPU及MIC通用计算架构逐步成熟,它们在高效并行计算、应用成本、易于扩展、能效等方面表现出的突出优点,使其越来越受到用户关注。
目前,并行加速器主要包括两大类,一种是来自NVIDIA和AMD的GPU并行加速处理器,另一种则来自Intel的MIC众核架构Xeon Phi融核协处理器。源自图形处理器GPU及融核协处理器的并行计算能力的快速发展和其可编程能力的不断提高,目前,通过“CPU+GPU”或“CPU+MIC”异构协同计算架构,可以将CPU从繁重的大规模并行计算任务中解救出来,由GPU并行加速器或MIC融核协处理器代为处理,利用加速器强大并行计算处理能力和高带宽,弥补CPU性能不足的计算加速方式。天河一号、天河二号的成功研制,不仅标志着我国超级计算机领域进入国际先进行列,同时也证明“CPU+GPU”和“CPU+MIC”异构并行计算在大规模计算中的可行性,并被大量应用于高性能计算领域。
面向计算密集型用户,如航空航天装备研制、卫星遥感数据处理、气象预报、海洋环境数值模拟、石油勘探数据处理、生物医药研究、金融工程数据分析、新材料开发和设计、计算结构力学、生命科学计算、流体动力学、计算机视觉、数据挖掘、数值分析等领域,并行加速器能很好地满足它们对较高浮点运算能力的要求。同样,并行加速器也适用于金融、证券、交通、邮政、电信、能源等领域对服务器性能、可扩展性及可靠性要求苛刻的企业级应用环境。面向当前最热点的大数据处理,诸如搜索引擎、社交网络等用户巨量资料检索、交互需要大量的运算处理能力,并行加速器的处理特性就能很好地吻合这种“高密集运算量+较低个体任务负载”的大数据处理要求。另外,将GPU融入到云计算底层架构中,打造“CPU+GPU”或“CPU+MIC”异构运算系统,可以实现CPU和GPU计算资源的合理分配,也会大大的降低云服务成本。
目前,中国并行加速器计算应用市场才刚刚起步,大部分并行加速器应用中科研性的应用比较多,生产性的应用比较少,主要原因是并行加速器应用研发与生产性的应用脱节,使得并行加速器的经济效益难以体现,很难形成研发应用良性循环。另外非常重要的原因还是在各个企事业单位,尤其是在科研跟企业的连接性方面都很缺乏应用型人才。要推动生产性并行加速器应用的普及与发展,有必要构建产学研用互动机制,将产品与技术的研发与行业实际应用紧密结合,充分利用并行加速器的优势,进一步拓展计算的应用范围。同时,通过用户对并行加速器应用中出现具体问题加速和优化并行加速器的技术与应用创新,从而使并行加速计算具备更好的实用性,能够为更多行业用户接受和认可。
并行加速器的广泛应用依赖于对并行算法、编程效率、系统扩展性等技术的采纳,并且并行加速器在并行计算、编程效率、大规模计算性能上的难题也需要有专业的人才来解决。现阶段,中国专业并行应用开发人才仍然存在较大的需求瓶颈,需要积极推进并行计算人才培养计划:一方面,企业要加大与科研院校保持良好的合作,从师资力量的培养、课程教育方面提供更多支持;高校需加强并行加速器相关专业课程的建设,以市场人才需求为导向,优化学科专业,培养更多并行加速器领域适应性人才。另外,还要大力扶植并行加速器行业应用典型。
刘新
