“蛋白质折叠”是生物科学研究领域的重要课题,当今世界卫生系统面临的最大挑战——阿尔兹海默氏症就是由于人体蛋白质分子的错误折叠所导致的。对于这个无法观察到的“微观世界”,目前科学家试图理解蛋白质折叠过程的方式就是在计算机上模拟蛋白质折叠的过程,再与药物实验验证的结果进行对比,以便寻找治愈疾病的方法,而模拟蛋白质折叠的过程必须依靠HPC(高性能计算)系统的支撑。
北京大学信息学院计算机系副系主任陈一峯和他的同事们,就是支撑这类研究的HPC技术团队之一。陈一峯告诉记者,从北大信息学院目前服务的各种项目来看,“天河二号”和“天河一A”这样的超级计算机已协助国内生物、化学、物理、天文、工学、工程等领域的研究机构实现了不少重大突破。从生物科学研究领域的需求来看,“天河”等超级计算机向E级计算的冲刺更是意义非凡,像“蛋白质折叠”这样的研究就极有希望在E级超级计算规模化的时代带来飞跃式的突破,解决人类遗传疾病难题。但在此之前,中国在HPC应用领域还有一些课要及时补上,才能让HPC在研究领域发挥其应有的价值。
很多研究虽然都对HPC有强烈的需求,但目前能用好并让HPC发挥其应有价值的却并不多。陈一峯强调,HPC应用领域所涉及的学科复杂,技术门槛、专业门槛都很高,对人才的要求更高。从目前的情况来看,国内在人才培养方面与国外还有一定的差距,既懂数学又懂计算机还懂物理的人才非常少。整个产业常常“招不到人”,全球都有这样的问题。
另外,硬件发展的速度远远超过了软件。从CPU技术的演进来看,从单核到双核到四核再到多核,以及现在的众核,HPC系统硬件的性能一两年就会发生翻天覆地的变化,远远超过了生物、化学、物理这些学科发展的速度。虽然人们看到了计算能力提升和计算成本下降可能会带来的突破性机遇,但开发相应的软件、用好工具却需要不断学习,才能为应用研究服务。像北大这样的HPC中心,必须对应用数学等众多专业学科有所研究,才能挖掘出合适的方法帮助应用方。从HPC相关新技术出现到真正被研究领域所用,是一个漫长的过程。
“国外一些国家实验室机制非常值得我们借鉴。”陈一峯告诉记者,美国等国家目前都设置了大型超算国家实验室,它们普遍采用多学科科学家共同交流、共同解决HPC难题的机制。物理学家、化学家、计算机专家会共同工作,解决利用HPC技术的应用难题,多学科专家交叉共同研究HPC技术的利用问题,更容易产生有价值的成果。而这正是目前国内HPC应用领域所欠缺的机制。
在今年公布的全球超级计算机TOP500榜单中,“天河二号”荣登榜首,中国超算已连续三年夺冠。在HPC应用的硬件条件上,中国甚至已经超过很多发达国家。但这样的硬件基础如何才能更快转化为生物、化学、工程等研究领域的一个个突破,确实是HPC生态圈应该思考的问题。
作为HPC硬件平台的引路者,英特尔其实也在尽全力弥补硬件发展过快所导致的软件滞后问题。在人才培养方面,英特尔推出了多核大学合作计划,与教育部一起组织了面向大学教师的专业培训,还通过编辑教材、在合作大学开设相关课程、举办竞赛等方式扩大HPC人才的培养范围。针对软件开发方面的困难,英特尔已推出了一系列工具帮助开发者降低开发成本,提升开发效率。如VTune、Thread Profiler等多线程工具、集群工具等,而且在MIC上的工具与在CPU上的工具也保持了一致,开发者不用重新学习。通过技术融合,英特尔正在逐步实现计算平台指令集的完全兼容。此外,英特尔还在通过编译器消除不同指令集的问题,以实现未来面向不同硬件平台,应用能自动适应变化。
在各种努力下,HPC或许很快就能摆脱“阳春白雪”的形象,从“小圈子”走向“大圈子”,在更多领域创造出奇迹,甚至为大数据、3D打印这样的下一代应用服务。
……
关注读览天下微信,
100万篇深度好文,
等你来看……