物有象 探无疆
- 来源:计算机世界 smarty:if $article.tag?>
- 关键字:油价,物探技术 smarty:/if?>
- 发布时间:2012-07-25 11:40
北京“的哥”王师傅开了8年出租,最近两个月来油价连续降价让他紧绷了许久的眉头略略松了松。“我住在房山,每天出车、收车都要放空几十公里,油价下跌当然能帮我省下不少油钱。”
燃油价格的波动,不但关系到王师傅这样一个普通出租车司机的收入,更是关系到整个社会生活的方方面面。同时出于降低碳排放、实现低碳发展的目标,国家近年来不断进行着能源结构的调整,石油、天然气等非煤炭的能源使用比例正在不断增加。
但是众所周知,长期以来中国一直是处于“富煤、少气、缺油”的资源环境下。找到更多的油气田资源,不光是广大物探工作人员的目标,也是众多相关IT工作人员的心愿。正如在中国石化石油物探技术研究院内有这样一块石雕,上面书着“物有象,探无疆”。
计算无止境
“我相信现在中国还有很多石油没找出来。”说这句话的人不是别人,正是中国石化物探技术研究院副院长兼工程师赵改善。
赵改善能说出这样的话,一方面源于他多年在石油物探方面的实际工作经验;一方面也源于其工作背后的高性能计算力量。
中国石化石油物探技术研究院(下称物探院)以原中国石化石油勘探开发研究院南京石油物探研究所为基础组建成立。在三维地震、高精度地震、井中地震、多波多分量地震等勘探方法上,以及基础理论研究、勘探工程规划、数据处理分析、复杂构造成像、复杂储层预测等物探关键技术领域,形成了一系列特色技术和专有软件产品;高质量处理了一万多平方千米三维地震资料,提供了数百口探井和开发井建议井位,为塔河、川东北、鄂尔多斯、东海、江苏、松辽等一大批油气田的勘探发现和增储上产做出了积极贡献。
据了解,为了配合日常工作,物探院在南京江宁新基地建设了可容纳380个机柜的高性能计算中心。“整个高性能计算中心CPU数量达到了11708个核,GPU数量达到了112640个核。总计算能力达到了单精度443TFlops,双精度248TFlops。”赵改善说,“整个中心主要在进行常规地震数据处理、地震成像处理,以及地震波场模拟计算。”
同样作为石油物探高性能计算方面的专家,中国石油东方地球物理公司研究院(下称BGP)副总工程师兼处理中心总工程师赖能和也认为,石油物探行业和高性能计算机技术的发展是密不可分的。“高性能计算机的发展促进了我们很多地球物理方面技术的进步,举一个简单的例子,例如石油物探研究中会涉及到叠前时间偏移或者是逆时偏移这些算法,这些算法上个世纪70年代就已经出现了。但是那时候计算机的计算能力非常有限,所以这些算法当时很难实现,或者说处于试验阶段。到上世纪90年代末的时候,还是处在实验阶段。真正到2000年以后,随着高性能计算技术的不断普及,这些密集型的算法才得以实现。”
挑战无极限
正如赖能和所言,在石油物探领域,业务计算量与高性能计算能力之间相互促进、螺旋上升的情形非常明显。
赵改善表示,随着勘探工作区域的不断扩大,以及地震数据采集技术与装备的发展,石油物探高性能计算所需要处理的数据量都是在成倍地增长。“2002年,我们处理的一个典型三维地震勘探项目,实际的面积只有800平方公里,每平方公里的数据大约230MB。2011年,我们进行的一个典型的三维地震勘探项目所涉及的区域面积就达到3000平方公里左右,每平方公里的数据量甚至可以达到10GB。”
勘探中地震波数据量的增加,直接带来的就是地震解释数据的激增,最终给相应的高性能计算系统带来了挑战。赖能和结合东方地球物理公司近年来在海内外多个处理项目的实际情况为例,向《计算机世界》报记者表示:“高密度地震采集带来了海量数据,例如我们现在进行的一些项目中,由于采用了可控震源高效采集技术,每日产生的数据可达到5TB-7TB。面对这些海量数据,系统架构、网络、内存、存储等方面都存在着不小的挑战,需要从整体考虑系统的搭建。”
对此,英特尔相关人士表示,要推动高性能计算在石油物探等领域的持续发展,除要提供专为高度并行化应用优化的产品外,还需要让整个数据中心的IT设备(包含服务器、存储设备、网络设备),在性能和功能上尽量实现平衡。
“目前英特尔平衡计算理念的最佳实践载体,就是于2012年3月上市的英特尔至强E5处理器。针对财务分析、媒体内容制作和高性能计算等计算密集型应用,该产品家族不但通过创新的微架构设计,例如对英特尔高级矢量扩展指令集 (Intel AVX)实现了比上一代至强处理器提升高达两倍的性能,而且由于在业内率先在处理器中集成支持PCI Express 3.0标准的I/O控制器,以及在处理器中内置了英特尔集成I/O和英特尔数据直接I/O技术,以及在平台层面以英特尔万兆位以太网控制器X540来提供低成本、低功耗的板载局域网(LOM)功能。在最近一期高性能计算Top500排行榜中,就有45套系统采用了英特尔至强E5处理器。”英特尔(中国)有限公司服务器平台的产品经理张振宇说。
物探云计算
云计算与高性能计算之间存在着千丝万缕的关系,前者的兴起,让很多相关人士觉得通过云计算的服务模式来解决高性能计算人才匮乏、缺乏建设和运维费用、应用复杂等问题成为可能。
国内也有不少高性能计算用户已经开始了基于云计算理念构建HPC服务,例如华大基因、上海交通大学等单位。具体到石油物探领域,之前一些民营的、从事地震资料处理与解释的企业,已经在进行相关的试验。目前,包括物探院这样的具有国有企业背景的机构,也开始了相应的摸索。
赵改善告诉《计算机世界》报记者:“云计算强调资源集中部署、实现远程共享的特点,在某些程度上是适合石油物探领域的。以物探院为例,我们的最终用户实际上就是各个油田,我们本身就是一个技术服务商的角色。以前更多的时候,我们是拿别人的资料来做一些数据处理的分析,我们现在也在思考,能不能通过软硬件整合,通过平台架构的建设,对油田提供一些面向成像技术的云计算服务。”
在赵改善看来,各个油田自建系统进行相应的地震数据处理,往往会存在性能瓶颈,“对于某些应用不是一个小的集群就能处理的,必须集中部署大系统才能解决问题。”另外一个方面,赵改善认为软件也是个制约因素。“地质成像技术发展中有一个很大的问题就是软件成本的问题,软件成本往往是硬件成本的1.5倍到2倍,有的甚至高达6倍。买得起硬件,不一定买得起软件。如果我们通过自主软件的研发,实现大规模的部署,这样在软件上会就节省很大一笔成本。无论从投资回报或者从管理来讲,我相信会得到用户的认可。”
不过,当前高性能计算采用云计算的方式,也面临着一个非常突出的障碍,就是网络传输带宽的问题。这个问题,记者也曾经在华大基因等之前推行云计算的高性能计算用户那里听到过。赵改善也指出,网络带宽的确制约着物探院对于云计算的尝试。
“相对于我们要处理的TB级的数据,目前的网络带宽确实是远远不够的,要真正实现云计算的思路,首先要解决带宽。”赵改善笑着说,“原始数据通过网络传输不大现实,解决带宽最有效的方法还是‘坐高铁’,相比网络,提着几个硬盘坐高铁的速度是最快的。”
期待融核
石油物探行业高性能计算应用是GPGPU(通用计算图形处理器)异构计算最早的试水者,随着近年来对于应用的深入,用户逐渐也对GPGPU这样的异构应用模式有了更深一步、更清晰的认识。一方面,GPGPU所涉及的异构编程模式一直在困扰着不少用户。现有的科学计算程序很多都是通过OpenMP 程序来实现的,如何继承原先已有的程序,让其方便地在GPGPU架构上运行,是相应软件编译过程中必须跨越的一个难关。
赵改善向《计算机世界》报记者表示,异构系统并行计算软件的开发也是目前高性能计算应用中的难点。
另一方面,包括东方物探、物探院这样的用户,逐渐开始关注到GPGPU架构的效率问题。赖能和就表示,GPGPU的架构并不是能够运行所有的应用,所以有些情况下,GPU计算单元是处于一种“休眠”的状况下。和常规的CPU相比,GPU的利用率并不令人满意。
针对GPGPU架构下的可编程性、可靠性和低功耗等问题,英特尔开发了集成众核架构产品。对于该产品英特尔倾注了大量的人力和物力,其前身甚至可以追溯到Larrabee显卡。以至于在真正产品面世前,英特尔就迫不及待地公开了“至强融核”的名称(相应具体产品将在2012年年底发布)。
英特尔相关人士表示,除了能够为高度并行的应用程序带来更高性能外,至强融核产品最大的一个亮点就是易用性。它能够利用英特尔CPU架构上使用的编程模式、技术和开发者工具,这就使得软件公司和 IT 部门无需重新为其开发人员提供与加速器有关的专用编程模型的培训。
据悉,目前包括BGP、物探院在内的用户都已经开始测试“至强融核产品”。赵改善透露,物探院正在与英特尔、浪潮一起在开展将相应软件移植到至强融核平台上的工作。赖能和也表示,BGP已经在至强融核平台上测试自主研发的地震数据处理与解释协同工作一体化软件系统Geo East。
链接
曙光第四代刀片瞄准高性能计算行业应用
7月10日,曙光信息产业股份有限公司正式发布曙光第四代刀片服务器曙光TC4600。
TC4600目前支持英特尔至强E5-2600处理器,标准42U机柜可容纳112片计算节点。据悉,这样的密集设计可以大大降低单台服务器的用电量和发热量,将电源模块的能效提升至90%以上。TC4600配有冗余金牌电源,转换效率可以达到93%,能够有效减省数据中心的用电成本,降低IT设备运营成本。另外,通过模块化设计,TC4600为计算刀片提供多种网络接口,既包括Infiniband QDR网络,也包括1Gb以太网络和10Gb以太网络。
曙光刀片服务器产品经理付雪华表示,作为一款高密度、高性能的刀片服务器,TC4600适用于科学计算、动漫渲染、石油物探、电力调度、气象预报和安全等多行业的应用。另据付雪华透露,针对一些对安全性有特殊要求的行业,曙光还会推出采用龙芯处理器的TC4600。同时,付雪华透露,TC4600支持GPGPU的异构计算模式,针对英特尔即将推出“至强融核”产品,曙光已经开始在TC4600平台上展开相应的测试工作。
针对这些以高性能计算应用为主的行业,曙光X86服务器产品总监房玉震表示,曙光TC4600强调的是技术差异,对于石油、超算等高性能计算用户,曙光绝不是单单地将产品交付给他们,而是从整体解决方案到真实应用的优化,曙光都有相关的专业团队来和用户一起进行合作。“我们会强调TC4600所具有的增值功能,也就是强调围绕产品的各种不同解决方案。同样,在销售渠道上,除了围绕大客户外,我们也会选择那些具有增值能力的合作伙伴,例如面向这些行业的独立软件开发商。”
本报记者 汤铭
