华大基因选用AMD六核皓龙处理器

  • 来源:中国计算机报
  • 关键字:处理器,华大基因
  • 发布时间:2010-10-15 14:39
  华大基因成立于1999 年9 月9 日。

  该公司的基因测序能力及基因组分析能力处于世界领先地位。在多年的发展中,华大基因建设了一支具有世界一流水平的、年轻的产学研队伍,开展了广泛的国际国内科技合作与交流,开创了科学、技术、产业相互推动的发展模式,在基因组科学和产业发展领域再现了“深圳速度”和“深圳奇迹”。

  高性能计算集群(HPCC)是基因研究工作的重要工具,基因的测序、数据处理、比对分析和结果提取等,都要在HPCC 上进行。为了确保基因研究工作能够高效地进行,华大基因对HPCC 系统的建设,以及其中核心部件处理器的筛选,都非常重视。

  就在最近,随着研究项目的增多,华大基因之前建设的HPCC 平台开始逐渐显得有些力不从“芯”。为此,华大基因又把目光投向了新一代的多核处理器,计划筛选强悍实用的多核处理器来升级HPCC系统。

  华大基因对市场上的新一代多核处理器进行了全面的对比分析,并结合实际工作进行了深入的测试。最终,华大基因决定全面引入基于AMD 六核的“伊斯坦布尔”处理器的戴尔刀片服务器,升级其HPCC 系统。

  华大基因采用68 片戴尔M605 刀片服务器和5 个M1000e 刀片服务器机箱先期提供给核心用户参考使用了。

  做聪明理性买家

  把握了技术趋势可以指导选型,但具体到设备采购,又是另外一回事。不是每个用户需要的高性能计算机都一样,因为应用不同;也不是每个厂商提供的计算机都一样,因为设计不同。这当中学问很深。

  清华大学计算机系副主任陈文光同时也担任863 高性能计算机评测中心副主任。这个机构听起来有几分科研色彩,其实也对公众提供服务———对国内的高性能计算机进行测试。这种测试除了以第三方发表中立客观意见为特色之外,对用户和系统厂商还具有一个独特的价值———全过程测试,从用户采购早期就开始介入,在设计、评估及购买决策阶段提供咨询,判断方案是否能够满足应用,接下来还可以提供样机测试,以及后续的系统验收、用户使用期间的调优支持等服务。

  陈文光认为,越来越多的用户已经意识到,单凭Benchmark进行性能测试已经远远不能满足需求,最佳的方法就是把LinPack仅仅作为部分参考依据,主要面向实际应用进行测试,并且根据评估结果,确定具体的性能指标。“难点在于,在系统还不存在的情况下,仅仅能对少量节点进行测试,同时要决定选择哪些应用,又该如何归结指标。”陈文光表示,在六年多的实践当中,凭借团队较强的技术实力,他们已经克服了难点,归纳出一整套方案。这对于高性能计算机用户,包括进行ChinaGrid节点建设的高校采购都具有一定的参考价值。

  目前,863 高性能计算机评测中心已为多个高校提供了高性能计算评测服务。

  借鉴中山大学模式

  作为学科门类齐全、科研应用机构较多的重点高校,同时也是ChinaGrid的核心节点,中山大学在高性能计算建设方面的探索可资借鉴。

  中山大学在高性能计算方面的应用主要是基于学科发展建设的研究类应用,以及承担国家重大工程项目的应用。中山大学网络与信息技术中心主任郭清顺介绍说,中山大学把高性能计算作为全校整体信息化的有机组成部分,以此作为建设数字化校园的重要支撑平台。通过配套相应资源,提供相应服务,再把这种服务转化成中大学科建设的效益,这样才能构成良性循环。通过需求来驱动,构成良性循环是推动高性能计算发展的总体规律。

  从2001 年开始,中山大学数字化校园建设已经探索了近十年。目前,中山大学已经进入到满足个性化应用的阶段。据了解,中山大学建设高性能网格平台整体上走了两大步,第三步正在规划与进行当中。2005年中山大学部署曙光4000,构建了7000亿次的高性能计算平台,2007 年的利用率就达到了90%以上。2008 年,中山大学又进行了第二期建设,部署曙光5000A,建立了5 万亿次的高性能计算平台,实现了平滑过渡。

  “我们预计今年年底到明年年初,再建20万亿次的计算能力,加上学校其他可以整合的能力,将达到30 万亿次以上的规模。”郭清顺介绍说,这种高性能计算方面的发展趋势表明了学校的科研、学科建设水平,以及承担国家重大项目能力正在提高,因为高性能计算都是应用驱动的。

  中山大学的高性能计算发展得风生水起,同时,该校还出台了相应的制度和原则,以保证平台建设和运营健康发展。

  “我们依托ChinaGrid 还会进一步发展。”郭清顺在分享经验时说,在人才方面,中山大学不仅为自己培养人才,也义务培养行业以及地区人才。“我们跟曙光合作成立了中山大学的高性能与网格计算培训基地,已经搞了若干次公益性培训。”

  在建设模式方面,中山大学创新性地采取了股东制。小股东都是学校内部的各个院所。具有中大特色的“股份制”一方面是指新建的高性能计算平台通过股份制方式统一建设,各股东把各自用于高性能计算的投入集资入股,在使用上可以优先获得保证。另一方面,学校各个实验室的小规模计算能力,或者过去学校为了某个特定用途建设产生的计算能力,会统一通过网络聚合起来。这两个层面的实际行动有效提高了资金利用率和建设水平,并且降低了建设成本和管理成本。

  中山大学在建设方面采取的是小步快跑的策略,根据需求情况去匹配建设,避免一次建设与投入很大,后期需求跟不上而造成浪费。目前,集群技术使中山大学这样的用户完全可以灵活地走按需建设的道路。郭清顺表示,未来也不排除为企业提供服务的可能性。高性能计算提升学校自身的学科建设能力和水平,同时要为经济建设服务,这就应该面向企业提供各种技术和服务,给企业做支撑,激发它们的需求,为企业发展提高科技含量。

  实施升级。刀片服务器配置为:AMD 六核皓龙2435 处理器(代号为“伊斯坦布尔”,2.6GHz)、16GB 内存(8×2GB)、一块146GB的SATA硬盘。

  刀片服务器全部被插装在M1000e机箱内,机箱均通过万兆线缆与万兆交换机相连,从而构成一个刀片式的万兆高性能并行计算网络系统。该HPCC 系统的管理节点是一台机架式服务器,后端存储则采用Panasas 的设备。

  华大基因高性能计算主任方林表示:“我们以为AMD‘伊斯坦布尔’处理器是性价比超高的多核处理器。该处理器在性能上比前代产品至少提升20%,同时还有价格优势。

  我们在大量引入AMD 新一代六核处理器后,设备的计算能力大概提升了两倍,这有力地推动了研究项目的开展。包括熊猫基因序列研究、中丹合作的糖尿病基因研究、中美英合作的千人基因组研究,以及人体肠道元基因组研究等在内的多个重大项目的进程,都有了不同幅度的提速,很多项目都将因此早出成果、多出成果。”如今,华大基因的HPCC 平台每天要产出大概10TB 左右的数据。这个数据量是非常惊人的,因为很多大型企业一年的业务数据量都达不到10TB。在如此繁重的计算任务面前,基于AMD“伊斯坦布尔”处理器的戴尔M605 刀片服务器以稳定、高效和可靠的性能,帮助客户实现无故障运行的目标。先期提供给核心用户参考使用了。

  做聪明理性买家

  把握了技术趋势可以指导选型,但具体到设备采购,又是另外一回事。不是每个用户需要的高性能计算机都一样,因为应用不同;也不是每个厂商提供的计算机都一样,因为设计不同。这当中学问很深。

  清华大学计算机系副主任陈文光同时也担任863 高性能计算机评测中心副主任。这个机构听起来有几分科研色彩,其实也对公众提供服务———对国内的高性能计算机进行测试。这种测试除了以第三方发表中立客观意见为特色之外,对用户和系统厂商还具有一个独特的价值———全过程测试,从用户采购早期就开始介入,在设计、评估及购买决策阶段提供咨询,判断方案是否能够满足应用,接下来还可以提供样机测试,以及后续的系统验收、用户使用期间的调优支持等服务。

  陈文光认为,越来越多的用户已经意识到,单凭Benchmark进行性能测试已经远远不能满足需求,最佳的方法就是把LinPack仅仅作为部分参考依据,主要面向实际应用进行测试,并且根据评估结果,确定具体的性能指标。“难点在于,在系统还不存在的情况下,仅仅能对少量节点进行测试,同时要决定选择哪些应用,又该如何归结指标。”陈文光表示,在六年多的实践当中,凭借团队较强的技术实力,他们已经克服了难点,归纳出一整套方案。这对于高性能计算机用户,包括进行ChinaGrid节点建设的高校采购都具有一定的参考价值。

  目前,863 高性能计算机评测中心已为多个高校提供了高性能计算评测服务。

  借鉴中山大学模式

  作为学科门类齐全、科研应用机构较多的重点高校,同时也是ChinaGrid的核心节点,中山大学在高性能计算建设方面的探索可资借鉴。

  中山大学在高性能计算方面的应用主要是基于学科发展建设的研究类应用,以及承担国家重大工程项目的应用。中山大学网络与信息技术中心主任郭清顺介绍说,中山大学把高性能计算作为全校整体信息化的有机组成部分,以此作为建设数字化校园的重要支撑平台。通过配套相应资源,提供相应服务,再把这种服务转化成中大学科建设的效益,这样才能构成良性循环。通过需求来驱动,构成良性循环是推动高性能计算发展的总体规律。

  从2001年开始,中山大学数字化校园建设已经探索了近十年。目前,中山大学已经进入到满足个性化应用的阶段。据了解,中山大学建设高性能网格平台整体上走了两大步,第三步正在规划与进行当中。2005年中山大学部署曙光4000,构建了7000亿次的高性能计算平台,2007 年的利用率就达到了90%以上。2008 年,中山大学又进行了第二期建设,部署曙光5000A,建立了5 万亿次的高性能计算平台,实现了平滑过渡。

  “我们预计今年年底到明年年初,再建20万亿次的计算能力,加上学校其他可以整合的能力,将达到30 万亿次以上的规模。”郭清顺介绍说,这种高性能计算方面的发展趋势表明了学校的科研、学科建设水平,以及承担国家重大项目能力正在提高,因为高性能计算都是应用驱动的。

  中山大学的高性能计算发展得风生水起,同时,该校还出台了相应的制度和原则,以保证平台建设和运营健康发展。

  “我们依托ChinaGrid 还会进一步发展。”郭清顺在分享经验时说,在人才方面,中山大学不仅为自己培养人才,也义务培养行业以及地区人才。“我们跟曙光合作成立了中山大学的高性能与网格计算培训基地,已经搞了若干次公益性培训。”

  在建设模式方面,中山大学创新性地采取了股东制。小股东都是学校内部的各个院所。具有中大特色的“股份制”一方面是指新建的高性能计算平台通过股份制方式统一建设,各股东把各自用于高性能计算的投入集资入股,在使用上可以优先获得保证。另一方面,学校各个实验室的小规模计算能力,或者过去学校为了某个特定用途建设产生的计算能力,会统一通过网络聚合起来。这两个层面的实际行动有效提高了资金利用率和建设水平,并且降低了建设成本和管理成本。

  中山大学在建设方面采取的是小步快跑的策略,根据需求情况去匹配建设,避免一次建设与投入很大,后期需求跟不上而造成浪费。目前,集群技术使中山大学这样的用户完全可以灵活地走按需建设的道路。郭清顺表示,未来也不排除为企业提供服务的可能性。高性能计算提升学校自身的学科建设能力和水平,同时要为经济建设服务,这就应该面向企业提供各种技术和服务,给企业做支撑,激发它们的需求,为企业发展提高科技含量。
关注读览天下微信, 100万篇深度好文, 等你来看……