数据中心的智慧之道

  • 来源:中国计算机报
  • 关键字:数据中心,云计算,大数据,物联网
  • 发布时间:2016-04-27 10:06

  ——2016年第九届中国数据中心大会特别报道

  4月15日,一年一度的中国数据中心大会如约而至。作为主办方,这已经是中国计算机报社连续第九年举办中国数据中心大会。本次大会以“智慧数据中心”为主题,从数据中心的规划、设计、部署和实施、运维和管理,以及未来演进等多个角度对智慧数据中心的建设和运营进行全方位的阐述,揭示了数据中心的智慧发展之道。

  随着信息的爆炸,以及云计算、大数据、物联网等的兴起,国内针对数据中心的投资持续增加。在中国,数据中心仍然是刚需。数据中心正朝着规模化、高密度、集约化、绿色化、智能化、自动化的方向发展。在这种趋势下,数据中心的建设、运维的复杂度逐渐增加,传统的数据中心建设和运维模式面临前所未有的挑战。数据中心的建设和运维必须摆脱原来的条条框框,实现从僵化到柔性、从粗放到精细、从主要依赖人工到自动化的全面转变,构建以高弹性、高效率、高可靠、高度智能化为基本特征的智慧型数据中心。

  数据中心运维是新商机

  前一段时间,相信大家都在关注“Alpha狗”与韩国九段棋手李世石的人机大战。中国的围棋棋圣聂卫平也在央视的一档电视节目中表示,对于此次的人机大战感到十分震撼。数据中心需不需要人工智能?也许你的数据中心也可以有“Alpha狗”。

  “实现数据中心的智能化,同时用软件的方式提升数据中心的可用性和能效,最终实现投资回报率的最大化,这是每个数据中心的用户应该认真思考的问题。”施耐德电气IT事业部解决方案产品总监郑浩表示。

  “Alpha狗”有两大制胜的法宝:一是具备深度学习的能力;二是它有两个大脑,一个是落子选择器,另一个是棋局评估器。“我们同样可以把‘Alpha狗’的这种智能化应用到现有的数据中心里。在这方面,施耐德电气已经做了大量的研究和实践。”郑浩表示,这主要体现在以下三个方面。第一,深度学习,即基于大量的数据中心建设实践和运维管理经验、端到端解决方案的研发和生产制造能力、对数据中心物理基础设施的深入了解,形成一套完善的基础知识库,这有点像“Alpha狗”在读棋谱。用户采用施耐德电气的实时数据采集追踪系统,可以持续更新相关知识,提升对数据中心的理解,再加上施耐德电气的一些分析工具,就可以对整个数据中心的运营和管理做出提前预测,或为运营者提供决策依据。这些都是深度学习的能力。

  第二,决策。数据中心内的大量设备分属不同的系统,由不同的管理团队管理和运维。施耐德电气可以通过模拟、风险评估等方式,找到不同设备之间的关联性,及时发现问题所在,从而进一步降低运维的风险。

  第三,自我优化。在定位了风险所在之后,关键是如何像“Alpha狗”的落子选择器那样,找到最佳的解决问题的办法。这就是自我优化要做的事。比如施耐德的智能化系统可以及时发现某一台服务器宕机,然后调配某个虚拟机接管业务,这些都是自动化实现的。

  亚马逊AWS(Amazon Web Service)于2006年便推出了第一个商业化的云计算服务。在构建和运营云计算服务的过程中,亚马逊AWS积累了大量的数据中心运维经验,先后推出了一系列云服务,实现了“基础设施即代码”的架构部署,使用代码或容器来自动部署和升级应用,并通过开发运维一体化(DevOps),使得持续的开发、集成和部署成为可能。

  亚马逊AWS是用云服务推动IT运维创新的标杆。人们对虚拟化技术不再陌生。服务器虚拟化或存储虚拟化只是将硬件进行了虚拟,而容器技术在此基础上,又将操作系统、中间件等都虚拟化,做成了一个个的容器,再将应用直接放到容器里,那么容器就可以像集装箱一样方便交付和运维了。容器技术、DevOps、微服务等将改变传统的应用交付模式,实现开发、测试、运维的一体化。

  亚马逊旗下有数千个团队,每个团队都像一个创业公司。这些团队采用微服务架构,实现了快速、持续的应用交付,其应用可运行在各种各样的环境中。亚马逊AWS首席云计算企业顾问张侠博士介绍说,亚马逊每年平均完成5000万次的交付。

  说到在运维方面的创新,亚马逊AWS提倡“基础设施即代码”的新理念。亚马逊AWS的数据中心运维已经完全是自动化的。依靠机器和软件实现整个系统的部署相比人工操作有很多明显优势:机器具有更好的可扩展性、可复制性、可审计性,并且可以保证环境的一致性,以及记录的安全等。从代码的开发到测试、配置、部署、持续监控,亚马逊AWS针对这一流程推出了一系列的工具,并总结出一套标准做法,轻松实现了持续集成、持续交付。

  在IT产业发展的过程中,IT服务化是一个新的转折点,而云计算本身也是一种IT服务。

  云有不同的模式,可以是私有云、公有云或混合云。从传统的IT运营到云运营,哪些内容发生了改变?在传统的IT系统中,一台服务器上安装一个操作系统,上面部署着不同的应用。传统的IT运维只需要针对单台服务器。而在云数据中心里,成百上千台服务器上安装了一个云操作系统,它掌管着所有IT硬件设备,甚至数据中心物理基础设施。一台物理服务器上可能部署了多个虚拟机,这时如果物理服务器出现问题,就不可能像传统IT运维那样,让这台服务器下线那样简单,而要非常谨慎,因为牵一发动全局。“比如,当某台服务器的电源出现问题时,管理员可能要进行多项检查,执行多项操作,才可能将坏掉的电源替换。”世纪互联蓝云事业部技术运维总经理汤涛表示,“云运维对于云应用来说是一个巨大的挑战。如果我们把传统的IT运维比作管理一个小宾馆,那么云运维就相当于管理一个五星级酒店,而且是连锁的。云运维有一套标准的执行流程。用户的每次处理都要小心谨慎,因为涉及云的应用、云操作系统、IT设备等多方面问题。”

  目前在中国,世纪互联网蓝云事业部有400多名工程师,可以提供国际专业水准的运维服务,包括云、基础设施、技术支持、客户支持、商务支持等服务。“我们可以针对中国本土用户的需求,提供本地化运维的云平台,同时保证平台的开放性和灵活性。我们可以在北京和上海数据中心的各3个机柜中保存6份备份数据,提高数据的可靠性、可用性,即使5个机柜掉电也不会影响数据的可用性。”汤涛表示。

  有效治理数据中心

  存储曾经是数据中心基础架构的瓶颈之一。如今,存储市场风云变幻,软件定义、全闪存、分布式存储、大数据存储等新概念层出不穷。什么样的存储解决方案才是最适合云数据中心的呢?

  为了了解云计算时代数据中心用户存储需求的变化,同有飞骥进行了一次调研,发现以数据驱动为导向成了用户最核心的需求。企业的信息部门正在从提供技术服务的润滑剂转变为以数据驱动为向导、促进业务创新的推进器。

  正是基于这一认识,北京同有飞骥科技股份有限公司(以下简称同有飞骥)秉承以数据为核心的思想,在云数据中心的存储架构方案设计中,按照数据业务的特点,将其划分为业务服务平台、业务运行平台、基础设施平台,将存储基础设施、大数据存储设备、数据保护设备等组成云数据中心的存储系统。这样的复合存储方案,除了可以保障数据的正常访问之外,还能在系统异常的情况下保障数据的安全性和完整性。同有飞骥可以帮助客户在建设云数据中心的过程中,打造混合的大数据存储平台,并通过智能感知引擎,为客户的运营服务、业务系统和管理决策平台提供可动态调节的数据存储资源。

  同有飞骥产品营销总监周灵筠表示,同有飞骥的云数据中心存储解决方案具有整合性和统一性,能够保证存储的连接,实现数据的透明迁移。

  最近几年,我国关于数据中心节能的相关要求、规范频繁出台。这主要是因为数据中心的整体能耗非常高,一个大型数据中心的耗电量甚至比一个园区整体的耗电量还大。数据中心的整体架构通常由IT系统、制冷系统和供配电系统组成。由于制冷消耗了太多能源,造成了数据中心的整体效率较低。

  2015年3月,为贯彻落实《国务院关于加快发展节能环保产业的意见》要求,全面提升数据中心节能环保水平,工业和信息化部、国家机关事务管理局、国家能源局决定开展绿色数据中心试点工作,旨在树立绿色数据中心样板,建立数据中心的评估体系。绿色是数据中心的发展方向。

  中国数据中心节能技术委员会秘书长吕天文表示:“除了数据中心的运维是一个新的商机以外,节能也是一个巨大的商机。我们的统计数据显示,2015年,中国数据中心节能市场的规模达30亿元,主要包括对机柜微环境的改造,以及新风制冷系统的使用等。如果按照现在的发展趋势,以及国家政策的扶持,未来三年,我国数据中心节能市场的规模达将达到85亿元,增长速度非常快。”

  “2015年,美国有66次大的数据中心宕机事件,其中25%是由于传统UPS系统故障导致的。另外,信息安全也是数据中心宕机的一个主要原因。为了解决这些问题,数据中心必须采用一个全新的架构,支持分布式的部署和扩容,同时还要提升数据中心基础设施的可靠性、安全性。”联方云天科技(北京)有限公司创始人兼首席执行官曾旭东博士表示。

  近几年,联方云天持续在产品和解决方案方面进行创新。2015年,中科曙光对联方云天进行了战略投资,双方可以实现优势互补,为数据中心客户提供更全面的解决方案。

  数据中心必须标准化、智能化,这样才能实现数据中心的高效运营,有效降低PUE值。软件定义数据中心的概念之所以盛行,也是因为这个原因。曾旭东表示,智慧数据中心包含三项核心内容:第一,实现软件定义能源;第二,实现数据中心的智能管理;第三,实现直观、可视化的3D运营。联方云天走在了软件定义能源市场的前列,其分布式的能源解决方案已经进入了电信、金融、政府等领域,不仅可以更好地实现节能减排,而且可以保证电力供应的连续性。软件定义能源将成为数据中心的重要支柱。

  当前,数据中心正朝着规模化、高密度、绿色化、智能化的方向发展。在这种趋势下,数据中心的建设、运维的复杂度逐渐增加,传统的数据中心建设和运维模式还能应对数据中心的新挑战吗?

  在数据中心的运维过程中经常会遇到一个棘手的问题,就是热量管理。“一个北京的客户拥有1300平方米的数据机房,每年的电费高达2000万元。无论从经济的角度,还是从数据中心长远发展的角度来考虑,数据中心的热量管理都是一个必须妥善解决的问题。”美国泛达网络中国区技术经理梁俊表示。

  现在,数据中心的客户都知道冷通道、热通道分开,但是有了冷热通道的分离,就能彻底解决数据中心的热量管理问题吗?答案是否定的。如果想从根本上解决数据中心的热量管理问题,就必须做好以下四件事:封闭、精确送风、密封和监控。

  现在,一谈到数据中心的能耗问题,很多人关心的只有PUE值。PUE值低于2甚至1.5,就说明这个数据中心已经达到了绿色数据中心的标准了吗?其实,PUE值并不是一个静态值,而是一个动态值,这意味着必须持续优化数据中心系统。泛达公司新推出的机柜解决方案,不仅可以实现冷通道和热通道的封闭,而且可以实现精确送风和柜内微环境的管理,有效管理冷空气的进入和热空气的排出。

  企业的云化之路

  在云计算刚出现时,人们都认为,云计算将给传统IDC行业带来极大的冲击。IDC云化势在必行。华云数据一直是IDC云化的倡导者和积极推动者。IDC云化有哪些好的办法和经验呢?

  华云数据集团能力中心副总裁郭晓介绍说,在实现数据中心云化的一开始,就要先分析云化的目的是什么,准备投入多少资金,计划支撑什么样的业务规模等;然后是采购适合的硬件设备,进行POC测试,验证方案是否可行;最后,在不中断业务的情况下,将数据迁移到云端。

  华云数据针对IDC云化提出了一系列解决方案和服务。因为很多IDC对云计算的认知并不深,也没有云化的任何经验,所以华云数据为这类IDC提供了很多顾问类的服务。比如,华云数据可以帮助这些IDC实现云计算系统与已有系统的对接,理顺工作流,并提供平台的定制化服务,让IDC拥有一个适合自己使用习惯的个性化的平台界面。

  将数据迁移到云端是一件非常困难的事,可能会花费很长时间,还可能中断现有的业务。而华云数据提供的数据迁移到云端的方案使用起来非常简单,基本不需要人工干预。“在迁移的过程中,我们的解决方案会持续地生成增量的镜像,这些镜像会分片地传到数据中心。”郭晓介绍说,接下来,华云数据的系统会做三件事情:第一,将用户原来的操作系统、数据、系统环境等打包;第二步,把镜像经过压缩、加密,上传到云端的服务器;第三,对镜像格式进行转换,删除不必要的数据。经过这些步骤,应用就可以在云端运行,整个过程不需要人工干预,也不会影响原有业务的运行。

  象云(北京)网络技术有限公司由企商在线、新云东方等在云计算领域有着深厚积淀和独特优势的公司发起成立,2015年还获得了国内知名投资公司九鼎投资的增资。就在数据中心大会举办的同一天,象云刚刚发布了2.0新产品,企商在线还宣布与中标软件合作,将国产操作系统引入公有云。

  “象云的定位非常清楚,就是走行业路线。目前,我们的主要精力都放在金融和泛金融行业。”企商在线销售中心副总经理于宗波介绍说。其实,金融行业是相对保守的行业。金融行业的客户在云化的过程中,要考虑的问题非常多,也比较慎重,最重要的就是合规性。如何通过创新,既能满足企业自身业务发展的需求,又能满足上级主管部门提出的合规性要求是摆在所有金融行业客户面前的问题。企商在线在这些方面也做了很多思考和探索。

  举例来说,银行客户对可用性和业务连续性的要求非常高。为此,企商在线和象云做了大量前期准备工作,进行了多次测试。目前,已经有很多金融和泛金融行业的客户将业务托管在象云的平台上,并且保持着稳定运行。

  另外,金融行业的客户对IT架构的可靠性、稳定性要求也非常高。“为了满足客户的需求,我们在架构设计、软硬件、中间件、数据库等方面遵循严格的流程,采用严格的设计规范,即使是在每天的业务高峰,也能让基础架构平台保持高性能、高可靠性,同时还能自由伸缩,实现资源的灵活调配。”于宗波介绍说。

  企商在线是老牌的IDC企业,在北京、上海、广州、深圳等地自建和自营着多个数据中心,未来还计划将业务拓展到美国市场。企商在线目前在全国部署了近100个节点,为象云的混合云和公有云服务提供基础架构方面的支撑。

  数据中心三大发展趋势

  赛迪顾问高级分析师鹿文亮博士认为,服务化、规模化、模块化与节能化是未来数据中心的三大发展趋势。第一,技术的创新与融合促进了服务业态的创新。技术融合与产品融合是相关的。以前,人们经常提到独立的硬件或软件,现在更多地谈论融合的产品和解决方案,比如软硬件高度融合的一体机。融合的产品和解决方案可以提供更高的性能、更低的维护成本。现在,互联网、物联网、大数据、云计算等技术并不是孤立存在的,而是相互依赖、相互融合的关系。

  第二,数据中心呈现规模化发展的趋势。现在,小型数据中心的建设和运维成本越来越高。为追求规模化效益,数据中心的规模正变得越来越大。2013年底,赛迪顾问的统计数据显示,全国的数据中心大约有46.7万个,其中绝大部分数据中心是中小型的。现在,机柜数量超过1万个的超大型数据中心的数量已占所有数据中心的10%左右。数据中心规模越大,客户越多,成本越低。

  第三,模块化与节能化。在数据中心领域,绿色节能是大势所趋。现在,许多新建的数据中心都在追求更低的PUE值。谈到模块化,鹿文亮重点谈到了以交付整机柜服务器为目标的“天蝎计划”。“天蝎计划”是2011年由BAT厂商提出的概念,目前已经付诸实践,硬件设计采用规范化的开源标准。整机柜服务器提供了标准的设计和接口,可以实现更好的空间利用率和能源利用率,优化散热,更好地降低PUE。整机柜服务器可以让企业更好地控制成本,并实现快速部署。

  亚马逊AWS首席云计算企业顾问张侠

  在云计算时代,一切皆软件,一切皆API。数据中心用户要学会利用容器、微服务、云架构等新技术,实现运维的自动化、一体化,顺应DevOps的新趋势,实现“基础设施即代码”。

  施耐德电气IT事业部解决方案产品总监郑浩

  实现数据中心的智能化,同时用软件的方式提升数据中心的可用性和能效,最终实现投资回报率的最大化,这是每个数据中心的用户应该认真思考的问题。

  世纪互联蓝云事业部技术运维总经理汤涛

  在中国,世纪互联蓝云事业部有400多名工程师,可以提供国际专业水准的运维服务,包括云、基础设施、技术支持、客户支持、商务支持等服务。世纪互联蓝云事业部可以针对中国本土用户的需求,提供本地化运维的云平台,同时保证平台的开放性和灵活性。

  中国数据中心节能技术委员会秘书长吕天文

  数据中心的一个发展趋势是,数据中心物理基础设施与IT设备进行深度融合,这样才能更好地实现数据中心的智能化、自动化和绿色化。

  联方云天科技(北京)有限公司创始人兼首席执行官曾旭东

  现在,云已经开始落地。那么,下一步是什么?曾旭东认为是大数据。随着互联网的深入发展,终端设备的使用越来越广泛,云计算进一步提升了IT系统的使用效率,带来了两个新的变化:第一,数据量大幅增加;第二,数据中心的运维和服务成为新的热点。

  北京同有飞骥科技股份有限公司产品营销总监周灵筠

  基于智能感知、应用定义存储的新理念,同有飞骥推出了一系列高性能的云存储产品,帮助用户构建DT时代高效能的数据中心,其中主要包括面向应用的智能感知平台、性能卓越的分布式集群存储系统、高效稳健的虚拟化存储系统,以及弹性、灵活的统一共享系统。

  美国泛达网络中国区技术经理梁俊

  泛达基于无线技术的DCIM系统可以对数据中心的环境进行监测,收集温度、湿度、气流、滴漏水等信息,并用软件进行分析,让管理者可以及时了解数据中心各系统的运行状况,以及PUE值是否上升等信息。泛达可以通过全面的解决方案,有效解决与数据中心热量管理有关的问题。

  企商在线销售中心副总经理于宗波

  未来,企商在线的三大主营业务包括IDC、云和CDN。企商在线要把这三大业务更好地融合在一起。目前,企商在线有几十个工程师专注于CDN、云计算的研发和部署。今年第三季度,企商在线将进一步提升网络的联通能力,扩大IDC业务。

  赛迪顾问高级分析师鹿文亮博士

  赛迪顾问预测,2016年到2018年,随着云计算、大数据、智慧城市、“互联网+”的落地,数据中心的需求量会进一步增加。2018年,我国数据中心的投资规模将达到3000亿元左右。鹿文亮对数据中心的建设提出两点建议:第一,注重生态建设,实现共赢发展;第二,创新服务模式,提升自身价值。

  本报记者 郭涛

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: