“站在云上”监控

  • 来源:中国计算机报
  • 关键字:美信科技,云计算
  • 发布时间:2014-06-26 13:50

  在国内网管软件市场,参与讨论云计算技术理念与IT监控服务如何结合的厂商目前还不多,而像北京美信时代科技有限公司(以下简称美信科技)这样,已实现将云计算解决方案部署在客户IT基础设施中的厂商更是凤毛麟角。

  为实现对客户分布在数据中心、局域网、广域网上的服务器、应用、存储等IT基础设施软、硬件的监控,美信科技建立了一套整体的工业级解决方案,并命名为美信CreCloud云网管,可帮助客户实现对大型数据中心和分布式IT架构的统一监控管理。

  云计算、大数据的另一面:多了、高了、复杂了

  美信科技总经理王朋向记者表示:“进入云计算、大数据时代后,企业IT设备的数量越来越多,IT设备的运维监控难度比以前更高,基于虚拟化的IT基础架构也更加复杂。”

  为了保证IT系统的正常运行,特别是在整个广域网的正常运行,监控是必不可少的。由于地方分支机构的技术力量有限,监控中心一般放在总部。总部负责集中监测性能、解决重大故障,地方分支机构一线工程师主要是处理一些简单问题。随着IT系统规模越来越大、系统架构越来越复杂、使用范围越来越广,企业对IT系统的可靠性要求就越来越高。运维人员在第一时间就要获知硬件、软件、网络上的故障情况,以便进行快速处理。所以,要降低系统瘫痪的概率,良好的监控能力就成为保障IT运维的首要条件。

  除此之外,国内一些大型企业、政府机构的IT架构设计和部署正在变得更加抽象。由于通过云计算能将负载均摊、压力分散,系统设计人员不再需要过分关心业务部署的具体位置、单台设备负载是否过高、能否承受业务压力这些问题,而是把注意力放在了如何设计出更能满足用户需求和可用性更高的系统上。并且伴随着IT系统在政府、企业应用的深度和广度的增大,IT系统的规模也不断扩大,部署10万、100万台设备的企业越来越多。为了保证数据稳定、可靠、安全地传输,企业、政府也建设了很多集中的信息系统,国内一些部委、大型企业也都在建立和扩大内部专网。

  在设备的虚拟化方面,虚拟化可以实现将CPU、内存、磁盘等资源进行逻辑抽象并统一表示,使得一个IP地址的背后存在的未必是一台真实的主机。虽然这样做能够提升资源利用率、有效控制成本,但同时也为网络管理增加了新的问题。比如在设备数量不增加的情况下,操作系统的绝对数量却越来越多,相应的管理任务量和复杂度就会增加。

  为应对基于以上情况的客户IT架构的变化,网管软件需要在监控能力、计算能力、部署方式上得到提升或优化,而基于云监控技术的云网管解决方案恰恰实现了在这些方面的升级:把多台监测服务器的监测能力通过虚拟技术整合到一起,实现对数据中心海量服务器的监控,监测设备数量最高可达100万台;当客户数据中心增加新设备时,只要相应增加“监测云”中的服务器即可实现设备监测的动态扩容;把一套系统采取分布式的方式部署到多台机器中,实现仅通过一个界面就可进行统一、集中管理,大大提升了维护工程师的工作效率。

  云网管:分布式+倒链监控

  “传统网管系统对于大型网络的监控,往往是采用二级架构的模式,即在总部部署一套管理端,在地方IT中心部署一套监控软件,地方中心的监控软件将配置信息和一些重要的报警信息同步到总部管理端。”王朋介绍称。

  而由于地方IT中心的维护工程师对监控软件的操作熟练度不够,使得系统在实际使用中效率较低。并且,很多地方中心的监测服务器都处于局域网中,总部控制器经常无法正常连接到监测服务器,以致获取不到数据,让监控无法继续。

  “美信CreCloud云网管的云架构分布式部署就能够解决上述问题。”王朋表示。在云网管中,核心组成部分包括CCU云控制器和TS云节点监控服务器。CCU云控制器是控制中心,负责调度监控任务,根据监测设备的数量和监测内容将监控任务分发给监测服务器,并监测云节点服务器的工作状态。一旦某台监测服务器出现故障,系统会立刻将监测任务转移到其他监测服务器上;TS云节点监测服务器主要任务是获取设备监测信息。随着监控规模的增加,TS云节点监测服务器也随之线性增加,新增加的监测服务器会自动注册到CCU中央控制器,接受新的监测任务。

  与传统网管系统相比,美信云网管的部署方案也有所不同。CCU云控制器会部署在总部,TS云节点监控服务器则分别部署在企业位于不同物理位置的数据中心。通过CCU云控制器的统一管理后台,能够让多个TS监测服务器协作运行,并实现监测动态负载均衡、多机容灾备份、监测增量热插拔等功能。

  CCU云控制器作为CreCloud美信云网管的大脑,能够直接把监测任务分配给TS云节点监控服务器,一个TS云节点监控服务器可以完成对1000台服务器的监测。监测完成之后,TS云节点监控服务器会将数据返回到由美信科技自主开发的RealDB(实时高效率缓冲数据库)。

  由于TS云节点监控服务器被部署于客户的局域网中,其映射到公网上的IP地址通常不固定,此时就会出现TS云节点监控服务器的定位问题。为此,CreCloud美信云网管提供了倒链监控的方法:在倒链监控中,CreCloud美信云网管各模块间通信均采用独创的MQ通信中间件。CCU云控制器将监测任务写入MQ消息队列,各个TS云节点监控服务器则主动从MQ消息队列中读取自己的监测任务,从而完成监测并将数据返回到RealDB数据库。即使在CCU云控制器定位不到TS云节点监控服务器的情况下,CreCloud美信云网管也能轻松完成客户的监控任务。

  国产化替代:靠技术征服客户

  网管软件平台负责网络系统的配置、故障、性能和网络用户分布等方面的基本管理,也是网络管理系统的“灵魂”和核心。在国内网管软件市场,国内厂商已经具备了替代国外厂商的能力。包括美信科技在内的一批国内IT业务网络管理解决方案供应商也正在依靠自己的技术、产品、解决方案,逐渐实现网管软件的国产化替代。

  以美信科技为中石油做过的项目为例,中石油之前买了10套某国外公司的网管产品,但实施后发现监控能力上还是达不到要求,而实施了美信科技的云网管解决方案后,新的网管系统就能够胜任监控工作。“没用过云网管解决方案的厂商,是想象不到网络管理能力是如何实现从量变到质变的。”王朋说。

  而对于国内网管软件厂商在产品和解决方案方面的优势和劣势,王朋总结说,国产产品的优势是网络管理功能的本地化程度高,而且可做定制。劣势是技术忠诚度和研发投入不够。“通常国内网管软件厂商客户关系都比较复杂,技术研发进展较慢,这就要求高层迅速找到企业发展的准确定位,比如是想做纯粹挣钱的公司还是想做真正做事的公司。”王朋表示,“有些国外公司在技术上做得更细、更专,做出来的产品很复杂,导致不符合中国市场需求,这是国内厂商的机会,但也取决于国内厂商的技术水平能不能征服客户。”

  本报记者 于杰

关注读览天下微信, 100万篇深度好文, 等你来看……