智和信通专注智能化监控

  • 来源:中国计算机报
  • 关键字:网管,软件,智和信通
  • 发布时间:2014-07-03 13:53

  网管软件的发展被北京智和信通技术有限公司(以下简称智和信通)总经理李少龙总结为三个阶段。第一阶段是设备商时代,即每个硬件厂商为自己的硬件设备专门配备网管软件,这个时期的网管软件功能非常有限,只能管理各个厂商自己的设备;第二个阶段是综合时代,比如一个用户采用了多个厂商的设备,就需要配置多个网管软件,这时候就需要一种综合网管软件来统一管理;第三个阶段是智能化时代,相比网络设备和硬件本身,用户对业务更加关注,配置网管软件主要是为了保障业务运行,此时提倡的是网管软件要智能化、简单化、面向业务。

  新、旧需求更替

  在网管软件市场发展早期,市场上的产品以国外产品居多,且扩展性和开放性差,大多无法实现用户的功能定制开发。部分产品至多会提供一些简单的插件和接口,但可改动性极小。智和信通在发现客户有深度定制需求后,决定采取开放代码的策略。“我们当时选择开放代码,出于三个目的。第一,让客户基于我们的代码直接开发,会减少很多基础的工作;第二,基于代码的灵活、开放度,要超过基于数据库和API的灵活、开放度,相当于把图纸给客户,让客户随意设计;第三,是为拥有自主知识产权和实现旗下产品的真正国产化。”李少龙对记者解释称,“在当时我们已经推出了网管软件开发平台,但要实现完全的自主知识产权,就还需要研发SNMP网关组件和拓扑图组件,否则我们自己或者我们的客户仍需承担向第三方购买组件的成本。”

  现在,越来越多的企业为提高工作效率,开始通过移动App为客户提供服务或者把整个办公网络部署在云计算平台。此时,网管软件需要具备的能力,是能够将企业内网中的传统网络设备、运行在云端上的App应用或云计算相关产品进行集中管控,再增加安全隔离的功能。在李少龙看来,这对网管软件厂商来说是挑战,也是机遇。“如果把集中管控和安全隔离这两个功能做好的话,市场前景会很好。”李少龙表示,“我们从去年下半年开始就加大了针对客户移动互联网需求的解决方案研发力度,并已成功为部分客户进行了实施。”

  不久前,智和信通曾服务过一家医院,这家医院提出了三个需求:一是要监控医生手持移动终端的使用情况,比如病例上传、下载的过程监控;二是要实现医生手持移动终端的故障告警;三是对外部非法访问的安全隔离和对异常访问IP的追溯。通过实施智和网络管理软件,智和信通满足了该医院客户的需求。“我们的软件具有智能化的定位能力,一旦发现某台移动终端出现故障,马上就能够快速定位到是在哪个楼、哪台设备。而为了实现医院服务器的对内开放、对外隔离,我们为其配置了隔离监控功能,一旦软件发现有外部非法访问,会马上向管理员告警。”李少龙对记者说。

  贴近客户业务

  网管软件的部署结构无论是采用单机架构、二级架构还是分布式结构,都有可能产生单点故障,即部署在地方分支机构的网管软件本身出现故障。尤其是在单机架构的情况下,监控系统将因为网管软件的故障失去监控能力。没有报警,运维人员会误认为没有故障,智和信通是通过配置看护程序来解决这一问题的。“在单机架构中,智和信通的网管软件在运行时还会受另一个叫做‘看门狗’的看护程序监控。看门狗是同网管软件部署在一起的,一旦发现网管软件运行异常,就会对网管软件进行自动重启、自动配置、自动恢复。”李少龙对记者说。

  企业IT架构中不同的网络和设备,对监控频率的要求也不同,比如有些核心设备要求秒级监控,而有些边缘设备只关注其是否在线就可以了,这就涉及监控资源分配的均衡问题:当监控资源分配不当时,很多客户会按照最大工作负载量增加大量的监控设备,而当负载高峰期一过,就会造成大量设备闲置。“如果客户不解决这个问题,就需要大量地增加磁盘、内存、CPU,但高峰期后一般会有80%的设备闲置。”李少龙向记者介绍了智和信通的解决办法——任务队列时技术。“我们会先把客户的监控任务做量化,然后排列在任务池里,再指派一定数量的工作者(即监控设备)执行这些任务,这样能做到单台服务器CPU的使用率永远在50%~60%,这对均衡地分配用户监控资源很有意义。”

  在智和信通的客户中,中国移动通信集团(以下简称中国移动)是具有代表性的客户,其业务管理的规范化也给李少龙留下了深刻的印象。2010年,中国移动在全国建设了不良信息过滤系统,此系统由不良信息过滤软件、Windows服务器、Linux服务器、数据库、分流设备、交换机、存储服务器等设备构成。中国移动需要一套集中的OMC(操作维护中心)监控软件,对不良信息过滤系统的所有的设备进行监控。

  智和信通为中国移动部署了旗下的网管软件产品——SugarNMS,凭借着优秀的秒级故障监控能力、直观的拓扑图界面展示、特有的分省Proxy SNMP网关技术、稳固的故障提示和警报提示, 最终在中国移动不良信息过滤系统的北方区域——北京、天津、黑龙江、吉林、辽宁、山东、山西、甘肃、青海、西藏、内蒙、河南、宁夏共13个省级公司,全面上线使用,并通过了极为严格的功能验收和性能验收。SugarNMS网管软件服务器部署在北京移动望京机房,管理13个省的500余台设备,6000多个监视任务,最高实现10秒内的极限故障探测。“中国移动对网管软件产品的要求很高,是最早提出秒级监控和分布式监管的运营商之一。作为运营商,他们在IT运维方面也拥有一套成熟的运维管理规范,在后续服务中,我们常会把中国移动的管理经验介绍给其他客户,其他用户也非常认可。”李少龙说。

  国产替代要“纯粹”

  实现对国外网管软件产品的国产替代是一个长期的过程,也取决于厂商最初研发方向的定位,如果一开始就基于国外产品的基础架构进行研发,再重新调整回国产化也不现实。国内网管软件厂商的产品从技术上也要真正实现与其他国产核心软硬件设备的接轨,如CPU、操作系统、数据库等,实现纯粹的国产替代。李少龙表示,“我们给用户实施的是纯粹的国产化方案,包括支持国产的龙芯CPU、国产的麒麟系统、国产的金仓数据库等。”

  网管软件产业与国家安全、信息安全紧密捆绑,战略重要性不容忽视。受此前“棱镜门”事件影响,国内正加速信息产品国产替代的进程,中国政府也加大了对国内信息安全产业的投入和支持力度。国产网管软件从对IT基础架构监控的主要功能,到对国产核心软、硬件产品的兼容,再到应用服务实施、交付能力的提升,都必须形成一个具体的、高效的实现流程,来保证对国外产品的替换。国产网管软件替代国外产品更要充分结合新兴技术、新兴开发模式和新市场需求,以应对与国外厂商的竞争。包括智和信通在内的一批国内网管软件厂商,正在中国市场上与国外厂商短兵相接。

  此前在给某国内科研院校提供服务时,智和信通碰到了一家国外网管软件老牌厂商。这家国外厂商的产品功能很强大,但仅支持国外操作系统,如Windows、Unix系统。“当时客户要求服务器硬件必须全部使用国产产品,但那家国外厂商并不支持,而实施了我们的产品后仅半年时间,就实现了所有平台环境的国产化,我们完全胜出。” 李少龙表示。

  本报记者 于杰

关注读览天下微信, 100万篇深度好文, 等你来看……