有“备”无患

  • 来源:信息方略
  • 关键字:IT建设,灾备管理,备份
  • 发布时间:2014-01-03 08:59

  随着各种新兴技术的兴起,企业对IT建设的重视程度不断加深,各种灾备模式和企业灾备管理建设也愈加完善;企业在容灾上的投入、长期范围内的容灾策略和目标,也根据企业战略作出调整,以保障企业运营有“备”无患。

  灾备中心的建设一直以来面临众多难题,譬如环境要求复杂、技术门槛高、资金投入巨大、人员要求高等等。这些困难使得各企业的灾备中心建设举步维坚,如何在现有的资源条件下,建设满足企业需求的灾备系统,成为对IT主管们的一项挑战。异地备份、两地三中心或者三地三中心,全面提升灾备管理水平,是每个对IT技术依赖性较强的企业共同追求的目标。怎样强化安全系统,稳固备份措施,达到或者超过行业标准要求,是IT负责人不断加深IT建设的目的。

  异地备份受青睐

  近年,证券行业迅猛发展,在经济环境中所占的权重不断增大,社会形象不断提升。对于企业信息技术部负责人来说,怎样秉着对行业、对股民、对公司自身负责的态度,保证信息系统的稳定性,是工作的重中之重。“除了本地备份,我们也在做异地备份,例如深圳机房的托管,实现两地三中心或者三地三中心,提升灾备管理水平。”国开证券有限责任公司信息技术部负责人李正欣介绍说。证券行业,属于对IT技术利用率非常高的行业之一,也是对IT系统依赖性非常强的行业之一,IT系统在整个企业预算中所占的比重较大。

  给企业信息技术部带来的挑战由此而来。包括业务数据管理和安全,风险控制以及内部管理,都会对IT产生较强的依赖性,需要对业务系统进行整体安全级别的提升。“企业灾备管理是一门综合性的工程,仅仅发展某一方面技术并不能对整体灾备产生明显作用。行之有效的灾备管理需要对企业重视每一个环节。”北京邮电大学计算机学院灾备技术国家工程实验室总工姚文斌说到。灾备管理贯穿在整个企业管理、生产流程中,对IT技术依赖性较强的企业来说尤为如此。

  “为了保证业务的完整性、连续性,我们建立了等级达到五级应用级的在线容灾中心。实现了出现故障4个小时内即可启用容灾系统。”华新水泥股份有限公司信息管理部部长刘胜对此经验丰富。强有力的灾备支撑,可以帮助企业满足日益发展的运营模式要求,随时随地提供系统服务。

  华新的IT应用全面贯穿在整个企业运行中,包括业务运行、内部管理,都会依赖于IT系统,如果IT系统中断,则会造成业务及生产系统的中断。为了保障公司正常运营,不因为IT信息技术造成系统中断,华新每年都会进行实际场景的模拟。每年都会进行的全系统演练。通过一个非常复杂而严谨的过程,例如尝试将数据中心关掉,看是否能够顺利启用容灾系统,是否可以觉察给生产造成的影响。

  为了实现组织、管理的一致性,包括协调容灾管理、团队演练的整体管理等,以及训练团队能够在发生故障的第一时间做出反应决策,华新在平时会通过组织一些演练,实现提高团队的技术水平和整体应对素质。各个企业的IT应用水平不同,应用层面不同,则对企业灾备管理的需求不同。

  IT系统的顺畅运行、安全容灾,对于流程制造型企业而言,非常重要。“几乎每个员工,特别是对管理层来说离开IT系统几乎没法办公。”刘胜说到,“7*24小时企业运营模式可以支撑整个生产线的运行,所以系统的稳定及容灾管理对华新来说,是一件非常重要的事情。”流程制造型企业整个运行、生产,都需要依靠IT系统,一旦IT系统中断整个业务势必受到影响。

  数据大集中对数据的安全威胁显著增加,异地灾备可以为企业数据提供安全保障。国开证券通过在深圳机房灾备建设的管理,还可以满足信息系统灾备建设距离的标准。同时,考虑安全的管理要求,选择契合企业发展需要的地点进行异地灾备,可以更加有效地实现实时管理。

  国开证券通过配比为接近1:1业务承载能力的备份管理,实现了对数据进行实时有效的备份。现在业务流程中,下单过程只是录入账户信息,信息即可直达交易所,从发起到结束不需要人为干预,如果系统停滞则出现的瘫痪及带来的损失不可估量。这也是证券公司最根本、最核心需要实现的目的。

  多中心提升灾备管理水平

  异地灾备优势明显,如果采用多地多中心的方式,或者云灾备的方式,可以达到更高的灾备管理水平。从技术发展方向上说,云灾备更便于对整个系统的保障,支撑力度也会变大,可以更有力地支撑企业运营发展,李正欣提到。

  越来越多的7*24小时企业运营模式要求系统服务必须有灾备支撑,可以随时随地提供服务。有效数据的保存期延长,导致数据量激增,快速查询和获取变得尤为重要,因此,如果采用云灾备,云环境中的多版本数据可以为灾备提供天然的基础。

  “整个基础架构的变化发展,以及理念,都是对原有团队的挑战,所以,如何整合也是需要考虑的问题。”李正欣说到。数据中心的建设是一个不断扩充的过程,以前的系统需要适应数据中心系统的不断发展。所以,顺应企业发展,对现有系统人员进行培训,牢固对技术的掌握,也十分必要。

  采用异地管理的形式具有很大优势,同时也必然面对很多挑战。例如采取托管式管理,两个团队对行业的认识不同、观念不同,都会在对接过程中产生问题。所以,需要更多更有效的沟通、检查、审查手段,借以实现异地灾备间的无缝沟通,不会产生观念或者管理流程方面的差异。

  采用云灾备的管理模式,会面临更多挑战。例如从观念上说,如同云环境下所有的业务都是某一种服务模式一样,云灾备同样可以作为一种基础服务和基础设施存在。

  从管理角度上说,在原来设备一级的管理基础上,增加了灾备管理则会相应增加管理的成本,但是相对于传统灾备来说,则是可以忽略不计的。

  从技术角度上说,需要做到数据安全性、保密性与便捷性的统一,尤其是针对巨量的数据管理来说,包括数据的组织架构、数据的容灾性分布、大规模用户的访问和安全机制、第三方监督和认证等等,不间断应用服务则是其中最具挑战性的工作。

  保证容灾系统达到真实的、有质量的灾备,运行管理过程中,要始终模拟真实系统的所有场景,模拟真实数据及系统环境。IT系统是一个在不断发展、扩展的过程,灾备系统建设面临的另一大挑战是,需要始终和数据中心同步。

  同时,容灾管理、团队演练的整体管理也需要保持一致性。团队的训练是否能够在发生故障的第一时间进行反应,都是通过平时的演练实现对团队的训练。在组织管理过程中,和平常的组织管理不同的是,即使没有出现实际的故障,只是日常维护、运行、演练也是非常重要的。包括完善的演练手册,整套完善的演练机制,以及运营管理模式,都需要融入在日常管理流程中。

  容灾级别越高,给技术层面带来的挑战也越大,如果只从技术角度来看相对比较容易。“但是怎样把系统强化得更安全,备份措施如何更稳固,甚至超过行业的标准要求,才是我们不断加深IT建设的目的。”李正欣说到。全面的灾备管理应该是涵盖各种管理流程,包括业务流程、风险核算,并且具有较强的承担风险的能力。

  灾备技术本身至少包含了容错技术、信息安全技术、应急管理技术、存储技术、传输技术等多方面技术的综合,它是一门综合性的工程,甚至不能简单地归纳到计算机领域、通信领域、应急管理领域等单一领域范畴。“因此,它最大的挑战是从上述技术中选择和优化最优的组合来应对多样的用户需求,也就是说仅仅发展某一方面技术并不能对整体发生根本性的作用。”姚文斌分享说。云灾备得到广泛应用是必然趋势,而不仅仅依靠几个相关技术的发展,正如同微机系统的高可靠性是保证其广泛应用的前提一样,未来云灾备技术必然成为云环境中的基本功能和结构。

  云灾备保障数据安全

  在越来越重视客户服务、用户体验的趋势下,为了降低人与人之间服务的距离感问题,采取云计算模式可以打破空间的限制。

  “目前我们做的仅仅是灾备计划中的一部分,还有一部分是期待企业之间的协作、行业间的协作。”刘胜介绍到。通过企业异地互相做灾备,或者是借助大型专业的云管理团队,可以通过租用等形式,实现企业灾备管理等。各种实现方式都在不断发展,包括技术成熟、法律标准成熟,企业将关键的核心数据放在平台上,在调用信息的时候,也会保障数据安全,不会出现失误。

  随着行业发展,企业对IT建设的重视程度不断加深,技术条件也愈加强大,企业灾备管理建设也愈加完善。从系统架构上说,传统的灾备是数据中心组成的点对点结构,但是云灾备是多点系统、乃至集合对应的综合系统。云环境中用于快捷服务的多数据版本结构为灾备提供了天然的基础条件;云环境中成千上万的服务器和存储设备为灾备提供了广阔的物理容灾基础;云环境中集中式管理和虚拟化技术为云灾备提供了良好的逻辑实现基础;云环境中的灾备成本大大降低,使之逐步向“平民化”发展。未来云灾备的发展,将给企业以至行业层面带来更多益处。

  Daisy

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: