别让容灾系统成为摆设
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字:容灾系统,地方商业银行 smarty:/if?>
- 发布时间:2014-10-15 10:26
——地方商业银行灾备系统建设之思考
前段时间,我国西北地区某地方商业银行发生的一次长达37小时的系统宕机事件再次引发了行业的广泛关注。据记者了解,银监会已要求其他同类银行对现有的容灾系统进行自查。地方商业银行在容灾建设和数据安全方面面临哪些挑战呢?
两大驱动力
地方商业银行主要包括城市商业银行和农信社两大类。地方商业银行虽然在规模上无法与国有大型银行相比,但其IT系统的复杂性和多样性,还有快速增长的数据量一点也不逊于国有大型银行。随着业务的快速发展和自身规模的不断扩张,地方商业银行对IT与业务系统的安全性越来越重视。
《商业银行数据中心监管指引》第五条明确指出:商业银行应于取得金融许可证后两年内设立生产中心,生产中心设立后两年内,设立灾备中心。由此可见,灾备中心已经成了商业银行开展业务的必备条件。
保证客户信息的安全、提供持续的服务是银行提高客户满意度的基本保障。银行IT运维的特点是:数据量大,应用环境和系统管理复杂,但运维人员数量少,技术水平参差不齐。此外,银行通常会大量采用外包服务,但缺少对这些外包服务和相关人员的必要的安全防护和审计手段。“与其他行业不同,地方商业银行科技事故的第一责任人是董事长。因此,地方商业银行的高层领导对科技的重视程度比较高,通常会参与IT决策过程。这对于银行IT系统建设,尤其是灾备系统建设来说是件好事。”赛门铁克公司华西区技术经理叶永军告诉记者。
地方商业银行“麻雀虽小,五脏俱全”,其特点就是钱少、人少,但是IT系统的复杂度并不小。“地方商业银行无论是在技术人员的数量上还是能力上,特别是经验上,与国有大型银行还有很大差距,这也造成了沟通上的一些困难。”叶永军举例说,“地方商业银行的技术人员可能了解一些具体的灾备技术和产品,但是对于如何从整体上把握和构建一个完整的银行安全架构,以及如何分阶段建设灾备系统等缺乏经验。另外,地方商业银行普遍对于外包服务和开发缺少有效的控制和管理。”
地方商业银行建立灾备系统的另一个驱动来自于银监会等监管机构的要求和规定。《商业银行信息科技风险监管指引》、《商业银行数据中心监管指引》、《商业银行业务连续性监管指引》等对IT系统的风险控制、预防、审计和业务连续性保障等提出了明确的要求。银监会等监管机构还会定期对银行的执行情况进行检查,这对银行的管理者来说也是一种压力。
满足合规要求
为了建设一个完备、适用的灾备系统,地方商业银行首先要树立一个正确的安全观。从用户的视角来看,信息安全包括基础架构的安全、应用的安全,数据的安全、运维管理的安全、终端的安全等几方面内容。具体来看,基础架构的安全就是要解决数据中心物理环境与虚拟环境的安全问题;终端安全既包括个人移动终端设备的安全,也包括银行许多特殊的终端设备,比如ATM机的安全;针对金融行业来说,应用安全主要指保证电子银行和互联网金融业务的安全;数据安全就是保证银行客户的个人资料安全,防止资料外泄;管理的安全就是要遵守监管部门的要求,实现合规。
“地方商业银行应对银行的安全有一个整体的认识,最好能建立一套完整的覆盖各个层面的安全体系。”叶永军表示,“赛门铁克针对用户的业务需求和监管要求,可以提供比较完整的解决方案,包括系统高可用性、灾备、网络安全、终端保护等解决方案。”
具体灾备系统的建设问题,地方商业银行首先还是要根据自己的业务需求和《信息安全技术信息系统灾难恢复规范》的规定确定灾备建设的等级。
《商业银行数据中心监管指引》的第七条明确指出,总资产规模1000亿元以上且跨省设立分支机构的法人商业银行,以及省级农村信用联合社应设立异地模式灾备中心,重要信息系统灾难恢复能力应达到《信息安全技术信息系统灾难恢复规范》中定义的灾难恢复等级第5级(含)以上;其他法人商业银行应设立同城模式灾备中心并实现数据异地备份,重要信息系统灾难恢复能力应达到《信息安全技术信息系统灾难恢复规范》中定义的灾难恢复等级第4级(含)以上。
《信息安全技术信息系统灾难恢复规范》将灾备系统划分为6个等级。从技术的角度来看,1、2等级要求企业对生产系统做备份,并且定期把备份数据通过一定的方式(如转运磁带)放到第二个站点;3、4等级与1、2等级最大的区别是,企业需要周期性地对数据进行备份,并通过电子链路和网络在线传输到灾备中心;5、6等级要求数据不是周期性的保护,而是实时地传输到备份站点,并要求在故障发生时,系统可自动地切换到灾备站点。针对不同等级的数据保护要求,赛门铁克有相应的解决方案。
以需求定方案
针对1~4等级的要求,赛门铁克可以提供备份容灾解决方案,即在生产中心对数据进行备份,然后通过赛门铁克的NetBackup解决方案将数据备份到容灾数据中心。赛门铁克的NetBackup解决方案不仅可以备份数据,而且可以将整个操作系统的应用设置也进行备份。“我们不仅可以备份数据和应用,而且可以帮助地方商业银行构建容灾演练平台。”叶永军介绍说。
近两年,赛门铁克将其特有的备份一体机设备用于容灾,进一步简化了灾备的架构。赛门铁克进行过一次调查,结果显示80%系统故障都与人为误操作有关。以前,企业建立灾备系统要分别采购和部署软硬件,还要打补丁,做软件的配置和优化等,不仅系统上线慢,而且维护也很复杂。赛门铁克的备份一体机是一个软硬一体化的解决方案,已将灾备所需的配置全部做好,不用额外采购硬软件,即插即用,减少了人为操作,应用十分方便,适合缺乏专业技术人员的地方商业银行使用。
吉林省农村信用社就在其主数据中心内部署了两台赛门铁克NetBackup 5220一体机设备,每台具有24TB的存储容量。在其灾难恢复站点,吉林省农村信用社部署了一台4 TB容量的赛门铁克NetBackup 5220备份一体机设备,用于最关键的数据保护。“由于备份目录随数据本身一起复制,备份映像可从任意位置即时进行灾难恢复。使用赛门铁克NetBackup 5220备份一体机,我们的部署非常成功,而且恢复速度是以前的8倍”。吉林省农村信用社IT主管侯福祥表示,“我们之所以选择赛门铁克NetBackup 5220备份一体机,就是看中其易用性。我们的备份管理员每天只需10~20分钟,即可备份好所有内容,而以前每天仅管理5个核心系统的备份就需要花费1小时。”
针对5、6等级的容灾需求,赛门铁克既可以提供同城的容灾方案,实现数据的实时复制,也可以提供两地三中心的容灾方案,将数据复制到1000公里甚至更远的容灾站点。为了满足5、6等级的容灾需求,赛门铁克会用到以下一些关键技术:基于主机卷或文件的数据复制技术,其优点是方式灵活(链路/同异步),支持存储虚拟化和异构存储,阵列镜像技术可以实现业务零停机和零数据丢失,同时减少计划内停机时间等;容灾应用切换管理技术可以按照单个应用、单个业务、业务群或整个数据中心的方式在数据中心之间切换应用,实现程序的自动停止或启动,切换时间为分钟级。
容灾系统建设的要点可归纳为“1、2、3、4”:“1”代表一个核心原则,即基于业务影响分析,全面提高IT系统的抗风险能力;“2”代表要关注RTO(恢复时间)和RPO(数据丢失量)两个重要指标;“3”代表要做好三件事,包括数据传输、业务切换和容灾演练与监控;“4”代表实现操作系统、文件、数据库和应用四项恢复。
叶永军表示:“在容灾系统建设中,除了关键的技术因素以外,地方商业银行还必须做好后续的运维管理。从我们的经验看,要把容灾往应用的生命周期前端和后端推进,在容灾系统上线前要先制定标准,系统上线后还要定期进行检查和考核,只有这样才能保证容灾系统在故障发生后真正发挥作用。”