一点都不能马虎

  • 来源:中国计算机报
  • 关键字:双活灾备中心,银行业,阜新银行
  • 发布时间:2015-03-31 07:47

  ——记阜新银行双活灾备中心的可用性建设

  双活灾备中心如今已经实现了从理论层面到业务实践的落地。当银行业的其他用户们因为怀疑双活模式是否真的优于传统灾备系统而犹豫不决时,阜新银行的双活灾备中心却早已上线运营,并用亲身经历证实了双活灾备中心的价值。

  灾备是出发点

  当一家银行发展到一定规模的时候,对基础设施的投入将变得更加重要。双活灾备中心虽然相对于冷备模式投入更高,但却能给业务连续性提供更有力的保障。用阜新银行IT项目负责人的话说,一家过千亿的银行如果宕机,一小时损失的钱要比建一个灾备中心花的钱多很多。虽然这个理由已经充分说明了建设双活灾备中心是很有价值的,但实际上,阜新银行IT项目负责人认为这还不足以说明双活的价值。

  据阜新银行IT项目负责人介绍,与其他银行选择冷备模式相比,阜新银行选择双活有两个原因:一方面,双活相比冷备有更多的优点,比如应用切换RTO (recovery time objective,恢复时间目标)大幅缩短;另一方面,冷备中心天生的缺点就是实用性低,而阜新银行规模较小,所以出发点也很朴素,就是要实用。所以,虽然与冷备中心相比,双活中心的投入更高,并且对技术、实施人员、后期运维人员技术的要求也更高,但是阜新银行还是选择双活,就因为一个出发点——要真正起到作用。“灾备中心的价值,往往是在出现灾难的时候才能看出好不好用,不出灾难基本上就在那儿备着,经济效益不好衡量,更多是在社会效益,比如说维护地区稳定、支持地方经济等方面。”阜新银行IT项目负责人说

  阜新银行的双活项目选择了IBM的PowerHA HyperSwap双活解决方案。该方案由IBM Power小型机、PowerHA集群软件、DS8000存储系统组成;在基础架构上安装了并行数据库,来实现了跨越10公里的Active-Active集群和双活数据中心部署,每套集群保证了从应用层——操作系统层——存储系统层的整体高可用,实现了双活数据中心的核心功能。

  当初,阜新银行把灾备中心的建设目标定位为五级。五级的应用级灾备中心RPO (recovery point objective,恢复点目标) 需小于30分钟,RTO是2小时之内。现在,阜新银行的双活灾备中心已经实现RPO为0,RTO在最极端的情形下是小于2小时,平均情形是2分钟以内,在非重大风险情形下,RTO甚至仅为几秒到几十秒不等,这些数据是经过几百个测试用例后得到的,每个测试用例都对应一种风险情形,实现安全可控目标。并且,阜新银行的“三中心”布局也已经建设完成了,建设顺序为先做一个异地灾备中心,后做两个同城灾备中心。从数据上看,三个中心的数据是一样的,同城灾备中心和异地灾备中心是双活关系,它们就像处在一个拉伸的局域网里。

  应用层双活才是真双活

  双活(Active-Active,简称AA)是指两个IT系统(一般指两套设备或是两个数据中心)同时处于生产状态。在日常工作中,两个系统可以共同承载业务的需求,而当其中一个出现故障时,可以更迅速地切换至另一个系统平台,保持业务连续性,并将故障的影响降至最低。银行的以太网络、SAN(Storage Area Network存储区域网络)网络的拓扑都是分很多层的,当每一层都能实现双活的时候,整体灾备中心才能支持双活。换句话说,双活的实质是应用层的双活,如果应用层不双活,应用层之下的拓扑层里面的设备即便能实现双活,也并不是真正意义的双活。

  “阜新银行的灾备中心实现的是应用层的双活。”阜新银行IT项目负责人解释称,“如果某一个应用本身暂时不支持双活模式,但我们把架构做成双活模式后,以后想进行应用改造时,就可以为实现应用双活提供支持。”

  应用层双活还包含一层意思,即全应用的覆盖。一个银行会有很多大大小小的应用,有些是重要业务,有些是相对不重要的。比如内部管理、人力资源管理或者纯粹的工资管理软件等,重要性就相对低一些。而原则上,双活需要覆盖到所有重要应用,比如监管单位和银行的接口,是属于重要的,就应该实现覆盖。阜新银行的双活灾备中心目前的覆盖率为70%,今后也会逐步实现全应用的覆盖。

  经验可借鉴

  阜新银行的实践过程也为其他中小银行提供了一个活生生的可借鉴案例。从目标的制定上看,阜新银行与其他银行相比有着理念上的不同。首先,阜新银行没有把灾备当成摆设;其次,既然上马了双活系统,就努力做到能让银行借助双活系统实现整个业务的全覆盖。

  阜新银行IT项目负责人介绍称,当初在构建双活中心的时候,阜新银行会提出一些技术层面上的指标,比如够不够弹性、是否支持扩展等,这些细化的指标相比其他银行提出的类似“云计算”之类的需求要更切合实际。“云的核心技术是虚拟化,而虚拟化最重要的一个特点就是具有弹性,也即按需分配。采用高度虚拟化的IBM小型机和存储的弹性的架构不但能帮助银行实现业务的快速发展,还能在新需求出现的时候实现快速响应。”阜新银行IT项目负责人说。

  同时,阜新银行也为建设双活灾备中心提出了很多创新的方案,比如把POC测试场景的数量扩充一倍、将同城灾备测试场景的风险系数进行量化等。虽然阜新银行双活灾备中心这个项目是以IBM为主的几家公司联合实施的,但作为整体的把关者,阜新银行制定了项目的每一步架构的规划、方案实施的流程、质量标准制定等。

  链接 阜新银行双活中心建设背景

  阜新银行是在阜新城市信用社基础上组建的城市商业银行。1994年12月,阜新市政府整合25家分散的信用社,组建城市信用社中心社;1997年6月,更名为阜新市城市信用联合社;2001年8月,组建为阜新市商业银行股份有限公司;2009年12月3日,中国银监会正式批准阜新市商业银行更名为“阜新银行”,这标志着该行正式步入区域性股份制商业银行行列。阜新银行于2013年5月开始构思同城灾备中心建设。通过对双活中心和冷备中心二者优劣势的论证,认为双活中心更适合自己业务发展。2013年7月,阜新银行双活中心开始立项招标,8月份完成招标并开始实施。经过POC测试、现场实施后,2014年11月,阜新银行双活中心正式上线。

  本报记者 于杰

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: