数据中心迁移浅析

  • 来源:网络空间安全
  • 关键字:数据中心迁移,信息系统,虚拟机
  • 发布时间:2019-07-07 22:29

  摘 要:论文以信息系统数据中心迁移为研究对象,介绍企业数据中心迁移中可能存在的需求,综合考虑系统迁移中的各类因素,从而选择低实施风险、低资源投入、少业务影响的数据中心迁移方法。

  关键词:数据中心迁移;信息系统;数据库;虚拟机

  中图分类号:TP391 文献标识码:B

  Abstract: This paper takes the data center migration of information system as the research object, introduces the possible requirements in the data center migration of enterprises, and comprehensively considers all kinds of factors in the system migration, so as to select the data center migration method with low implementation risk, low resource investment and little business impact.

  Key words: data center migration; information system; database; virtual machine

  1 引言

  伴随着IT技术的发展和组织对信息系统依赖程度的提高,单位的信息化建設高速推进,由此产生了较多问题:原有机房空间、电力、制冷等基础环境不能满足法则要求;信息系统分布在多个数据中心不便于管理,且发展受限;受限于早期技术和对信息化认知,信息化规划有一定局限性,使得信息系统运维和运营难度提升;随着单位自身的发展,办公场地的搬迁要求数据中心随之迁移。

  由于上述诸如此类的原因,一些单位产生了数据中心迁移需求。随着各种技术在数据中心迁移中被应用和迁移经验的积累,数据中心迁移从最初的纯物理迁移发展到逻辑迁移,数据中心迁移方案趋于多样化,数据中心迁移也不再是为迁移而迁移,迁移过程使得以前不可能实现或较难实现的变革变得简单,如数据中心重新规划、系统架构调整、网络结构调整、系统优化等。

  2 数据中心迁移需求分析

  由于各单位的IT现状不同,搬迁过程中的需求也不尽相同,在数据中心迁移项目中,大致会有几项需求。

  2.1 数据安全要求

  保护数据安全是所有数据中心迁移项目的最基本要求。迁移项目中,数据丢失风险可能来自两个层面:物理损坏和逻辑破坏。物理损坏一般由磁盘损坏造成,而迁移过程中的误操作、数据复制中的软件或网络原因等则可能造成逻辑损坏。

  因此在迁移实施前,必须做好数据备份工作,并且所采用的备份方式必须能够应对物理和逻辑两个层面的破坏。为确保备份数据的可用性和有效性,需要对备份数据进行数据恢复测试工作。

  为完成数据备份和恢复测试,需要备份系统和恢复测试环境。备份系统一般包括备份服务器、备份介质、备份工具。恢复测试环境可以采用低配设备,如本地硬盘、性能满足最低要求的软件等。

  2.2 业务连续性要求

  满足单位业务连续性要求是数据中心迁移项目的基本要求之一。如果迁移涉及设备量大、系统复杂,且允许的停机时间窗口不足以完成所有系统一次性迁移,则需要分批次迁移,且控制每批次的迁移量,使得每批次的停机时间窗口满足单位的业务连续性要求。

  2.3 多个数据中心搬迁到一个数据中心

  由于各种原因,单位的数据中心可能分布在多个机房,也可能有多个通过数据中心迁移项目,将部署在多个机房或数据中心的系统迁移到一个数据中心,迁移过程中实现网络、系统的整合。

  2.4 搬迁后网络调整需求

  数据中心迁移项目中IP地址变更是较为常见的需求。由于早期数据中心建设时的局限性,以及后续的快速发展,普遍造成数据中心IP使用无序、不规范,利用数据中心迁移机会,使得重新规划IP地址成为可能,特别是目标机房重新部署系统,可以从容排除IP变更后的任何隐患。

  如果采用逻辑迁移,且目标数据中心新建主干网络,一般目标机房的网络架构将会重新规划部署,使用更趋合理、优化。

  2.5 系统调整需求

  目标数据中心应用系统重新部署的迁移项目,可能会产生各种系统调整、优化需求。比如系统架构调整:单节点系统变更为多节点系统、部署在同一设备的数据库和应用拆分到不同设备、共用服务器的应用拆分;比如存储调整:SAN网络优化整合、存储扩容、Raid重构等;比如统一版本基线:硬件固件版本、操作系统版本、数据库软件版本、应用软件版本等。

  2.6 技术文档梳理完善需求

  单位在信息化建设过程中,随时都有技术人员流失的可能,不可避免地会造成技术文档的缺失。通过数据中心迁移,特别是目标数据中心重新部署系统是一个重新梳理、检验、完善文档的过程。

  3 数据中心迁移方法

  数据中心迁移采用的方法有物理搬迁和逻辑迁移。所谓物理搬迁,就是将承载业务系统的设备从源机房搬运到目标机房恢复业务;所谓逻辑迁移,就是在目标机房部署相应的设备,将源机房的系统采用迁移、复制、部署后切换等方法迁移到目标机房。

  纯物理搬迁一般适用于设备量较少、应用比较简单的数据中心,可以在一个时间窗口内一次性完成整个数据中心迁移。通常的物理搬迁用于非关键系统的迁移。

  逻辑迁移过程中经常会采用一种或多种方法来达成目标,这种方法包括基于数据库的复制技术、基于存储的复制技术、基于虚拟化的虚拟机迁移技术等。除此之外,数据中心迁移中还经常采用类似于用于容灾的主备系统切换。

  3.1 基于数据库的数据复制

  基于数据库的数据复制只针对数据库数据,常用的数据库软件如Oracle、DB2、SQLServer等都可以通过数据库软件自带的或其他软件进行数据复制。在此以Oracle数据库为例介绍。

  3.1.1 实现数据库复制需要具备的软硬件条件

  服务器:目标机房需要用于部署数据库的服务器,服务器性能与源数据中心服务器性能相当。

  磁盘阵列存储设备:一般配置的磁盘阵列的可使用空间高于源数据中心数据库数据量,因为在迁移过程中,除部署数据库外,经常需要存放其他数据。

  光纤交换机:建议采用双机架构部署,每台光纤交换机端口配置数量按照需要接入的服务器计算。

  以太网交换机:如果是集群数据库,可能需要心跳网络,如条件允许,建议心跳网络和业务网络使用不同交换机,或采用逻辑隔离,交换机端口数量按照需要接入的服务器端口计算。

  基于数据库的复制软件较多,视具体情况,部分软件需要购买软件许可。以Oracle数据库为例,基于Oracle数据库的数据复制技术大体上可分为两类:Oracle自己提供的数据同步技术和第三方厂商提供的数据同步技术。Oracle自己的同步技术有DataGuard、Streams、Advanced Replication和GoldenGate的数据同步软件。第三方厂商的数据同步技术有Quest公司的SharePlex和DSG的RealSync。其中,Oracle的DataGuard是免费软件,其它都是付费软件。

  3.1.2 源数据中心和目标数据中心之间专线网络需求

  除第一次创建目标数据中心数据库时数据量较大外,在后续数据复制时只需传送日志,普通专线即可满足。数据复制分为实时同步和定时同步,所需专线带宽可根据所产生的日志量决定。

  3.1.3 基于数据库复制的特点

  目标数据中心数据库可以以打开方式存在,在数据复制过程中可以检查数据库数据,减少系统迁移窗口内的数据检查时间。

  如采用一些付费软件,可以在不同数据库软件、不同版本间复制数据,可在迁移期间实现软件基线统一。

  部分复制软件支持一对多、多对一、双向复制等,也可以选择部分对象进行复制,可满足数据分发和数据集成的需要,在迁移期间可同时实现数据库架构调整。

  3.2 基于存储的数据复制

  基于存储的数据复制是一种最常见也是最昂贵的一种方式,可以实现同步或异步的数据复制,同时不消耗主机资源。一般情况下这种复制方式不适于窄带的环境,同步方式也不适于远距离的复制。

  3.2.1 基于存储的数据复制需要具备的软硬件条件

  磁盘阵列存储设备:要求与源数据中心同品牌、性能相当的存储设备,所需存储容量按照源数据中心需要复制的数据所使用的存储卷空间计算。

  服务器:目标数据中心可以配置服务器。

  光纤交换机:目标数据中心在不配置服务器的情况下,可不用光纤交换机,否则,光纤交换机端口按接入设备计算。

  波分设备:如采用同步方式,需要波分设备。

  复制软件:与存储同一厂商软件,需要购买软件许可。

  3.2.2 源数据中心和目标数据中心之间专线网络需求

  如果采用同步数据复制方式,在两个数据中心间需要裸光纤连接,并且需要配置远距离单模光纤模块或波分设备,如果需要多个光纤通道,建议配置波分设备。

  如果采用异步数据复制方式,可以按照数据增量配置普通专线。

  3.2.3 基于存储复制的特点

  以卷为单位,可以按需进行复制。

  可以用于虚拟机、数据库数据、文件等数据復制。

  基于存储的数据复制保证其数据一致性和可靠性。

  数据复制过程中不能对数据进行读写操作,如果在正式迁移前需要利用复制数据来做测试工作,需要断开数据复制。

  同步方式复制一般在同城数据中心实现,且目标机房和源机房光纤距离建议不超过30公里。

  3.3 虚拟机迁移

  目前使用的虚拟化软件较多,在此以VMWare虚拟化软件为例来介绍。

  首先需要在目标数据中心搭建一个虚拟化平台,同时在目标数据中心部署用于虚拟化平台的X86服务器。虚拟化平台的资源和服务能力需要根据迁移实施的业务系统数量进行详细计算。

  3.3.1 在目标数据中心搭建虚拟化平台需要的设备

  服务器:如果需要在线迁移,应选用硬件兼容设备,设备性能数量如能配置与源数据中心相当则最好。如不具备条件,可暂时配置一定数量设备,可逐批次迁移虚拟机,源机房服务器上虚拟机清空后可搬迁到目标数据中心使用,这样做的优点是投入成本较少,缺点是每批次迁移虚拟机受限,划分迁移批次受限。

  以太网交换机:建议采用双机架构部署,每台交换机端口数量需要满足资源池内所有服务器的接入需要,即按每台服务器的一半端口计算。

  磁盘阵列存储设备:需要首先确定采用什么RAID技术。然后再根据部署的应用系统数量、存储空间计算。如果为新部署服务器,本地硬盘至少需按100GB计算;如果是P2V迁移服务器需要按原有物理服务器硬盘计算,另外还需考虑预留平台管理使用空间。

  光纤交换机:建议采用双机架构部署,每台光纤交换机端口配置数量应不少于资源池内服务器数量。

  如果还有部分采用物理服务器部署的DB数据库服务器,则需要统一考虑其网络、存储等资源。

  3.3.2 虚拟化平台间专线网络需求

  为了满足从原有虚拟化平台迁移到目标数据中心虚拟化平台,实现业务系统的在线迁移割接或者业务系统的安全应急保障。需要在两个数据中心打通以太网专线网络和存储专线网络。

  两个数据中心的以太网专线和存储网络专线不是必要条件,用户可根据实际情况进行网络专线的申请。

  3.3.3 虚拟机迁移特点

  虚拟化因成本低廉、灵活高效、节能环保、管理便捷等诸多优势,正在被众多企业所推崇和应用。在未来的企业IT部署中,虚拟化必将在服务器、存储、网络、应用、数据中心、灾难恢复等诸多领域广泛普及,并发挥重大作用。

  VMWare虚拟化迁移方案,可以帮助用户在不影响生产主机的情况下,完成生产主机到虚拟主机的复制迁移,然后在很短的时间内(计划时间内),就可以将业务系统切换到虚拟主机上。该方案可以帮助用户快速高效地部署实现虚拟化的数据中心和站点迁移。同时,可以对虚拟机和基于虚拟机的业务系统,提供数据和业务连续性的保护。

  3.4 系统切换

  系统切换经常发生在数据中心容灾中,将运行在生产数据中心系统的业务切换到灾备数据中心的系统中。如果把目标数据中心看作灾备中心,采用系统切换的方式进行数据中心迁移则是一次单向的主备切换,即按生产系统在灾备中心部署应用系统,通过测试后,在计划的时间窗口内将业务切换到灾备中心应用系统。

  系统切换可以用于某些特定系统,比如核心业务系统、除核心外的关键业务系统,一般这种系统业务连续性要求较高,停机时间短,通过系统切换可以快速完成迁移。

  当然,如果条件满足,所有系统都能实现系统切换则是最理想的方法。比如数据中心迁移的目标机房是灾备机房,且灾备机房具备满足生产系统的网络环境,有一定数量和性能的服务器,通过分批次利旧设备的方式完成数据中心迁移。

  3.4.1 目标数据中心需要具备的环境和设备

  网络环境:具备完整的、满足部署生产环境的网络环境。

  服务器:根据批次划分,至少拥有承载最大批次系统的服务器数量,且性能满足系统需求,当然最好拥有1:1的数量和性能的服务器。

  磁盘阵列存储设备:根据所选用的数据迁移技术确定设备品牌和相关需求。

  光纤交换机:建议采用双机架构部署,每台光纤交换机端口配置数量按照需要接入的服务器计算。

  3.4.2 主备数据中心间专线网络需求

  一般需要用于传送同步数据和业务数据、以及远程切换或维护操作的网络,用于同步数据的网络带宽根据选用的数据复制技术决定;用于传送业务数据的带宽根据数据中心迁移期间两个数据中心系统互访的数据量峰值决定;远程切换或维护操作所使用网络带宽要求不高,可与业务网络公用。

  3.4.3 系统切换迁移特点

  系统切换相对快,需要的停机时间短。

  目标数据中心部署相同系统,在系统切换前可以进行充分的测试,迁移成功率高。

  在迁移过程中源数据中心系统保留,一旦迁移失败或迁移后目标数据中心系统故障,可以快速回退。

  目标数据中心的网络环境、应用系统重新部署后可以充分测试,使得平时一些不能实施调整、优化的工作成为可能。

  对系统部署的实施能力要求较高,包括厂商支持、实施文档的质量、部署工程师的技术能力等。同时,通过部署期间对文档的整理、完善,将明显提高后期的系统维护能力。

  如果源数据中心和目标数据中心间能够二层网络互通,则系统切换可以灵活进行,批次划分简单,否则必须整网段迁移或迁移后的系统变更IP所在的网段。

  4 数据中心迁移方法选择

  4.1 决定迁移方法选择的因素

  选择适用的迁移方法,是项目成功的关键,影响迁移方法选择的主要因素,包括项目资源投入、业务连续性要求、实施风险、迁移涉及数据量、新旧数据中心距离、项目工期要求等。

  4.1.1 资源投入

  資源包括项目投入资金、可用设备、人力资源等。如果投入资金有限,且无其它可用设备,则只能考虑物理搬迁;如能购置适量设备或有适量利旧设备,则可考虑核心系统逻辑迁移,其它系统物理搬迁,或分批次逻辑迁移;如有足够资金或设备,则可考虑完全采用逻辑迁移。人力资源包括迁移实施人员、应用厂商支持人员、配合迁移和测试的业务人员。

  相对来说,纯物理搬迁需要投入的资源最少,而搭建1:1系统进行迁移所需投入资源最多。

  4.1.2 业务连续性要求

  即便在同一个迁移项目中,不同的系统业务连续性要求也会不同,针对业务连续性要求不同的系统,可以采用不同的迁移方法。对于业务连续性要求高的,应选用快速迁移的方法。比如停机时间2小时的系统,一般来说只能采用系统切换的方法,并且数据复制应采用同步方式。

  相对来说,纯物理搬迁需要较长的停机时间窗口,而搭建1:1系统进行迁移所需停机时间较短。

  4.1.3 实施风险

  实施风险来自设备故障风险、设备故障导致的系统和数据破坏风险、迁移失败等。

  相对来说,纯物理搬迁由于设备故障带来的风险较高,且回退困难,而搭建1:1系统如果迁移失败,可以快速回退,也不受设备故障影响,风险较小。

  4.1.4 数据量

  数据量包括数据总量和数据增量。如果数据量在GB级别的,则对迁移方法的选择几乎无影响。但如果数据量巨大,如几十TB,且数据增量较大,则需要选用合适的迁移方法和带宽,如存储复制、波分链路或裸光纤。

  相对来说,纯物理搬迁节约了大量的数据复制时间和设备投入,但一出现数据丢失则需要花费大量时间进行数据恢复。而采用数据复制技术,需要用较长时间实施数据复制,但可避免设备故障带来的数据丢失风险。

  4.1.5 新旧数据中心距离

  如果是不同城市迁移数据中心,且对业务连续性要求较高,则不适用物理搬迁。实际中,对于生产系统,也是较多采用在目标数据中心重新部署后切换的方法。

  4.1.6 項目工期要求

  相对物理搬迁来说,采用逻辑迁移,从项目调研、系统搭建、数据复制实施、系统测试等环节都需要花费大量时间,项目工期相对较长。

  4.2 迁移方法的选择

  首先确定哪个因素是最需要优先考虑的,如果希望尽可能降低风险和迁移造成对业务的影响,最好的方法就是目标数据中心搭建1:1的系统进行切换,但这样势必需要大量的资源投入;如果受限于资源投入,可以考虑核心系统进行逻辑迁移,其他系统进行物理搬迁;如果还是超出预算,可以考虑核心数据进行逻辑迁移,其他进行物理搬迁;如果还是超出预算,只能纯物理搬迁了。

  某汽车制造企业,系统硬件设备分别部署在3个机房,不利于统一管理。新数据中心作为未来集团级数据中心正式投入使用,具备同时承载以上机房所有设备能力,因此,需将3个机房的设备及系统迁移至新数据中心。项目项目涉及600台设备,206套应用系统,从3个机房整体迁移到新机房,迁移过程需要修改系统IP地址。由于没有新购设备预算,该项目采用物理搬迁,分4个批次完成搬迁,每个批次安排在周末48小时内完成,搬迁窗口内需要中断业务,项目工期5个月。这个项目企业主要考虑投入成本采用了物理搬迁方法。

  某央企,新建机房投入使用,原机房租期即将到期,需要将数据中心整体迁移到同城新机房。项目涉及157个业务系统,50多个测试系统,涉及服务器、存储、网络、安全等设备636台,虚拟机736个,数据量约160TB。部分核心系统要求2个小时内完成迁移恢复业务,其他核心系统要求8小时内完成迁移。新机房内核心网络新购设备搭建,新购100TB容量的磁盘阵列作为新核心存储,新购少量高配置PC服务器。最终采用了逻辑迁移和物理搬迁的方法完成迁移,用新购服务器在新机房搭建虚拟化平台,两个数据中心二层网络互通,采用腾挪方法,迁移一部分搬迁一部分,迁移大部分应用服务器,只有少量应用服务器采用物理搬迁。数据采用2个机房核心存储配置数据复制进行迁移,其他存储数据通过核心存储迁移。数据库服务器部署在冗余的IBM小型机,采用先搬迁一半恢复业务再搬迁另一半的方法,迁移过程满足企业务连续性要求,项目工期6个月。这个项目企业较为重视业务连续性要求,大部分采用了逻辑迁移,有冗余设备部分采用物理搬迁的方法。

  总之,综合多种因素,选择适合单位自身需要的迁移方法就是最好的方法。

  5 结束语

  本文介绍了对于数据中心迁移中的数据安全、业务连续、网络及系统的整合等需求,提出多种的迁移方式及迁移方法,并综合考虑数据中心迁移的资源投入、业务要求、实施风险、数据中心距离、项目工期等因素,为选择适合数据中心迁移的方法提出科学合理的建议,希望能为有关数据中心迁移提供参考。

  参考文献

  [1] 曲波, 邓旭东, 姜锋. Oracle GoldenGate数据同步机制研究与应用[J]. 微型电脑应用, 2014(6):55-58.

  [2] 赵根, 颜英, 王彦集. 数据大集中管理模式下数据同步技术探讨[J]. 信息与电脑(理论版), 2012(6):96-97.

  [3] 李正忠. 虚拟化在企业IT架构中的价值与应用[J]. 信息安全与技术, 2013, 4(2):69-70.

  [4] 赵颖, 蒋荟. 基于数据同步技术的5T系统架构优化方案研究[J]. 铁路计算机应用, 2016, 25(6):9-12.

  [5] 谈永奇. Oracle中两种数据同步技术的性能测试与评价[J]. 中国数字医学, 2011, 06(2):62-64.

  作者简介:

  张黎明(1977-),女,汉族,北京人,英国伯明翰大学,硕士,国家能源集团神华信息技术有限公司,工程师;主要研究方向和关注领域:IT系统的安全及运行维护。

关注读览天下微信, 100万篇深度好文, 等你来看……