使用云备份取代磁带的隐性挑战

  • 来源:计算机世界
  • 关键字:云备份,磁带
  • 发布时间:2014-02-25 14:34

  IT专业人员对磁带绝对是爱恨交加,这不是什么秘密。但是情况在发生变化!对于本地磁盘备份自身无法解决的问题,云存储提供商拥有的高度冗余、不断维护的磁盘库,肯定能解决问题!

  虽然云在一些应用场合绝对取代得了磁带,但它无法始终满足每个人的需要,这也是磁带的日子为何仍过得有滋有润的主要原因。

  然而,如果你忍不住想丢弃磁带,改到云端,将备份由他人操心,那你不用苦恼,情况绝对在改善——特别是你只处理数量比较少的数据,能应对漫长的恢复时间,或者有大量闲置带宽的情况下。

  为了了解与磁带和其他各种内部备份相比,云适合什么、不适合什么,不妨先深入探究一下。本文给出的两个例子将表明问题和决策并不如你想象的或希望的那么简单。

  磁带备份场景

  A公司是一家小型会计师事务所,拥有几台虚拟服务器,完整备份大概需要500GB (增量备份大概需要50GB)。现在它使用老一代的LTO-4驱动器进行备份,互联网连接是速率为5Mbps的铜质线路,但考虑到该公司处于市中心,它拥有想象得到的几乎任何连接方案。

  B公司是一家制造公司,拥有约35台虚拟服务器,完整备份大概需要8TB(增量备份大概需要800GB)。现在它结合使用磁盘到磁盘备份和最新一代的LTO-6自动加载机,用于备份数据。互联网连接是速率为20Mbps的铜质线路,这是它希望在乡村地区获得的最佳连接方案。

  为了力求简单,两家公司都使用了Veeam Backup and Replication的虚拟备份软件,可将生产型机器预先经过压缩和重复数据删除处理的映像转储到本地磁盘上,然后在本地磁盘处备份起来。(在进行这番比较时没有计入虚拟备份软件和本地磁盘的成本,因为内部备份方案和云备份方案都需要这块成本)。此外,这两家公司还都面临一个棘手的业务要求:数据在异地至少备份一年。会计师事务所是国税局要求这种离线备份,而制造公司则是与一家要求异地备份的《财富》100强公司签有国防合同。

  首先来比较成本。A公司在LTO-4驱动器方面的开支约1600美元,构成每年GFS介质轮换体系的30只磁带每只另花费30美元。一名办公室经理每星期花大概两个小时确保磁带已换好,成本约为每小时15美元;每过个把月总会出问题(通常是他忘了换磁带所引起的),就要请外包的IT人员远程解决问题,费用达90美元。这种方案的总成本是每年约4000美元,显然人力成本占了大头。

  B公司在16插槽LTO-6自动加载机方面的开支约4000美元,构成GFS介质轮换体系的90只磁带每只另花费105美元。一名专职服务器管理员每星期花4小时维护备份,每小时成本约30美元,她很少需要外界的帮助来确保系统正常运行。假设自动加载机用了三年后需要更换,这种方案每年的成本约17000美元。这回,硬件占了成本的大头(具体是存储介质),但人力成本仍占总成本的三分之一多。

  其次是冗余。严格地说,A公司或B公司在冗余方面都做得不够。备份内容先写入到磁盘,然后复制到磁带上,那样每个备份至少有两个副本,但除此之外没有太多的冗余机制。要是基于本地磁盘的副本被覆盖(一般不超过一星期)后,某只存档磁带遭到了破坏,备份内容就没有备份可言。对不信任磁带的人来说,这种风险很吓人,于是要求磁带介质有副本,但这必然会大幅抬高成本。

  再来比较备份速度。A公司和B公司似乎都受制于各自一代LTO驱动器的性能。然而事实上,限制因素通常是源存储,而不是磁带驱动器。要说磁带驱动器在哪一个方面尤为擅长,那就是全速存储大量的顺序数据(LTO-4的速度为120MBps,LTO-6的速度为160MBps),当源存储的速度不够快,跟不上驱动器的速度时,磁带驱动器就表现不佳,有时就会导致效率低下的缓冲区欠载(buffer underrun),以及当缓冲区被重新填充时试图继续接着运行。

  为了方便比较,这两家公司的吞吐量都大大高于单一1Gbps以太网链路的实际吞吐量(大约110MBps),也高于7200转速磁盘组成的小型阵列的持续读取性能,这类磁盘通常中间存储目标用于备份(速度可能在70Mbps到100Mbps)。

  假设该中间磁盘目标是A公司真正的瓶颈,完整备份可能需要约两小时。考虑到B公司的存储需求大得多,可以假设它会部署性能更好的中间存储系统,可以全速运行磁带驱动器,那样完整备份可能需要约15个小时(如果换备份介质,时间更长)。

  最后是恢复速度。假设你有本地中间磁盘备份副本,想要的数据又实际上包含在该副本中,恢复几乎立即进行。然而,如果你的本地副本已被破坏(可能由于整个站点遭到灾难),或者需要的数据比本地副本中所含的数据更久远,那就只好回过头去找磁带。

  找磁带则需要从异地保管库取回磁带;如果站点果真遭到了破坏,要找到能读取介质的磁带驱动器。根据情况严重程度,这个过程可能短则几小时,长则几天,加上恢复的实际时间通常与备份时间相似。

  假设磁带妥善存储在另外某个地方,而且两个小时内可以获取,那么A公司的完全恢复最少需要六个小时,B公司最少需要近一天。

  云端备份场景

  现在不妨比较这两家公司备份到云端时面临的备份现状。

  A公司决定将备份移到亚马逊网站大受欢迎的S3云存储平台用于主备份,并使用亚马逊的低成本Glacier用于存档备份。现在,A公司无须弄清楚驱动器和介质可能多贵,只要弄清楚要耗用多少存储空间,如何将数据上传到云端。虽然磁带模式并不适用于云,但解决这个问题的办法是,每星期将完全备份传送到云端,然后将每天的增量备份传送到云端。之后,每月将该备份的存档副本传送到Glacier,不需要进行另外的备份。

  该公司需要大约800GB的存储空间来存储一星期的完全备份,外加六天的增量备份。这要为S3中的800GB活动备份每月支付约76美元(每年912美元),还要为复制到Glacier的9.38TB备份每月支付约96美元(每年1152美元)。假设软件运行正常,没人需要维护,这种方案的成本大概只有磁带方案的一半。

  但等一下,需要考虑的不仅仅是存储。该公司还要考虑数据如何传送到云端。假设独家享用速率为5Mbps的互联网连接,将500GB的完全备份上传到云端需要近9天。这显然行不通。速率为100Mbps的连接只要11个小时多点的时间就能传完,但成本不菲:5Mbps的连接每月可能成本不到200美元,而100Mbps的光纤连接成本每月大约高达1000美元。光这一项就要增加9000美元,因而每年的总成本达到11000美元。

  对B公司来说情况更糟糕。就S3中的12.69TB和Glacier中的152.25TB而言,存储成本每年将近15万美元。而将这些数据传送到云备份环境,又需要多少成本?成本为零,因为这无法完成,由于位于乡村地区,B公司只能享用20Mbps的连接,而通过20Mbps的连接传送每周8TB的完全备份需要的时间将远远超过一个月。

  如何看待云备份

  当然,这不是说云存储对上面提到的这两家公司绝对没用。问题是,传统的内部备份和云备份全然不同,所以将传统的备份方案转为云方案会有三个问题。

  一个问题是,云环境下介质成本显然大幅上升。一盒LTO-6磁带每GB的成本约4美分,可以将这些数据存储数个月,不用再花一分钱。相比之下,S3每月每GB成本为9.5美分(每年每GB 1.14美元),Glacier倒是便宜很多,每月每GB仅为1美分(每年每GB 12美分)。

  第二个问题是,目前可用来将内部数据复制到云端的手段远远谈不上最佳。

  第三个也是最关键的问题是,上述两家公司需要针对所有数据实行不同种类的存档备份规则。在B公司的8TB备份中,可能只有一小部分数据是该公司的用户真正致力于确保有可靠存档备份的。从备份集中挑选出这部分特定的数据,并进行文件层备份,其实很容易。

  但这就带来了新问题:能不能将磁带备份换成云备份?令人满意的答案是,那得看情况。这取决于你是否有经常变化的大量数据,它会增加每次需要传送的数据量,大到一定程度后可能造成对现有的互联网连接而言成本过高或不现实;此外,这还取决于你备份什么内容、如何管理内容。

  总之,如果你想使用云备份,先要彻底考虑清楚所有这些问题,看看云备份是否可行,然后再看看其成本是否合理。到时你可能会发现,磁带还是更合适的方案。

  编译 清水

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: