RAID存储环境中的分层存储

  • 来源:中国计算机报
  • 关键字:SSD,RAID,分层存储,SAS磁盘
  • 发布时间:2011-09-09 15:36
  随着固态磁盘(SSD)技术的问世,高速易失性存储器的成本不断走低,一个存储系统中可能同时包括高性能的SSD、低成本的SATA磁盘和可靠性好的SAS磁盘。

  这些新型存储技术的集成与优化管理对用户来说是一个严峻的挑战。解决这一难题的最有效的方法是将用户经常访问的热数据(HotData)放在低延迟、高速度的存储介质上,而将极少被访问的数据放在高延迟、低成本的存储介质上,也就是所谓的分层存储。

  正因为有如此多样化的存储介质,IT存储专家才有机会创造性地根据存储介质性价比和容量的不同来确定用户数据最理想的存放地。本文将深入探讨分层存储如何在混合存储环境中大幅提升存储的性能和可靠性,以及如何增强主机操作系统的缓存性能并降低成本。

  更多的选择更强的控制力

  当今,服务器可以实现多种不同的功能,而服务器上的每种应用也有其特定的工作负载特性。服务器对性能的需求主要取决于其负载情况以及对QoS(服务质量)的要求。虽然与以前相比,存储解决方案的种类更丰富了,并可实现更完善的定制化,但同时也会增加存储的复杂性,使得存储性能和容量规划的工作难度逐渐增大。用户进行性能和容量规划时,需要了解应用的I/O特性、容量和性能的增长要求、磁盘和存储的性能特点、数据保护需求以及企业的预算。

  存储控制器可以提供丰富的选项,比如新型复合RAID类型,具有高级特性和高级缓存的选项以及可满足各种预算要求的多种硬件减负方式。如今,先进的嵌入式处理器的使用让智能存储控制器具有更丰富的功能,并可实现功能扩展。

  磁盘技术的不断发展促进了存储解决方案的优化。用户可以根据自己对成本和性能的需要,合理利用不同的磁盘技术创建定制化的存储后台。SATA技术能够普及的主要原因是,它具有很低的单位容量成本,但是从性能的角度看,SATA的总体性能是最低的。SAS磁盘虽然具有更高的性能和可靠性,但是成本也更高。还有一种新的选择就是SSD技术,它可以同时支持SATA和SAS接口。SSD能够提供比旋转介质高得多的随机性能,但其价格也更高。

  多种磁盘技术共存增加了用户选择存储解决方案的难度,而让这种选择变得更加复杂的是各种RAID类型的性能不同。用户要优化工作负载,就必须了解特定的I/O性能,还要清楚如何根据可用性的需求来选择最理想的RAID类型。

  用户可以清楚地看到,某些磁盘类型可能更适合某类特定的应用。SSD的平均成本比15KRPM的6GbSAS驱动器高6.5倍,但SSD并不是在所有的应用中都能够实现比SAS高6.5倍的实际性能的提升。

  很多用户会问相同的问题:“若想达到和高性能SSD相同的性能,需要多少块旋转式的传统磁盘呢?”要想准确地回答这个问题,确实需要一番思考。不过在实际应用中,很可能只有一部分实际存储容量会在任意给定时间点被访问。在过去几十年中,许多缓存架构都是根据上述假设被成功设计出来的。有些用户仍会问:“能不能使用价格不同、性能特点各异的不同存储介质构建统一的存储平台呢?”

  难度开始加大

  众多存储厂商已经认识到,随着非统一介质架构的普及,分层存储可能是一种两全其美的解决方案。分层存储的概念很简单,就是把最常使用的数据放在速度最快的存储介质上,将冷数据(ColdData)放在速度较慢的存储介质上。分层存储和缓存之间的差异在于,在分层存储架构中,所有参与存储的逻辑磁盘的容量都可用于存储用户的数据。分层存储并不是一个全新的概念。具有颠覆性的SSD技术的出现为分层存储的发展带来了新的机遇。

  下面,我们将介绍一个分层存储在数据库环境中发挥作用的例子。

  如图1所示,ACME公司正在设计一种新型的SQL服务器。根据过去的经验,ACME得到下列信息:存储总容量为4TB,其中3%的容量为常用存储(大约125GB),在65%的时间里被访问;6%的容量为间歇存储(大约250GB),在25%的时间里被访问;余下的容量用于存储冷数据,在10%的时间里被访问。

  针对此情况,理想的成本敏感型解决方案应该使用4TB存储容量创建一个逻辑设备,并依据每秒I/O次数和响应时间的需求为每个层级的数据提供必要的性能。

  接下来,让我们看看采用同类磁盘替代方案的结果。

  以下是四种存储基础架构的简单比较,如表1所示。

  很明显,分层存储方案每次进行数据库事务处理时的成本更低,其性能约是纯SATA解决方案性能的6倍,约是纯SAS解决方案性能的3倍,同时其容量也是最大的。

  用户在选择存储解决方案时需要综合考虑性价比、容量和占地空间等因素。

  分层存储的支持和反对意见

  分层存储是一种比较理想的解决方案,它通过采用多种类型的存储介质,使得存储系统的成本和性能都得到优化,而且可以显著节省设备所需的占地空间。

  智能化分层存储可以提供动态调配环境,并可自动地将被经常访问的数据放置在速度最快的存储介质上,甚至可以将最关键的数据放置在具有高可用性的卷上,或者将远程站点访问的数据复制到本地的存储设备上。

  尽管分层存储具有多种优势,但它还是存在一些值得注意的缺陷。比如,虽然识别和适当存储常用数据的工作是由系统自动完成的,但是构建能够满足当前和未来要求的合适的存储子系统仍然需要由存储专业人员来完成。另一个潜在的缺点是,在分层存储模式下,虽然逻辑卷是以单个磁盘的形式出现的,但是该卷仍可能被分散到多个物理磁盘组上,容易出现数据丢失的情况。不过,用户可以通过使用硬件RAID来进行保护,以降低数据丢失的可能性。

  我们身处数据爆炸的时代,行业用户对存储容量的需求不断增长。磁盘种类较以往更加丰富,数据业务处理要求存储系统具有更高的性能,数据资产要求更全面的保护。分层存储可以让行业用户在单一存储解决方案中充分发挥SATA存储的低成本优势、企业级SAS的安全性和可靠性优势以及SSD的高性能优势。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: