教你实施云存储
- 来源:计算机世界 smarty:if $article.tag?>
- 关键字:实施,存储,云 smarty:/if?>
- 发布时间:2010-05-12 17:14
随着云的兴起,作为云架构中数据的存储体,云存储也成为备受关注的领域。根据IDC的数据,到2013年,云存储服务的增长率预计将超过所有其他IT云服务。在未来四年内,云服务的市场规模将从现在的174亿美元增长到442亿美元,其中,云存储的市场比例将从目前的9%增长到14%,也就是说云存储的市场规模将接近62亿美元。
周健编译
在当今日益激烈的商业竞争环境下,IT专家们关于数据中心的看法比以前更加重要了。网络、存储等这些IT服务,过去在企业内部都是独立存在的。随着IT整合的不断推进,现在这些服务之间的界限越来越模糊了,而之间的合作却越来越多。IT部门在这一过程中能够节约成本,提高服务能力,可谓受益匪浅。许多企业都发现,这一切都是在朝着云的方向发展。
SAN适用于存储成本较高、且用途单一的环境。由于数据中心骨干网络通过建立一条数据传输通道来存储数据,而现在的网络速度越来越快,这给IT的整合创造了发展机遇。通过基于iSCSI或FCoE(Fibre Channel over Ethernet)的IP网络内部存储云变得越来越有吸引力。传统网络连接完全可以满足IP传输(如iSCSI、NFS或CIFS以及FCoE)的需求。
FCoE的出现是为了满足SAN向企业数据中心的拓展。许多数据中心都是用以太网来为SAN提供TCP/IP网络或光纤通道的。有了FCoE,光纤通道就成了与传统网络不同的另一种网络协议。因为FCoE直接运行于以太网络的协议栈中,而iSCSI则运行于TCP/IP。由于FCoE在IP层无法路由,也就不会工作在IP路由的网络上。
新的数据中心网络传输将包含多种协议,包括传统的TCP/IP和新的FCoE,同时继续支持外向型的网络信息和数据通信。
如果企业比较关注存储方面的预算,那么应该在考虑云之前做好相应的考察和准备。
什么是云存储
云存储是目前正在使用的各式各样的后台技术,包括可扩展的冗余服务器、控制器、存储和软件,融合在一起建立一个存储的“云”。
云存储模型是从地理上互相分离的地点建立一些磁盘池,并将这些磁盘池看做存储的逻辑分区,然后一一复制这些分区,最后通过网络上的全局命名空间安全地将这些合并的存储显示给各个用户。
这些磁盘池具有重复数据删除、精简配置、高可扩展性、数据保护和简单管理等特性。除此之外,磁盘池还应包含带宽较高的通信网络,用来保证云存储的实现。
随着数据量的几何增长,企业的IT预算不增反降,这给企业带来巨大的挑战。目前,企业均在拼命地控制数据量、减少成本。而云存储可以帮助解决这些问题。
据统计,在企业的存储环境中,有大约60%到80%的数据已经过时,这些数据都应该存储在如下所示的第3到6层存储设备中。
第一层:经营活动用,高速
第二层:经营活动用,中等速度
第三层:SAN/NAS(中、高速度)
第四层:SAN/NAS(中、低速度)
第五层:内容索引存储(CAS)
第六层:虚拟磁带库(VTL)
在大部分数据中心中,还有数量相当可观的非结构化数据和归档数据,这些数据也非常适合云存储。
内部云和外部云
云存储分为两类:内部的和外部的。外部云的特征主要是由第三方提供。内部云有很多与外部云相同的特征,但是服务是由企业自己提供的。
网络延迟是选择内部云还是外部云时必须要考虑的因素。外部云依靠互联网,主要适合第4层到第6层的数据。与其对应的是,内部云由于本地内部互联网的带宽较高,因此可以用于第3层以上的数据存储。
对于大部分IT部门来说,存储需求弹性是决定内部云存储容量的重要因素。有些厂商可能会预测未来数据量将无限增长,并推销快速扩展能力、容错能力、动态扩展以及容量增长规划等特性,这些其实都是需要慎重考虑的。云不是解决过去无限增长的灵丹妙药,而是需要有效管理的商品。
另外,在实施之前,还需要定义和理解关键性能指标。通常我们认为,不活动数据仅需要占用提供给更高层存储性能的一小部分。不过,电子发现等并行活动除外。
响应时间和终端用户的体验也应当被考虑进来。云解决方案应当能够满足一定的服务等级标准或者操作等级标准。由于数据是通过内部网传输的,现有网络承载能力和潜力也应当作为一项考虑因素,主要是因为网络延迟会带来一些麻烦的问题。想要找到最佳的云解决方案,网络的独立性、数据的重复程度、地理位置的接近程度等统统需要考虑。
任何一种新技术在管理上的简单程度和实施起来的便捷程度都很重要。因为任何企业引进新技术的任务基本上都是由现有的内部员工完成的。
企业需要确定实施云存储的人员需求和职责,以及职责和工作时间的分配。这虽然不是纯技术问题,但考虑这个问题的过程有助于提高现有员工的综合素质。
确定云存储在企业内部是否切实可行还需要严谨的思考。首先,需要对数据中心的数据进行分析,从而确定有多少数据可以转移到云。然后,确定数据如何转移到云。最初的一部分数据应该是简单的拷贝过去的;其他数据可能需要借助某些工具按照事先设定好的策略进行迁移。
另外一个重要的问题是经济方面的可行性。外部云比较适合重视成本控制和拒绝风险的企业;其他企业将在研究了外部云的成本和风险以后选择内部云。
因为外部云的本质是服务,成本与数据存储量和合同时间长短有关。而内部云几乎需要传统内部存储需要的一切成本。
特性和功能
云存储可以仅仅是存储,也可以是计算和存储的结合。在云计算领域,有很多特性和功能,服务器和存储都可以虚拟化,并使用多种不同的网络协议相连接。在纯粹一些的云存储中,存储依靠的是以太网上的HTTP(S)、CIFS/NFS、FCIP/iSCSI或者FCoE协议。在基于块的存储中也可以实施云存储,不过需要在其之上使用某种工具来提供文件系统。
预配置、自动分层、重复数据删除、自动复制以及分布式解决方案等存储特性已经开始变成主流。
实施云需要警惕以下情况:
单个文件过大;
小文件数量过多;
文件的访问频率超过了链接协议的支持范围;
扩展云供应商有时会关闭预读缓存引擎,使终端用户数据恢复很慢。
收益与担忧
云存储的好处有很多,包括能够提高存储、网络等部门之间的协作,提供存储池的自服务访问功能等。云存储可以随着策略的改变自动调整,包括快捷的预配置、反定位以及自动复制等。扩展云的主要问题有:数据的可用性、签名期限、缺乏定位控制、数据没有物理访问路线、网站新组建需要支持扩展云、对额外的带宽需求更高、对数据必须压缩和(或)加密,以及可能的法规遵从风险。
内部云可能出现的问题较少,但是用户仍然对其安全、管理、报警、更新和软硬件刷新等存在顾虑,还有就是内部云的成本也比较高。不过大部分这些顾虑在现有的存储体系下也存在,不是什么新鲜事物。
云存储能够为用户快速地提供额外的存储,而不必劳烦存储管理员。将数据从一个平台移动到另一个平台、一个站点移动到另一个站点等都是全自动的,大大减少了存储管理员的工作负担。
用户在固定层实施云存储,比如备份或者存档等,将只需要设置一下策略,现有的工具就能够自动把数据转移到云存储。有些用户使用云的目的在于随着季节性波动能够快速增加存储容量,或者需要在数据测试环境中创建一份有用数据的拷贝,这时云会根据用户设置的策略释放一些临时占位空间,并在必要的时候将这些被释放的数据备份或存档。
最后,对于自己管理云存储的用户来说,可以尝试使用一些自动创建策略的解决方案。这些方案可能包括预配置和反定位存储功能。
实施云服务的五个阶段有:
1. 集中管理IT,以实现规模经济,可视化成本构成,并有效控制IT服务量。
2. 基于关键业务需求提供标准云服务。尝试为消耗大量资源的应用程序支持提供特殊的解决方案。提高质量、减少预配置时间、降低成本和风险的关键在于一致性。标准化是成功进行整合和实现自动化的前提。
3. 虚拟化并整合物理资源。虚拟化和整合能够增加资产利用率和存储效率。任何级别的基础设施都可以实施虚拟化;统一的存储、统一的光纤、虚拟化的服务器,由于应用程序和数据均十分灵活,资产利用率得到了提高,资产寿命循环管理得到了简化。资源池使产品市场化速度更快,并大量降低成本。
4. 自动化环境。一旦云服务和云过程实现了标准化,基础设施也实现了虚拟化,自动化就可以随之而来。自动化工具能够提高数据提取能力,简化整个工作流管理,使之更有效率。
5. 自服务和API的委托控制。控制权回到企业/用户手中是云服务模型成功部署的标志。在应用程序整合和拥有自服务能力以后,应用程序管理员和拥有者可以根据需求实现存储的弹性供给,根据企业情况选择不同的性能和数据保护级别,并在应用程序出现异常时自动恢复。不过这也会大大提高对管理员反应能力的考验。要想最大化实现和利用云服务,需要整个组织的协助才能推进各个阶段的顺利进行。
……
周健编译
在当今日益激烈的商业竞争环境下,IT专家们关于数据中心的看法比以前更加重要了。网络、存储等这些IT服务,过去在企业内部都是独立存在的。随着IT整合的不断推进,现在这些服务之间的界限越来越模糊了,而之间的合作却越来越多。IT部门在这一过程中能够节约成本,提高服务能力,可谓受益匪浅。许多企业都发现,这一切都是在朝着云的方向发展。
SAN适用于存储成本较高、且用途单一的环境。由于数据中心骨干网络通过建立一条数据传输通道来存储数据,而现在的网络速度越来越快,这给IT的整合创造了发展机遇。通过基于iSCSI或FCoE(Fibre Channel over Ethernet)的IP网络内部存储云变得越来越有吸引力。传统网络连接完全可以满足IP传输(如iSCSI、NFS或CIFS以及FCoE)的需求。
FCoE的出现是为了满足SAN向企业数据中心的拓展。许多数据中心都是用以太网来为SAN提供TCP/IP网络或光纤通道的。有了FCoE,光纤通道就成了与传统网络不同的另一种网络协议。因为FCoE直接运行于以太网络的协议栈中,而iSCSI则运行于TCP/IP。由于FCoE在IP层无法路由,也就不会工作在IP路由的网络上。
新的数据中心网络传输将包含多种协议,包括传统的TCP/IP和新的FCoE,同时继续支持外向型的网络信息和数据通信。
如果企业比较关注存储方面的预算,那么应该在考虑云之前做好相应的考察和准备。
什么是云存储
云存储是目前正在使用的各式各样的后台技术,包括可扩展的冗余服务器、控制器、存储和软件,融合在一起建立一个存储的“云”。
云存储模型是从地理上互相分离的地点建立一些磁盘池,并将这些磁盘池看做存储的逻辑分区,然后一一复制这些分区,最后通过网络上的全局命名空间安全地将这些合并的存储显示给各个用户。
这些磁盘池具有重复数据删除、精简配置、高可扩展性、数据保护和简单管理等特性。除此之外,磁盘池还应包含带宽较高的通信网络,用来保证云存储的实现。
随着数据量的几何增长,企业的IT预算不增反降,这给企业带来巨大的挑战。目前,企业均在拼命地控制数据量、减少成本。而云存储可以帮助解决这些问题。
据统计,在企业的存储环境中,有大约60%到80%的数据已经过时,这些数据都应该存储在如下所示的第3到6层存储设备中。
第一层:经营活动用,高速
第二层:经营活动用,中等速度
第三层:SAN/NAS(中、高速度)
第四层:SAN/NAS(中、低速度)
第五层:内容索引存储(CAS)
第六层:虚拟磁带库(VTL)
在大部分数据中心中,还有数量相当可观的非结构化数据和归档数据,这些数据也非常适合云存储。
内部云和外部云
云存储分为两类:内部的和外部的。外部云的特征主要是由第三方提供。内部云有很多与外部云相同的特征,但是服务是由企业自己提供的。
网络延迟是选择内部云还是外部云时必须要考虑的因素。外部云依靠互联网,主要适合第4层到第6层的数据。与其对应的是,内部云由于本地内部互联网的带宽较高,因此可以用于第3层以上的数据存储。
对于大部分IT部门来说,存储需求弹性是决定内部云存储容量的重要因素。有些厂商可能会预测未来数据量将无限增长,并推销快速扩展能力、容错能力、动态扩展以及容量增长规划等特性,这些其实都是需要慎重考虑的。云不是解决过去无限增长的灵丹妙药,而是需要有效管理的商品。
另外,在实施之前,还需要定义和理解关键性能指标。通常我们认为,不活动数据仅需要占用提供给更高层存储性能的一小部分。不过,电子发现等并行活动除外。
响应时间和终端用户的体验也应当被考虑进来。云解决方案应当能够满足一定的服务等级标准或者操作等级标准。由于数据是通过内部网传输的,现有网络承载能力和潜力也应当作为一项考虑因素,主要是因为网络延迟会带来一些麻烦的问题。想要找到最佳的云解决方案,网络的独立性、数据的重复程度、地理位置的接近程度等统统需要考虑。
任何一种新技术在管理上的简单程度和实施起来的便捷程度都很重要。因为任何企业引进新技术的任务基本上都是由现有的内部员工完成的。
企业需要确定实施云存储的人员需求和职责,以及职责和工作时间的分配。这虽然不是纯技术问题,但考虑这个问题的过程有助于提高现有员工的综合素质。
确定云存储在企业内部是否切实可行还需要严谨的思考。首先,需要对数据中心的数据进行分析,从而确定有多少数据可以转移到云。然后,确定数据如何转移到云。最初的一部分数据应该是简单的拷贝过去的;其他数据可能需要借助某些工具按照事先设定好的策略进行迁移。
另外一个重要的问题是经济方面的可行性。外部云比较适合重视成本控制和拒绝风险的企业;其他企业将在研究了外部云的成本和风险以后选择内部云。
因为外部云的本质是服务,成本与数据存储量和合同时间长短有关。而内部云几乎需要传统内部存储需要的一切成本。
特性和功能
云存储可以仅仅是存储,也可以是计算和存储的结合。在云计算领域,有很多特性和功能,服务器和存储都可以虚拟化,并使用多种不同的网络协议相连接。在纯粹一些的云存储中,存储依靠的是以太网上的HTTP(S)、CIFS/NFS、FCIP/iSCSI或者FCoE协议。在基于块的存储中也可以实施云存储,不过需要在其之上使用某种工具来提供文件系统。
预配置、自动分层、重复数据删除、自动复制以及分布式解决方案等存储特性已经开始变成主流。
实施云需要警惕以下情况:
单个文件过大;
小文件数量过多;
文件的访问频率超过了链接协议的支持范围;
扩展云供应商有时会关闭预读缓存引擎,使终端用户数据恢复很慢。
收益与担忧
云存储的好处有很多,包括能够提高存储、网络等部门之间的协作,提供存储池的自服务访问功能等。云存储可以随着策略的改变自动调整,包括快捷的预配置、反定位以及自动复制等。扩展云的主要问题有:数据的可用性、签名期限、缺乏定位控制、数据没有物理访问路线、网站新组建需要支持扩展云、对额外的带宽需求更高、对数据必须压缩和(或)加密,以及可能的法规遵从风险。
内部云可能出现的问题较少,但是用户仍然对其安全、管理、报警、更新和软硬件刷新等存在顾虑,还有就是内部云的成本也比较高。不过大部分这些顾虑在现有的存储体系下也存在,不是什么新鲜事物。
云存储能够为用户快速地提供额外的存储,而不必劳烦存储管理员。将数据从一个平台移动到另一个平台、一个站点移动到另一个站点等都是全自动的,大大减少了存储管理员的工作负担。
用户在固定层实施云存储,比如备份或者存档等,将只需要设置一下策略,现有的工具就能够自动把数据转移到云存储。有些用户使用云的目的在于随着季节性波动能够快速增加存储容量,或者需要在数据测试环境中创建一份有用数据的拷贝,这时云会根据用户设置的策略释放一些临时占位空间,并在必要的时候将这些被释放的数据备份或存档。
最后,对于自己管理云存储的用户来说,可以尝试使用一些自动创建策略的解决方案。这些方案可能包括预配置和反定位存储功能。
实施云服务的五个阶段有:
1. 集中管理IT,以实现规模经济,可视化成本构成,并有效控制IT服务量。
2. 基于关键业务需求提供标准云服务。尝试为消耗大量资源的应用程序支持提供特殊的解决方案。提高质量、减少预配置时间、降低成本和风险的关键在于一致性。标准化是成功进行整合和实现自动化的前提。
3. 虚拟化并整合物理资源。虚拟化和整合能够增加资产利用率和存储效率。任何级别的基础设施都可以实施虚拟化;统一的存储、统一的光纤、虚拟化的服务器,由于应用程序和数据均十分灵活,资产利用率得到了提高,资产寿命循环管理得到了简化。资源池使产品市场化速度更快,并大量降低成本。
4. 自动化环境。一旦云服务和云过程实现了标准化,基础设施也实现了虚拟化,自动化就可以随之而来。自动化工具能够提高数据提取能力,简化整个工作流管理,使之更有效率。
5. 自服务和API的委托控制。控制权回到企业/用户手中是云服务模型成功部署的标志。在应用程序整合和拥有自服务能力以后,应用程序管理员和拥有者可以根据需求实现存储的弹性供给,根据企业情况选择不同的性能和数据保护级别,并在应用程序出现异常时自动恢复。不过这也会大大提高对管理员反应能力的考验。要想最大化实现和利用云服务,需要整个组织的协助才能推进各个阶段的顺利进行。
