RAID 6技术简介

来源:联商网

2007-09-29 08:13

  为什么需要RAID 6  在经过多年的沉寂之后,RAID 6技术随着大容量ATA硬盘的广泛采用又重新引起了业界的重视。相对于RAID 5来说,用户对RAID 6的了解比较少,根据HDS的技术白皮书《采用RAID-6技术,增强数据保护》改编成此文与大家共享。为了较为完整地说明问题,编者保留了一些与具体产品配置相关的内容。  RAID 5是在存储系统中广泛采用的数据保护技术。该技术是通过把应用数据

  为什么需要RAID 6
  
在经过多年的沉寂之后,RAID 6技术随着大容量ATA硬盘的广泛采用又重新引起了业界的重视。相对于RAID 5来说,用户对RAID 6的了解比较少,根据HDS的技术白皮书《采用RAID-6技术,增强数据保护》改编成此文与大家共享。为了较为完整地说明问题,编者保留了一些与具体产品配置相关的内容。

  RAID 5是在存储系统中广泛采用的数据保护技术。该技术是通过把应用数据分成数段,连同这些数据段的校验信息写入一组磁盘来实现的。如果其中有个磁盘出现了故障,就会利用其余的磁盘中的数据和检验信息把故障盘中的数据恢复到热备盘中以保证数据不会丢失。这样RAID 5就存在一种风险,如果在数据重建的过程中,RAID组中的第二块硬盘出现故障,就会出现数据丢失。

  以前,两块盘同时坏的情况是小概率事件,几乎不可能发生。但是近来随着光纤(FC)盘和SATA盘的容量和密度不断增加,使得RAID 5的重建时间也不断增加。这样两块盘同时坏的概率也增加了,在企业级存储上,这种风险必须得到重视。

  为了应对这种情况,存储厂商的RAID 6技术就是可以保证两块盘同时出故障而不会丢失数据的新技术。日立数据系统(HDS)公司的TagmaStore全线存储系统除了支持RAID 5,RAID 1技术以外还可以支持RAID 6保护技术,提供给用户多种保护方式的选择。

  RAID 6技术背景和简介

  RAID技术是为了防止存储系统因为磁盘故障而丢失数据而研发出来的。该技术把数据和校验信息分布到一组盘中(RAID组),当有盘坏的时候,丢失的那部分数据可以通过其他盘上的数据和校验信息计算恢复。这样就增强了存储系统的可靠性。

  HDS公司的TagmaStore全线存储系统可以支持RAID 0,RAID 1,RAID 5和RAID 6技术,所以HDS的存储系统不但可以提供更好的可靠性,而且也可以比以往的存储系统有更出色的性能。

  HDS的高端存储系统一般以4个磁盘为一个组,称为Array Group,而一个RAID组则包含一个或者多个Array Group。例如:RAID 1(镜像)可以是2D + 2P或者4D + 4P的配置,也就是说2块数据盘,2块镜像盘,或者4块数据盘和4块镜像盘的配置。RAID 5(带校验的条带化)可以是3D + 1P的配置,其中3块数据盘,1块检验盘,或者是7D + 1P的配置,其中7块数据盘,1块检验盘的配置。实际上,RAID 5的数据和校验都是条带化后分散在RAID组中的各个磁盘中的。

  RAID-1提供了最高的可靠性,一块盘上的数据都镜像到RAID组中的另外一块磁盘上。但是这种方式对磁盘的利用率不高,只有一半的磁盘空间能够存放数据,存放同样的数据要多买一倍的磁盘。RAID 5改善了利用率的问题,但是因为要计算校验信息而使得写性能有所下降。HDS TagmaStore系列存储中的模块化产品也能支持RAID 0技术(没有校验的条带化),RAID 0技术有很好的性能表现,但是RAID 0没有冗余保护功能,RAID组中任何一块磁盘的损坏都会造成数据的丢失。因此HDS只在中端模块化阵列的光纤盘上支持RAID 0技术,在SATA盘上不支持RAID 0,同时HDS建议用户不要在关键数据上采用RAID 0技术。

  当采用RAID 1或者RAID 5技术的时候,如果其中有个磁盘出现了故障,就会利用RAID组中其余的磁盘中的数据和检验信息把故障盘中的数据恢复到热备盘中以保证数据不会丢失。工程师用新盘替换坏掉的磁盘,这时候存储系统会把热备盘中的数据拷贝回新换上的盘中(HDS的WMS/AMS中端模块化存储可以支持不回拷)。当回拷完成后,系统又回到了正常工作状态,可以再次抵御磁盘故障。

  如今磁盘的容量和密度一再变大,出现了300GB的光纤盘和500GB的SATA盘,每个盘中存放的数据比以往大了很多,磁盘故障影响的数据量也跟着增加。这样从磁盘故障,到磁盘系统恢复正常状态的时间也会比以往长很多,这个过程中同一个RAID组里面第二块磁盘出现故障而导致数据丢失的可能性也变大。

  为了防止两块磁盘故障而引起的数据丢失,HDS TagmaStore存储系统现在支持RAID 6(6D + 2P)。和RAID 5相似的是,RAID 6采用了校验数据,和RAID 5不同的是RAID 6有两份检验数据,可以保证同一RAID组中两块磁盘同时故障而不丢失数据。

  SATA推进了RAID6的使用

  被称为双重奇偶的RAID-6技术并不是一种新技术,它在理论上已经出现了大约20年。然而,直到最近,RAID-6技术才得到了实际应用,这多亏了功能更加强大的RAID处理器。迄今为止,RAID-6通过SATA技术在现实世界中获得了巨大成功。存储行业分析专家表示,未来的12~18个月将会出现SATA用户的采纳高峰期。

  主要被用在中低端市场的高容量500GB和750GB的SATA磁盘,使RAID-6技术的使用变得更加必要。SATA磁盘的可靠性不高,经常发生双磁盘故障,并且驱动器本身也用于保持更多的数据,使得双磁盘故障潜在的更加具有破坏性。

  Brad O'Neill是Taneja集团的高级分析人士,他说,“SATA磁盘起步阶段并没有设计为比较高的性能。对于那些对费用情况比较敏感的小型组织或者部门,以及使用Tier-2的大型组织部门,它们比较适合于使用SATA磁盘用于商务操作;它更加有利于默认的进行更好的保护,以此交换那些小型性能障碍所带来的问题。”

  高性能的SATA驱动器应用于近线的以及入门层面的存储之中,这也意味着即使没有第二磁盘的故障,一个单独故障的修复状态也将对第二平台之上的数据产生损坏,专家说。驱动器本身的规模可以导致它比较长的改造时间,并且单一系统的性能也会出现一定的问题;意味着该系统将长时间的比较脆弱,直到第二故障的出现。

  Tom Treadway是Adaptec公司的存储软件部门的CTO,他说,“双重奇偶最大的好处并不在于保护两种同时发生的故障,这是一种相对而言的小概率事件。而它真正的保护在于针对那些在改造模式下所产生的小型故障。”

  用户们的权衡和反应

  Andy Tran是太平洋标题和艺术工作室的高级行政副总裁和CTO,该公司是美国加州好莱坞的一家电影后期制作工作室;TRAN说,“我们到目前为止,还没有遇到什么性能方面的问题。”该公司使用了DataDirect网络的9550 SATA队列的0.5 PB的容量,这通过将额外的硬件资源需求整合于一个包裹中,从而解决了计算双奇偶变量所带来的性能负载,而这个包裹的形式是在一个中央缓冲服务器的周围设置28个双核特定的ASIC。

  SATA在电影处理进程的存储方面是非常有利的,因为它的高性能以及低成本,Tran说,但是RAID-6附加的保护也是非常重要的。在制作一部电影的过程中,太平洋工作室创建了大量的文件容量,超过30TB。他说,“在我的商务中,我们需要确保没有任何的损坏和故障。如果任何的LUN发生故障,那么将意味着我们损失整个的文件系统,并且将损失整个的电影。”

  Tran还说,到目前为止,他只在一个队列之上对RAID-6进行了开发,并且在更加广泛的执行之前,应该首先对它更加的熟悉。他希望,从长远来说,能够更多的依赖于RAID-6,但是还说,这并不是对任何人来说的,尤其是在比较大的队列之中,每台RAID需要贡献两台驱动器进行奇偶处理,这样就增加了大大增加了磁盘的费用。

  Tran说,“我并不认为,很多的厂家将提供RAID-6,并不会像RAID-5那样广泛。用户们也担心容量性能等的问题。”

  RAID-6性能问题的新方法

  对于那些考虑RAID-6的用户而言,一些厂家试图通过更加高效的奇偶计算法则来减轻性能障碍,这可以减少处理器中磁盘输入输出设备资源的数量。

  在RAID-5系统之中,每个RAID团组需要一个磁盘用于奇偶计算,并使用一种独占式的运算法则,或者在该进程中处理器解决某一种特定的方程,用于取代一台驱动器故障中所损失的字节。RAID-6需要这个方程在两个变量的条件下进行求解,这意味着传统的独占式的或者进程安排中的字节需要被访问两次。这样以来,在传统的运算法则之下,在一个RAID团组的六个磁盘中,解决两个变量的问题就意味着需要12次的输入输出访问。

  然而,厂家们如今提供了RAID-6的计划方案,例如Overland公司,Adaptec公司以及Nexsan公司,它们也都改为应用Reed-Solomon运算法则,这就使得双重奇偶可以通过在RAID团组中的每一个磁盘上使用一次输入输出而进行计算,这样以来,六个磁盘就只需要最少的六次输入输出。

  其他的厂家中,最著名的是NetApp,它正在改变其包裹中的存储控制的方法,并读出磁盘中的数据以减少RAID-6输入输出负载。NetApp公司正在使用它的WAFL系统以将双奇偶数据安置于磁盘平台之上,从而RAID计算期间它可以更加简易的被控制者进行访问。

  Overland通过一种称为DriveAlive的功能特色进入RAID-6领域之中,这是一种热交换的特色,当队列底盘中的一个磁盘刀片被取出来用于例行维护的时候,例如替换一个驱动器盘片,这时候它可以对整体的改造模式进行了延迟。DriveAlive减少了重建模式下的性能问题,而这主要通过减少事件数量而实现的,在此队列完全进入了重建模式。

  离开SATA,RAID-6可能受到限制

  NetApp说,对于RAID-6作为一种数据保护方案的可能性仍然值得认真研究,对于Fibre Channel (FC)以及连续附加SCSI(SAS)而言,但是无论用户们是否拥有更加昂贵的、高可靠性的磁盘驱动器,偏离单独奇偶运算的需求都将是值得怀疑的,这一点也是其他一些磁盘厂家的共识。

  Jerry Hoetger是Xyratex公司的产品管理主管,他说,“RAID-6将成为某些用户的清单条款。但是我并没有真正看到它在高可靠性驱动器方面的兴趣,例如SAS以及Fibre Channel。”

  越来越多的用户正在将更多的工作量包裹于比较便宜的驱动器之上,但是仍然存在一种可能性,那就是性能关注将取得最终的胜利,据O'Neill透露。他说,“用户们不得不进行特定的工作量决定,有些时候是特定的应用软件决定,关于到底哪种形式的奇偶运算保护可以使用。”

>

联商网APP
专业、深度、全面了解零售

立即打开