关于RAID的一些基本概念


RAID简介
内嵌微处理器的磁盘子系统通常称为R A I D系统。R A I D阵列的可用容量总小于成员磁盘的总量。
一、RAID 0(分块)是简单的、不带有校验的磁盘分块,本质上它并不是一个真正的R A I D,因为它并不提供任何形式的冗余。假如RAID 0的磁盘失败,那么,数据将彻底丢失。为了在RAID 0情况下恢复数据,唯一的办法是使用磁带备份或者镜像拷贝。
二、RAID 1(镜像)是非校验的R A I D级。
三、RAID 2(专有磁盘的并行访问)的定义涉及R A I D控制器中的错误校验电路。这个功能已经被集成到磁盘驱动器中,虽然便宜,但效率却不高。因此, RAID 2没有形成产品。
四、并行访问R A I D都属于R A I D 3。R A I D 3(使用专有校验磁盘的同步访问)子系统将数据分块存放到阵列中的所有驱动器,将校验数据写到阵列中的一个另外的校验磁盘, R A I D 3被认为是校镽 A I D。
五、RAID4(使用专用校验磁盘的独立访问)是一种独立访问的R A I D实现,它使用一个专用的校验磁盘。与RAID 3不同的是,RAID 4有更大量的分块,使多个I / O请求能同时处理。虽然它为读请求提供了性能的优势,但RAID 4的写开销特别大,因为在每次读、修改和写周期中,校验磁盘都被访问两次。
六、RAID 5(使用分布式校验的独立访问)是一个独立访问的R A I D阵列,校验数据被分布在阵列中的所有磁盘。换而言之,即没有一个专有校验磁盘,因而,没有像RAID 4一样的写瓶颈。
七、RAID 6(使用双校验的独立访问)提供两级冗余,即阵列中的两个驱动器失败时,阵列仍然能够继续工作。

RAID 1: 就是我们常说的“磁盘镜像”,通过在阵列里的一个 硬盘上完全复制相同数据的方式来提供对数据的充分保护。如果其中一个硬盘毁坏,另外一个硬盘将提供精确的,完全相同的数据,RAID系统将切换到镜像的硬盘继续使用,对用户而言,数据并没有丢失。 这种镜像系统不好的地方是数据的存储速度并没有得到改善,而且磁盘利用率低。然而,它提供对管理者而言最简单有效的保护,当一个硬盘失效时,阵列管理软件会直接将数据请求切换到有效硬盘上。

RAID 3:RAID 3 将数据交错分布在多个驱动器中,有一个专门的硬盘用户提供奇偶数据存储,提供错误数据的恢复和重建。

RAID 5: RAID 5 是最通行的配置方式。它是具有奇偶校验的数据恢复功能的数据存贮方式。在 RAID 5里,奇偶校验数据块分布于阵列里的各个硬盘中,这样的数据连接会更加顺畅。 如果其中一个硬盘损坏,奇偶校验数据将被用于数据的重建。这是一个很通行的做法。这种方式的缺点是数据的读写时间会相对长些(在写入一组数据时必须完成两次读写操作)。它的容量是 N-1,最小必须有三个硬盘。

磁盘阵列术语汇编  Array:阵列

磁盘阵列模式是把几个磁盘的存储空间整合起来,形成一个大的单一连续的存储空间。NetRAID控制器利用它的SCSI通道可以把多个磁盘组合成一个磁盘阵列。简单的说,阵列就是由多个磁盘组成,并行工作的磁盘系统。需要注意的是作为热备用的磁盘是不能添加到阵列中的。

Array Spanning:阵列跨越

阵列跨越是把2个,3个或4个磁盘阵列中的存储空间进行再次整合,形成一个具有单一连续存储空间的逻辑驱动器的过程。NetRAID控制器可以跨越连续的几个阵列,但每个阵列必需由相同数量的磁盘组成,并且这几个阵列必需具有相同的RAID级别。就是说,跨越阵列是对已经形成了的几个阵列进行再一次的组合,RAID 1,RAID 3和RAID 5跨越阵列后分别形成了RAID 10,RAID 30和RAID 50。

Cache Policy:高速缓存策略

NetRAID控制器具有两种高速缓存策略,分别为Cached I/O(缓存I/O)和Direct I/O(直接I/O)。缓存I/O总是采用读取和写入策略,读取的时候常常是随意的进行缓存。直接I/O在读取新的数据时总是采用直接从磁盘读出的方法,如果一个数据单元被反复地读取,那么将选择一种适中的读取策略,并且读取的数据将被缓存起来。只有当读取的数据重复地被访问时,数据才会进入缓存,而在完全随机读取状态下,是不会有数据进入缓存的。

Capacity Expansion:容量扩展

在微软的Windows NT,2000或Novell公司的NetWare 4.2,5操作系统下,可以在线增加目前卷的容量。在Windows 2000或NetWare 5系统下,准备在线扩容时,要禁用虚拟容量选项。而在Windows NT或NetWare 4.2系统下,要使虚拟容量选项可用才能进行在线扩容。

在NetRAID控制器的快速配置工具中,设置虚拟容量选项为可用时,控制器将建立虚拟磁盘空间,然后卷能通过重构把增加的物理磁盘扩展到虚拟空间中去。重构操作只能在单一阵列中的唯一逻辑驱动器上才可以运行,你不能在跨越阵列中使用在线扩容。

Channel:通道

在两个磁盘控制器之间传送数据和控制信息的电通路。

Format:格式化

在物理驱动器(硬盘)的所有数据区上写零的操作过程,格式化是一种纯物理操作,同时对硬盘介质做一致性检测,并且标记出不可读和坏的扇区。由于大部分硬盘在出厂时已经格式化过,所以只有在硬盘介质产生错误时才需要进行格式化。 Hot Spare:热备用

当一个正在使用的磁盘发生故障后,一个空闲、加电并待机的磁盘将马上代替此故障盘,此方法就是热备用。热备用磁盘上不存储任何的用户数据,最多可以有8个磁盘作为热备用磁盘。一个热备用磁盘可以专属于一个单一的冗余阵列或者它也可以是整个阵列热备用磁盘池中的一部分。而在某个特定的阵列中,只能有一个热备用磁盘。

当磁盘发生故障时,控制器的固件能自动的用热备用磁盘代替故障磁盘,并通过算法把原来储存在故障磁盘上的数据重建到热备用磁盘上。数据只能从带有冗余的逻辑驱动器上进行重建(除了RAID 0以外),并且热备用磁盘必须有足够多的容量。系统管理员可以更换发生故障的磁盘,并把更换后的磁盘指定为新的热备用磁盘。

Hot swap Disk Module:热交换磁盘模式

热交换模式允许系统管理员在服务器不断电和不中止网络服务的情况下更换发生故障的磁盘驱动器。由于所有的供电和电缆连线都集成在服务器的底板上,所以热交换模式可以直接把磁盘从驱动器笼子的插槽中拔除,操作非常简单。然后把替换的热交换磁盘插入到插槽中即可。热交换技术仅仅在RAID 1,3,5,10,30和50的配置情况下才可以工作。

I2O(Intelligent Input/Output):智能输入输出

智能输入输出是一种工业标准,输入输出子系统的体系结构完全独立于网络操作系统,并不需要外部设备的支持。I2O使用的驱动程序可以分为操作系统服务模块(operating system services module,OSMs)和硬件驱动模块(hardware device modules,HDMs)。

Initialization:初始化

在逻辑驱动器的数据区上写零的操作过程,并且生成相应的奇偶位,使逻辑驱动器处于就绪状态。初始化将删除以前的数据并产生奇偶校验,所以逻辑驱动器在此过程中将一并进行一致性检测。没有经过初始化的阵列是不能使用的,因为还没有生成奇偶区,阵列会产生一致性检测错误。

IOP(I/O Processor):输入输出处理器

输入输出处理器是NetRAID控制器的指令中心,实现包括命令处理,PCI和SCSI总线的数据传输,RAID的处理,磁盘驱动器重建,高速缓存的管理和错误恢复等功能。

Logical Drive:逻辑驱动器

阵列中的虚拟驱动器,它可以占用一个以上的物理磁盘。逻辑驱动器把阵列或跨越阵列中的磁盘分割成了连续的存储空间,而这些存储空间分布在阵列中的所有磁盘上。NetRAID控制器能设置最多8个不同容量大小的逻辑驱动器,而每个阵列中至少要设置一个逻辑驱动器。输入输出操作只能在逻辑驱动器处于在线的状态下才运行。

Logical Volume:逻辑卷

由逻辑磁盘形成的虚拟盘,也可称为磁盘分区。

Mirroring:镜像

冗余的一种类型,一个磁盘上的数据在另一个磁盘上存在一个完全相同的副本即为镜像。RAID 1和RAID 10使用的就是镜像。 Parity:奇偶校验位

在数据存储和传输中,字节中额外增加一个比特位,用来检验错误。它常常是从两个或更多的原始数据中产生一个冗余数据,冗余数据可以从一个原始数据中进行重建。不过,奇偶校验数据并不是对原始数据的完全复制。

在RAID中,这种方法可以应用到阵列中的所有磁盘驱动器上。奇偶校验位还可以组成专用的奇偶校验方式,在专用奇偶校验中,奇偶校验数据可分布在系统中所有的磁盘上。如果一个磁盘发生故障,可以通过其它磁盘上的数据和奇偶校验数据重建出这个故障磁盘上的数据。

Power Fail Safeguard:掉电保护

当此项设置为可用时,在重构过程中(非重建),所有的数据将一直保存在磁盘上,直到重构完成后才删除。这样如果在重构过程中发生掉电,将不会发生数据丢失的危险情况。

RAID:独立冗余磁盘阵列

独立冗余磁盘阵列最初叫做廉价冗余磁盘阵列(Redundant Array of Inexpensive Disks),它是由多个小容量、独立的硬盘组成的阵列,而阵列综合的性能可以超过单一昂贵大容量硬盘(SLED)的性能。由于是对多个磁盘并行操作,所以RAID磁盘子系统与单一磁盘相比它的输入输出性能得到了提高。服务器会把RAID阵列看成一个单一的存储单元,并对几个磁盘同时访问,所以提高了输入输出的速率。

RAID Levels:RAID级别

RAID级别为不同冗余类型在逻辑驱动器上的应用。它可以提高逻辑驱动器的故障容许度和性能,但也会减少逻辑驱动器的可用容量,每个逻辑驱动器都必须指定一个RAID级别。

RAID 1,3和5的逻辑驱动器使用了单一的阵列,附表1描述了它们的具体情况。简单地说,RAID 0是没有冗余,它可由一个或多个物理驱动器组成;RAID 1是镜像冗余,它在一个阵列中需要两个物理驱动器;RAID 3为专用奇偶校验冗余,即所有的冗余数据都存储在一个专用的磁盘上,一个阵列至少由三个物理驱动器组成;RAID 5为分散奇偶校验冗余,即阵列中的冗余数据分散存储在阵列中所有磁盘上,它的一个阵列中至少需要三个物理驱动器。

RAID 10,30和50是逻辑驱动器跨越阵列而组成的。附表2描述了跨越磁盘阵列的情况。

Read Policy:读取策略

NetRAID控制器提供了三种读取策略,分别为Read-Ahead(预读),Normal(标准)和Adaptive(适中)。

预读是在运行中,控制器不断的提前读取未被请求的数据,把它存储在内存中,并期望这些数据能被使用。预读可以更快的提供连续数据,当访问的是随机数据时效果就不佳了。

标准策略不使用预读的方法,当读取的数据大部分为随机数据时,这个策略是最有效的。

适中策略是当访问的最后两个磁盘上的数据存储在连续扇区上时,将采用预读的方法。

Ready State:就绪状态

就绪状态是一个可用的硬盘,它即不在线也不是热备用盘,并可以添加到任一个阵列中或者指定为热备用盘的这种硬盘状态。   Rebuild:重建

在RAID 1,3,5,10,30或50阵列中把一个故障盘上的所有数据再生到替换磁盘上的过程。磁盘重建过程中逻辑驱动器通常不会中断对其数据的访问请求。

Rebuild Rate:重建率

重建操作过程的速度。每个控制器都分配了重建率,它反映的是在重建操作中IOP资源使用的百分比。

Reconstruct:重构

在改变RAID级别后,对逻辑驱动器上的数据重新整理的过程。

SCSI Disk Status:SCSI磁盘状态

SCSI磁盘(物理驱动器)可以有以下五种状态,分别为Ready(就绪),未配置的加电可操作磁盘;Online(在线),配置过的加电可操作磁盘;Hot Spare(热备用),当一个磁盘出现故障时,准备使用的加电待用磁盘;Failed(故障),磁盘发生错误导致失效或用户利用NetRAID控制器实用程序使驱动器脱机的状态;Rebuilding(重建),磁盘正处于从一个或几个关键性逻辑驱动器上恢复数据的过程中。

Stripe Size:条带容量

在每个磁盘上连续写入数据的总量,也称作“条带深度”。你可以指定每个逻辑驱动器的条带容量从2KB,4KB,8KB一直到128KB。为了获得更高的性能,要选择条带的容量等于或小于操作系统的簇的大小。大容量的条带会产生更高的读取性能,尤其在读取连续数据的时候。而读取随机数据的时候,最好设定条带的容量小一点。如果指定128KB的条带将需要8MB内存。

Striping:条带化

条带化是把连续的数据分割成相同大小的数据块,把每段数据分别写入到阵列中不同磁盘上的方法。此技术非常有用,它比单个磁盘所能提供的读写速度要快的多,当数据从第一个磁盘上传输完后,第二个磁盘就能确定下一段数据。数据条带化正在一些现代数据库和某些RAID硬件设备中得到广泛应用。

Virtual Sizing:虚拟容量

当此设置生效后,对一个逻辑驱动器来说,控制器将报告逻辑驱动器的容量比实际的物理容量要大的多。“虚拟”空间可以允许在线扩容。

Write policy:写入策略

当处理器向磁盘上写入数据的时候,数据先被写入高速缓存中,并认为处理器有可能马上再次读取它。NetRAID有两种如下的写入策略:

Write Back(回写),在回写状态下,数据只有在要被从高速缓存中清除时才写到磁盘上。随着主存读取的数据增加,回写需要开始从高速缓存中向磁盘上写数据,并把更新的数据写入高速缓存中。由于一个数据可能会被写入高速缓存中许多次,而没有进行磁盘存取,所以回写的效率非常高。

Write Through(完全写入),在完全写入状态下,数据在输入到高速缓存时,它同时也被写到磁盘上。因为数据已经复制到磁盘上,所以在高速缓存中可以直接更改要替换的数据,因此完全写入要比回写简单的多。

存储技术 > 磁盘镜像 磁盘镜像是一个简单形式的设备虚拟化技术,产生的每个I / O操作都在两个磁盘上执行, 而两个磁盘看起来就像一个磁盘一样。磁盘镜像也称R A I D 1。

存储技术 > 存储区域网络( S A N) 存储区域网络( S A N)是一种专用网络,可以把一个或多个系统连接到存储设备和子系统, S A N可以被看作是负责存储传输的“后端”网络,而“前端”网络(或称数据网络)负责正常的 T C P / I P传输。

存储技术 > 网络连接存储( N A S) 网络连接存储( N A S),表示总控的网络存储服务器产品。典型的N A S都连接到普通的网络 上,通常是以太网,提供带有预先配置好的磁盘容量和存储管理软件的集成系统,构成一个完 备的存储解决方案。