raid概念
有时候对raid有点含糊不清,特别从网上找了一些资料总结一下
优点:
http://baike.baidu.com/view/63423.htm?fromId=7102
下面的内容来自
http://www.ibm.com/developerworks/cn/aix/redbooks/HACMP-3/1.html
独立磁盘冗余阵列(Redundant Array of Independent Disk,RAID)
磁盘阵列是磁盘驱动器组,这些驱动器协同工作以实现高于单个(独立)驱动器的数据传输速率。阵列还可以提供数据冗余,以便在阵列中的一个驱动器(物理磁盘)发生故障时,数据不会丢失。取决于 RAID 级别,数据将实现镜像或条带化,或者同时实现这两者。
有关一些广泛使用的 RAID 级别的特征,请参见表 2。
RAID 0
RAID 0 也称为数据条带化 (data striping)。传统上,文件按顺序写入到单个磁盘。使用条带化,信息将划分为字节块(固定容量的数据,通常称为“块”),并将这些块并行写到一系列磁盘(或从一系列磁盘并行读取这些块)。这种方法具有两个性能优点:
- 由于多个 I/O 流同时进行,数据传输速率比顺序操作更高。
- 由于数据的分布性消除了访问模式偏差,随机访问吞吐量得到了提高。这意味着,对于跨许多磁盘均匀分布的数据,随机访问很可能会发现所需的信息跨多个磁盘分布,从而得益于比单个磁盘更高的吞吐量。
RAID 0 的唯一目的是提高性能。不存在冗余,因此任何磁盘故障都需要从备份中重新加载数据。
RAID 1
RAID 1 也称为数据镜像。在这种实现中,每个数据块的相同副本保存在单独的磁盘上,或在更常见的情况下,每个磁盘具有包含信息的准确副本(或镜像映像)的“孪生磁盘”。如果阵列中的任何磁盘发生故障,则镜像磁盘将维持数据可用性。读取性能可以增强,因为始终使用其动臂机构(磁头)最靠近所需数据的磁盘,从而最小化寻道时间。
写入操作的响应时间会比单个磁盘稍慢一点,具体取决于写入策略;写入操作可以并行(为了实现更快的响应)或顺序(为了实现安全性)执行。
RAID Level 1 具有数据冗余,但是应该定期保存数据(备份)。这是在文件或目录被意外破坏或删除时用于恢复数据的唯一途径。
RAID 2 和 RAID 3
RAID 2 和 RAID 3 是并行处理阵列机制,其中阵列中的所有驱动器协同操作。与数据条带化类似,要写入到磁盘的信息划分为字节块(固定容量的数据),每个块被写到单独的磁盘上的相同物理位置(并行)。在进行读取时,可以同时向每个磁盘发送数据请求。这种体系结构要求为每个数据条带写入奇偶校验信息;RAID 2 和 RAID 3 之间的区别在于,RAID 2 可以利用多个磁盘驱动器实现奇偶校验,而 RAID 3 只能利用一个磁盘驱动器。如果某个驱动器发生故障,系统可以在奇偶校验信息和其余驱动器的基础上重新构造丢失的数据。针对大容量数据的性能非常优异,但是小容量数据请求的性能非常糟糕,因为始终要涉及到每个驱动器,并且不能存在重叠或独立的操作。
RAID 4
RAID 4 通过使用更大的数据块,并跨所有驱动器(保留用于奇偶校验的驱动器除外)对数据进行条带化,从而解决了 RAID 3 的某些缺点。使用磁盘条带化意味着 I/O 请求只需涉及到所需数据实际所在的驱动器。这意味着可以实现同时以及独立的读取。但是,写入请求需要一个读取/修改/更新周期,从而在单个奇偶校验驱动器上导致瓶颈。
必须读取每个条带,插入新数据,然后在将条带写回磁盘之前计算新的奇偶校验信息。然后再使用新的奇偶校验信息更新奇偶校验磁盘,但是在完成此操作之前,不能将该磁盘用于其他写入操作。这个瓶颈意味着,RAID 4 使用得不如 RAID 5 那么多,后者实现了相同的过程,但是没有瓶颈。
RAID 5
RAID 5 非常类似于 RAID 4。区别在于,奇偶校验信息也跨用于数据的相同磁盘分布,从而消除了该瓶颈。奇偶校验数据决不会与它所保护的数据块存储在相同的驱动器上。这意味着,现在可以执行并发读取和写入操作,并且由于可以使用一个额外的磁盘(以前用于奇偶校验信息的磁盘),性能也提高了。还存在其他可能的增强,以进一步提高数据传输速率,例如缓存从磁盘进行的同时读取,并在读取接下来的块时传输该信息。这可以实现接近适配器速度的数据传输速率。
与 RAID 3 一样,在磁盘发生故障的情况下,可以在其余驱动器的基础上重新构建信息。RAID 5 阵列也使用奇偶校验信息,虽然创建阵列中的数据的定期备份仍然非常重要。RAID 5 阵列一次一个段(一个段可以包含多个块)地跨阵列中的所有驱动器对数据进行条带化。在具有 n 个驱动器的阵列中,一个条带包括写到其中“n-1”个驱动器的数据段和一个写到“第 n 个”驱动器的奇偶校验段。这种机制还意味着,并非所有磁盘空间都可用于存储数据。例如,在具有五个 72 GB 磁盘的阵列中,尽管总存储空间为 360 GB,但是只有 288 GB 可用于存储数据。
RAID 0+1 (RAID 10)
RAID 0+1 也称为 IBM RAID-1 Enhanced 或 RAID 10,是 RAID 0(数据条带化)和 RAID 1(数据镜像)的组合。RAID 10 提供了 RAID 0 的性能优点,同时保持了 RAID 1 的数据可用性。在 RAID 10 配置中,数据及其镜像都跨阵列中的所有磁盘进行条带化。第一个条带是数据条带,第二个条带是镜像,镜像与数据放在不同的物理驱动器上。RAID 10 实现可以提供优异的写入性能,因为它们不必计算或写入奇偶校验数据。RAID 10 可以通过软件 (AIX LVM)、硬件(存储子系统级别)或通过硬件和软件的组合来实现。具体的实现解决方案取决于总体需求。RAID 10 的成本特征与 RAID 1 相同。
表 2 列出了当今的 IT 实现中使用的最常见 RAID 级别。
表 2 广泛使用的 RAID 级别的特征
RAID 级别 |
可用磁盘容量 |
读取/写入操作性能 |
成本 |
数据保护 |
---|---|---|---|---|
RAID 0 |
100% |
读取/写入性能都非常高 |
低 |
否 |
RAID 1 |
50% |
中/高读取性能,中等写入性能 |
高 |
是 |
RAID 5 |
80% |
高读取性能 |
中 |
是 |
RAID 10 |
50% |
读取/写入性能都非常高 |
高 |
是 |
目前还有比较流行的raid dp 同时 坏两块硬盘都不会影响业务