LaTeX 渲染有问题。将就着看吧。
冗余磁盘阵列 / 独立磁盘冗余阵列:RedundantArraysofIndependent Disks (RAID)
RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)是一种将多个物理硬盘组合成一个逻辑硬盘的技术,以提升数据的性能、冗余性和可用性。通过 RAID,可以在数据存储时实现一定的容错能力,避免数据因某一硬盘的故障而丢失。
特性:
由一组物理磁盘驱动器组成,被视为单个逻辑驱动器
数据是分布在多个物理磁盘上
冗余磁盘容量用于存储校验信息,保证磁盘万一损坏时能恢复数据
# 分类:
# RAID 0
数据以条带的形式在可用的磁盘上分布
不采用冗余来改善性能(不是 RAID 家族中的真正成员)
优点:读写速度提升,因为可以并行读取和写入。
缺点:没有数据冗余,任何一块硬盘故障都会导致所有数据丢失。
适用场景:对速度要求较高的数据处理任务,不要求数据冗余。
用途:高数据传输率 ,高速响应 I/O 请求
# RAID 1
采用了数据条带
采用简单地备份所有数据的方法来实现冗余
优点:
高速响应 I/O 请求:即便是同一个磁盘上的数据块,也可以由两组硬盘分别响应
读请求可以由包含请求数据的两个对应磁盘中的某一个提供服务,可以选择寻道 时间较小的那个
写请求需要更新两个对应的条带:可以并行完成,但受限于写入较慢的磁盘
单个磁盘损坏时不会影响数据访问,恢复受损磁盘简单
** 缺点:** 价格昂贵
** 用途:** 只限于用在存储系统软件、数据和其他关键文件的驱动器中
与 RAID 0 相比:
如果有大批的读请求,则 RAID 1 能实现高速的 I/O 速率,性能可以达到 RAID 0 的两倍
如果 I/O 请求有相当大的部分是写请求,则它不比 RAID 0 的性能好多少
# RAID 01 vs. RAID 10
RAID 01 =RAID 0+1:先做 RAID0,再做 RAID1
RAID 10 =RAID 1+0:先做 RAID1,再做 RAID0
两者在数据传输率和磁盘利用率上没有明显区别,主要区别是对磁盘损坏的容错能力
RAID 01 会无法恢复,但 RAID 10 可以恢复。
# RAID 2
采用并行存取技术
目标:
所有磁盘都参与每个 I/O 请求的执行
实际基本被弃用
# RAID 3
采用并行存取技术
各个驱动器的轴同步旋转
采用非常小的数据条带,所有盘一起读写
校验:对所有数据盘上同一位置的数据计算奇偶校验码
优点:能够获得非常高的数据传输率,对于大量读请求,性能改善特别明显
缺点:一次只能执行一个 I/O 请求,在面向多个 IO 请求时,性能将受损
# RAID 4
采用独立存取技术
每个磁盘成员的操作是独立的,各个 I/O 请求能够并行处理
采用相对较大的数据条带
根据各个数据盘上的数据来逐位计算奇偶校验条带,奇偶校验位存储在奇偶校验盘的对应条带上
# RAID 4 的特点
块级条带化:RAID 4 将数据按块(通常是较大的数据块)条带化分布在多个磁盘上,而不是按字节。每个磁盘存储数据的不同块,并且会有一个独立的磁盘用于存储所有数据块的奇偶校验。
单一奇偶校验磁盘:和 RAID 3 类似,RAID 4 使用一个单独的磁盘来存储所有的奇偶校验数据。如果数据磁盘之一发生故障,奇偶校验磁盘可以帮助恢复丢失的数据。
容错能力:RAID 4 能够容忍一块磁盘的故障而不丢失数据,因为奇偶校验磁盘可以用来重建丢失的磁盘数据。但如果奇偶校验磁盘发生故障,数据将不可恢复。
性能瓶颈:由于所有的奇偶校验数据都存储在一个单独的磁盘上,RAID 4 会受到写操作性能瓶颈的限制。每次写入数据时,都需要读取、计算并写入新的奇偶校验信息,这会导致奇偶校验磁盘的过载。
# RAID 4 的优缺点
优点:
较高的顺序读取性能:与 RAID 3 相比,由于块级条带化,RAID 4 在进行顺序读取时性能较好。
容错性:RAID 4 可以容忍一块硬盘故障,能够通过奇偶校验数据恢复丢失的数据。
缺点:
写入性能瓶颈:由于所有的奇偶校验操作都集中在单一磁盘上,写操作时必须读取该磁盘上的旧的奇偶校验信息,并进行更新,这会导致性能下降。尤其是在频繁写入的情况下,奇偶校验磁盘会成为性能瓶颈。
随机读取性能差:尽管顺序读取性能较好,但在处理小文件或随机读取时,RAID 4 的性能不如其他 RAID 级别(如 RAID 5)。
性能
当执行较小规模的 I/O 写请求时,RAID4 会遭遇写损失
对于每一次写操作,阵列管理软件不仅要修改用户数据,而且要修改相应的校验位
当涉及所有磁盘的数据条带的较大 I/O 写操作时,只要用新的数据位来进行简单的计算即可得到奇偶校验位
每一次写操作必须涉及到唯一的校验盘,校验盘会成为瓶颈(实际基本弃用)
# RAID 5
与 RAID 4 组织方式相似(常用)
在所有磁盘上都分布了奇偶校验条带
避免潜在的 I/O 瓶颈问题
RAID 5 通过 块级条带化 和 分布式奇偶校验 来提供数据冗余和容错能力。这意味着数据被分割成块,并分布到多个磁盘上,同时奇偶校验信息也分布在所有磁盘上,以便在某一磁盘发生故障时恢复数据。
访问时的 “两读两写”:读在写前,读 / 写不需要并行
# RAID 50
RAID 5 与 RAID 0 的组合,先作 RAID 5,再作 RAID 0,也就是对多组 RAID 5 彼此构成条带访问
RAID 50 在底层的任一组或多组 RAID5 中出现 1 颗硬盘损坏时,仍能维持运作;如果 任一组 RAID5 中出现 2 颗或 2 颗以上硬盘损毁,整组 RAID50 就会失效
RAID 50 由于在上层把多组 RAID 5 进行条带化,性能比起单纯的 RAID 5 高,但容量 利用率比 RAID5 要低
# RAID 6
采用两种不同的校验码,并将校验码以分开的块存于不同的磁盘中
奇偶校验码 P(Parity Code P)
Reed-Solomon 校验码 Q(RS Code Q)
优点
提升数据可用性:只有在平均修复时间间隔内 3 个磁盘都出了故障,才会造成数据丢失
缺点
写损失:每次写都要影响两个校验块(读 3 个写 3 个磁盘)
# 不同 RAID 的比较
# 总结
0:I/O 快,但是数据可用性低
1:数据可用性高但是容量可用性低
2/3:不能并行处理,处理速度慢
456:数据可用性高但是写速率收到影响