viernes, 7 de enero de 2011

Introducción a RAID (Parte I)

Este es una artículo que salió hace un par de días en  Linux Magazine y me pareció muy claro, es una introducción a los niveles o configuraciones de arreglos RAID. Tiene imágenes de Wikipedia, que también tienen una explicación muy buena al respecto, así que se las recomiendo como complementaria. El autor es  Jeff Layton y pueden encontrar una compilación de sus artículos para LM aquí. Está bastante largo así que lo pueden marcar para referencias futuras, en unos días les traigo la segunda parte que son los RAIDs anidados. Los dejo con la traducción, les deseo un feliz fin de semana.



Introducción a RAID.

RAID es una de las tecnologías que realmente ha revolucionado el almacenamiento de datos. En este artículo, vamos a revisar los seis niveles más comunes de RAID, describiremos cómo funciona cada uno y veremos algunos detalles implícitos.

Introducción
Una de las técnicas más comunes para mejorar sea la fiabilidad o el rendimiento de los datos (o ambos) es el llamado RAID (Redundant Array of Inexpensive Disks. Matriz Redundante de Discos Baratos). El concepto fue desarrollado en 1977 por David Patterson, Garth Gibson y Randy Katz, como una manera de utilizar varios discos de bajo costo para crear un solo disco, desde la perspectiva del sistema operativo y al mismo tiempo lograr una mayor fiabilidad o rendimiento, o ambos.
Antes de que alguien salte y diga que RAID no significa "matriz redundante de discos baratos", permítanme comenzar diciendo que fue esa la definición original. Con el tiempo, la definición se ha vuelto más comúnmente conocida como "matriz redundante de discos independientes", tal vez porque la palabra "barato" no está asociada con los controladores de discos RAID. Personalmente yo uso la definición original, pero como sea, la definición significa que los discos son independientes el uno del otro. Siéntase libre de utilizar cualquier definición, ya que no va a cambiar el contenido de este artículo. Ahora, de vuelta a nuestra discusión de RAID.
Cuando el documento original se publicó, cinco diferentes niveles o configuraciones RAID fueron definidas. Desde entonces se han desarrollado otras configuraciones RAID incluyendo las que se conocen como configuraciones RAID "híbridas" o anidadas .
El RAID Advisory Board (RAB) se creó para ayudar a asesorar a la comunidad de TI acerca de las configuraciones de RAID definidas y para ayudar a la creación de nuevas definiciones de configuraciones RAID. Si bien no es una organización que crea normas o etiquetas jurídicamente vinculantes, ayuda a aclarar el significado de los niveles RAID y que es comúnmente aceptado en la comunidad al respecto. Hubo un tiempo en que las empresas crearon configuraciones y etiquetas RAID muy extrañas, provocando una gran confusión. El RAB ha contribuido a reducir la proliferación de las configuraciones RAID "raras" y estandarizar el significado de los diversos niveles de RAID.
En este artículo quiero examinar las siete configuraciones estándar más común de RAID. Pero también tocaré muy brevemente algunas de las configuraciones RAID híbridas. Para cada nivel de RAID, voy a describir la forma en que funciona así como las ventajas particulares de la configuración y sus contras. Sin embargo, antes de empezar quiero aclarar una cosa: RAID no debe ser entendido como un sustituto de las copias de seguridad. RAID puede ayudar a mejorar la fiabilidad de los datos lo que significa finalmente la disponibilidad de los mismos (mejorando el uptime relacionado a los datos) y / o el rendimiento de los datos (rendimiento de E/S). No pretende ser un sustituto de las copias de seguridad ni del mantenimiento de múltiples copias independientes de los datos.

Niveles o configuraciones RAID:
Como se mencionó anteriormente, hay cinco niveles o configuraciones RAID originales que se han definido, pero se han desarrollado otros desde que la publicación del artículo original. En la terminología RAID a cada configuración se le asigna un número también llamado "nivel" RAID. Las configuraciones RAID básicas se enumeran como: RAID 0, RAID 1, RAID-2, el RAID-3, RAID-4, RAID-5 y RAID-6.

RAID-0
Esta configuración RAID está realmente enfocada al rendimiento ya que los bloques son, básicamente, distribuidos en varios discos. La figura 1 tomada de wikipedia ilustra cómo los datos se escriben en dos discos:

En esta ilustración, el primer bloque de datos, A1, se escribe en el primer disco, el segundo bloque de datos, A2, se escribe en el segundo disco, el tercer bloque de datos, A3, se escribe en el primer disco, y así sucesivamente. Si la E / S ocurre lo suficientemente rápido los bloques de datos pueden ser escritos casi simultaneamente (es decir, A1 y A2 serán escritos casi al mismo tiempo). Dado que los datos se dividen entre los discos en unidades del tamaño de bloques, se suele decir que los datos están distribuidos entre los discos. Como puede ver, la división de datos en los discos significa que el rendimiento de escritura del conjunto de discos en general es muy rápida, por lo general mucho más rápida que para un solo disco.
La lectura de un grupo RAID-0 es también muy rápida. Cuando llega una solicitud de lectura la controladora RAID, que controla la ubicación de los datos, sabe que puede leer A1 y A2, al mismo tiempo, ya que se encuentran en discos diferentes, duplicando básicamente el rendimiento potencial de lectura en relación con un solo disco.
Usted puede tener tantos discos como desee en un RAID de nivel 0 (un grupo de discos en una configuración RAID-0). Sin embargo, una de las desventajas de RAID-0 es que no proporciona ninguna redundancia de datos adicional (solo se enfoca al rendimiento). No se obtiene ni almacena paridad de datos alguna lo que significa que si usted pierde un disco en un RAID-0, perderá el acceso a todos los datos de la matriz. Si usted puede recuperar el disco perdido de nuevo en la matriz sin perder ningún dato, entonces puede recuperar el arreglo entero, pero esto es un hecho bastante raro.
En consecuencia, podemos ver que RAID-0 se centra exclusivamente en el rendimiento de datos sin redundancia adicional más allá de la redundancia en un solo disco. Esto afecta la forma en que RAID-0 es utilizado. Por ejemplo, se puede utilizar en situaciones donde el rendimiento es primordial y ud tiene una copia de sus datos en otro lugar o los datos no son importantes. Un caso clásico es el uso de un espacio reservado donde se escriben los datos mientras se ejecuta una aplicación pero no son necesarios una vez que la aplicación concluye y el resultado final se copia a un dispositivo de almacenamiento más resistente. Si se pierde el espacio temporal mientras se ejecuta la aplicación, se puede reconstruir el RAID-0 con un menor número de unidades de disco, y se vuelve a ejecutar la aplicación.
La capacidad y la tasa de fallos de un RAID-0 es la más sencilla de calcular. La capacidad se calcula como

Capacidad = n * min (tamaños de disco)

Donde "n" es el número de discos de la matriz y "mín (tamaños de disco)" es la capacidad mínima entre las "n" unidades (esto indica que se pueden utilizar unidades de distintos tamaños). Esta ecuación también significa que el RAID-0 es muy eficaz respecto a la capacidad ya que no pierde espacio en el almacenamiento de información de paridad u otro sistema de corrección de errores. Utiliza todo el espacio para los datos y está centrado en el rendimiento.
La tasa de fallos es un poco más complicada, pero también puede ser estimada.

MTTFgroup = MTTFdisk / n

Donde MTTF es el tiempo medio hasta el fallo (Mean Time To Failure), "grupo" se refiere al arreglo completo y "disco" se refiere a un solo disco. Agregando mas discos, se reducen en gran medida el MTTF para el RAID-0. Tener dos discos disminuye el MTTF a la mitad. Tres discos reduce el MTTF en un factor de 3, y así sucesivamente. Así que se entiende por qué las personas se muestran renuentes a utilizar RAID-0 para sistemas de archivo en los que la disponibilidad de datos y la fiabilidad son importantes. Sin embargo, RAID-0 es la configuración de RAID más rápida y tiene una mejor utilización de la capacidad que cualquier otra configuración RAID mencionada en este artículo.
La tabla debajo muestra un resumen de RAID-0:

Clic para ampliar.

RAID-1
RAID-1 es casi el opuesto exacto de RAID-0, ya que utiliza varias unidades que son espejos el uno del otro. Normalmente se utilizan dos unidades en RAID-0, pero las configuraciones de tres unidades en RAID-1 son cada vez más comunes. RAID-1 toma un bloque de entrada de datos a una unidad y crea una imagen espejo (copia) de él en una segunda unidad. Así RAID-1 no calcula ninguna paridad del bloque - sólo copia el bloque entero a una segunda unidad. La figura 2 tomada de wikipedia  ilustra cómo los datos se escriben en dos discos en RAID-1.


En este ejemplo cuando el bloque A1 se escribe en el disco 0, el mismo bloque también se escribe en el disco 1. Dado que los discos son independientes el uno del otro, la escritura en el disco 0 y la escritura en el disco 1 pueden ocurrir al mismo tiempo. Sin embargo, cuando se leen los datos, el controlador RAID puede leer el bloque A1 desde el disco 0 y el bloque A2 desde el disco 1, al mismo tiempo ya que los discos son independientes. Así que en general, el rendimiento de escritura de un arreglo RAID-1 es el mismo que un solo disco, y el rendimiento de lectura es más rápido que un array RAID-1 en relación a un solo disco.
La ventaja de RAID-1 se encuentra en el hecho de que los discos contiene copias de los datos. Así que si usted pierde el disco 0, exactamente los mismos datos se encuentran en el disco 1. Esto mejora enormemente la fiabilidad y la disponibilidad de los datos .
La capacidad de RAID-1 es la siguiente:

Capacidad = min (tamaños de disco)

Lo que significa que la capacidad de RAID-1 está limitada por el disco más pequeño (se pueden utilizar unidades de diferentes tamaños en RAID-1). Por ejemplo, si usted tiene un disco de 500 GB y un disco de 400 GB, la capacidad máxima sería de 400 GB (es decir, que la unidad de 500 GB se utiliza como espejo, y los 100 GB restantes no se utilizan). RAID-1 tiene la menor utilización de la capacidad que cualquier otra configuración RAID.
La confiabilidad o probabilidad de fallo es también descrita en wikipedia. Dado que los discos son espejos el uno del otro, pero todavía independientes, la probabilidad de que ambos discos fallen, dando lugar a la pérdida de datos, es la siguiente:

P (fallo doble) = P (unidad única)^2

Así que la probabilidad de fallo de una configuración RAID-1 es el cuadrado de la probabilidad de fallo de una sola unidad. Dado que la probabilidad de fallo de una sola unidad es menor que 1, esto significa que el fallo de un array RAID-1 es aún menor que la probabilidad de fallo de una sola unidad. La referencia tiene una discusión más amplia sobre la probabilidad de fallo, pero en general, la probabilidad de fallos es bastante baja.
Uno podría estar tentado a utilizar RAID-1 para almacenar datos importantes en lugar de habilitar copias de seguridad . Mientras que RAID-1 mejora la fiabilidad de los datos o la disponibilidad, no es un sustituto para copias de seguridad. Si la controladora RAID falla, o si la unidad que contiene el array RAID-1 sufre algún tipo de fallo, entonces los datos no estarán disponibles, e incluso se pueden perder. Sin una copia de seguridad ud no tendrá copia de sus datos. Sin embargo, si usted hace un respaldo de los datos, entonces tendrá una copia. La moraleja del cuento es - haga copias de seguridad reales y no dependa de un RAID-1.
La tabla  a continuación muestra un breve resumen de RAID-1 con algunos puntos destacados.

Clic para ampliar.

RAID-2
Este nivel de RAID es uno de los cinco originales definidos, pero ya no es muy utilizado. El concepto básico es que RAID-2 distribuye los datos a nivel de bits en lugar de a nivel de bloque (recuerde que RAID-0 los distribuía a nivel de bloques) y utiliza codificación Hamming para los cálculos de paridad. En RAID-2, el primer bit está escrito en el primer disco, el segundo bit está escrito en la segunda unidad, y así sucesivamente. A continuación, se calcula la paridad de código Hamming y se almacena en los discos o en un disco independiente. Con este enfoque se pueden alcanzar niveles de rendimiento muy alto ya que los datos están fragmentados en varias unidades, pero también se pierde un poco de rendimiento porque hay que calcular la paridad y almacenarla.
Una característica interesante de RAID-2 es que puede calcular errores de un solo bit y recuperarse de ellos. Esto previene errores de datos o lo que algunos llaman "bit rot". Para una evaluación global de RAID-2, aquí tienen un enlace.
De acuerdo con este artículo los discos duros adicionan una clase de corrección de errores que utiliza códigos Hamming, así que usarlos en niveles RAID se volvió redundante  y  la gente dejó de usar RAID-2.

RAID-3
RAID-3 emplea datos distribuidos a nivel de bits, añade cálculos de paridad y los almacena en un disco de paridad dedicado. La figura tomada de wikipedia ilustra cómo los datos se escriben a cuatro discos en RAID-3.

Este diseño RAID-3 utiliza 4 discos, distribuye los datos a través de tres de ellos y utiliza el cuarto disco para almacenar la información de paridad. Así que un trozo de datos "A" tiene el byte A1 escrito en el disco 0, el byte A2 en el disco 1 y el byte A3 escrito en el disco 2. Luego se calcula la paridad de los bytes A1, A2 y A3 (AP (1-3) en la Figura ) y se escriben en el disco 3. El proceso entonces se repite hasta que el trozo entero de datos "A" está escrito. Tenga en cuenta que el número mínimo de discos de un arreglo RAID-3 es de tres (se necesitan 2 discos para datos y un tercer disco para almacenar la paridad).
RAID-3 es también capaz de un rendimiento muy alto, mientras que la adición de la paridad devuelve alguna fiabilidad y disponibilidad de datos en comparación con un esquema distribuido RAID-0 puro. Dado que el número de bandas distribuidas es probable que sea más pequeño que un bloque y que los datos se acceden al mismo tiempo hay una gran mejora en el rendimiento de lectura y escritura. Sin embargo, la configuración de RAID-3 tiene algunos posibles efectos secundarios.
En particular, este enlace explica como el RAID-3 no puede atender múltiples solicitudes al mismo tiempo. Esto resulta del hecho de que un bloque de datos se repartirá entre todos los miembros del grupo de RAID-3 (menos el disco de paridad) y los datos tienen que residir en la misma ubicación en cada unidad. Esto significa que los discos (husos) tienen que ser accedidos al mismo tiempo, utilizando la misma banda, lo que significa que los ejes tienen que estar sincronizados. Como consecuencia, si llega una solicitud de E/S a la matriz para el trozo de datos A (ver Figura 3), todos los discos tienen que buscar al principio del bloque A, leer sus bytes específicos y enviarlo de vuelta a la controladora. Cualquier otra solicitud de datos, por ejemplo, para el trozo de datos B en la Figura 3 deberá esperar hasta que la solicitud de "A" haya terminado, porque todas las unidades estarán siendo utilizadas.
La capacidad de RAID-3 es la siguiente:

Capacidad = min (tamaños de disco) * (n-1)

lo que significa que la capacidad de RAID-3 está limitada por el disco más pequeño (pueden utilizarse unidades de diferentes tamaños en RAID-3), multiplicado por el número de n unidades, menos uno. El "menos uno" es debido al disco dedicado a la paridad.
RAID-3 tiene un buen desempeño, ya que es similar al RAID-0 (distribuido), pero debe suponer cierta reducción en el rendimiento debido a los cálculos de paridad (lo hace la controladora RAID). Sin embargo, si usted pierde el disco de paridad no se pierden los datos (los datos permanecen en los otros discos). Si pierde un disco de datos, todavía tiene el disco de paridad para recuperar los datos. Así que RAID-3 ofrece una mayor disponibilidad de datos y la fiabilidad de RAID-0, pero con una cierta reducción en el rendimiento debido a los cálculos de paridad y E / S. Más discusión sobre el rendimiento de RAID-3 se encuentra en este enlace.
RAID-3 no es muy popular en el mundo real, pero puede que todavía lo vea por ahí de tanto en tanto. RAID-3 se utiliza en situaciones en que RAID-0 es totalmente inaceptable porque no hay redundancia de datos suficientes y la reducción del rendimiento en la transmisión de datos debido a los cálculos de paridad de datos es aceptable.
La tabla  a continuación es un breve resumen de RAID-3 con algunos puntos destacados.

Clic para ampliar.

RAID-4
RAID-3 mejora la redundancia de datos mediante la adición de un disco de paridad para añadir un poco de fiabilidad. De manera similar, RAID-4 se basa en un RAID-0 por la adición de un disco de paridad para distribución a nivel de bloques. Dado que ahora la distribución es a nivel de bloques, cada disco se puede acceder de forma independiente para leer o escribir datos permitiendo accesos múltiples a datos al mismo tiempo. La figura a continuación tomada de wikipedia  ilustra cómo los datos se escriben a cuatro discos en RAID-4. 

En este esquema, los datos se escriben en trozos de bloques en los tres primeros discos (discos 0, 1, y 2) mientras que la cuarta unidad de disco (disco 3) es la unidad de paridad. La paridad de los bloques en las unidades es calculada por el controlador RAID y se almacena en el disco de paridad dedicado. En la figura, la paridad para A1, A2 y A3 se muestra como Ap en la unidad de paridad.
El disco de paridad dedicado supone un cuello de botella de rendimiento en RAID-4, en particular para escrituras E/S. Dado que RAID-4 es distribuido a nivel de bloques, ud puede escribir en los bloques A1 y B2, al mismo tiempo, ya que se encuentran en discos diferentes. Sin embargo, la paridad de ambos bloques se tiene que escribir en la misma unidad que sólo puede acomodar una solicitud de E/S a la vez. En consecuencia, una de las escrituras de paridad (A1 o B2) quedará bloqueada y el rendimiento de E/S se reduce. Para más información sobre el rendimiento de RAID-4, por favor ver el siguiente enlace.
La capacidad de RAID-4 es la siguiente:

Capacidad = min (tamaños de disco) * (n-1)

Lo que significa que la capacidad de RAID-4 está limitada por el disco más pequeño (pueden utilizarse unidades de diferentes tamaños en RAID-4), multiplicado por el número de n unidades, menos uno. El "menos uno" nuevamente es debido al disco de paridad. Sin embargo, se recomienda utilizar unidades del mismo tamaño en RAID-4.
RAID-4 mejora en la redundancia a RAID-0, que tiene cero redundancia de datos, mediante la adición de un disco de paridad. Usted puede perder una unidad de disco sin perder datos. Por ejemplo, usted podría perder el disco de paridad sin perder datos o podría perder uno de los discos de datos sin pérdida de datos. Pero la introducción de la unidad de paridad dedicada reduce el rendimiento de escritura en relación con RAID-0. Sin embargo, si la pérdida de rendimiento de escritura de RAID-4 es aceptable le da más redundancia de datos que RAID-0.
RAID-4 fue la última configuración RAID definida en el documento original. En el mundo real, RAID-4 se utiliza muy poco debido a que RAID-5 (véase la siguiente subsección) lo ha sustituido.
La tabla a continuación es un breve resumen de RAID-4, con algunos puntos destacados.

Clic para ampliar.


RAID-5
RAID-5 es similar al RAID-4, pero ahora la paridad se distribuye entre todas las unidades en lugar de utilizar una unidad de disco de paridad dedicado. Esto mejora el rendimiento de escritura en relación con RAID-4 ya que la paridad está escrita en todas las unidades de la matriz. La figura a continuación tomada de wikipedia ilustra cómo los datos se escriben a cuatro discos en RAID-5.

En este diseño, los bloques de paridad se etiquetan con un subíndice "p" para indicar la paridad. Observe cómo se distribuyen en las cuatro unidades. Los bloques alineados (un bloque por unidad) suelen ser una "banda". En la figura los bloques en una banda son todos del mismo color. El tamaño de datos de la banda es como siguiente:

Tamano de datos en una banda = tamaño de bloque * (n-1)

Donde n es el número de unidades de la matriz. Dentro de una banda hay un bloque único de paridad y todos los otros son bloques de datos. Cada vez que un bloque dentro de la banda se cambia o se escribe, el bloque de paridad se vuelve a calcular y se vuelve a escribir (esto se denomina a veces proceso de lectura-modificación-escritura). Este proceso agrega una sobrecarga reduciendo el rendimiento.
RAID-5 también tiene algunos problemas de rendimiento para escrituras pequeñas (más pequeñas que una sola banda) ya que la paridad debe ser calculada en varias ocasiones lastrando la capacidad computacional de la controladora RAID. Como se mencionó anteriormente el proceso de lectura-modificación-escritura que debe seguirse sucede mucho más a menudo en este caso.
La capacidad de RAID-5 es muy similar al RAID-4 y es la siguiente:

Capacidad = min (tamaños de disco) * (n-1)

Lo que significa que la capacidad de RAID-5 está limitada por el disco más pequeño (pueden utilizarse unidades de diferentes tamaños en RAID-5), multiplicado por el número de n unidades, menos uno. El "menos uno" en este caso es debido a la información de paridad (aquí no hay disco dedicado)
Con RAID-5 se puede perder una sola unidad y no perder los datos, ya sea porque los datos o los bloques de paridad que faltan en la unidad perdida se pueden encontrar en las unidades restantes. Además, muchos controladores RAID permiten lo que se llama unidades de repuesto en caliente (hot-spare). Esta unidad es típica de un arreglo RAID, pero no se utilizó inicialmente para almacenar datos. Si el grupo RAID pierde una unidad, el hot-spare es inmediatamente puesto en el grupo del arreglo RAID por el controlador.
En el caso de RAID-5, el controlador de inmediato comienza la redistribución de datos y bloques de paridad en esta nueva unidad. Para ello, las unidades iniciales en la matriz tienen que tener todos los bloques de lectura y la controladora RAID tiene que volver a calcular la paridad o reconstruir los bloques de datos que faltan. Esta combinación significa que puede tomar un poco de tiempo para reponer los datos a la unidad hot-spare. Lo bueno de tener un disco hot-spare es que normalmente el proceso de restauración sucede automáticamente, de modo que casi no hay retraso en la incorporación de una unidad hot-spare.
RAID-5 se ha utilizado durante mucho tiempo y durante este tiempo la disponibilidad y redundancia de datos ha sido muy buena. Sin embargo, hay un fenómeno nuevo que afecta a RAID-5 explicado en el varios artículo en la web como este. Básicamente, la capacidad de las unidades está creciendo más rápido que la tasa de errores de lectura irrecuperable (URE) de los discos al punto de que perder una unidad de una matriz RAID-5 y recuperarla con una unidad hot-spare casi con seguridad conducirá a una URE que significa que la matriz RAID-5 se perderá y los datos tendrán que ser restaurados a partir de una copia de seguridad. Sin embargo, este es tema para otro artículo.
No faltan los artículos acerca de RAID-5 en la web. Y encontrará opiniones a favor y en contra basadas en los diferentes casos de uso. Asegúrese de entender el uso de la aplicación cuando lea acerca de los pros y los contras de RAID-5. Una visión razonable de las ventajas y desventajas de RAID-5 es ofrecida en este artículo.

La tabla a continuación es un breve resumen de RAID-5 con algunos puntos destacados.

Clic para ampliar.


RAID-6
Como se mencionó anteriormente, existe un problema potencial con RAID-5 para unidades de mayor capacidad y un mayor número de ellas. RAID-6 intenta ayudar con esta situación por medio de dos bloques de paridad por banda en lugar de uno solo como hace RAID-5. Esto le permite perder dos unidades sin perder ningún dato. La figura a continuación tomada de wikipedia ilustra cómo los datos se escriben a cuatro discos en RAID-6.

En esta figura, el primer bloque de paridad se indica con el subíndice "p" como en "Ap". El segundo bloque de paridad en la banda se indica con el subíndice "q", como Aq. El uso de dos bloques de paridad reduce la capacidad utilizable de un RAID-6 como sigue:

Capacidad = min (tamaños de disco) * (n-2)

Lo que significa que la capacidad de RAID-6 está limitada por el disco más pequeño (pueden utilizarse unidades de diferentes tamaños en RAID-6) multiplicado por el número de n unidades, menos dos. El "menos dos" es debido al uso de dos bloques de paridad por banda.
Calcular el primer bloque de paridad, p, se hace de la misma manera que en RAID-5. Sin embargo, el cálculo del bloque de paridad q es más complicado, como se explica aquí. Esto significa que el rendimiento de escritura de un arreglo RAID-6 puede ser más lento que un RAID-5 para determinado nivel de desempeño del controlador RAID. Sin embargo, el rendimiento de lectura de un RAID-6 es tan rápido como una matriz RAID-5 dado que omite la lectura de los bloques de paridad. Pero a cambio de un peor rendimiento, RAID-6 puede tolerar la pérdida de dos unidades, mientras que RAID-5 sólo tolera perder una sola. Junto con unidades más grandes y más cantidad de las mismas, significa que se pueden construir arreglos RAID-6 mas grandes en relación a RAID-5.
La tabla a continuación es un breve resumen de RAID-6, con algunos puntos destacados.

Clic para ampliar.

Niveles RAID híbridos
Como puedes ver, cada uno de los niveles estándar de RAID (0-6) tiene ciertas limitaciones. Algunas de las ellas tienen un gran rendimiento (RAID-0), pero la disponibilidad de datos y la redundancia son bastante horribles, mientras que otras tienen una disponibilidad y redundancia de datos muy buena (RAID-6), pero el rendimiento no es tan bueno. Así que como puede imaginar, la gente empezó a preguntarse si no podría combinar los niveles RAID para combinar las características y lograr tal vez un mejor rendimiento al mismo tiempo que una redundancia y disponibilidad muy buenos. Esto conduce a lo que la gente llama Niveles RAID híbridos o más comúnmente llamados niveles RAID anidados.
El tema de los niveles RAID anidados es bastante largo así que voy a guardarlo para otro artículo. Pero el concepto básico es la combinación de niveles de RAID en una cierta manera. Por ejemplo, una configuración común se llama RAID 1+0 o RAID-10 El primer número (el de la izquierda) se refiere a la parte "baja" o inicial de la matriz. A continuación, el segundo número se refiere a la parte alta de nivel o matriz RAID. El RAID de nivel superior utiliza el nivel más bajo como bloques de construcción.
En el caso de RAID-10, el enfoque es usar varios pares de unidades (RAID-1) en el nivel más bajo y luego combinarlas usando un RAID-0. Esto conserva las bondades de RAID-1 como la disponibilidad de datos y la redundancia, mientras que gana algo de rendimiento de un RAID-0.

Resumen
Esto concluye nuestra introducción a RAID. Para algunas personas puede ser nuevo y para muchos será una reseña. Ahora que hemos cubierto lo básico, en próximos artículos vamos a explorar los niveles anidados más en profundidad, incluyendo RAID-01-RAID 5, RAID-6 y configuraciones RAID-10.