Le RAID est une solution qui a été développée à l'origine pour le marché des serveurs de réseau afin de créer un stockage volumineux à moindre coût. Essentiellement, il faudrait plusieurs disques durs à moindre coût et assemblés via un contrôleur pour fournir un seul disque de plus grande capacité. C’est ce que RAID signifie: matrice redondante de lecteurs ou de disques peu coûteux. Pour ce faire, un logiciel spécialisé et des contrôleurs étaient nécessaires pour gérer les données réparties entre les différents disques.
Finalement, la puissance de traitement de votre système informatique standard a permis aux fonctionnalités de pénétrer dans le marché des ordinateurs personnels.
Le stockage RAID peut maintenant être basé sur un logiciel ou du matériel, et peut être utilisé à trois fins distinctes. Ceux-ci incluent la capacité, la sécurité et la performance. La capacité est simple et concerne généralement presque tous les types de configurations RAID utilisées. Par exemple, deux disques durs peuvent être liés ensemble en tant que lecteur unique au système d'exploitation, permettant ainsi de créer un lecteur virtuel d'une capacité double. Les performances sont une autre raison clé pour utiliser une configuration RAID sur un ordinateur personnel. Dans le même exemple où deux lecteurs sont utilisés comme un seul lecteur, le contrôleur peut fractionner un bloc de données en deux parties, puis placer chacune de ces parties sur un lecteur séparé. Cela double efficacement les performances d'écriture ou de lecture des données sur le système de stockage. Enfin, le RAID peut être utilisé pour la sécurité des données.
Cela se fait en utilisant une partie de l'espace sur les lecteurs pour essentiellement cloner les données écrites sur les deux lecteurs. Encore une fois, avec deux lecteurs, nous pouvons faire en sorte que les données soient écrites sur les deux lecteurs. Ainsi, si un disque tombe en panne, l’autre a toujours les données.
Selon les objectifs de la matrice de stockage que vous souhaitez assembler pour votre système informatique, vous utiliserez l'un des différents niveaux de RAID pour atteindre ces trois objectifs.
Pour ceux qui utilisent des disques durs sur leur ordinateur, les performances vont probablement être plus un problème que la capacité. D'autre part, ceux qui utilisent des disques SSD voudront probablement un moyen de prendre les plus petits disques et de les relier pour créer un seul disque plus grand. Examinons maintenant les différents niveaux de RAID pouvant être utilisés avec un ordinateur personnel.
RAID 0
Il s'agit du niveau le plus bas du RAID et n'offre aucune forme de redondance, raison pour laquelle il est appelé niveau 0. Essentiellement, RAID 0 prend deux disques ou plus et les assemble pour créer un disque de plus grande capacité. Ceci est réalisé par un processeur appelé striping. Les blocs de données sont divisés en fragments de données, puis écrits dans l'ordre dans les lecteurs. Cela offre des performances accrues car les données peuvent être écrites simultanément sur les disques par le contrôleur, ce qui multiplie la vitesse des disques. Vous trouverez ci-dessous un exemple de la manière dont cela pourrait fonctionner sur trois disques:
Drive 1 | Lecteur 2 | Drive 3 | |
---|---|---|---|
Bloc 1 | 1 | 2 | 3 |
Bloc 2 | 4 | 5 | 6 |
Bloc 3 | 7 | 8 | 9 |
Pour que RAID 0 fonctionne efficacement pour améliorer les performances du système, vous devez essayer d’avoir des lecteurs compatibles. Chaque lecteur doit avoir la même capacité de stockage et les mêmes caractéristiques de performance. Si ce n'est pas le cas, la capacité sera alors limitée à un multiple du plus petit des lecteurs et les performances au plus lent des lecteurs, car il faudra attendre que toutes les bandes soient écrites avant de passer au jeu suivant. Il est possible d'utiliser des lecteurs incompatibles, mais dans ce cas, une configuration JBOD pourrait être plus efficace. JBOD ne représente qu'un groupe de lecteurs et constitue en réalité un ensemble de lecteurs auxquels on peut accéder indépendamment les uns des autres, mais qui apparaissent comme un seul lecteur de stockage pour le système d'exploitation. Ceci est généralement réalisé en disposant de la plage de données entre les lecteurs. Cela s'appelle souvent SPAN ou BIG. En réalité, le système d'exploitation les considère tous comme un seul disque, mais les blocs sont écrits sur le premier disque jusqu'à ce qu'il soit plein, puis passe au deuxième, puis au troisième, etc. avec des disques de différentes tailles, mais cela n’augmentera pas les performances du module RAID. Le principal problème des configurations RAID 0 et JBOD est la sécurité des données. Étant donné que vous avez plusieurs lecteurs, les risques de corruption de données ont augmenté car vous avez plus de points de défaillance. En cas de défaillance d’un lecteur de la matrice RAID 0, toutes les données deviennent inaccessibles. Dans un JBOD, une panne de disque entraîne la perte de toutes les données qui se trouvaient sur ce disque. Par conséquent, il est préférable que ceux qui souhaitent utiliser cette méthode de stockage disposent d'un autre moyen de sauvegarder leurs données. Il s'agit d'un premier véritable niveau de RAID car il fournit un niveau complet de redondance pour les données stockées sur la matrice. Cela se fait par le biais d'un processus appelé mise en miroir. En réalité, toutes les données écrites sur le système sont copiées sur chaque unité d’un tableau de niveau 1. Cette forme de RAID est généralement réalisée avec une paire de disques seulement, car l’ajout de disques supplémentaires n’ajoutera aucune capacité supplémentaire, mais une redondance accrue. Pour mieux donner un exemple, voici un tableau qui montre comment cela serait écrit sur deux lecteurs: Pour tirer le meilleur parti d'une configuration RAID 1, le système utilisera à nouveau des disques compatibles partageant les mêmes capacités et performances. Si des lecteurs incompatibles sont utilisés, la capacité de la matrice sera égale à celle de la plus petite capacité de la matrice. Par exemple, si un téraoctet et demi et un lecteur d'un téraoctet étaient utilisés dans une matrice RAID 1, la capacité de cette matrice sur le système serait simplement d'un téraoctet. Ce niveau de RAID est très efficace pour la sécurité des données car les deux disques sont effectivement identiques. Si l’un des deux disques tombe en panne, l’autre possède les données complètes de l’autre. Le problème avec ce type d'installation est généralement de déterminer lequel des disques est en panne car souvent, le stockage devient inaccessible lorsqu'un des deux échoue et ne sera pas restauré correctement tant qu'un nouveau disque ne sera pas inséré à la place du disque en panne et qu'une restauration ne sera effectuée. processus est exécuté. Comme mentionné précédemment, il n’ya pas non plus de gain de performance. En fait, le surcoût du contrôleur pour le RAID entraînera une légère perte de performances. C'est une combinaison quelque peu compliquée des niveaux RAID 0 et niveau 1. Le contrôleur aura besoin d'au moins quatre disques pour fonctionner dans ce mode car il va créer deux paires de disques. Le premier ensemble de disques est un tableau en miroir qui permet de cloner les données entre les deux. Le second ensemble de disques est également mis en miroir, mais configuré pour être la bande du premier. Ceci fournit à la fois la redondance des données et des gains de performances. Vous trouverez ci-dessous un exemple d’écriture de données sur quatre lecteurs utilisant ce type de configuration: Pour être honnête, ce n'est pas un mode de RAID souhaitable pour fonctionner sur un système informatique. Bien que cela améliore quelque peu les performances, il n’est vraiment pas bon en raison des énormes frais généraux du système. En outre, cela représente un énorme gaspillage d’espace, car la matrice de disques ne représentera au maximum que la moitié de la capacité de tous les disques combinés. Si des lecteurs incompatibles sont utilisés, les performances seront limitées aux lecteurs les plus lents et la capacité sera simplement le double du lecteur le plus petit. Il s'agit du niveau de RAID le plus élevé que l'on puisse trouver dans les systèmes informatiques grand public et constitue une méthode beaucoup plus efficace pour augmenter la capacité et la redondance. Cela est possible grâce à un processus de fractionnement des données avec parité. Pour ce faire, il faut au moins trois lecteurs car les données sont divisées en bandes sur plusieurs des lecteurs, mais un bloc est ensuite mis de côté pour la parité. Pour mieux expliquer cela, examinons d'abord comment les données peuvent être écrites sur trois lecteurs: En substance, le contrôleur de lecteur prend un bloc de données à écrire sur tous les lecteurs du module. Le premier bit de données est placé sur le premier lecteur et le second sur le second. Le troisième lecteur obtient le bit de parité, qui est essentiellement une comparaison des données binaires sur les premier et second. En mathématiques binaires, vous n'avez que 0 et 1. Un processus de calcul booléen est effectué pour comparer les bits. Si les deux s'additionnent pour former un nombre pair (0 + 0 ou 1 + 1), le bit de parité sera égal à zéro. Si les deux s'additionnent pour former un nombre impair (1 + 0 ou 0 + 1), le bit de parité sera égal à un. La raison en est que si l'un des disques tombe en panne, le contrôleur peut alors déterminer quelles sont les données manquantes. Par exemple, si le lecteur 1 tombe en panne, ne laissant que les lecteurs deux et trois, et que le lecteur deux comporte un bloc de données et que le lecteur trois comporte un bloc de parité, le bloc de données manquant du lecteur 1 doit être égal à zéro. Cela permet une redondance des données efficace qui permet de restaurer toutes les données en cas de panne d'un lecteur. Désormais, pour la plupart des configurations client, une défaillance aura toujours pour conséquence que le système ne fonctionnera pas. Pour que le système fonctionne, il est nécessaire de remplacer le lecteur défaillant par un nouveau lecteur. Ensuite, un processus de reconstruction des données doit être effectué au niveau du contrôleur. Une fonction booléenne inverse est ensuite utilisée pour recréer les données sur le lecteur manquant. Cela peut prendre un certain temps, en particulier pour les disques de plus grande capacité, mais il est au moins récupérable. Désormais, la capacité d’une matrice RAID 5 dépend du nombre de disques dans la matrice et de leur capacité. Une fois encore, la matrice est limitée par le plus petit lecteur de capacité de la matrice, il est donc préférable d'utiliser des lecteurs correspondants. L'espace de stockage effectif est égal au nombre de disques moins une fois la capacité la plus faible. Donc, en termes mathématiques, c'est (n-1) * Capacitymin . Ainsi, si vous avez trois disques de 2 Go dans une matrice RAID 5, la capacité totale sera de 4 Go. Une autre matrice RAID 5 utilisant quatre disques de 2 Go aurait une capacité de 6 Go. Maintenant, les performances du RAID 5 sont un peu plus compliquées que certaines des autres formes de RAID en raison du processus booléen nécessaire pour créer le bit de parité lors de l'écriture des données sur les disques. Cela signifie que les performances d'écriture seront inférieures à celles d'une matrice RAID 0 avec le même nombre de disques. Les performances en lecture, en revanche, ne souffrent pas autant que l'écriture car le processus booléen n'est pas terminé car il lit les données directes des lecteurs. Nous avons discuté des différents avantages et inconvénients de chacun des niveaux de RAID pouvant être utilisés sur des ordinateurs personnels, mais il existe un autre problème que beaucoup de personnes ne réalisent pas lorsqu'il est question de créer des configurations de disques RAID. Avant de pouvoir utiliser une configuration RAID, celle-ci doit d'abord être construite soit par le logiciel du contrôleur matériel, soit dans le logiciel du système d'exploitation. Cela initialise essentiellement le formatage spécial requis pour suivre correctement la manière dont les données seront écrites et lues sur le lecteur. Cela ne semble probablement pas être un problème, mais vous devez le faire même si vous souhaitez modifier la configuration de votre matrice RAID. Par exemple, supposons que vous manquez de données et que vous souhaitiez ajouter un lecteur supplémentaire pour une matrice RAID 0 ou RAID 5. Dans la plupart des cas, vous ne pourrez pas le faire sans d'abord reconfigurer la matrice RAID, ce qui supprimera également toutes les données stockées sur ces disques.Cela signifie que vous devez entièrement sauvegarder vos données, ajouter le nouveau lecteur, reconfigurer le module de lecteurs, le formater, puis restaurer vos données d'origine sur le lecteur. Cela peut être un processus extrêmement pénible. Par conséquent, assurez-vous que la matrice est configurée comme vous le souhaitez la première fois.RAID 1
Drive 1 Lecteur 2 Bloc 1 1 1 Bloc 2 2 2 Bloc 3 3 3 RAID 1 + 0 ou 10
Drive 1 Lecteur 2 Drive 3 Lecteur 4 Bloc 1 1 1 2 2 Bloc 2 3 3 4 4 Bloc 3 5 5 6 6 RAID 5
Drive 1 Lecteur 2 Drive 3 Bloc 1 1 2 p Bloc 2 3 p 4 Bloc 3 p 5 6 Le gros problème avec toutes les configurations RAID