Les professionnels de la technologie de l’information (TI) ont reconnu l’importance de la reprise après sinistre depuis des décennies. Les vers Internet très en vue, les catastrophes naturelles et d'autres atteintes à la sécurité de grande envergure rappellent la nécessité de planifier correctement la reprise après sinistre et les autres problèmes de continuité des activités.
La reprise après sinistre s’applique principalement aux entreprises et autres grandes organisations, mais les mêmes principes de base s’appliquent également aux réseaux domestiques.
Qu'est-ce que la récupération après sinistre?
La reprise après sinistre implique une série de mesures à prendre en cas de pannes majeures imprévues afin de minimiser leurs effets néfastes. En réseau, les catastrophes peuvent résulter d'événements tels que
- Malware informatique
- Pannes d'électricité
- Attaques de hackers
- Coupures ou pannes de câbles souterrains
- Incendie, inondation, tremblement de terre et autres catastrophes naturelles dans une installation
- Erreurs dans l'administration du système
Le concept connexe de continuité de l'activité implique de veiller à ce que les processus métier critiques d'une entreprise, y compris ceux utilisant des systèmes informatiques, puissent être maintenus en cas de sinistre.
Pourquoi la récupération après sinistre est-elle importante?
Lorsqu'elles sont bien exécutées, les procédures de reprise après sinistre permettent d'économiser d'importantes sommes d'argent. L’impact financier sur les entreprises de quelques heures, même de perte de connexion réseau et Internet, se chiffre facilement à des millions de dollars. La reprise après sinistre peut également améliorer la qualité de la vie humaine et peut même sauver des vies. La perte de contact du téléphone cellulaire avec les amis et la famille devient extrêmement perturbante en cas d’urgence.
Cela dit, les investissements dans la continuité des activités doivent être mis en balance avec des considérations pratiques relatives aux coûts et à la complexité de la préparation à un avenir inconnu:
- Coût - la reprise après sinistre complète est prohibitive
- testabilité - les plans de reprise après sinistre qui ont fière allure sur le papier mais ne sont techniquement pas prouvés échoueront probablement dans la pratique
- l'accent est mis sur le back-office - Il est facile de se laisser séduire par les solutions pour la salle des serveurs, mais sans dispositions adéquates pour les personnes et l'infrastructure côté client, la continuité des activités ne sera pas assurée.
Les réseaux domestiques ne disposent pas du matériel coûteux d'une grande entreprise, mais la préservation des données et des communications peut être tout aussi importante.
Planification de la reprise après sinistre
La meilleure approche de la reprise après sinistre est principalement axée sur la planification et la prévention. Bien que les tremblements de terre et les attaques terroristes soient généralement difficiles à anticiper, de nombreux autres scénarios de catastrophe peuvent être analysés en détail.
Pour les événements qui ne peuvent pas être évités, un plan de reprise après sinistre informatique prend en compte la nécessité de:
- Détecter les pannes ou autres effets de catastrophe le plus rapidement possible
- Notifier toutes les parties concernées afin qu'elles puissent prendre des mesures
- Isoler les systèmes affectés afin que les dommages ne puissent pas se propager
- réparation les systèmes critiques affectés afin que les opérations puissent reprendre
Celles-ci sont collectivement appelées activités de gestion ou d'atténuation des risques.
Techniques de récupération après sinistre
Tous les bons plans de reprise après sinistre informatique prennent en compte les trois principaux composants des opérations: données, systèmes et personnes.
Du point de vue technique, la plupart des organisations ont recours à une forme de redondance rendre possible la récupération des données et des systèmes. La redondance permet aux données secondaires ou aux ressources système d'être mises en service rapidement, en cas de défaillance ou d'indisponibilité des ressources principales. Les entreprises peuvent répliquer des serveurs et autres matériels critiques sur plusieurs sites pour se protéger de tout point de défaillance unique.
Alors que la mise en miroir de disques traditionnelle maintient les données hautement disponibles dans des situations normales, elle ne fonctionne que sur de courtes distances. Les sauvegardes permettent de capturer des instantanés des données dans des emplacements déplacés. Les stratégies de sauvegarde réseau traditionnelles, par exemple, archivent régulièrement des copies de données critiques afin de pouvoir les restaurer ultérieurement si nécessaire. Si les sauvegardes sont conservées sur le site ou à un seul emplacement, leur valeur pour la récupération après sinistre est faible. Les grandes entreprises investissent dans la technologie SAN (Storage Area Network) pour répartir les données plus largement sur leurs réseaux internes. Certains utilisent aussi hébergement tiers services de stockage en nuage.
Les réseaux domestiques peuvent également tirer parti des solutions de sauvegarde réseau et de stockage en nuage pour mieux gérer leurs risques.
Parmi les autres techniques courantes de prise en charge des plans de reprise après sinistre, citons:
- Attribuer aux membres de l'organisation des tâches spéciales à assumer en cas de sinistre et leur fournir la formation nécessaire
- Réalisation d'exercices de récupération après sinistre qui s'exercent contre des scénarios de récupération spécifiques