Billets d'expert

Icon Article Sauvegarde

Sauvegarde

Publication : 29 novembre, 2011

Finalité des sauvegardes

En informatique, une architecture redondante permet d'assurer la haute disponibilité d'un système mais n'est pas suffisante pour protéger ses données. Il est nécessaire d'effectuer des sauvegardes (backups en anglais) afin de pouvoir récupérer les données perdues suite à une suppression ou une modification accidentelle, une défaillance technique ou une infiltration malveillante (hack). Cela est valable aussi bien pour des postes clients que pour des systèmes centraux de type serveur mais les enjeux ne sont pas les mêmes. En effet, les données contenues dans un serveur sont en général destinées à un plus grand nombre d'utilisateurs et sont de nature plus critique que celles contenues dans un système client. C'est pourquoi les moyens techniques de sauvegarde sur serveur sont plus sophistiqués que ceux mis en oeuvre pour les postes clients, même si de nombreuses solutions existent pour ces derniers : points de restauration, disques durs externes, clés USB...

Mettre en place un mécanisme de sauvegarde permet également d'archiver les données, c'est-à-dire de les conserver en leur associant une date.


Les différents mécanismes de sauvegarde

Le mécanisme de sauvegarde utilisé doit impérativement pouvoir assurer la pérennité et la récupération des données critiques d'une entreprise indépendamment du sinistre subi et sans perturber le fonctionnement du système d'information. C'est pourquoi son choix fait suite à la définition préalable d'une stratégie de sauvegarde, précisant le type et le volume de données devant être sauvegardées, la rétention (durée pendant laquelle les données sauvegardées sont conservées intactes), la fréquence et le mode de sauvegarde. Un plan de reprise d'activité ou plan de secours est également défini pour indiquer la procédure à suivre en cas d'incident. Ce plan peut faire appel à des interventions manuelles ou à des automatismes de type signal d'alarme, dispositif anti-feu, etc.


Les supports de sauvegarde

Plusieurs critères doivent être pris en compte pour choisir le support de sauvegarde le plus adapté. Parmi eux :

  • la fiabilité du support,
  • la vitesse de transfert des données,
  • la capacité de stockage du support,
  • le volume physique du support.

Quelques exemples de support de sauvegarde : disque dur externe, disque optique (CD-ROM, DVD), clé USB, serveur de fichiers sur le réseau local, serveur distant...




Les stratégies de sauvegarde

Parmi les différentes stratégies de sauvegarde envisageables, on peut trouver :

  • la sauvegarde sur système client : les données à sauvegarder peuvent êtres placées sur un support amovible : CD-ROM, DVD, disque dur externe, clé USB. En outre, plusieurs outils intégrés tels que les points de restauration ou les images système (ou ghost) permettent de restituer l'état d'un système à une date donnée.
  • la sauvegarde en ligne : de plus en plus de services proposent un espace de stockage gratuit ou payant selon le volume des données à sauvegarder. On peut ainsi accéder à ses données à partir de n'importe quel ordinateur disposant d'une connexion internet. Cette solution est surtout intéressante pour les particuliers qui n'ont pas à se soucier des risques de pertes de données car l'hébergeur se charge lui-même d'effectuer des sauvegardes. L'inconvénient principal est que l'hébergeur peut consulter, modifier ou dupliquer les données, même si le chiffrement des données peut résoudre le problème. Enfin, il peut y avoir des limitations au niveau de la bande passante disponible, ce qui peut rendre l'accès aux données plus contraignant. C'est pourquoi cette solution n'est en général pas envisageable pour les entreprises.
  • la sauvegarde en pair à pair : les données à sauvegarder sont séparées en blocs qui sont ensuite disséminés vers d'autres postes ou serveurs à travers le réseau, en effectuant plusieurs copies sur différentes machines afin d'assurer la disponibilité des données en cas de défaillance ou de mise hors tension d'une machine. Cette solution permet de se servir de l'espace disque inutilisé sur un réseau LAN ou WAN et d'éviter d'avoir à investir dans du matériel supplémentaire (dédié) pour sauvegarder ses données. L'inconvénient est que les données sont parfois difficiles à restaurer ou peuvent être perdues car elles sont disséminées sur plusieurs postes. Il peut être aussi impossible de sauvegarder ses données quand il n'y a pas suffisamment de postes disponibles sur le réseau. C'est la raison pour laquelle les entreprises optent en général pour une autre solution de sauvegarde, même si ces inconvénients sont en passe d'être corrigés.
  • la sauvegarde sur serveur : cette solution est la plus utilisée par les entreprises. Elle consiste à centraliser les données sur un ou plusieurs serveurs sur le réseau local ou sur des serveurs distants (datacenter).

Dans le cas de la sauvegarde sur serveur dans un réseau local, deux solutions de stockage sont de plus en plus utilisées :

  • le stockage en réseau NAS (Network Attached Storage) : serveur de fichiers fournissant un accès plus rapide aux fichiers et une administration et configuration simplifiées par rapport à un serveur de fichiers classique. Le montage de disques durs en RAID permet de répartir les données sur plusieurs disques dur afin d'améliorer, selon le système RAID utilisé, la tolérance aux pannes, la sécurité, les performances ou une répartition de ces trois caractéristiques. Le serveur NAS autorise des accès provenant de serveurs de fichiers multiples. Cela permet d'implanter facilement des systèmes de répartition de charge (load balancing) et de tolérance aux pannes. Les protocoles utilisés pour accéder à un serveur NAS sont les suivants : CIFS, NFS, AFP. Le protocole NDMP est utilisé pour le transfert des données d'un serveur NAS vers un serveur de sauvegarde.
  • le réseau de stockage SAN (Storage Area Network) : réseau dédié au stockage relié au réseau des utilisateurs. Il comporte des équipements d'interconnexion (switches, bridges) et des éléments de stockage (disques durs) reliés par des interfaces très haut débit (Fibre Channel, iSCSI, FCoE). Un SAN permet de partager plus efficacement des données entre plusieurs ordinateurs d'un réseau local car le trafic SAN est séparé du trafic des utilisateurs. Les serveurs applicatifs servent d'interface entre le réseau SAN et le réseau des utilisateurs.

Un NAS est généralement utilisé pour servir des fichiers tandis qu'un SAN est plus adapté pour les applications client-serveur comme les bases de données et les transactions en ligne. Il est également possible de trouver un NAS et un SAN dans la même infrastructure réseau.


Les méthodes de sauvegarde

Plusieurs méthodes de sauvegarde existent :

  • la sauvegarde complète (full backup) : toutes les données sont enregistrées, qu'il y ait eu des modifications ou non. C'est la méthode de sauvegarde la plus sûre mais la plus coûteuse en terme de temps de sauvegarde.
  • la sauvegarde incrémentale (incremental backup) : enregistre les données modifiées depuis la sauvegarde précédente. Cette méthode de sauvegarde est plus rapide qu'une sauvegarde complète mais nécessite de posséder toutes les sauvegardes précédentes pour reconstituer les données.
  • la sauvegarde différentielle (differential backup) : enregistre uniquement les données modifiées depuis la dernière sauvegarde complète. Cette méthode de sauvegarde est plus lente que la sauvegarde incrémentale mais aussi plus fiable car seule la dernière sauvegarde complète est nécessaire pour reconstituer les données.
  • la sauvegarde à delta (delta backup) ou sauvegarde en mode bloc : sauvegarde incrémentale procédant à un niveau plus fin, en comparant par bloc de données et non uniquement par fichier.

Le volume des données à sauvegarder allonge considérablement le temps de sauvegarde et parfois une sauvegarde incrémentale ou différentielle ne suffit pas. Pour remédier à cela, plusieurs techniques sont utilisées. Parmi elles :

  • la compression des données sauvegardées,
  • la déduplication : élimination des doublons dans les données sauvegardées,
  • l'utilisation des snapshots : images instantanées d'un disque.

D'autre part, pour protéger ou limiter l'accès aux données sauvegardées, les données peuvent êtres chiffrées et une gestion des droits d'accès peut être mise en place.