La semaine dernière, OVH a perdu un data center dans un incendie. Cette triste nouvelle m’a rappelé tout un tas d’événements passés qui m’ont construit et qui m’ont permis d’améliorer ma gestion des données. C’est pourquoi aujourd’hui je vais partager avec vous pourquoi et comment sauvegarder ses données au travers de bonnes pratiques sur la sauvegarde.

Introduction

A vrai dire, j’ai hésité avant de publier cet article. Je ne voulais pas me placer en donneur de leçon. Personne n’est à l’abri d’une perte de donnée. Il faut savoir être humble sur ce genre de sujet. J’ai donc préféré attendre un peu et ne pas réagir à chaud.

Pendant cet incident, nous pouvions lire tout un tas de réactions sur Twitter au sujet des pertes de données. Je ne vais pas entrer dans le débat de la responsabilité. Je retiens seulement qu’il y a un manque de connaissance ou d’information sur la nécessité de faire des sauvegardes des données. Et c’est ce que je vais tenter d’éclairer ici en :

  • développant un modèle de menace
  • proposant des bonnes pratiques de sauvegarde des données

Pourquoi sauvegarder ses données ?

En panne, tu tomberas

Connaissez-vous l’aphorisme célèbre de Werner Vogels, CTO d’Amazon : « Everything fails all the time » ? L’idée est qu’il ne faut pas se demander si un service va rencontrer une défaillance mais plutôt quand il va tomber en panne. Et par extension se demander comment réagir en cas de défaillance. Olivier Martineau explique ce scénario de panne à l’échelle de la startup.
C’est de cette approche que le principe de Design for failure tire toute son essence. Pour vos données, le service qui les stocke peut tomber en panne (de façon temporaire ou définitive !) : un disque dur, un serveur, un data center, … Il est impossible de prévoir toutes les pannes. Il est alors nécessaire de mettre en place un système résilient à la perte de données.

Les données dans le cloud, tu ne possèdes pas

La panne n’est pas la seule raison d’une perte de données (ou de service). Comme le souligne Stéphane Bortmeyer :

Dépouillé, tu seras

Tout matériel physique peut être volé. Que se soit un PC dans un bureau, un ordinateur portable dans un coffre de voiture ou un téléphone portable dans une poche.

De même, tout système informatique peut être compromis. Il fut un temps où l’on craignait les virus ou pirates destructeurs de données. Actuellement, nous redoutons plus les rançonneurs et leurs rançongiciels. Toujours est-il que vos données peuvent être la cible d’une attaque.

L’erreur, tu feras

Vous avez pensé à toutes les menaces externes. Mais êtes-vous à l’abri d’une erreur de manipulation (ou un bug applicatif) ? Vous savez :

  • cette suppression de répertoire accidentelle ou
  • cette exécution de la mauvaise requête SQL et sans retour arrière possible.
  • Sans parler de cette application mal configurée qui a modifié les données sur le mauvais environnement…

Comme vous pouvez le constater, le modèle de menace est large et très varié. La probabilité d’occurrence n’est pas anodine. Une fois donc avec tous ces risques en tête, il n’y a qu’une seule question !

Comment sauvegarder (efficacement) ses données ?

Nous allons donc explorer les bonnes pratiques de sauvegarde des données pour pallier à tous ces risques.

Comment ?

En terme de sauvegarde de données, il y a un principe assez simple nommé la règle du 1-2-31 :

  • 3 copies d’un même fichier : une défaillance n’arrive jamais seule2; vous devez donc avoir plusieurs vraies copies3.
  • 2 supports différents : votre sauvegarde ne doit pas être sur le même disque ou le même serveur.
  • 1 sauvegarde hors-site : que ce soit chez soi ou chez un hébergeur, personne n’est à l’abri d’un incendie ou une inondation; l’une des sauvegardes doit être dans un lieu différent4.

Quoi ?

Il est inutile de tout sauvegarder. La nature des données peut aider à déterminer si la donnée doit être sauvegardée. Par exemple, est-il nécessaire de sauvegarder le résultat des entrainements de machine learning (qui pourront être recalculés) ? En revanche, il sera impossible de reconstruire toutes ces photos, documents de travail, etc…

Quand ?

La fréquence des sauvegardes dépend de la criticité des données. Vous pouvez très certainement accepter de perdre 1 semaine voire 1 mois de billet de blog personnel. Mais combien de commandes clients pouvez-vous me permettre de perdre ?

Idéalement, ces sauvegardes doivent être versionnées car rien ne garantit que les dernières ne contiennent pas une destruction ou altération plus ou moins partielle de vos données.

Je vous conseille fortement d’automatiser vos sauvegardes car c’est une tâche répétitive facilement automatisable. Et car si vous ne l’automatisez pas, il arrivera un moment où vous ne ferez plus vos sauvegardes.

Contrôler

Un autre point important appris à mes dépends : une sauvegarde ne vaut rien si elle n’est pas vérifiée et testée. En effet, quelle déception le jour où vous avez besoin d’accéder à une sauvegarde et que vous constatez qu’elle est vide. Et même non vide, est-ce que votre base de données est capable de restaurer votre sauvegarde ?
Il va donc falloir tester la restauration des données. A l’échelle d’une entreprise, cela peut même se traduire par des exercices d’incident afin de vérifier que tous les équipes connaissent les procédures et ont les bons réflexes.

Aller plus loin

Ma Dernière suggestion sera sûrement la protection de l’accès aux sauvegardes. Pensez à les chiffrer et les protéger avec un mot de passe ou une clé. Bien évidemment, le transfert des copies doit se faire également avec un protocole sécurisé qui ne laisse pas circuler des données en clair sur le réseau.

Conclusion

Comme vous pouvez le voir, ces bonnes pratiques de gestion de sauvegarde 5 et de restauration des données sont valables à la fois dans le monde professionnel et personnel6. Elles participent à une bonne hygiène de vie numérique. Malheureusement, on en prend bien la mesure seulement au pied du mur.

Ce qu’il faut retenir, c’est que vous aurez un jour un incident sur vos données. La question est donc : serez-vous donc prêt le jour venu ?

Tout va bien... grâce aux bonnes pratiques de sauvegarde des données !

Pour conclusion, je vous laisse avec la lecture d’une courte histoire : Tao of Backup.

  1. Next Inpact a fait un article plus détaillé sur la stratégie de sauvegarde 3-2-1.
  2. Ces 4 derniers mois, j’ai connu 3 pannes de support de stockage à titre personnel…
  3. Non, le RAID n’est pas considéré comme une copie de sauvegarde. C’est un mécanisme de protection contre la défaillance d’un disque dur.
  4. Si vous avez uniquement recourt à des services en ligne, assurez-vous qu’ils ne soient pas tous chez le même hébergeur dans le même data center…
  5. A noter que le gouvernement propose également des bonnes pratiques sur Pourquoi et comment bien gérer ses sauvegardes ?
  6. D’ailleurs, n’oubliez pas votre ordiphone qui contient une mine d’information et données personnelles.
https://blog.lecacheur.com/wp-content/uploads/2021/03/tumblr_ph8vi5e2SK1sfie3io1_1280-1024x794.jpghttps://blog.lecacheur.com/wp-content/uploads/2021/03/tumblr_ph8vi5e2SK1sfie3io1_1280-150x150.jpgSeBConceptiondonnées,sauvegardeLa semaine dernière, OVH a perdu un data center dans un incendie. Cette triste nouvelle m'a rappelé tout un tas d'événements passés qui m'ont construit et qui m'ont permis d'améliorer ma gestion des données. C'est pourquoi aujourd'hui je vais partager avec vous pourquoi et comment sauvegarder ses données au...Un blog, c'est un blog !