Cours GIDO 2 Conservation Des Documents
Cours GIDO 2 Conservation Des Documents
Cours GIDO 2 Conservation Des Documents
INTRODUCTION
Vous êtes un futur stagiaire d’un service public, un collaborateur d’un organisme privé
ou un citoyen qui créera et recevra des documents sous forme numérique ?
Vous aurez un poste de responsabilité et vous serez chargé d’organiser l’accès et l’utilisation
des documents numériques de vos collaborateurs ?
Alors ce cours contient des principes et des stratégies qui vous seront très utiles dans vos
Nous vous proposons une sélection de conseils pratiques pour la gestion et la conservation de
votre information numérique. Il s’agit essentiellement de conseils de bons sens, de conseils
techniques, mais également de méthodes de travail et de procédures à mettre en œuvre pour
garantir un accès permanent et durable aux données numériques stratégiques de votre
organisation.
Nous vous présenterons les enjeux de la conservation à court, moyen et long terme des
documents numériques, qu’ils soient de nature professionnelle ou privée. Nous aborderons les
caractéristiques des principaux supports de stockage numérique pour vous permettre d’évaluer
la pertinence de votre stratégie de sauvegarde. Et de manière plus globale, nous vous
dispenserons des conseils qui touchent à la gouvernance de l’information : être capable de
développer une stratégie globale pour votre service qui garantisse la bonne conservation des
fichiers informatiques et à la continuité de votre activité avec ce type d’information.
Un fichier numérique est composé d’une succession de bits, ou plus simplement une
succession de 0 et de 1. Le terme bit est le résultat de la contraction de deux mots anglais :
binary digit, qui se traduit par chiffre binaire. Sans les moyens de lire et d’interpréter cette
succession de 0 et de 1 gravés sur un support de stockage, il est impossible d’en comprendre
le contenu et la signification. Pour comprendre les moyens nécessaires à garantir l’intégrité, la
lisibilité, l’intelligibilité et la réutilisation des données, il est essentiel de connaître les
spécificités de moyens nécessaires à garantir l’intégrité, la lisibilité, l’intelligibilité et la
réutilisation des données, il est essentiel de connaître les spécificités de l’environnement
numérique.
La combinaison gagnante
La conservation des données, leur lisibilité et leur intelligibilité dépendent d’une combinaison
d’éléments techniques.
2-Des systèmes d’exploitation qui permettent aux logiciels de fonctionner sur les machines
(Windows, Mac OS, Linux, etc.).
3-Des machines dont les composants permettent de créer, traiter, interpréter, visualiser les
données au niveau matériel :
4-Des logiciels qui servent à créer, traiter, interpréter, visualiser les données au niveau logique
: logiciels de photographie, de traitement de texte, de calcul, bases de données, etc.
5-Des formats dans lesquels les bits sont combinés pour former des paquets logiques traités
par les logiciels. Ces formats sont indiqués dans l’extension des noms de fichiers :doc, .docx,
.jpg, .pdf, .tiff,.xls, etc.
Remarque : la défaillance d’un seul élément peut bloquer l’accès aux données. Cela peut
se produire au niveau de la lecture des données ou de leur interprétation.
Cette obsolescence crée un « paradoxe temporel » entre la durée de vie de l’écrit administratif
et juridique (qui s’étale souvent sur 20 ou 30 ans, voire plus) et la durée de vie des
technologies de l’information, qui se renouvellent et évoluent bien plus vite.
Croire qu’il y aura toujours un logiciel capable de lire vos documents est contraire à la
prudence, voire contraire à la réalité.
Prenons l’exemple du traitement de texte MS Word : les versions et les mises à jour de ce
logiciel ne sont pas forcément compatibles entre elles. L’option de rétrocompatibilité des
versions est mise au point par la firme qui produit le logiciel.
Voici à présent un petit exercice pratique : essayez d’ouvrir un document produit sous Word
2.0 ou Word 95 avec un pc équipé de Word 2007. Que se passera-t-il ? Un message d’erreur
vous avertit de l’échec de l’opération. Corriger cela nécessitera au minimum de solides
connaissances en informatique. Et après de multiples manipulations, vous aurez réussi à
récupérer le document sous Word 95, mais pas celui sous Word 2.0!
Le schéma suivant propose une vue théorique des limites de lecture de 4 documents produits
avec différentes versions d’un même logiciel.
D’un côté nous enregistrons notre information sur des supports éphémères et de l’autre, nous
manifestons un intérêt grandissant pour le stockage longue-durée d’une quantité croissante de
données.
Voici un cas pratique d’évolution des besoins de stockage dans notre quotidien. En
photographie numérique, on assiste à l’escalade du nombre de pixels par photo et du nombre
de photos conservées. Par conséquent, c’est l’explosion du nombre de giga-octets nécessaires
au stockage. Mais si au lieu de comparer le nombre de pixels de notre appareil avec celui de
notre voisin, nous nous posions les vraies questions ?
Le nombre de pixels choisi est-il vraiment adapté à la finalité de la photo ? Vais-je imprimer
en 10/15 ou vais-je en faire une affiche ?
Est-ce que ce que je conserve présente un intérêt réel ? Pourrais-je encore lire ces fichiers
dans 10, 20 ou 30 ans ? La quantité de fichiers conservés ne va-t-elle pas noyer les personnes
qui souhaitent les (re)voir ? Les descriptions seront-elles suffisantes pour reconstruire le
contexte dans lequel les photos ont été prises et les retrouver facilement ?
.
En informatique, il faut anticiper le crash des données numériques en adaptant la
stratégie de conservation.
La conservation des documents numériques impose de développer une stratégie qui repose
sur l’organisation d’un ensemble de procédures et de choix techniques. Ce n’est jamais une
solution « one shot », mais un processus de vigilance constant, à long terme, qui doit être
intégré dans les procédures de travail de votre institution, au même titre que les procédures de
sécurité par exemple.
3. Le choix des formats de fichiers les plus adéquats, dès la création des données.
1. Supports magnétiques
L’information est encodée au moyen d’une tête de lecture électro-aimantée qui transmet un
champ magnétique au support physique. C’est pendant cette transmission, que les données
sont enregistrées. Lors de la lecture, les modifications de champs magnétiques sont
interprétées et l’information est ainsi restituée.
2. Supports optiques
La lecture et l’écriture sont rendues possibles grâce à un laser. Celui-ci traverse les différentes
couches du disque avant d’être renvoyé à sa source au moyen d’une couche d’aluminium, qui
opère comme un miroir. En d’autres mots, la couche du disque qui renferme l’information est
entourée par d’autres couches : aluminium pour la réflexion, vernis pour la protection,
colorant pour la gravure et face imprimée pour l’identification.
Les supports optiques les plus répandus sont les compacts discs, les DVD…
Il y a cinq paramètres à prendre en compte pour choisir le support le plus approprié à vos
données et à l’usage que vous en faites.
1. La capacité de stockage
La capacité de stockage
Les supports numériques actuels ont une capacité de stockage 50 000 fois supérieure à
Pour illustrer ceci, nous nous référons au Centre National d’Études Spatiales (CNES) en
France, qui disposait dans les années ‘90 d’un local de 500 m² pour stocker ses données sur 50
000 bandes magnétiques d’une capacité de 150 Mo chacune. Ce volume total de 7,5 To tient
aujourd’hui sur 1 petite cartouche magnétique dernière génération, soit un espace de 0,1 m².
Les capacités des supports disponibles pour les particuliers ne cessent d’évoluer.
Actuellement, les clés USB propose une capacité de 4 à 256 Gb. Les disques durs externes
offrent entre 500 Go et 12 To.
Selon le type
Tous les supports numériques ne présentent pas les mêmes qualités de longévité. Le stockage
sur bande magnétique de fabrication récente, comme les bandes LTO, présente l’avantage
d’une durée de vie nettement supérieure à celle des disques durs. Cela peut aller jusqu’à 30
ans pour certaines catégories de LTO, contre environ 5 ans pour beaucoup de disques durs.
Selon la fabrication
Les CD et les DVD ont une durée de vie moyenne de 7 à 10 ans si la qualité est au rendez-
vous.
Il existe une différence importante de durée de vie entre les CD pressés par procédé industriel
et les CD-R gravés sur un ordinateur personnel. Si ces derniers sont moins durables,
l’explication réside dans le présence d’une couche d’écriture que les CD enregistrables sont
seuls à posséder.
Cette couche est de type organique et donc moins stable par nature. Elle est appelée dye , du
fait de la présence d’un colorant dans sa composition. Celui-ci est « brûlé » par le passage
d’un laser 10 fois plus chaud que celui qui sert à la lecture. Ce sont ces différents éléments qui
rendent le cd gravé plus fragile face au temps.
Conditions environnementales
1. Une température trop élevée et instable, avec des écarts importants. La température doit se
situer entre 16°C et 23°C avec une fluctuation maximale de 4°C par heure. C’est pourquoi, les
locaux de serveurs sont toujours climatisés.
2. La lumière solaire, mais aussi les UV de certains types d’éclairage. Il est fortement
déconseillé d’exposer des disques à la lumière du soleil.
4. Les champs électromagnétiques dangereux pour les supports magnétiques. Ne placez pas
ces supports à proximité d’un four à micro-ondes, de baffles de chaîne hifi, d’appareils
électriques à bobine, d’appareils sans fil, d’une gaine technique rempli de câbles électriques,
ou d’une antenne GSM en toiture.
5. Une humidité de l’air trop élevée. Le taux d’humidité relative du local se situera entre 30%
et 50% avec une fluctuation maximale de 10% par heure.
6. La poussière qui encrasse les mécanismes. De ce fait, les locaux où sont entreposés les
supports seront régulièrement nettoyés.
7. La nourriture et les boissons à proximité des supports. Pour éviter de salir ou de renverser
les liquides sur le matériel.
8. La surtension qui effacerait les données des supports. De manière préventive, il faut
s’assurer que les serveurs et/ ou les librairies de sauvegarde soient reliés à la terre.
Un emballage approprié réduit le risque d’usure prématurée. Pour vos disques optiques et vos
bandes magnétiques, préférez :
• un stockage vertical ;
• l’identification sur les médias sans aucune étiquette et sans aucune marque à l’encre, surtout
si les encres des feutres contiennent des solvants (Il existe néanmoins des feutres spéciaux
pour CD).
Manipulations
• En termes de conservation, les facteurs humains sont aussi déterminants. Il est recommandé
de manipuler avec précaution les supports numériques, d’éviter les chocs physiques et les
rayures. Manipulez les CD par l’anneau central et les bords, sans poser vos doigts sur la zone
d’enregistrement.
Attention, vos disques durs sont très sensibles aux chocs physiques. Le mécanisme qui
commande le/les bras de lecture fonctionne avec une précision de l’ordre de quelques
nanomètres. En cas de chocs, les têtes de lecture pourraient être endommagées et empêcher
toute lecture des données. Elles pourraient également rayer la surface des disques de manière
définitive.
Autre précaution importante : évitez de déplacer un disque dur pendant son fonctionnement.
Au moment d’enregistrer vos données, vous aurez à choisir le format de fichier. Il vous faudra
opter pour des formats qui faciliteront la conservation des informations, en évitant les formats
qui poseront, à court ou à long terme, des difficultés sérieuses de lecture.
Pour y arriver, voici les trois critères principaux qui permettent de bien choisir un format :
Les formats publiés et ouverts seront privilégiés pour vos opérations de sauvegarde. On
appelle formats ouverts ceux qui peuvent être lus et modifiés par des informaticiens, car les
informations qui permettent de le faire appartiennent au domaine public. On dit dans ce cas
que les codes sources sont publiés. Dans le cas contraire, si une société ne publie pas les codes
sources des logiciels qu’elle crée, c’est généralement pour rester propriétaire du
développement du logiciel et en maximiser les revenus. Ce deuxième type de format est
appelé format propriétaire.
Cependant, des formats propriétaires mais largement diffusés (comme PDF ou TIFF) sont
parfois préférables aux formats ouverts mais peu utilisés. Car plus un format est diffusé, plus
il existe d’outils pour l’exploiter et maintenir sa compatibilité avec les formats plus récents.
La large diffusion d’un format, à elle seule, n’est cependant pas un critère qui garantit de
pouvoir utiliser ce formatsur le long terme.
2. Indépendance
Le format ne doit pas être dépendant d’autres formats ou d’un système d’exploitation. Pour
illustrer cela, prenons le cas des premiers logiciels IBM : ils ne pouvaient être exploités que
par les machines de cette marque et de cette époque.
Le choix du format dépendra fortement du moment où les données sont utilisées : s’il est
nécessaire de traiter et de modifier les données, on optera pour un format d’exploitation. Si au
contraire les données sont dans leur forme définitive et peuvent être archivées, un format de
conservation sera nécessaire. Le tableau ci-dessous montre que les deux types de formats sont
très différents.
En guise de conclusion
La conservation des documents numériques sur le long terme est un problème ouvert. Le
manque de recul est certain. Les formats dont les spécifications ne sont pas connues posent
problème néanmoins les questions de formalisme ne vont pas résoudre tout le problème. Il
fallait rappeler ici l'importance pour la conservation des documents numériques des aspects
matériel et logiciel.
Aujourd’hui il ne faut pas trop penser en terme de format pérenne. Les formats ne sont pas
pérennes, les logiciels non plus et le matériel encore moins. Mais il faut penser en terme de
migration de fichiers, migration du matériel et en terme de conversion de formats. Les
difficultés de conservation sont en fait intrinsèques à cette même technique qui permet tant de
prodige pour la création ou la diffusion.
Quel est l'avenir ? En fait il est très difficile de deviner les évolutions, les miracles possibles.
Certains aspects qui nous semble aujourd'hui inquiétants ne le seront plus demain, non pas
que les problèmes auront été résolu mais simplement ne seront plus d’actualités ou bien
auront été contournés.
BIBLIOGRAPHIE
Bulletin des Archives de France sur l'archivage à long terme des documents électroniques
http://www.archivesdefrance.culture.gouv.fr/fr/publications/DAFbulelectronique.html
Jean-Luc Philip. Le point de vue d'un généalogiste sur la conservation des documents
http://www.archivesdefrance.culture.gouv.fr/fr/publications/dafbuln%B06.html#chapitre9
Claude Huc. La pérennité des documents électroniques - points de vue alarmistes ou réalistes
? Centre National d’ötudes Spatiales, Toulouse (n° 7, octobre 2001)
http://www.archivesdefrance.culture.gouv.fr/fr/publications/dafbuln%B07.html#chapitre1Cat
herine Dhérent. Les archives électroniques. Manuel pratique. Direction des Archives de
France, Paris (2002)
http://www.archivesdefrance.culture.gouv.fr/fr/archivistique/DAFmanuel%20version%207.ht
ml
http://www.adae.gouv.fr/spip/article.php3?id_article=7&var_recherche=conservation+docum
ents+num%25E9riques
Stratégie globale pour la conservation à long terme des documents électroniques en Suisse.
http://www.staluzern.ch/vsa/ag_earchiv/home_f.html
http://www.digitaleduurzaamheid.nl/index.cfm?paginakeuze=185&categorie=2
http://www.digitaleduurzaamheid.nl/bibliotheek/docs/Migration.pdf
http://www.digitaleduurzaamheid.nl/bibliotheek/docs/white_paper_emulatie_EN.pdf
BANAT-BERGER F., DUPLOUY L. et HUC C., L’archivage numérique à long terme. Les
- HUC Claude (dir.), Préserver son patrimoine numérique, classer et archiver ses e-mails,
photos, vidéos et documents administratifs, Eyrolles, Paris, 2011 ;