mercredi 6 décembre 2006

Les stratégies de gestion et de conservation préventive des documents électroniques.

Références bibliographiques :

LUPOVICI Catherine. Les stratégies de gestion et de conservation préventive des documents électroniques. BBF, 2000, vol. 45, n°4, pp. 43-54.


Résumé :

Depuis toujours et quelque fût le type de document, ces derniers ont toujours demandé à ce que l'on s'attarde sur leur conservation : les documents papier pour être conservé dans les meilleures conditions ont une qualité de l'environnement à respecter ainsi qu'une politique à choisir pour la diffusion du document sur support de reproduction.

Le document même s'il est numérique pose toujours des questions de conservation, bien qu'un peu différentes. Dans cet article, l'auteur nous présente la problématique de la conservation des documents numériques, nous définit l'objet d'information numérique ainsi que l'organisation de l'archivage numérique et finit par nous présenter quelques projets d'archivage de documents numériques.

La ressource électronique c'est un contenu, mais aussi son mode de lecture, le programme. Les deux sont stockés sur un support. La problématique des conservations des documents numérique consiste à pouvoir assurer la visualisation de ce document, malgré le renouvellement rapide des technologies. Plusieurs techniques sont exploitées pour résoudre ce problème : techniques de rafraîchissement du support et d'émulation de l'environnement informatique du document, ou encore impression sur papier ou conservation de microreproductions.

Au départ, la conservation se faisait sur supports magnétiques, puis sont apparus le CD et le DVD. Ce dernier offre la possibilité de conserver beaucoup de données, mais risque finalement de leur faire perdre de la qualité. Le CD quant à lui a une durée de vie de cinq année seulement s'il est gravé et de 15 à 20 ans s'il est pressé. Il faut alors reporter régulièrement les données sur un support nouveau comme cela se faisait auparavant.

A cela s'ajoute le fait que l'environnement informatique évolue très rapidement ce qui implique un renouvellement régulier des différents programmes (qui généralement ont du mal à lire des document d'une version antérieure), périphériques, méthodes de traitement des données, techniques de stockage...

Il faut alors trouver des solutions. Deux sont plus particulièrement exploitées : la migration des données et l'émulation d'un environnement informatique. Le première solution propose changer les formats des documents électroniques d'un environnement matériel a un autre ou d'une génération de technologie a une autre, tout en préservant l'intégrité du document et permettant ainsi son utilisation pour la recherche et l'affichage de données. La seconde solution consiste à simuler un environnement informatique pour les documents qui ne seraient lisibles que sur PC ou sur Mac. Mais cette solution coûte cher car il faut développer les émulateurs, des techniques pour recréer le document numérique et des techniques permettant de préserver les documents et leur environnement pour prévenir de l'altération.

Quelles sont alors les caractéristiques particulières de l'objet d'information numérique ? L'objet numérique, c'est tout d'abord l'information qu'il contient. Plusieurs niveaux d'abstraction ont été définis : le niveau le plus bas est le niveau où l'information se contente d'être faite d'une 1 ou d'un 0. Il faut alors conserver la succession de bits constituants l'information. Il ne permettent cependant pas de rendre compte du format ni de la structure de l'information, et il existe de multiples codes ce qui ne simplifie pas la traduction des bits en information. Le niveau le plus élevé d'abstraction est celui qui présente le problème de migration des données ou d'émulation de l'environnement afin de retrouver un contenu intellectuel, une présentation, un mode de recherche et de navigation.

L'objet numérique est aussi définit par sa fixité, c'est-à-dire l'action de conserver une version stable et fixée de l'objet numérique qui doit comprendre des numérotations en cas de changement et donc de versions nouvelles. L'idéal est de fixer régulièrement un état de la totalité des bases de données.

La référence est encore une autre caractéristique de l'objet numérique. Pour la conservation et l'accès, il doit y avoir un besoin de référence unique et pérenne à l'objet numérique. La référence doit être un lien actif, elle se trouve généralement dans les bibliographies, catalogues, dictionnaires de données. Il existe des systèmes de description intégrant dans une notice bibliographique le lien direct, où il est alors possible d'inclure les références directement dans l'objet numérique, c'est l'équivalent des métadonnées, URL ou URN.

La provenance de l'objet numérique retrace ses origine, historique de conservation, environnement technique, qui permettent de s'assurer de l'authenticité de l'objet et de connaître son contexte de création.

Le contexte justement est la dernière caractéristique et s'avère être présent a plusieurs niveaux: d'abord au niveau technique d'utilisation : contraintes matérielles (PC, Mac...), contraintes logicielles (logiciel utilisé). Le contexte de l'objet numérique, cela peut aussi être le lien qu'il entretien avec d'autres objets. Cela peut poser problème dans le cas par exemple d'un document HTML qui pointe vers d'autres pages : il faudrait alors conserver toutes les adresses des objets pointés. Enfin, le contexte peut être lié à un moyen de communication.

Entre les objets d'information numérique et leur conservation apparaît alors le besoin d'organisation de toutes les responsabilités entre ceux qui créent ces objets et ceux qui les préservent. L'organisation à tendance à se faire entre les créateurs de l'information (fournisseurs, propriétaires de droits, qui sont responsables de l'archivage de leurs objets tant qu'il n'y a pas eu de transfert de responsabilité), les bibliothèques (présentes pour les problèmes techniques et juridiques tout en gardant leur mission de collecte et de préservation de l'héritage culturel et intellectuel) et enfin les communautés de créateurs souhaitant archiver sur le long terme sur le web. Les responsabilités diffèrent selon les pays c'est pourquoi ont finalement été mises en place certaines normes, par exemple l'OAIS (Open Archive Information System), instauré sur le principe des archives ouvertes. L'OAIS a pour but d'archiver tout document électronique pour pouvoir en assurer la pérennité, permettre aux demandeurs l'information qu'ils recherchent et doit pouvoir gérer les droits, les tarifs... c'est pour cela que l'archive OAIS est composée de plusieurs entités : l'entité d'ingestion, de stockage, de gestion des données, d'accès et d'administration. Un certain nombre de projets basé sur le système de l'OAIS sont en cours pour expérimenter justement ce système : PRESERV, PANDORA, NEDLIB, CEDARS. Ce dernier par exemple regroupe plusieurs bibliothèques nationales, universitaires, et de recherche de Grande-Bretagne pour expérimenter l'aspect du droit d'archivage en accord avec les éditeurs. Le projet NEDLIB cherche quant à lui à développer l'aspect de préservation sur le long terme et travaille donc sur les systèmes d'émulation et de migration des données, tout en consacrant aussi une partie de sont temps a l'étude des métadonnées nécessaires a la conservation des données. Le problème de la conservation des documents numériques n'est donc pas encore résolu, mais reste grandement étudié.


Avis critique :

J'ai trouvé ce texte globalement plutôt long, théorique et parfois trop précis. La longueur vient sûrement du fait que certaines choses reviennent souvent : archives ouvertes, métadonnées...

Il reste néanmoins intéressant de voir les solutions qui sont envisagées au problème de la conservation des données numériques, même si cela reste pour l'instant assez abstrait. Le schéma qui est proposé pour expliquer le système de l'OAIS était le bienvenu pour éclaircir un peu le texte.

Enfin, le texte datant de 2000, les choses ont eu le temps d'évoluer et les projets peut être d'aboutir, il serait intéressant de trouver des informations sur la suite des événements concernant ces problèmes de conservation des documents numériques.

Aucun commentaire: