mercredi 6 décembre 2006

Le Digital Object Identifier : le système du DOI

Références bibliographiques :

LUPOVICI Catherine. Le Digital Object Identifier : le système du DOI. BBF, 1998, vol. 43, n°3, pp. 49-54.

Résumé :

Dans cet article, Catherine Lupovici présente non seulement le DOI (Digital Object Identifier), mais aussi de manière générale les autres identifiants existants, qu'ils soient physiques, logiques, ou dans un réseau.

Lors de la création d'un document, lui est attribué un identifiant, généralement une suite de chiffres ayant tous rapport avec une unité d'information. L'identifiant permet comme tous les autres, d'identifier un objet lors de sa production, comme de sa diffusion et sert donc pour les éditeurs, librairies, bibliothèques, centres de documentation...

Les identifiants sont généralement choisis par les bibliothèques nationales et sont intégrés dans les descriptions bibliographiques. Les exemples les plus anciens d'identifiants documentaires physiques sont l'ISBN, représentant une suite de chiffre signifiants et l'ISSN, dont les chiffres le composant sont choisis de manière séquentielle. Cependant ces identifiants posent problème au sens ou l'ISBN d'un même ouvrage peut être différents selon si est relié ou broché. A l'inverse, l'ISSN d'une revue sera le même pour tout document quel que soit le support de diffusion.

Plusieurs autres types d'identifiant ont été mis en place pour désigner les parties d'un document électronique qui pouvaient être considérées comme unités documentaires en elles même : ce sont les identifiants logiques. Certains n'ont pas été retenus car s'avérant trop compliqués et finalement représentatifs à eux seul des données contenues dans une description bibliographique. D'autres, ont été retenus, c'est le cas du PII (Publisher Item Identifier) et du SICI (Serial Item & Contribution Identifier). Le premier existe depuis maintenant plus de dix ans et reste utilisé essentiellement pour les pré-publications dans le monde des sciences, techniques et médicine. C'est un numéro non signifiant attribué par les éditeurs lors de l'introduction du document dans la chaîne de publication, et qui peut s'appliquer à tout support. Le SICI est utilisé pour les différents niveaux de granularité des publications en série. Trois niveaux sont définis : le fascicule, l'article et la partie d'article. Cet identifiant peut donc se présenter sous trois formes différents selon le niveau de granularité auquel il fait référence. Les PII et SICI sont surtout utilisés pour effectuer des commandes, gérer les droits d'usage, rechercher en ligne...

Dans le contexte du réseau qu'est Internet, il a longtemps été considéré que les identifiants des documents mis en lignes étaient leur URL (Uniform Resource Locator). Cependant, on a vite réalisé que l'URL ne pouvait pas être un identifiant valable du fait d'abord qu'elle n'est pas pérenne, mais aussi parce que ce n'est pas un identifiant unique (un document pouvant être mis en ligne sur plusieurs sites). Un système d'URN (Uniform Resource Name) est en train d'être mis en place dans l'objectif de résoudre ce problème de multiplicité de localisation d’un document électronique à l'aide d'un système de répertoire d'enregistrement des ressources. En attendant la mise en place définitive de l'URN, la PURL (Permanent URL) devrait aussi permettre de rendre les URL toujours consultables en les mettant à jour régulièrement. Ce système dissocie la localisation de l'identification du document et ne garde que cette dernière si la localisation change.

Le dernier système mis en place par les éditeurs est le DOI (Digitial Object Identifier). Le DOI a été développé par le CNRI pour mettre en place un répertoire national d'identifiants permettant la gestion des droit d'utilisation des documents électroniques. Le DOI s'applique à l'objet quelle qu'en soit sa granularité. La Fondation DOI est une fondation internationale responsable du réseau-DOI. Les objectifs du DOI sont d'avoir un identifiant permettant l'accès à l'information électronique, tout en permettant aux éditeurs de gérer plus facilement leur droits, de choisir la publication partielle ou totale des oeuvres qu'ils distribuent, d'archiver les objets électroniques et de rendre le Web plus pérenne.

Le DOI est compatible avec les identifiants vus précédemment (URN, PII, SICI...). Il est concrètement composé de la manière suivante : identifiant de l'éditeur/identifiant de l'objet chez l'éditeur. L'identifiant de l'éditeur est attribué au niveau international et coûte 1000$US pour une attribution, quant à l'identifiant de l'objet, c'est l'éditeur qui le choisit (il peut correspondre à un identifiant déjà existant tel que l'ISBN, l'ISSN, le PII, le SICI...).

Le rôle des éditeurs dans le contexte du DOI consiste essentiellement à s'intéresser aux détenteurs de droits. Ils possèdent donc tous des bases de données pour gérer les documents qu'ils possèdent et qui peuvent donner les conditions d'accès à ces documents en fonction des droits (accès gratuit, ou par abonnement, licence, à l'unité...). Ces bases de données peuvent être consultables depuis le site du DOI, afin de trouver les meilleures propositions.

Un répertoire existe, qui gère les différents identifiants, les traduits dans les URL des détendeurs de droit, et redirige les utilisateurs vers ces pages. C'est par exemple ce même répertoire qui gère les droits en cas de cession pour changer l'URL du nouveau détenteur.

Le DOI permet donc d'optimiser l'accès aux objets électroniques tous en respectant au mieux les droits de ceux qui les possèdent.

Avis critique :

J'ai choisi cet article pour approfondir la partie de cours que nous avions vu sur le DOI. J'ai appris beaucoup de choses sur cet identifiant, mais aussi sur les nombreux autres identifiants existants, leur système de fonctionnement, dont je n'avais pas forcément entendu parler et que j'ai pu mettre en parallèle avec les ISBN et ISSN.

Cependant, certaines parties sont restées floues, du fait que l'auteur utilise parfois des termes un peu techniques et des concepts pas forcément compréhensibles, sûrement parce que je ne suis pas une professionnelle du monde de l'édition.

J'ai aussi trouvé cela surprenant que l'article affirme que le DOI serait payant, alors que si l'on met observe les archives de l'IFREMER que j'ai analysées il y a peu de temps, toutes les données étaient accessibles gratuitement, et la recherche pouvait pourtant s'effectuer par DOI.

Si cet article m'a donc appris beaucoup de chose, il me questionne aussi sur des contradictions observées.

Aucun commentaire: