Acteurs du livre
Retrouvez les acteurs qui créent, publient et diffusent le livre en Bourgogne

Vie du livre
Retrouvez les acteurs qui font vivre le livre en Bourgogne

Base bibliographique bourguignone
Un catalogue, une bibliographie, des ressources numériques

Base biographique bourguignone
Cherchez et trouvez un auteur ou une personnalité de Bourgogne d'hier ou d'aujourd'hui

Quartier livres
Découvrez ici des coups de cœur, des chroniques et des demandes d'emploi

Liens utiles
s'abonner au flux RSS
s'inscrire à la newsletter
Espace presse



Catalogues nouvelle génération ou la fin du catalogage, par Jacques Kergomard
Date : 2010-10-05 11:48:05

Depuis quelques années, les principales évolutions des systèmes informatiques de gestion de bibliothèques (SIGB) se font autour et grâce à Internet : bibliothèques numériques, virtuelles ou encore 2.0. Tout se passe comme si l’automatisation des tâches, qui font le quotidien des bibliothécaires, était un problème réglé depuis la fin du siècle dernier. Pourtant, les pratiques professionnelles continuent à évoluer et les nouvelles possibilités de communication facilitent le travail en réseau, pour la circulation des documents comme pour la gestion des catalogues, par exemple pour les intercommunalités en plein développement.


Malgré la généralisation de l’informatisation des bibliothèques, on estime que 20 % du temps de travail interne est encore consacré au catalogage, alors que les techniques informatiques permettraient de le diviser par dix. Automatiser une tâche signifie qu’elle est exécutée par une machine sans autre intervention humaine que le pilotage et le contrôle du processus. Le programme de saisie du catalogue est tout au plus une aide à la rédaction de notices, comme un traitement de texte est une aide à la saisie de documents. Un véritable automate de catalogage devrait pouvoir établir seul une notice. Ce serait une sorte de super scanner capable d’analyser sémantiquement les pages utiles d’un document pour en extraire les métadonnées nécessaires à la rédaction de la notice. Un tel système expert n’existe pas et personne n’explore cette piste : le catalogage des documents non numériques n’est pas automatisé et probablement pas automatisable.

Un catalogue est un outil d’identification et de localisation des collections. La description des documents possédés respecte des normes et des règles de catalogage, identiques pour tous. Seules les données relatives à l’organisation et à la localisation sont propres à chaque lieu. Le même travail de catalogage, hors données locales, est répété à l’identique dans chaque établissement. La solution passe alors par une mutualisation du travail : une notice créée dans un catalogue est disponible pour d’autres sites qui peuvent la recopier localement. Une première manière de faire est le catalogage partagé. Dans ce cas, le travail de rédaction des notices est réparti entre différents établissements. Le répertoire CD-RAP permet le dépouillement de 175 périodiques dans 50 bibliothèques. Pour le catalogue collectif SUDoc, une bibliothèque qui ne trouve pas un titre dans le réservoir se doit de le créer pour le localiser, rendant ainsi la notice disponible pour tous.

Mais le fonctionnement le plus courant aujourd’hui est la récupération des notices auprès d’établissements qui, sans être des bibliothèques, constituent des catalogues pour leurs propres besoins : le Cercle de la librairie avec la base Electre, les librairies en ligne (Amazon, Decitre) en association avec des organismes de diffusion (Moccamen- ligne, Zebris), des centrales d’achats (GAM, Cdmail, CVS, etc.). Mis à part Moccam-en-ligne, tous ces produits sont payants ou associés à une prestation commerciale.

La Bibliothèque nationale de France (BnF), avec la Bibliographie nationale française, produit des données bibliographiques de référence pour les documents publiés ou diffusés en France et la fourniture gratuite de ces données aux bibliothèques publiques fait partie de ses missions.

En récupérant des données toutes faites à l’extérieur, le professionnel ne catalogue plus, mais il ne faudrait pas que le temps ainsi gagné soit en partie utilisé pour la recherche et la dérivation des notices des fournisseurs.

Avant d’intégrer un nouveau titre, le bibliothécaire consulte des sites marchands, professionnels ou d’actualités littéraires pour se tenir au courant des nouveautés éditoriales, vérifie la cohérence de l’achat en fonction de la politique documentaire et de l’état de son fonds, passe une commande chez son fournisseur. Toutes ces opérations nécessitent la constitution d’une notice provisoire que nous appellerons notice de gestion. Elle pourra être récupérée au cours de la commande et du traitement des acquisitions si la dérivation est possible à chaque étape du circuit dans le SIGB.

Mais un catalogue ne peut pas être une simple juxtaposition de notices de gestion disparates. C’est un ensemble cohérent de notices bibliographiques et autorités respectant les mêmes règles et formats. En France, seule la BnF peut prétendre disposer d’une telle base de données, constituée depuis une trentaine d’années par des équipes spécialisées. Constituer localement un catalogue d’une qualité équivalente n’est pas envisageable. Mais il est possible de recopier à partir d’une base de référence, l’ensemble des données bibliographiques et autorités correspondant aux collections locales. Un automate utilise les notices de gestion pour rechercher les notices bibliographiques sur le serveur de la BnF. Les notices autorités sont, soit récupérées au coup par coup à partir des notices bibliographiques, soit intégrées en totalité, qu’elles soient liées ou non à des documents détenus par la bibliothèque.

La bibliothèque municipale de Fresnes a ainsi entièrement automatisé la gestion de son catalogue depuis plusieurs années et selon son directeur, Thierry Giappiconi, le temps consacré à la récupération de notices et à la création de données locales ne représente que 1,3 % du temps de travail interne à la bibliothèque de Fresnes.

Je ne dispose malheureusement pas de données chiffrées pour l’administration et le contrôle d’un tel catalogue. Il n’est pas question de contrôler la qualité du travail de la BnF qui, quelles qu’en soient ses imperfections, est de toutes façons bien meilleur que ce que peut produire une bibliothèque, même importante. Mais il s’agit plutôt de la surveillance de l’automate de récupération, de la cohérence de la base et de l’intégration des mises à jour. Il est certain que ce travail est bien moindre que celui consacré à un catalogue manuel.

Le catalogue n’est qu’un outil. Les techniques de catalogage et les modèles informatiques de données ont été conçus en fonction de son usage : principalement identifier et localiser les collections. Le format Intermarc à la base du Catalogue collectif de France a d’abord été développé et adapté pour les besoins de la BnF. Les SIGB du marché doivent adapter les données à leur modèle. Comme peu de logiciels savent gérer le format Intermarc, un premier changement de format vers Unimarc est effectué par la BnF suivi d’un second reformatage pour l’intégration dans le système informatique local. Toute transformation entraîne une dégradation de l’information selon le principe du téléphone arabe, ce qui vaut aussi pour les données récupérées. À cette première perte de qualité s’ajoute une difficulté pour les exploiter favorablement. Même les plus sophistiqués des SIGB ne peuvent pas prétendre utiliser les possibilités offertes par les notices. Le meilleur est incontestablement le système de la BnF, parce que le format de catalogage a été en partie conçu et adapté pour lui. Les formats Marc ont été pensés pour être lisibles directement par des machines, mais c’était au milieu des années 1960, époque où par exemple le modèle relationnel pour les bases de données n’existait pas encore. Depuis, les techniques informatiques ont beaucoup évolué et le développement du web a révolutionné les moteurs de recherche et la gestion des données. Pour profiter de ces évolutions, de nouvelles normes de catalogage sont apparues. Les FRBR privilégient la notion d’oeuvre à celle du document et le code de catalogage RDA renouvelle complètement la notion d’autorité pour l’adapter au futur web, celui des données. Alors que l’on parle depuis au moins dix ans d’abandon des formats Marc pour adopter des schémas de données basés sur XML, on en est toujours au stade de la réflexion, au mieux de l’expérimentation pour les bibliothèques. Changer les pratiques imposerait une réécriture complète des logiciels et une refonte complète de tous les catalogues existants. S’il a fallu 30 ans pour arriver à une généralisation des formats Marc alors que l’on partait en général de rien ou de catalogues papier, comment mener une telle révolution sans d’importants dégâts collatéraux ? La bibliothèque de Fresnes a encore des souvenirs douloureux, et quelques séquelles, de la fusion des bases BN Opale et Opaline, autorités comprises, pour former BN Opale +, opération mineure par rapport à celle que représenterait un changement de paradigme. La prise de conscience de l’ampleur du travail de constitution des catalogues a amené les bibliothèques à déléguer cette tâche à la BnF. Le concept d’informatique dans les nuages, « infonuagique » pour les Québécois, repose sur cette même logique : utiliser pour ses propres besoins, des ressources informatiques, matérielles et logicielles, situées ailleurs. Sur ce modèle, pourquoi ne pas aller jusqu’à confier à la BnF la gestion complète des catalogues. Elle prendrait en charge la gestion des notices bibliographiques et autorités, mettrait à disposition ses outils logiciels puissants pour les exploiter et laisserait aux bibliothèques la maîtrise de ses données locales. Une telle répartition des tâches résoudrait la plupart des problèmes liés à la recopie en local des données et rendrait enfin possible les changements nécessaires dans les pratiques et les normes pour ouvrir les catalogues des bibliothèques au web de données.

Jacques Kergomard, Bibliotic

Glossaire

BN Opale : ancien catalogue en ligne des collections de la BnF, hors collections spécialisées.
BN Opale + : ancienne dénomination du Catalogue général de la BnF. http://catalogue.bnf.fr
BN Opaline : ancien catalogue en ligne des collections spécialisées de la BnF, dont les différentes bases qui le composaient ont été transférées dans BN Opale + en juin 2007.
CD-RAP est un répertoire d’articles de périodiques produit et réalisé par la société CD-Script, sous la responsabilité scientifique de la bibliothèque municipale de Lyon.
FRBR : Functional Requirements for Bibliographic Records, spécifications fonctionnelles des notices bibliographiques, modèle conceptuel de données bibliographiques élaboré par un groupe d’experts de la Fédération internationale des associations de bibliothécaires et des bibliothèques (IFLA).
Marc : Machine Readable Cataloguing, catalogage lisible par une machine (informatique), format d’échange des données bibliographiques. Des déclinaisons de ce format ont vu le jour : Intermarc, format de catalogage utilisé par la BnF ; Unimarc conçu par l’IFLA en 1977 et utilisé par la majorité des bibliothèques françaises. RDA : Resource Description and Access, nouvelle norme pour la description des ressources et les accès, définie pour le monde numérique.
SUDoc : le catalogue du Système Universitaire de Documentation, catalogue collectif français des bibliothèques et centres de documentation de l’enseignement supérieur et de la recherche.
XML : eXtensible Markup Language, langage extensible de balisage, développé par le World Wide Web Consortium (W3C). Le XML est un langage informatique codant la structure et l’organisation de l’information d’un document. Ce langage ouvert permet d’échanger des données et leurs structures.
 



Page précédente La revue du CRL
Centre régional du livre de Bourgogne
Conseil régional de Bourgogne Ministère de la culture et de la communication Bibliothèque nationale de France Fédération interrégionale du livre et de la lecture