CARTE BLANCHE AUX JEUNES CHERCHEURS
Le web des données ou le media de valorisation des pratiques professionnelles en bibliothèques
Table des matières
Texte intégral
1Depuis son émergence, le web n’a cessé d’être perçu comme un dispositif informationnel, un espace de sociabilité, un artefact technique et un média de communication. Sa dimension technique et l’hétérogénéité de ses services lui assignent le rôle d’un « composite »1. Cette notion évoquée par Joëlle Le Marec et Igor Babou désigne, selon Laurence Monnoyer-Smith, « […] un complexe hétérogène de pratiques, d’organisations, de savoirs, de normes et de machines qui instancie le web… »2 Parmi tous ces aspects, nous nous intéresserons à l’étude du web en tant que média de valorisation des pratiques professionnelles et non comme média de partage et d’échange de l’information. Notre recherche cible l’une de ses évolutions majeures : le web des données. Cette nouvelle extension est fondée sur un ensemble de technologies, de vocabulaires et de référentiels conformes aux standards du web. Elle permet la description, la publication et la réutilisation des données structurées et des métadonnées cantonnées dans les silos du web invisible. Sa création vise à améliorer la qualité de traitement, d’interprétation et de moissonnage des données pour les machines et les agents du web. Pour y parvenir, il est indispensable de mobiliser les différents profils de professionnels en les incitant à collaborer et à partager leurs savoir-faire. La technicité ne semble plus être l’unique spécificité du web des données. La médiation des pratiques professionnelles serait, en effet, l’une de ses valeurs émergentes. Quels sont les aspects de cette médiation ? Comment se traduit-elle sur le terrain ? Quelles seront ses répercussions sur les professionnels des bibliothèques ? Ces questionnements sont les axes majeurs de cette recherche auxquels nous tenterons de répondre.
2Si le web des données est le futur média de valorisation des pratiques professionnelles, c’est qu’il existe en bibliothèques un sentiment d’incompréhension vis-à-vis de l’intérêt et de la valeur ajoutée de certains métiers. Nous présumerons aussi que la médiation est le reflet de l’absence de communication entre les différentes communautés institutionnelles. C’est une hypothèse qui incarne le sentiment d’inquiétude des professionnels de l’information quant à l’avenir de certaines professions. On supposerait également que la valorisation des pratiques professionnelles serait à l’origine d’une catégorie d’experts capables de faire évoluer le web actuel d’un espace de diffusion à un espace de structuration de la connaissance et de certification de l’information. L’objectif de cet article est de valider ou d’infirmer cet ensemble d’hypothèses en nous fondant sur les données des entretiens et des enquêtes de terrain.
Revue de littérature
3La documentation scientifique est peu présente sur le sujet. L’ouvrage d’Emmanuelle Bermès « Le web sémantique en bibliothèques » ainsi que le mémoire de recherche de Jasmin Hügi et de Nicolas Prongué : « Les bibliothèques face aux Linked Open Data : de nouvelles applications web et de nouvelles compétences professionnelles » sont d’importantes sources pour cette recherche. Hormis ces deux références, la plupart des articles évoquent la technicité du web des données et la manière selon laquelle les professionnels des bibliothèques procèdent au traitement de la donnée. Notre corpus s’est également fondé sur les contributions et les communications des professionnels de l’information et des bibliothèques dans les journées d’étude et les séminaires nationaux ou internationaux. Le recours à la littérature grise était primordial. On relève des informations intéressantes sur l’évolution des métiers au sein des bibliothèques à l’aune du web des données dans les rapports du groupe d’incubation World Wide Web Consortium : « Bibliothèques et le web des données » et celui du Ministère de la Culture et de la Communication : « Feuille de route stratégique : Métadonnées culturelles et transition Web 3.0 ».
Méthodologie
4Cette recherche est le résultat d’une enquête qualitative menée avec différents types de professionnels principalement ceux des bibliothèques. Lors d’un séjour scientifique à la Bibliothèque nationale de France, nous avons pu rencontrer des experts en catalogage, des chefs de projets, un directeur de département et des conservateurs, tous impliqués dans l’étude et l’analyse de l’impact des technologies et des référentiels du web des données sur les pratiques professionnelles. La plupart d’entre eux appartiennent à l’équipe data.bnf.fr dont les contributions au développement du web des données en bibliothèques se révèlent de plus en plus importantes. Nous avons aussi intégré le Ministère de la Culture, Europeana, la Bibliothèque des Champs Libres de Rennes et le Service Commun de Documentation de l’université Lille 3 dans notre champ d’études. Durant cette enquête, nous avons bénéficié de l’expertise de deux consultants et de quatre chercheurs spécialisés dans l’implémentation des technologies du web des données en bibliothèques et dans l’institution culturelle.
Résultats
5La diversité de ces profils est à l’origine de résultats riches et intéressants. Tous les interviewés confirment que le web des données permet à travers ses technologies et sa mise en relation des données de revaloriser certains métiers et pratiques professionnelles. C’est sur la notion de médiation que leur approche diverge. Si les professionnels des bibliothèques mettent l’accent sur la valorisation du catalogage et des catalogueurs, les consultants, les chercheurs et certains professionnels de l’information perçoivent la question autrement. Ils valoriseraient la collaboration, l’échange et la communication entre les différentes communautés institutionnelles. D’autres pensent que les technologies du web des données mettraient en valeur le travail des bibliothèques, en matière de structuration et de traitement de la donnée, et attribuent à ces institutions le rôle d’instances de certification de certains jeux de données du web.
Valorisation du catalogage et des catalogueurs
Le catalogage
6Les professionnels des bibliothèques sont d’accord pour affirmer que le web des données est le média de valorisation de certaines pratiques professionnelles dont le catalogage. Cette pratique très importante pour les bibliothèques est en train d’évoluer. Sa mise en valeur par les technologies du web des données est une réplique au mouvement « zéro catalogage » prédisant la disparition de cette pratique et de sa substitution par la récupération des notices. Nous tenterons durant cette partie de bien illustrer ce constat, confirmé par l’ensemble des professionnels, en analysant ses trois aspects majeurs :
7La Frbérisation des catalogues : ou l’émergence d’un nouveau modèle de catalogues et de notices. Les catalogueurs sont davantage appelés à mieux connaître les fonctionnalités du modèle conceptuel Functional Requirements for Bibliographic Records. Ils devraient manipuler des notices utilisant la notion entité relation, et procéder à l’éclatement des modèles traditionnels. L’unicité de la notice, la création d’une structure en réseau, conforme à celle du web, et la transposition des données au format Resource Description Framework est la principale visée de cette procédure.
8L’émergence d’un double discours sur les positions à adopter en matière de catalogage : Cette attitude démontre la volonté de faire évoluer le catalogage et de confirmer son existence par rapport au mouvement prédisant sa disparition et sa substitution par la récupération des notices. Or s’il est vrai que les technologies du web des données parviennent à mettre en exergue le processus du catalogage, elles ne réussissent pourtant pas à convaincre tous les professionnels de la nécessité de changer leurs pratiques, d’où ce double discours. Il arrive que certains aient une attitude conservatrice à l’égard du changement et que d’autres y adhèrent bien car ils sont persuadés de l’intérêt de ces technologies dans la mise en valeur de la donnée structurée et de la pratique du catalogage.
9Apparition de la notion du « Cataliage » ou le « Catalinking » : C’est un nouveau processus de catalogage fondé sur la création de liens vers des ressources externes dont le choix est relatif aux documents à cataloguer ou au public à desservir.
Les catalogueurs
10En ce qui concerne les catalogueurs, ils sont de plus en plus valorisés par les grandes structures. Incompris et souvent interrogés sur l’utilité de leur travail à long terme, ils sont actuellement aux premières loges avec les technologies du web des données. Leur maîtrise du format Marc et du modèle FRBR3 leur attribue des compétences et un savoir-faire fortement prisé. La production de données structurées atteignant le plus haut niveau de granularité descriptive fait qu’ils sont de plus en plus recherchés pour leurs compétences techniques. À titre d’exemple4 on se rend compte que derrière le Knowledge Graph il y a la base Freebase.com qui comprend 130 concepteurs développeurs pour 150 catalogueurs, soit une proportion de ¾ de catalogueurs pour ¼ d’informaticiens développeurs. Un autre chiffre du même genre, mais cette fois-ci chez Google Maps où l’on retrouve 5 000 employés dont 3 000 catalogueurs pour 2000 ingénieurs-développeurs.
11Outre la proportion majoritaire de ces professionnels, on relève aussi la volonté des managers de sensibiliser les catalogueurs à l’importance de leur rôle dont ils n’ont souvent pas conscience. Les catalogueurs ont l’impression de saisir des données inutiles et répétitives. Selon la responsable du département audiovisuel de la Bibliothèque nationale de France, le fait de montrer à cette communauté le résultat de leur travail dans le produit data.bnf.fr permet une meilleure compréhension de l’intérêt qu’ils ont à structurer les données pour générer leur réutilisation à long terme. Des formations ont été prévues dans ce sens. C’est une manière d’apaiser ce sentiment d’inquiétude qui affecte certains d’entre eux quant à l’intégration des technologies du web des données et les incite à se poser la question suivante : « Quel est notre rôle et quelle est notre valeur ajoutée par rapport à ces technologies ? ». « Notre métier va-t-il disparaître ? Va-t-on tous suivre le modèle américain ? »
Dispositif de communication et de collaboration entre les communautés institutionnelles
Communication technique
12Nos interviewés relèvent aussi un rapprochement entre les différents profils de professionnels qui jusqu’alors communiquaient très peu entre eux. Deux types de communications sont à noter : il s’agit d’abord d’une communication technique entre les membres d’une même communauté, et ensuite d’une communication de convergence qui tente de rapprocher des profils et des parcours divergents. L’idée de dire que le web des données est un média, se traduit, selon certains professionnels des bibliothèques, par une meilleure communication entre les individus et les institutions. Les débats, les conférences et les études de cas publiés dans des revues de renom telles que The Journal of Science dénotent l’engouement des professionnels pour ces technologies. C’est aussi le reflet d’une double volonté de leur part de faire évoluer la technologie en la réadaptant aux besoins des bibliothèques et de faire évoluer celles-ci en intégrant ces technologies, mais surtout à travers l’échange de processus, de pratiques et d’expériences techniques diverses.
Communication de convergence entre des profils divergents
13Le web des données réussit à créer une convergence entre les institutions et les profils divergents de professionnels qui n’ont pas toujours eu les mêmes approches. C’est le cas des bibliothécaires et des informaticiens. Si les premiers sont fascinés par le modèle du graphe, qui leur permet de relier leurs données et de les rendre interopérables, les seconds sont moins persuadés de l’efficacité d’un tel modèle. Selon un chargé de projet au Ministère de la Culture, l’intégration des technologies du web sémantique nécessite la mise en place d’un processus de médiation pour convaincre la hiérarchie de l’impact bénéfique de ces technologies. Ce processus est principalement fondé sur l’action et non le discours. « Quand on convainc les gens de mettre un agent de leur service dans un tel projet, cela les implique d’une manière ou d’une autre. Dans ce cas c’est l’action qui compte et non le rapport verbal. C’est surtout dans l’action qu’on comprend la mesure de la difficulté de ces projets innovants et que l’on devient réaliste »5 (Sajus, 2014) Ces projets comportent tous les profils des professionnels de l’information : catalogueurs, indexeurs, informaticiens, etc. La pluridisciplinarité, la présence documentaire et informatique constituent les principales caractéristiques de ce web.
Émergence de la notion d’experts et d’expertise
14L’intégration des technologies du web des données engendre, selon les professionnels des bibliothèques, la notion d’expertise. On relève ainsi le développement de nouvelles expertises autour de la description fine et détaillée des ressources comme c’est le cas pour les documents scientifiques ou multimédias. Le traitement de ces ressources sera désormais confié à un expert dont la mission est d’assurer la granularité, la propreté et l’authenticité des métadonnées pour qu’elles puissent être reliées à d’autres jeux de données et réutilisés par d’autres bibliothèques. Pour certains consultants cette notion d’expertise prend une autre forme : celle de la certification et de la validation des données du web. Les référentiels et les données structurées des bibliothèques sont indispensables au web des données car ils permettent, selon Marc Maisonneuve6, de faire évoluer le web actuel vers un espace de contrôle d’informations et de référentiels, ce qui amènera à reconnaître la valeur du travail des bibliothécaires.
Discussion
15Les hypothèses de départ se confirment. La technicité n’est plus le seul élément du web des données. Le savoir-faire des catalogueurs est de plus en plus indispensable à l’évolution de ce web et de l’ensemble de ses technologies. C’est une approche qui se confirme avec les initiatives de l’OCLC (Online Computer Library Center) dont l’objectif est d’assurer la réadaptation des formats et technologies du web des données pour qu’elles soient compatibles aux standards du web et des bibliothèques. On peut mentionner à titre d’exemple schema bib extend qui n’est qu’une réadaptation du schema.org pour les bibliothèques. Le rôle des bibliothécaires se confirme ainsi. On se rend compte qu’il est de plus en plus difficile pour Google de promouvoir l’idée de son efficacité à trouver toutes les informations sur le web et à ignorer l’intérêt et l’utilité du processus de traitement de l’information. Les technologies du web des données ont induit une prise de conscience chez les professionnels des bibliothèques sur la nécessité de structurer et de valider la donnée avant sa publication sur le web. Cette attitude met en valeur le rôle des bibliothèques et des catalogueurs. Or si la valorisation des pratiques professionnelles par les technologies du web des données semble être une valeur ajoutée pour certains professionnels, elle l’est moins pour d’autres. Selon Antoine Isaac (Europeana) les technologies du web des données portent en elles le potentiel de mettre en valeur les pratiques professionnelles et c’est ce qui se passe quand les bibliothèques commencent à échanger des données et à les représenter en Linked data.
16Pour ce qui est de la valorisation du travail des catalogueurs, les professionnels convergent pour la description de deux réalités distinctes. Ils confirment cette hypothèse pour les grandes structures productrices de notices bibliographiques et d’autorités, mais l’infirment pour les moyennes et les petites bibliothèques dont la réalité est toute autre. Adeptes de la récupération, ces dernières n’éprouvent plus le besoin d’avoir des catalogueurs dans leurs établissements. Cette double réalité du terrain fait que les catalogueurs sont de plus en plus tiraillés entre deux discours : celui de la valorisation de leurs compétences et du déclin de leur profession, ce qui mettrait leur raison d’être en jeu et justifierait leur inquiétude croissante.
Conclusion
17L’analyse du web des données comme média de valorisation des pratiques professionnelles confirme son développement et son évolution d’un web de machines à un web faisant évoluer les usages numériques. Cette approche nous est bien confirmée par Bertrand Sajus lorsqu’il souligne que le web des données fait évoluer les usages des communautés professionnelles et savantes en leur fournissant des outils permettant le croisement des informations. « Le gros enjeu du web des données c’est qu’il n’est plus un vecteur de diffusion de la connaissance, mais l’outil qui permet sa co-construction »7.
Bibliographie
BAKER Thomas, BERMES Emmanuelle, KOYLE Karen et al. Rapport final du groupe d’incubation « Bibliothèques et ». In : Groupe d’incubation W3C – Rapport 25 octobre 2011 : [en ligne]. Disponible sur : http://mediatheque.cite-musique.fr/MediaComposite/ARTICLES/W3C/XGR-lld-fr.html (consulté le 09.03.2014)
BERMES Emmanuelle, POUPEAU Gautier, ISAAC Antoine, Le web sémantique en bibliothèques. Paris : Collection Bibliothèques, éditions du Cercle de la Librairie, 2013
GFII, Données culturelles et Linked Open Data Valoriser le patrimoine public dans le : Synthèse de la journée d’étude du GFII organisée le 26 mars 2013 à la Maison de l’Europe.
HÜGI Jasmin, PRONGUÉ Nicolas, Les bibliothèques face au Linked Open Data : de nouvelles applications web et de nouvelles compétences professionnelles. Genève, Haute École de Gestion de Genève, 2014
Ministère de la Culture et de la Communication. « Feuille de route stratégique : Métadonnées culturelles et transition Web 3.0 ». [en ligne]. Disponible sur : http://www.culturecommunication.gouv.fr/var/culture/storage/pub/feuille_de_route__metadonnees_culturelles_et_transition_web_3_0_janvier_2014/files/docs/all.pdf (consulté le 14/02/2014)
MONNOYER-SMITH (Laurence). Chapitre 1 – Le web comme dispositif : comment appréhender le complexe ? [en ligne]. Disponible sur : http://www.academia.edu/2606162/Le_web_comme_dispositif_comment_appréhender_le_complexe. (consulté le 14/10/2014).
Notes
1 Monnoyer Smith (Laurence). Chapitre 1 – Le web comme dispositif : comment appréhender le complexe ? [en ligne]. Disponible sur : http://www.academia.edu/2606162/Le_web_comme_dispositif_comment_apprehender_le_complexe_. (consulté le 14/10/2014).
2 Ibid.
3 Voir Frbérisation des catalogues p. 3.
4 Wenz, Romain, 2014. Bibliothèques Linked open data : nouvelles perspectives de bibliothèques. mp3. Paris : entretien du 3 août 2014.
5 Sajus, Bertrand, 2014. Bibliothèques Linked open data : nouvelles perspectives de bibliothèques. mp3. Ministère de la Culture et de la Communication : entretien du 18 avril 2014.
6 Maisonneuve, Marc, 2014. Bibliothèques Linked open data : nouvelles perspectives de bibliothèques. mp3. Tosca Consultants-Paris : entretien du 4 juillet 2014.
7 Op. cit., Sajus et Bertrand.
Pour citer ce document
Quelques mots à propos de : Kaouther Azouz
Laboratoire Geriico. Université Charles de Gaulle-Lille 3