- accueil >
- Collection >
- 10-Varia >
- DOSSIER >
DOSSIER
CONCLUSION
Bibliométrie et visualisation au service d’un laboratoire
Réseaux mixtes : auteurs et thématiques
Table des matières
Texte intégral
1Les publications scientifiques du laboratoire, fournissent des indices précieux de la science en mouvement. L’approche scientométrique [4] peut alors être mobilisée pour extraire des publications des indicateurs macroscopiques ou des cartographies.
2Le terrain de recherche a été restreint aux seules publications du laboratoire I3M entre 2011 et 2013.
Ressource et méthodes
3À partir des publications retenues pour l’évaluation mi-parcours du quinquénal. Les différentes grandes étapes du traitement bibliographique puis linguistique sont décrites ci-après :
-
est dressé le réseau des co-auteurs, où chaque auteur est associé à ses co-auteurs, chaque co-auteur aux autres co-auteurs. La relation est pondérée par la fréquence de co-auctorialité. Ce réseau dénote les collaborations entre les auteurs (pas seulement de I3M).
-
une indexation des mots des titres des publications calcule la distribution des termes. Un traitement linguistique est appliqué (lemmatisation, suppression des mots “vides” tels que les articles, etc.). Les termes sémantiquement proches sont associés .
-
pour chaque titre, chaque mot de l’ensemble précédent est associé d’une part aux autres mots du titre le suivant pour générer le réseau d’association thématique revisitant ainsi une technique proposée par Leydersdorff [4].
-
les termes les plus fréquents d’un titre sont associés à leurs auteurs et co-auteurs.
4Le graphe mêlant le réseau d’auteurs et co-auteurs ainsi que les termes utilisés par ces derniers est traité par un module de détection de communautés [1]. Ce traitement met en exergue les communautés thématiques/acteurs du domaine. La distribution terminologique (cf. Figure 1) appuie la taille de représentation des nœuds du réseau pour mettre en valeur des thématiques fortement représentées.
Figure 1 – Représentation en nuage de mots-clés des titres de publications du laboratoire, généré avec http://tagcrowd.com
Figure 2 – Réseau de co-auctorialitéet thématiques représenté avec Gephi
Représentation et outil de visualisation
5Le graphe est généré (Figure 2) en sélectionnant les nœuds les plus connectés. Dans ce réseau, les auteurs sont les numéros, les termes sont laissés en clair. Un outil de visualisation interactif en ligne ouvre des capacités d’interactions avec le réseau et dispose les communautés à l’aide de l’algorithme force-directed qui positionne à proximité les nœuds d’une même communauté. Les liens ne sont représentés que sur action de l’usager. Sur le même principe les statistiques relationnelles sont accessibles via un menu pour mettre en exergue :
-
les termes les plus utilisés ou auteurs les plus prolixes (degré),
-
degré au sein de leur communauté thématique, même interprétation relative à la communauté,
-
les nœuds connecteurs (intermédiarité), soulignant la propension d’un nœud à interconnecter différentes communautés.
Résultats
6Par les traitements statistiques et graphiques opérés, on obtient un dispositif d’intelligence informationnelle, qui permet de montrer (cf. Figure 3) les thématiques fortement représentées (les communautés), mais encore des thématiques de collaboration latentes, des potentialités d’association entre acteurs.. Apparaissent également les activités transversales à différents domaines (acteurs présents dans différentes communautés, hubs) ou encore les domaines émergeants. La spatialisation du réseau généré laisse apparaître des communautés thématiques. Les fonctions d’interaction dynamique avec l’usager facilitent la compréhension des données représentées… Cf. : http://www.wikisic.net/I3M2/force_fonts.html
Figure 3 – réseau de co-auctorialité seuillé présenté sur un outil en ligne
Conclusion
7Au plan informationnel, l’outil montre clairement son utilité par la possible navigation au sein du réseau, la mise en avant des thèmes de chaque auteur. Ce dispositif est cependant fortement contraint par la qualité de la source de données : la complétion d’une base de publication commune telle qu’elle est actuellement en cours de construction via le dispositif HAL est indispensable. Sous réserve d’une utilisation systématique de la base de données, de tels traitements pourraient s’avérer précieux non plus uniquement à la définition des thématiques et acteurs de la recherche au sein d’un laboratoire, mais également pour l’appréhension des contours du champ disciplinaire des sciences de l’information et de la communication, à partir de son activité réelle et dans une dimension réflexive.
Bibliographie
BLONDEL V., GUILLAUME J.-L., LAMBIOTTE R., LEFEBVRE R. (2008)‘Fast unfolding of communities in large networks’, Journal of Statistical Mechanics : Theory and Experiment 2008 (10), P10008 (12pp)
BOUTIN E., LIU P., YUAN Y. (2007), “Les réseaux latents : un outil au service de l’intelligence économique”, Actes du colloque VSST Maroc, octobre, 2007, p. 1-13.
BOUTIN E., DUMAS P., ROSTAING H., QUONIAM L. (1996), « Les réseaux comme outils d’analyse en bibliométrie. Un cas d’application : les réseaux d’auteurs. », Cahier de la Documentation, Association Belge de Documentation, N° 1, p. 3-13
LEYDERSDORFF, L. (1987), “Co-words and Citations Relations between Document Sets and Environments”, First International Conference on Bibliometrics and Theoretical Aspects of Information Retrieval, August 24-28, Diepenbeek, Belgium, 1987.
ROSTAING H. (1996). La bibliométrie et ses techniques. Toulouse : Sciences de la Société
Pour citer ce document
Quelques mots à propos de : Eric Boutin
USTV, boutin@univ-tln.fr
Quelques mots à propos de : Emmanuel Marty
UNSA, emmanuel.marty@unice.fr
Quelques mots à propos de : Gabriel Gallezot
Quelques mots à propos de : David Reymond
Quelques mots à propos de : Samy Ben Amor
USTV, benamor@univ-tln.fr