Aller la navigation | Aller au contenu

FORMATION, MONDE PROFESSIONNEL

Nathalie Pinède

Les enjeux de la médiation des données a l’heure du numérique
L’exemple de la licence professionnelle mind

Article

Texte intégral

1Il est indéniable qu’un vaste mouvement autour des données (data) s’est fait jour, suscitant autant des visions fantasmatiques que des politiques publiques concrètes et s’inscrivant, souvent à notre insu, dans les logiques économiques et marchandes du web. Il s’agirait ainsi de la 2e « révolution » massive des données après celle de l’imprimerie de Gutenberg. En 2020, l’univers numérique est estimé à 40 zettaoctets (ce qui serait l’équivalent de 57 fois tous les grains de sable de toutes les plages de la terre…), avec un doublement de l’univers numérique tous les deux ans depuis 2013. Au-delà de ces chiffres vertigineux assortis d’images tentant de saisir la mesure de la démesure, se posent plus concrètement une série de questions : quelles données ? Pour quelles finalités ? Avec quelles compétences ? Parmi les multiples possibles qui accompagnent cette hypertrophie des données, qualifier, structurer et mettre à disposition des corpus de données numériques, deviennent aujourd’hui des enjeux déterminants pour les organisations. Se poser en tant que « médiateur » de l’information numérique suppose dès lors un équilibre à trouver entre des compétences et des cultures multiples (informatique, communicationnelle, documentaire). C’est tout l’objet et la finalité de la licence professionnelle MIND (Médiations de l’information numérique et des données).

Contexte : les enjeux des données aujourd’hui

2Que se sache-t-il derrière ce terme désormais passe-partout de data ou « données » ? Trois types d’objet peuvent être associés à ce concept (Collet-Thireau et Thomas, 2015) : les données dites « brutes », les métadonnées, et les traces. À partir de cette vision polymorphe des données, plusieurs déclinaisons emblématiques autour des « data » émergent. Ainsi les problématiques en lien avec le « big data » ou l’« open data » sont-elles significatives de cette complexité.

3À l’expression « Big Data » (Frické, 2014 ; Delort, 2015), on associe notamment les multiples traces présentes sur le web, traces issues de nos comportements numériques. Ces traces multiples qui accompagnent de façon souterraine le moindre de nos gestes et de nos clics sur le web génèrent malgré nous, auteurs inconscients, des sillages gigantesques devenant autant de terrains d’analyse. C’est un double mouvement qui naît alors, entre représentation et intervention (Rieder, 2010). Ces traces représentent une forme de réalité, celle de nos pratiques en action, et à ce titre, peuvent être auscultées aux plans sociologique, marketing, etc. Elles peuvent également être réinvesties pour proposer aux usagers, clients, une réalité calculée et construite sur la base d’une analyse statistique des traces précédentes. Cette forme d’intervention effectuée à partir d’une lecture de nos traces projetée dans une réalité prédictive est sous-tendue par des logiques algorithmiques, invisibles aux publics, influençant de façon secrète mais efficace, nos pratiques informationnelles et d’une certaine façon, notre vision et nos représentations symboliques du monde. Cette nouvelle « raison algorithmique » permettant de prendre le pouls de flux massifs de données ne va évidemment pas sans risques ni limites sur divers plans épistémologique, éthique et bien sûr, méthodologique, ce que soulignent par exemple Boyd et Crawford (2012). A. Rouvroy et T. Berns (2013) parlent quant à eux de « gouvernementalité algorithmique » pour qualifier « un certain type de rationalité (a)normative ou (a)politique reposant sur la récolte, l’agrégation et l’analyse automatisée de données en quantité massive de manière à modéliser, anticiper et affecter par avance les comportements possibles » (p. 173). Plus largement, D. Cardon (2015) identifie quatre familles de calcul numérique en lien avec cette raison algorithmique. Les mesures d’autorité et de prédiction, en particulier, que D. Cardon qualifie comme étant respectivement « au-dessus » et « au-dessous » du web illustrent un régime de l’invisibilité ou de l’inaccessible, ces conditions de fabrication qui échappent à notre regard de citoyen, de chercheur et de professionnel de l’information communication. A cette approche quantitative et algorithmique des données, peut répondre sur un autre plan celle – qualitative – des « thick data »1 visant à donner de l’épaisseur par la contextualisation et l’interprétation.

4Quant au mouvement de type « open data », il tend à une « libération » de données publiques et s’inscrit dans un idéal (voire une injonction sociale) de transparence. Les données mises à disposition résultent d’une série de transformations (reformatage, nettoyage et desindexicalisation) permettant une « brutification » de données métiers préexistantes dans des contextes politiques et organisationnels (Denis et Goëta, 2013), le tout pour une mise à disposition publique, intelligible par tous et interopérable. Dans cette perspective, « les « jeux de données » produits par ces acteurs publics constituent des ressources d’interprétation et de connaissance du territoire dans toutes ses dimensions, et engagent a priori la possibilité d’un meilleur exercice de la citoyenneté. » (Bonaccorsi, 2014). Ce qui ne va pas sans « fabrique de l’évidence » (Jeanneret, 2001) : « Cette nouvelle figure du progrès est justifiée tout particulièrement par un discours techniciste, qui donne à penser que le perfectionnement des dispositifs engendrerait automatiquement des effets de transparence sociale » (p. 137).

5Ces quelques jalons évoqués autour des données sont éminemment sommaires et d’autres figures des data pourraient être évoquées (soft, small…). Mais quelles qu’elles soient, ces questions autour des « data » et de l’information numérique » mobilisent des points de vue et disciplines multiples, avec de fortes implications aux plans technique, sociétal, politique, éthique ou juridique. Ainsi, la facette algorithmique des « big data » nous amène plutôt du côté de l’informatique et de la statistique, à travers des métiers comme celui de « data scientist ». Mais les sciences de l’information et de la communication sont bien entendu elles aussi mobilisées sur les questions en lien avec les données dans des environnements numériques dynamiques comme celui du web, que cela soit au niveau de la recherche (Barats, 2016 ; Severo et Romele, 2016), ou au niveau de la formation, avec un certain nombre d’interrogations et de défis à relever. En effet, au plan du traitement et de l’interprétation, l’entrée par les données pose aussi la question de la compétence d’analyse (statistique et logicielle) pour « faire parler » de grands volumes de données, ce qui ne constitue pas l’apanage de notre discipline. Par contre, dans notre champ, former à la complexité de la production et de l’utilisation de ces données hétérogènes et multiples, à leur documentation et scénarisation pour des publics hétérogènes s’inscrit dans une approche tout à la fois nécessaire et complémentaire d’autres points de vue. Dès lors, un angle d’attaque pertinent, au vu des caractéristiques de notre discipline et des profils de certains de nos étudiants, consiste à jouer la carte d’une « littératie » ou culture des données2, mettant notamment en jeu la problématique de la médiation.

Le choix de la médiation pour aborder les données

6D’une façon très générique, la médiation est le lien construit qui va s’établir entre différentes entités. Tout le monde s’entendra sur le fait que la médiation ne consiste pas en un simple relais inscrit dans un processus linéaire de diffusion et de transmission d’information, jalonné de simples aiguillages, d’un point de départ à un point d’arrivée. À l’origine, la médiation nous renvoie à une forme de négociation entre plusieurs pôles et entités, dans une situation marquée par des formes d’asymétrie. La médiation tire pour partie sa substance et son essence des interstices qui se créent dans ces entre-deux et participe dès lors à la création de liens, ainsi qu’à la construction du sens, devenant « un « tiers » symbolique (ensemble de valeurs, de pratiques partagées, de lieux de mémoire) qui d’une certaine façon transcende le quotidien des échanges » (Jeanneret, 2005). Faire lien, tout en faisant sens, donc. M. Gellereau précise quant à elle que le terme « médiation » peut s’appréhender selon deux angles : « celui du rapport au système (la médiation sociale) ou celui de la construction du sens (processus interprétatif) » (Gellereau, 2013, p. 26). Dans une approche de type système, la médiation va mettre en jeu des logiques de régulation et de négociation, permettant de rapprocher des entités, d’asseoir un processus communicationnel. Sous l’angle de la construction du sens, la médiation peut être vue comme processus interprétatif dans un contexte identifié, où seront mobilisés différents sujets, dispositifs, systèmes de signes, etc.

7Dès lors, la médiation se pose en tant que processus dynamique. Qui dit dynamique d’échange suppose de facto un caractère évolutif, non figé, de l’activité de médiation, s’appuyant notamment sur des pratiques en renouvellement quasi constant. Celle-ci contient sa propre densité en tant qu’activité de fabrication, et ce, quel que soit le domaine concerné. Dans un tissu relationnel dense où se connectent et s’entrecroisent dispositifs et services, usagers et « médiateurs », les objets, savoirs, données circulent et « tout déplacement implique une transformation de quelque chose, une production, un réagencement [des] représentations incarnées dans des productions matérielles » (Babou, Le Marec, 2008, p. 139). Dans l’usage opératoire du concept de « médiation », différentes déclinaisons peuvent être recensées. J. Davallon (2004) en identifie par exemple cinq : médiation médiatique, médiation pédagogique, médiation culturelle, médiation institutionnelle et médiation technique. Mais d’autres déclinaisons pourraient être citées, comme la « médiation documentaire », la « médiation des savoirs », ou plus récemment, la « médiation algorithmique » (Rieder, 2010), sans que cela épuise pour autant le registre des possibles dans le champ de la mise en action opératoire du concept de « médiation ».

8Dans un environnement où les organisations poursuivent et amplifient un vaste mouvement non seulement de numérisation de leurs documents mais aussi de décloisonnement et d’ouverture de leurs données, s’avère plus que jamais indispensable un accompagnement autour de ces données et documents, faisant lien et sens. En effet, « libérer » des données, y compris en respectant des formats interopérables, ne suffit pas : il est nécessaire d’organiser la rencontre entre ces données et leur(s) public(s) mais aussi de participer à la formation à l’autonomie des usagers. Dans ce cadre-là, les ressorts de la médiation, à partir d’une réflexion et d’un travail sur le lien autour des data et de l’information dans les écosystèmes numériques, apportent une plus-value déterminante. C’est l’objectif principal porté par la licence professionnelle MIND de l’IUT Bordeaux Montaigne.

L’exemple de la licence professionnelle MIND

9La licence professionnelle MIND3 a été créée en 2016 à l’IUT Bordeaux Montaigne et résulte d’une réorientation d’une licence professionnelle précédente4, afin de s’adapter aux évolutions dans le champ de l’information-documentation et du numérique. Son objectif principal est de former des professionnels du domaine au niveau L3, à même d’animer et de valoriser l’information numérique, les données du web ainsi que des ressources documentaires de multiples natures. Pour la formation de ces étudiants de niveau intermédiaire (sans domaine de spécialité avéré ou de parcours universitaire long), quatre types de médiation ont été ciblées afin de construire une compétence « orchestrale » : médiations des données, collaborative, audiovisuelle et documentaire, l’ensemble reposant sur un double socle, technique et culturel (fig. 1).

Figure 1 – Architecture de conception de la licence MIND

Image 10000000000004B0000003470FEEBF80BCF6077C.jpg

10En ce qui concerne la médiation des données, plusieurs plans sont mobilisés. Il s’agit tout d’abord de permettre un « habillage » des données en travaillant par exemple la dimension visualisation afin de permettre leur valorisation et de faciliter leur compréhension dans une perspective orientée « design d’information ». Mais cela peut être également, dans une approche plus pédagogique, l’accompagnement des publics pour une acculturation à des jeux de données, tels que proposés par les collectivités locales. Les médiations documentaires s’articulent avec les médiations de données, elles représentent ce cadre d’inscription nécessaire et fondamental à la production d’un environnement structuré, renseigné et adapté pour les documents, qu’ils soient numériques ou pas. Les médiations audiovisuelles constituent une déclinaison particulière autour de l’image et des vidéos, à la fois dans une logique de contextualisation et de construction du sens. Enfin les médiations collaboratives permettent de déployer des stratégies de médiations numériques à travers différents dispositifs du web, dans un croisement pluri-médias (Twitter, Facebook, etc.) favorisant des interactions diversifiées et réactives entre différents acteurs.

11Mais la mise en action de ces quatre grands types de médiation choisis repose nécessairement sur la consolidation d’un double socle, technique et culturel : socle technique pour dialoguer et agir (bases de données, sites web, architecture de l’information…) ; socle culturel pour comprendre les enjeux de ces environnements numériques, mobiles et pluriels (médias, droit, information-communication, statistiques…). Les projets tuteurés en lien avec l’environnement socioéconomique5 contribuent dans le cadre de la formation à une mise en situation par les problématiques de terrain. L’entrecroisement de ces dimensions, compétences techniques, culture du numérique et médiations, contribue à créer un cadre polyvalent et ouvert, permettant de faire face et de s’adapter à certains des grands enjeux actuels, en pilotant ou participant à des projets orientés « data ».

Conclusion

12Former aux data dans le domaine des sciences de l’information et de la communication n’est pas un défi mineur… L’erreur serait sans doute, notamment à un niveau L3, de chercher à donner aux étudiants des compétences qui ne sont pas de leur ressort (statistiques, algorithmique, par exemple). Mais une connaissance réelle et une expérience de ces domaines, associées à un renforcement des compétences info-documentaires ainsi qu’à une culture solide globale sur les logiques du numérique, permet d’élaborer une compétence professionnelle ancrée en information-communication et participant de la mise en intelligibilité et usages de l’information numérique et des données.

Bibliographie

Babou I. et Le Marec J., « Les pratiques de communication professionnelle dans les institutions scientifiques. Processus d’autonomisation », Revue d’anthropologie des connaissances, 2(1), 2008, p. 115-141.

Barats C. (dir), Manuel d’analyse du web en Sciences Humaines et Sociales, Paris, Armand Colin (2ème éd.), 2016.

Bonaccorsi J., « Le monde de l’open data : les jeux sémiotiques et esthétiques de la « visualisation» comme rhétorique de la transparence », 23ème Congrès mondial de Science politique, IPSA, 2014.

Boyd D. et Crawford K., « Critical Questions for Big Data: Provocations for a Cultural, Technological, and Scholarly Phenomenon », Information, Communication, & Society, 15(5), 2012, p. 662-679.

Cardon D., A quoi rêvent les algorithmes ? Nos vies à l’heure des big data, Paris, éditions du Seuil, La République des Idées, 2015.

Collet-Thireau K. et Thomas J.-P., « Big Data et Open Data : quel impact pour les professionnels de l’information ? », I2D – Information, données & documents, 53(4), 2015, p. 9-10.

Davallon J., « La médiation : la communication en procès », Médiation & information (MEI), 2004, p. 39-59.

Delort P., Le big data, Paris, PUF (Que sais-je ?), 2015.

Denis J. et Goëta S., « La fabrique des données brutes. Le travail en coulisses de l’open data », Journée d’études SACRED Penser l’écosystème des données. Les enjeux politiques et scientifiques des données numériques, Paris, 13 février 2013.

Frické M., « Big data and its epistemology », Journal of the Association for Information Science & Technology66(4), 2014, p. 651-661.

Gellereau M., « Pratiques culturelles et médiation », in S. Olivesi (dir.), Sciences de l’information et de la communication, Grenoble, PUG, 2013, p. 25-41.

Jeanneret Y., « Médiation », in La société de l’information : glossaire critique, Paris, La Documentation française, 2005.

Jeanneret Y., « Les politiques de l’invisible. Du mythe de l’intégration à la fabrique de l’évidence », Document numérique, 5(1), 2001, p. 155-180.

Rieder B., « Pratiques informationnelles et analyse des traces numériques : de la représentation à l’intervention », Études de communication, 35(2), 2010, p. 91-104.

Rouvroy A. et Berns T., « Gouvernementalité algorithmique et perspectives d’émancipation. Le disparate comme condition d’individuation par la relation ? », Réseaux, 1 (177), 2013, p. 163-196.

Severo S. et Romele A. (dir), Traces numériques et territoires, Paris, Presses des Mines, 2016.

Notes

1  Tricy Wang, 2013. « Big Data Needs Thick Data » (http://ethnographymatters.net/blog/2013/05/13/big-data-needs-thick-data/

2  La FING (Fondation Internet Nouvelle Génération) développe toute une série d’actions sur la culture et l’usage des données numériques, notamment en lien avec les activités organisationnelles. Voir sur ce sujet http://fing.org/infolab et par exemple, le projet « Parlez-vous data ? » qui comprend trois étapes (diagnostic, design, déploiement) visant à accompagner les organisations dans l’émergence et/ou la consolidation d’une culture de la data.

3  http://www.infonumbordeaux.fr/mind/

4  Licence professionnelle « Ressources documentaires et bases de données, option image fixe, image animée et son ».

5  En 2017-2018, les étudiants de la licence professionnelle MIND travaillent en collaboration avec la société Dactactivist (https://datactivist.coop) sur un projet de documentation et d’harmonisation de données ouvertes.

Pour citer ce document

Nathalie Pinède, «Les enjeux de la médiation des données a l’heure du numérique», Les Cahiers de la SFSIC [En ligne], Collection, 15-Varia, FORMATION, MONDE PROFESSIONNEL,mis à jour le : 01/04/2020,URL : http://cahiers.sfsic.org/sfsic/index.php?id=152.

Quelques mots à propos de : Nathalie Pinède

IUT Bordeaux Montaigne, Laboratoire MICA (Médiations, information, communication, arts)