Aller la navigation | Aller au contenu

> Axe 1

Gabriella Salzano

Réutilisation de données publiques : un exemple de participation numérique

Article

Texte intégral

Introduction

1Les données publiques (DP) sont des données libres d’accès, collectées par des organismes publics pour accomplir leurs missions en toute transparence. Très variées (données statistiques, sociales, économiques, environnementales, documents d’archives, collections d’ouvrages…) et a priori gratuites, les DP sont intéressantes par leur ouverture et fiabilité. Elles bénéficient de cadres réglementaires favorables, se déployant dans plusieurs pays ainsi qu’en Europe, afin d’ouvrir des nouveaux marchés aux développeurs, favoriser la croissance et augmenter la transparence du secteur public.

2L’analyse de la dynamique générée par la mise à disposition des DP est un vaste thème de recherche, traité sous différents aspects au sein de l’équipe DICEN-IDF. L’objectif de ce papier est de faire état de recherches récentes et en cours sur la réutilisation des DP, indicateurs essentiels de la participation des acteurs à cette dynamique. En analysant la réutilisation des DP issues des sites institutionnels de quatre pays, nous faisons émerger le rôle de ces acteurs, ainsi que des freins et leviers à une plus forte réutilisation des DP. Les institutions et les utilisateurs sont les co-créateurs de la valeur ajoutée des DP. Les premiers, arbitres de la diffusion de ces données, opèrent des choix stratégiques, d’organisation et d’orientation technologique ; les deuxièmes, citoyens, chercheurs, journalistes et développeurs d’applications, interviennent à différents niveaux selon leurs profils : contribution dans l’évaluation et l’indexation des données, coopération dans la définition d’objectifs communs, collaboration à des processus de conception et de développement.

Démarche

3Ces recherches s’inscrivent dans le contexte scientifique de l’Observatoire de Recherche sur les données publiques [Salzano, 2012], qui comporte des analyses empiriques et des analyses dirigées par des approches d’Ingénierie des SI. Les premières se révèlent pertinentes pour analyser un objet d’étude aussi contemporain et en rapide progression [Yin, 2009], tandis que les deuxièmes couvrent des aspects stratégiques, organisationnels et technologiques, en liaison avec la qualité des systèmes d’information [Comyn-Wattiau & al., 2010]. Les difficultés de cette démarche sont liées à l’hétérogénéité des plateformes (ancienneté, organisation…) et des modes de collecte d’informations. Elle conduit à recueillir et élaborer des éléments quantitatifs et qualitatifs concernant les données diffusées, les outils associés, métadonnées et moteurs de recherche, ainsi que la réutilisation de ces données. Elle amène à identifier des verrous ainsi que des leviers à la dynamique de la mise à disposition et de la réutilisation des DP.

4Pour comparer des dispositifs de réutilisation de DP, Salzano [2013] analyse l’offre d’applications recensées par les sites institutionnels de quatre pays. Ces applications transforment plusieurs données brutes en informations accessibles par le public, à l’aide de mashups et d’outils de visualisation sur PC, tablettes ou téléphones. Le panel de plateformes choisies comprend deux sites pionniers, data.gov (US) et data.gov.uk (UK), deux sites plus récents, data.gouv.fr (FR) et dati.gov.it (IT), et des portails à couverture plus restreinte, développés par exemple par les collectivités territoriales en France et Italie.

La réutilisation des données publiques : comparaison entre quatre pays

5La réutilisation des DP apparaît comme un processus clairement mais différemment enclenché dans les pays étudiés. Les sites data.gov (US) et data.gov.uk (UK) présentent des catalogues très riches d’applications, structurés et décrits via des métadonnées très détaillées. Des métadonnées renseignent sur les tags et appréciations fournies par les utilisateurs. La plateforme italienne, démarrée au même temps que l’analogue en France, présente un vaste portefeuille d’applications, structuré selon les dimensions thématiques, économiques et de couverture géographique. En France et en Italie plusieurs collectivités territoriales développent des plateformes publiant des DP et des applications.

6Les thématiques prioritaires sont les transports, la santé et les loisirs. En France, par exemple, l’application gratuite Handimap.org, présente dans les deux portails de Rennes Métropole et de Montpellier Territoire Numérique, permet de calculer des itinéraires accessibles aux personnes à mobilité réduite et d’afficher différents points d’intérêts liés à l’accessibilité. La Rochelle publie une application gratuite pour Smartphones et tablettes (Android), concernant les déplacements des personnes à mobilité réduite, qui a valu à la ville un trophée Ville citoyenne 2012.

Freins et leviers à la réutilisation des données publiques

7Actuellement, les applications publiées par les plateformes étudiées n’exploitent pas tout le potentiel des données institutionnelles, car elles utilisent très majoritairement un seul jeu de données, plutôt que plusieurs. Les applications à couverture internationale munies d’interfaces multilangues sont très peu nombreuses (OMS, Eurostat).

8Les principaux freins, stratégiques et organisationnels, se manifestent par la prolifération de catalogues hétérogènes de ressources potentiellement partageables (données et applications). Les recherches automatiques de données et leur réutilisation dans des contextes variés sont difficiles.

9Les technologies facilitant des développements rapides sont désormais largement diffusées. Ainsi les leviers plus discriminants pour la réutilisation des DP se situent au niveau stratégique. Les pays établissent des accords de collaborations dans des secteurs prioritaires, comme les politiques publiques territoriales, et tous les portails lancent de nombreux concours pour inciter des développeurs à participer de la communauté Open Data. Nous analysons plus en détail des leviers spécifiques.

Les sites anglo-saxons data.gov et data.gov.uk

10Au sein de data.gov, les citizen-developed apps (230), sélectionnées à l’issue de concours internationaux, sont utilisées pour des prises de décisions dans des domaines aussi divers que l’analyse du marché du travail, aux niveaux locaux, régionaux ou des états, ou la planification d’activités en fonction de la qualité de l’air actualisée en temps réel. Cependant, comme ces applications ne sont pas rattachées au gouvernement fédéral, data.gov ne peut pas être garant des implications de leurs utilisations ni de la qualité de l’information diffusée. Le Developers’ Corner incite les développeurs à rejoindre la communauté de l’Open Data pour corréler des données institutionnelles à l’aide d’approches relevant du Web sémantique, d’outils de visualisation, de gestion de contenus, comme Dupral, et d’interrogation, comme SPARQL. La communauté data.gov Semantic Web, en conjonction avec le W3C, recommande des standards pour les données institutionnelles et leurs métadonnées, et sollicite les développeurs à créer une nouvelle génération des mashups de données liées.

11Le site data.gov.uk publie environ 230 applications et incite fortement les développeurs à en soumettre des nouvelles pour les partager. Le datastore du portail londonien réunit environ 75 applications et incite la créativité des potentiels contributeurs avec des inspirational uses, en mettant en vitrine quelques applications (recensement, élections, location de vélos,...).

Le site data.gouv.fr

12Pour stimuler la réutilisation des DP, la mission Etalab, responsable du site data.gouv.fr, lance régulièrement des concours dataconnections, en répartissant les applications en 3 catégories : Projets Grand Public, Projets d’Utilité Publique et Projets Professionnels. Le dernier concours a introduit la thématique principale “Mobilité et territoires”, qui comprend le transport, le tourisme, la vie ou l’information locale, notamment géographique.

13De plus, Etalab a lancé récemment une phase de concertation avec les parties prenantes pertinentes au mouvement open data : administrations, réutilisateurs, citoyens. L’objectif de cette démarche participative de co-conception est de préparer une nouvelle version de la plateforme data.gov.fr et « recueillir toutes les suggestions des parties prenantes pertinentes, repérer un maximum de compétences de notre écosystème et produire un effort de prototypage rapide en public. ». Le processus de co-design en cours vise à améliorer la collecte des données et leur pertinence, faciliter la réutilisation et l’exploitation des données ainsi que l’innovation à partir de la plateforme, mieux insérer data.gouv.fr dans le réseau des ressources open data et construire un retour vers les administrations qui partagent leurs données. Plusieurs fournisseurs de solutions technologiques, opérant aussi bien dans la diffusion des données ouvertes que dans leur réutilisation, ont apporté leurs contributions constructives à ce processus. Leurs réponses détaillées sont publiées sur le site Etalab

Conclusions et perspectives

14La dynamique générée par la mise à disposition de données publiques est un phénomène très récent, complexe, international et en rapide évolution. Ce papier l’analyse à partir des plateformes institutionnelles de quatre pays : États Unis, Royaume Uni, France et Italie. En utilisant une démarche généralisable à d’autres domaines, il met en évidence les différents niveaux de maturité des portails, en termes de réutilisation au travers des applications. Il identifie aussi des freins stratégiques et organisationnels à une plus forte exploitation des DP et les principaux leviers .

15Nos perspectives de recherche concernent l’analyse des dispositifs de visualisation implémentés par des sites de mise à disposition de DP, qui, si pertinents, facilitent l’exploration et l’analyse des données. Les questions visées sont du type : quelle(s) stratégie(s) de visualisation adopter face à la masse croissante de données publiées et à leurs différentes typologies ? quelles recommandations (technologiques, d’organisation…) peut-on formuler pour que la diffusion de ces données au grand public soit la plus large possible ? Cette analyse focalisera sur le domaine de la santé en liaison avec l’environnement, où les données sont largement géolocalisées. Le panel de plateformes comprend des sites transnationaux, nationaux et de ministères en charge de la santé et de l’environnement.

Bibliographie

Boustany, J., Salzano, G. (2011), La réutilisation des données publiques : quels dispositifs ?, 8e Colloque international ISKO-France, Lille 27-28 juin 2011

Comyn-Wattiau, I., Akoka, J., Berti-Equille, L. (2010), La qualité des systèmes d’information. RSTI-ISI, Vol. 15/6, p. 9-32.

Salzano, G. (2009), Vers un observatoire de recherche sur les données publiques en santé, Colloque de l’Association Information et Management (AIM), Vers un Management Éthique et Responsable ? La Contribution des Systèmes d’Information, 21 au 23 mai 2012, Bordeaux.

Salzano, G. (2013), Réutilisation de données publiques : Une étude comparative entre quatre pays, Inforsid 2013, 31e édition à Paris, 29-31 juin 2013

Yin R. K. (2009) Case Study Research. Design and Methods, Fourth Edition, 240 pages, SAGE Publications, Inc.

Pour citer ce document

Gabriella Salzano, «Réutilisation de données publiques : un exemple de participation numérique», Les Cahiers de la SFSIC [En ligne], Collection, 9-Varia, DOSSIER, > Axe 1,mis à jour le : 22/04/2020,URL : http://cahiers.sfsic.org/sfsic/index.php?id=740.

Quelques mots à propos de : Gabriella Salzano

UPMLV, DICEN-IDF EA 4420, CNAM. Courriel : gabriella.salzano@univ-mlv.fr