Qu'est ce que l'open data

Aller au contenu. | Aller à la navigation

Navigation

Navigation
Menu de navigation
Vous êtes ici : Accueil / Ma Ville / Administration / Services communaux / Data office / Open Data / Qu'est ce que l'open data
Actions sur le document
QU’EST-CE QUE L’OPEN DATA ?

L'ouverture des données est une philosophie visant à rendre des données numériques accessibles à tous et à s’affranchir des restrictions sur le droit d'accès et de réutilisation. Les données ouvertes s'inscrivent aussi dans une démarche plus vaste de transparence et de participation des citoyens que l’on retrouve dans toutes les politiques d’ouverture des droits. (Source : Wikipedia)

Il existe de multiples définitions de l’Open Data. En voici 2 pour illustration.

La première définition est très large et revient à dire que toute donnée publiée via le web est une donnée Open Data. Notez que certains considère toute donnée structurée ou non mais qui dispose d’une licence d’utilisation Open Data peut être considérée comme Open Data.

La 2ème définition est plus restrictive et ne considère comme Open Data que les données qui sont exploitables automatiquement par des programmes tiers. Chaque terme de chaque définition peut être débattu mais ce n’est pas l’objet de la présente note. S’il faut résumer les textes provenant des organismes gérant ou légiférant sur les Open Data on peut considérer que les Open Data sont des données qui sont accessibles via Internet et qui disposent d’une licence d’utilisation Open Data.

POURQUOI LES OPEN DATA ?

Beaucoup considèrent que la plupart des données sont de facto la propriété du public. Elles sont malheureusement souvent emprisonnées dans des silos réservés à l’usage exclusif de certains organismes. La mise à disposition de ces données permettra une bien meilleure transparence des organismes qui les fournissent. Les besoins des citoyens grandissent, mais les moyens publics ne suivent pas. Rendre les données publiques facilitera le développement d’applications par des tiers ce qui accélèrera grandement la mise à disposition de services nouveaux de façon plus économique et partant participera au développement digital de la Wallonie.

Les Open Data sont une façon de partager les données entre organismes publics, ce qui n’est pas facile actuellement. Elles pourront être utilisées pour effectuer du benchmarking (analyses comparatives) entre les différentes institutions et ainsi promouvoir les pratiques les plus efficaces. Néanmoins, pour avoir une réelle valeur, il faut que tous les acteurs participent. Par exemple, au niveau communal, les Open Data auront bien plus de valeur si toutes les communes participent. Les Open Data sont aussi utilisées par la presse, le secteur éducatif, pour les études de marché, le privé, etc… . Rien que par le fait que les Open Data élargissent leur propre audience, il faut s’attendre à des innovations auxquelles personne ne pense encore actuellement. D’autre part, l’intérêt des Open Data a été pressenti depuis longtemps par l’Union Européenne qui a légiféré en la matière. Ces directives doivent être transposées dans les législations locales. A terme, les Open Data deviendront obligatoires.

LE DEGRE D'OUVERTURE DES OPEN DATA

Tim Berners-Lee (connu pour avoir créé le world wide web) propose une classification à 5 étoiles des Open Data afin de pouvoir plus facilement appréhender le degré d’ouverture d’une Open Data et l’usage qui peut en être fait.

degre-opendata

★ Disponible sur le Web, quel que soit le format, (par exemple un pdf, un scan) mais avec une licence Open Data.

★★ Idem niveau 1 mais dans un format structuré lisible numériquement (par exemple, une feuille Excel au lieu d’un scan de table)

★★★ Idem que le niveau 2 étoiles mais dans un format non propriétaire comme le CSV (au lieu d’Excel)

★★★★ Idem que le niveau 3 étoiles, directement utilisables par d’autres programmes. Utilise les standards OPEN du W3C (RDF & SPARQL)

★★★★★ Idem que le niveau 4 étoiles, plus liaison avec d’autres données.

Plus les Data Sets ont d’étoiles, plus, ils seront exploitables et plus ils généreront de la valeur. Rien n’empêche de commencer avec des Data Sets 1 étoile. La Ville de Namur doit viser le degré d’ouverture du niveau 4 étoiles. Ce n’est qu’à cette condition que l’on peut espérer voir se développer des applications avec une réelle valeur ajoutée.

En savoir plus : Détails du degré d'ouverture des open data (5 étoiles)

DIFFERENTES FORMES D'OPEN DATA
  • Page web (★)
  • Download (★, ★★ et ★★★)
  • Web Service (★★★★)
  • Web Map Service (WMS) (★★★★)
  • RSSFeed (★★★)

En savoir plus : Détails des différentes formes d'open data

STRATEGIE OPEN DATA
  • Infrastructure

Le principe de base est de mettre à disposition les Open Data sur le serveur de la source des données et de les y laisser. Ces données sont référencées dans des catalogues centraux qui les décrivent et qui expliquent comment les accéder. C’est donc le rôle des développeurs ou des intégrateurs de collecter toutes les données nécessaires au développement de leurs applications.

En Angleterre, il existe des agrégateurs. Des schémas de données sont publiés. Les données de toutes les localités respectant ce schéma peuvent être interrogées via une seule requête qui les agrège en un seul bloc, ce qui rend ces données beaucoup plus attractives pour les développeurs (Source : http://aggregator.opendata.esd.org.uk/  ). Le site d’agrégation est géré par la Local Government association à http://www.local.gov.uk/  , l’Union des Villes anglaise.

Il faut espérer, qu’en Wallonie des opérateurs privés ou publics qui procéderont à l’agrégation des données verront vite le jour. En effet, même si les données des 262 communes sont référencées centralement, si les données elles-mêmes restent sur 262 serveurs différents, cela restera difficilement gérable pour les développeurs d’applications de type startup  et risque de n’être possible que pour de très gros opérateurs.

  • Extraction et Mise à disposition des données

Pour pouvoir mettre à disposition les données, la Ville devra investir dans le développement d’interfaces d’extraction de données des différentes bases de données qu’elle possède. Ces données devront être traitées, par exemple pour les regrouper et ainsi les anonymiser. Ces données devront être mises à disposition dans des espaces séparés des data bases centrales afin d’éviter tout risque d’accès à des données confidentielles de la Ville ou des citoyens. Le service Data Office et le service informatique sont chargés de définir quels sont les outils nécessaires pour ce faire. Priorité sera donnée à des logiciels de type ouverts de façon à minimiser les coûts et à permettre facilement leur réutilisation.

Un premier laboratoire sera mis en place dans le cadre de la mise à jour des données (projet Cytise -> http://cytisenamur.cytise.be/ ) de la Population de Namur qui avait été fournie en 2008 par le professeur Poulain. Quitte à devoir de toute façon retraiter ces données, autant les rendre Open data pour faire d’une pierre deux coups.

Le service Data Office est aussi chargé de faire un inventaire des données et de proposer des priorités. Pour ce faire il s’inspirera de ce qui est fait à l’extérieur, de ce qui existe actuellement à la Ville de Namur et de ce qui peut être fait rapidement sans demander trop de ressources. Suite à l’upgrade des outils de cartographie, il pourra aussi rapidement rendre accessible et référencer les données déjà disponibles dans les systèmes cartographiques.

DATA SETS, CE QUI EXISTE

En Belgique au niveau fédéral, il existe un peu plus de 848 data sets référencés sur la version francophone du site http://data.gov.be , un peu plus de 3.563 dans la version flamande. Ce site est fourni par le Fedict.

La toute grande majorité des data sets francophones de ce site sont sous la forme de fichiers downloadables peu exploitables automatiquement. Une bonne moitié des data sets de la version flamande sont mentionnés comme disponibles sous la forme de services web exploitables automatiquement. La toute grosse majorité des data sets mentionnés comme webservice proviennent de la Ville d’Anvers. Un certain nombre vient des Villes de Gand et de Courtrai pour ne parler que des communes.

On trouve 82 Data sets sur le site http://opendata.digitalwallonia.be/dataset  de l’Agence Du Numérique (ADN) wallonne dont 15 de la Ville de Namur. L’Open Data fait partie des mesures 21 et 22 du plan numérique en cours de démarrage en Wallonie.

Sur le site européen http://open-data.europa.eu/en/data on dénombre 7.853 Data sets dont 1090 concernent la Belgique (Notez pour la bonne interprétation des chiffres qu’un Data Set peut concerner plusieurs pays).Il s’en ajoute d’heure en heure.

Ces chiffres n’intègrent pas nécessairement les Open data qui peuvent exister un peu partout sur les sites individuels des localités. Pour être référencées, elles doivent faire partie d’un catalogue qui est repris par ces sites.

Un exemple d’Open Data

Le Tec développe actuellement des Open Data qui permettront par exemple de calculer dans combien de minutes un bus va arriver à un point d’arrêt. Ces données seront fournies en temps réel. Cela permettra à la Ville d’émettre un Cahier Spécial des Charges pour l’acquisition ou le développement de panneaux afficheurs aux points d’arrêt qui se baseront sur ces Open Data pour diffuser des informations utiles aux voyageurs.

A noter que la SNCB développe des Open Data similaires, mais principalement avec les données des horaires statiques (Mise à jour une fois par mois). Google les exploite déjà pour déterminer la ligne la plus appropriée pour un trajet et pour diffuser le temps de parcours. La SNCB envisage de mettre à disposition les données en temps réel.

REUTILISATION DES OPEN DATA

Les Open Data n’ont d’intérêt que si elles sont réutilisées. Un Data Set réutilisé est un data set qui est exploité par un logiciel tiers via des downloads ou des accès web automatiques.

Les fonctionnalités, l’utilité et la disponibilité de ces applications restent actuellement encore réduites. En Belgique, il n’existe pas encore de structure pyramidale intégrée de référencement qui pourrait rendre cette initiative plus attractive pour les développeurs en collectant automatiquement et en centralisant tous les moyens d’accès aux Open Data des différents niveaux de pouvoir et organismes belges. Mais c’est en train de se mettre en place avec notamment des initiatives de l’Europe, du fédéral et des régions.

Si les communes réputées très avancées en Open Data en Europe, mettent parfois un nombre considérable de data sets sur le web, ceux-ci sont, dans les faits, rarement réutilisés. Sur le site européen on trouve 21 applications publiées (Il peut en exister plus mais qui ne se sont alors pas manifestées), ce qui est très peu au vu des 7.853 data sets existants sur ce même site.

Par contre, il existe de plus en plus d’applications web qui fournissent des webservices rendant leurs données plus facilement exploitables par d’autres applications sans pour autant référencer ces données sur les sites de référencement des Open Data.

L’Angleterre qui est plus avancée que la Belgique dans le domaine et qui possède un certain recul, constate que les Open Data mises à disposition par des organismes publics sont surtout réutilisés par d’autres organismes publics et que l’ensemble des réutilisations permet une meilleur gestion de l’appareil public.

NORMES

Les Open Data ne se limitent pas à mettre en ligne des donnés déjà disponibles en interne, mais aussi en un traitement préalable de ces données afin qu’elles répondent aux normes reconnues. Le but étant de les rendre agrégables, exploitables et comparables. Notamment en matière de données géographiques, on s’inspirera des directives INSPIRE des Communautés Européennes.

La stricte observance des normes est une condition sine qua non pour espérer un succès quelconque en matière d’Open Data. En effet, mettre à disposition des Open Data dans des formats non interopérables n’a que très peu d’intérêt et aura un même un effet négatif sur l’image de l’organisme à l’origine de ces données.

LICENCES

Toute donnée devra faire l’objet d’une licence d’utilisation. Sans licence Open aucune donnée ne pourra être considérée comme Open Data. Celle-ci sera généralement de type ouvert qui permet la réutilisation des données avec ou sans but commercial, à titre gratuit ou pas. La tendance générale parmi les pays européens est de permettre une utilisation des données à titre gratuit que la finalité soit commerciale ou pas.

La plupart des licences actuelles dégagent le fournisseur de données de toute responsabilité quant à la fiabilité ou quant à la pérennité des données. Cela en enlève beaucoup l’intérêt en matière de développement du numérique.

Une certaine uniformité parmi les licences devra être respectée que ce soit au sein de la Ville elle-même ou que ce soit au travers des différents niveaux de la pyramide des pouvoirs où on retrouve ces données ou plutôt les méta données qui s’y réfèrent. Sans cette uniformité, l’utilisation de données agrégées ou liées risque de devenir très vite un casse-tête. La multiplicité des pouvoirs en Europe et en particulier en Belgique est un frein à cette uniformisation.

La rédaction d’une licence ou plusieurs licences Open Data est un travail prioritaire pour la Ville de Namur.

RESSOURCES

A l’heure actuelle, il est difficile d’évaluer la charge de travail ou financière que représente une stratégie Open data pour la Ville de Namur. Force est de constater que les Villes les plus avancées en la matière disposent de développeurs informatiques plus nombreux et probablement de budgets plus importants.

C’est pourquoi, si des développements doivent être faits, la stratégie sera d’outsourcer un maximum de développements et de services à l’extérieur, particulièrement en matière d’extraction et de traitement des données.

Néanmoins, le service Data Office, exploitera au maximum de ses possibilités les données déjà disponibles actuellement.

D’autre part, la mesure 21 du Plan du numérique wallon vise précisément le développement des Open Data en Wallonie. Des budgets y seront alloués. Des développements auront lieu notamment en matière de site de référencement. La Ville de Namur doit rester attentive à cette initiative et s’inscrire dans les rangs des participants.

GLOSSAIRE

API, CMS, CSV, Data base, HTML, Hypertexte, INSPIRE, Json, KML, Métadonnée, PICC, RDF, RSS, Service Web, SPARQL, URI, W3C, Web sémantique, XML

En savoir plus : Définition des termes utilisés en Open data

top