Lexique de l'OpenData

Page décrivant l'ensemble des termes utilisé dans le mouvement d'ouverture des données. Cette page est en partie héritée du lexique d'OpenDataLab Occitanie

API : Application Programming Interface. Interface de programmation permettant d’accéder à une application ou à un programme. Des jeux de données peuvent être rendus accessibles, soit par téléchargement (pour les jeux de données raisonnablement stables dans le temps) soit par API (pour les jeux de données très volumineux ou très volatiles).
 

Big Data : Le terme de Big Data est utilisé lorsque la quantité de données qu’une organisation doit gérer atteint une taille critique qui nécessite de nouvelles approches technologiques pour leur stockage, leur traitement et leur utilisation. Volume, vitesse et variété sont souvent les trois critères qui permettent de qualifier une base de données de “Big Data”.
 

CADA : Commission d’Accès aux Documents Administratifs, elle sert de recours aux citoyens qui ont des problèmes pour accéder aux données publiques. La CADA est une autorité administrative indépendante dont le rôle est consultatif. Elle peut aider un citoyen à obtenir un document administratif individuel qui lui a été refusé. Elle répond aux consultations des administrations qui la saisissent sur le caractère communicable ou réutilisable des documents qu’elles détiennent ou sur les modalités de leur communication ou de leur réutilisation. Elle intervient pour tous les documents détenus par un service de l’État, une collectivité territoriale, un établissement public ou un organisme chargé de la gestion d’un service public, que cet organisme soit public ou privé.
 

CKAN : Comprehensive Knowledge Archive Network. Logiciel open source pour réaliser un portail Open Data permettant de publier, de partager et de trouver des données. Il inclut une base de données pour cataloguer et stocker des jeux de données.
 

CNIL : La Commission Nationale Informatique et Liberté, est une autorité publique chargée de veiller à la protection des données personnelles. Elle dispose d’un pouvoir de contrôle et peut également sanctionner les entreprises, organisations ou individus collectant des informations personnelles qui ne respectent pas la loi informatique et liberté.
 

Crawl : Processus de recueil d’information sur le web qui consiste à mettre en place un robot qui parcourt tout ou partie du Web, copie les pages trouvées et les stocke dans une archive. Par exemple, le métier de la société Google est de crawler et d’indexer l’ensemble du Web pour faciliter les recherches.
 

Crowdsourcing : Pratique qui correspond à faire appel à des internautes volontaires pour proposer ou créer des contenus, répondre aux questions d’autres visiteurs. Il s’agit ainsi d’une mutualisation des ressources et des compétences (par exemple Open Street Map ou Open Food Facts).
 

Data.gouv.fr : Site officiel servant de répertoire pour les données publiques du gouvernement français, mis en ligne en décembre 2011 par la Mission Etalab. En décembre 2013, data.gouv.fr a subi une profonde transformation, en changeant sa structure et la philosophie de son site. Elle est devenue une plateforme collaborative orientée vers la communauté, au bénéfice d’une meilleure réutilisation des données publiques.
 

Datavisualisation : Aussi nommée "dataviz" , il s’agit de technologies, méthodes et outils de visualisation des données. Elle peut se concrétiser par des graphiques, diagrammes, cartographies, chronologies, infographies, ou même des créations graphiques inédites. La présentation sous une forme illustrée rend les données plus lisibles et compréhensibles.
 

Etalab : Mission initialement rattachée au premier ministre, proposée dans le rapport Riester de 2010, mise en place en 2011, chargée de mettre en oeuvre la politique d’ouverture des données de l’administration française, et de mettre en place un annuaire des données publiques françaises, data.gouv.fr. Elle a défini en 2011 la Licence Ouverte. La mission Etalab a été rattachée en 2012 au Secrétariat Général pour la Modernisation de l’État.
 

geo.data.gouv.fr : Trouvez facilement les données géographiques dont vous avez besoin ! Portail basé sur les API de la plateforme Inspire et développée par la mission Etalab. Cette passerelle permet de faire remonter de manière automatique les données géographiques ouvertes provenant de plateformes d'information géographique de nombreux territoires de France Métropolitaine et d'Outre Mer vers le portail national data.gouv.fr.

Format : Type de fichier informatique. Pour faciliter la réutilisation de données ouvertes, il convient que les données soient disponibles dans des formats ouverts et facilement interprétables par la majorité des logiciels. Par exemple : pour un tableur, il est conseillé de disposer d'un format .csv (format ouvert), plutôt que d'un format propriétaire tel qu'.xls (format propriétaire de Microsoft Excel).

Les 10 principes  de l'Open Data, tels que définis dans l’article de la Sunlight Foundation « Ten principles for opening up governement information » c'est-à-dire « dix principes pour l’ouverture de l’information gouvernementale », précisent que les données sont ouvertes quand elles sont à la fois :

  1. complètes ;
  2. primaires (c'est à dire brutes) ;
  3. fraîches ;
  4. accessibles ;
  5. électroniquement lisibles par une machine ;
  6. accessibles sans discrimination ;
  7. disponibles sous des formats ouverts (dont les spécifications techniques sont publiques et sans restriction d’accès);
  8. disponibles sous une licence libre ;
  9. accessibles de façon pérenne en ligne ;
  10. sans coût d'utilisation (le prix de mise à disposition ne doit pas excéder le coût de production du support).


INSPIRE : Directive européenne concernant les données géographiques. Elle garantit l’accès à tous des ressources géographiques de chaque pays. Elle définit des standards devant assurer l’interopérabilité des applications géographiques utilisant des données venant de plusieurs pays.

Jeu de données : (ou Dataset). Collection structurée et documentée de données sur laquelle les réutilisateurs s’appuient.

Licence : Contrat définissant les conditions d'utilisation d'une oeuvre de l'esprit (dans notre cas d'un logiciel ou de données informatiques), indiquant les droits et obligations concédés. https://aful.org/ressources/licences-libres et https://fr.wikipedia.org/wiki/Licence_(juridique)

Licence Ouverte : Une licence ouverte, libre et gratuite, qui apporte la sécurité juridique nécessaire aux producteurs et aux réutilisateurs des données publiques ; Une licence qui promeut la réutilisation la plus large en autorisant la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données. Une exigence forte de transparence de la donnée et de qualité des sources en rendant obligatoire la mention de la paternité. Une opportunité de mutualisation pour les autres données publiques en mettant en place un standard réutilisable par les collectivités territoriales qui souhaiteraient se lancer dans l’ouverture des données publiques. La publication du décret n° 2017-638 prévu par l’article L 323-2 du CRPA fait de la Licence Ouverte 2.0 la licence de référence pour les administrations pour la publication de données publiques, aux côtés de l’ODbL, et permet ainsi son utilisation par l’ensemble des administrations.

Licence ODbL : Open Data Base Licence, licence imposant la gratuité à toute donnée dérivée des données sous cette licence et autorisant une utilisation commerciale de celles-ci. OpendataFrance a réalisé un document vulgarisation , la licence ODBL pour les nuls

Portail européen des données ouvertes : Portail internet

OpendataLab : Le laboratoire de la valorisation des données publiques  en Occitanie. Ce projet a pour mission d'appuyer les collectivités territoriales et l'État, de structurer l'ouverture des données des filières thématiques (en favorisant les démarches innovantes).

Réutilisation : Fait de prendre un jeu de données pour le visualiser, le fusionner avec d’autres jeux, l’utiliser dans une application, le modifier, le corriger, le commenter, etc.

Scraping : Processus d’aspiration des données d’un site par un robot qui connait et utilise la structure du site pour en extraire les données.

Service public de la donnée :  Ensemble de jeux de données de référence (donnée pivots), mis en oeuvre par Etalab, selon l'article 14 de la Loi pour une République Numérique.