« If data is to be truly useful for a broad range of innovators it must be easy to obtain and the terms under which it can be used have to be as open and intelligible as possible. »
« Si les données doivent être vraiment utile pour un large éventail d'innovateurs, elles doivent être obtenu facilement et les termes dans lesquels elles peuvent être utilisées doit être ouverte et compréhensible au possible. »
Source : http://poit.cabinetoffice.gov.uk/poit/2009/02/introduction-to-the-taskforce-final
«Il est, je crois, un principe élémentaire du droit d'auteur que l'auteur n'a pas de droit d'auteur des idées, mais seulement dans l'expression de celles-ci. La loi du droit d'auteur ne lui donne pas tout monopole de l'utilisation des idées avec lesquelles il traite ou de toute propriété, même si elles sont originales. Ses droits d'auteur se limitent à l'œuvre littéraire dans laquelle il les a exprimées. Les idées sont des biens publics, l'œuvre littéraire est la sienne.» Justice Thorson P. in Moreau v. St. Vincent
Ce document, constitué de 3 billets dont celui-ci est le premier, a pour ambition de démontrer l'intérêt des données libres en partant d'une description du microcosme des projets libres (communauté, licence, modèle économique, etc.).
Le premier billet décrit les projets libres : liberté, modèles économiques, etc. La plupart des utilisateurs de Firefox, Linux, ou OpenOffice.org etc., ne connaissent ni les principes ni les implications d'un projet libre ou open source et pourtant celles-ci ont des implications sur le logiciel et leur utilisation. Le deuxième billet expliquera le mode de fonctionnement des projets en logiciels libres et open source : communauté, outils utilisés, organisation. Enfin le dernier billet traitera des données libres : quelles licences ? Quels modèles économiques ? Quelles organisations ? Quelles données doivent être libérées ?
Le lecteur notera que je parle ici de “projet libre” et pas de logiciel libre ! Pourquoi ? Parce que le concept du libre a aujourd'hui largement dépassé le cadre des logiciels pour toucher à tout ce qui se créer : logiciel bien sur mais aussi données, document, dessin, musique et vidéo.
Un projet Libre se base sur quatre libertés. Ces quatre libertés autorisent certaines actions, mais en aucun cas elles n'empêchent la commercialisation du projet. Cette commercialisation se base sur un modèle économique. Ce chapitre explique les quatre libertés, leurs conséquences d'un point de vue commercial et les différents modèles économiques créés pour répondre à la problématique des projets libres.
Les principes sous-jacent sont toujours les mêmes, ils reposent sur la notion de “liberté” et plus précisément de 4 libertés (Source Wikipédia) :
Pour plus d'information sur les différents types de licence, je vous invite à lire la page wikipedia sur les logiciels libres. Vous y apprendrez les différences entre les différentes licences libres (GPL, BSD, etc.). Pour une comparaison des licences disponibles, lisez le site Veni,Vidi, Libri : tableau de licence ainsi que les fiches licences de la même association.
Un projet libre n'est pas un projet gratuit, rien n'interdit à son créateur de vendre directement ou indirectement son projet ou en proposant des services autour du projet (nous verrons comment un peu plus tard). Ceci est important car la plupart des incompréhensions proviennent de là : les projets libres ne sont pas gratuit, les projets libres ne sont pas contre le commerce et leurs contributeurs ne seront jamais contre la possibilité de vivre de leur travail ! Il faut bien financer les ordi, le temps, la bière et les pizzas ! Autrement dit un projet libre repose uniquement sur les libertés que lui accordent son auteur.
Mais alors pourquoi un projet libre est généralement gratuit ? Cela est une conséquence directe d'une des libertés (et il y en a d'autre comme nous le verrons plus tard). La liberté 2 vous permet de redistribuer des copies payantes … ou gratuites ! L'équipe d'un projet libre devra donc bien réfléchir à la manière de rentabiliser son projet. D'autre part, vous noterez que l'ensemble des thématiques auxquels touchent les projets libres sont liés directement au monde numérique. Parce que ce qui coûte ce sont les développements du projet. Une fois réalisée cela ne coûte (presque) rien de le copier. Mise à part le prix du CD, de la gravure ou de l'envoi par la poste, ce qui vous sera probablement facturé, les projets libres déjà développés sont gratuit. Ceci peut être relié aux problèmes de piratage et aux arguments des personnes contre la répression.
Mais alors sur quoi repose le modèle économique des projets libres ? Les premiers projets libres (projet de logiciels) ont commencés par le travail de développeurs bénévoles (du dimanche), ces types de projet existent toujours. Puis peu à peu des modèles économiques se sont mis en place, des projets libres entièrement gérés par des sociétés éditrices sont apparus. Généralement on peut considérer quatre types de modèles économiques : celui basé sur les services, celui basé sur la valeur ajoutée, celui sur les doubles licences et enfin celui sur la mutualisation.
Voici quelques explications concernant les modèles économiques.
Modèle économique basé sur les services : ce modèle propose le développement ou l'intégration de projet libre ou la mise en place de service ASP (Application Service Provider). On peut considérer ces sociétés comme des éditeurs open source, dans le sens où elles réalisent le même travaille qu'une société éditrice de logiciels. Camptocamp fait maintenant partie de cette catégorie avec le projet MapFish, la société Makina Corpus également.
Modèle économique basé sur la valeur ajoutée : ici le modèle repose sur un ou des projets libres créés en dehors de la société. Celle-ci proposant des services à valeurs ajoutées : développement à la carte de modules ou extensions, de configuration spécifique, vente de CD de logiciels libres avec de la documentation en français, etc. Makina Corpus est également un exemple de société basée sur un tel modèle économique.
Modèle économique basé sur la double licence : ce modèle économique un peu spécial est basé sur une double licence : une libre et une autre propriétaire. Généralement le projet libre est basé sur une communauté (bénévole ou non) et le projet propriétaire est basé sur ce projet libre auquel est ajouté des modules/extensions/applications propriétaires (la gestion d'un format propriétaire par exemple), des services (documentation en français, support, etc.). Autodesk fonctionne comme cela pour MapGuide (avec les versions OS et Entreprise).
Modèle économique basé sur la mutualisation : La mutualisation évoquée est celle de la mutualisation des ressources : financières et/ou humaines. Dans un premier cas plusieurs clients financent le développement d'un ou plusieurs modules pour un projet. Dans le deuxième cas, plusieurs groupes de développeurs (bénévoles, salariés d'un organismes publics ou privés) développent des modules ajoutés au projet. Le projet CartoWeb de Camptocamp est un exemple qui me semble répondre à ce modèle (plusieurs clients financent un module), OpenLayers ainsi que tous les projets de l'OSGeo (plusieurs sociétés/développeurs développent des modules ajoutés au projet).
Certaines sociétés éditrices de logiciels propriétaires ont un modèle économique très ressemblant à ceux-là dans le mesure où ils vendent un projet propriétaire mais qui repose sur des briques libres. La différence est que ce type d'application repose sur une licence très permissive (type BSD) qui autorise les utilisateurs à changer la licence (licence BSD ⇒ licence propriétaire). On peut considérer que leur modèle économique est basé sur un mélange du modèle type double licence et à valeur ajoutée.
Quel intérêt un projet a à choisir une licence BSD ? Les licences libres autorisent les modifications du codes, et qu'elles autorisent le changement de licence ou non, il est de l'intérêt du développeur de reporter ses modifications (liberté 3) dans le projet initial. Celui-ci gagnant des fonctionnalités supplémentaires, une meilleure stabilité, etc.
Parmi la multitude de projet libre les plus connus sont sans aucun doute les projets de logiciels libres. Cette section présente le fonctionnement des projets en tant que projet de logiciels libres. Ce qui me semble définir un projet de logiciel libre est l'existence d'une communauté de développeurs dont des règles écrites ou tacites régissent les comportements et les relations en toute transparence. Les utilisateurs ont la possibilité d'échanger ou de suivre les échanges avec ou entre les développeurs.
Le mode de fonctionnement des projets libres est directement lié aux modèles économiques choisis ainsi qu'aux libertés fondamentales (voir plus haut). Les mots-clés sont les termes communautaire, transparence et indépendance.
Un projet libre a pour vocation de réunir des contributeurs d'horizon divers autour du projet. La licence autorisant les utilisateurs à modifier et diffuser leurs modifications, il est de l'intérêt du projet d'accepter les modifications des utilisateurs et de l'intérêt des développeurs extérieurs à retourner leur développements les plus génériques. Et ce pour différentes raisons :
Un travail gagnant-gagnant en somme.
Pour que les contributions puissent être acceptées il faut que le projet se soit réunit autour d'une communauté d'utilisateurs et de développeurs prêt à contribuer. Mais il faut également des règles définies pour que tout utilisateurs et développeurs puissent connaître le processus d'acceptation des contributions au projet et connaître les besoins.
Pour une bonne communication entre les développeurs et les utilisateurs, des outils sont mis en place. On trouve généralement :
Le serveur de dépôt de code, les listes de diffusion et le bugtracker sont le minimum que propose un projet. Ces outils ont chacun une fonction précise dans le processus de développement.
Il existe généralement plusieurs listes, mais toutes celles qui sont présentées ici n'existent pas toujours :
La liste dev permet de discuter entre les développeurs : quelles sont les nouvelles fonctionnalités qui vont être ajoutées, discussion sur leur conception, sur les bug et leur résolution, définition du planning des prochaines versions, etc. C'est aussi l'endroit pour poser vos questions si vous désirez ajouter une nouvelle fonctionnalité.
La liste user vous permet de poser vos questions lié à des problématiques d'utilisation du logiciel. Les développeurs y répondent directement et rapidement assez souvent.
La liste commit vous permet de suivre de près (de très près même) les développements qui sont ”commité” (d'où le nom de la liste) dans le serveur de dépôt de code source.
La liste release vous permet de vous tenir au courant des sorties des nouvelles versions.
Les listes locales vous permettent de poser votre question dans votre langue. Très peu de ce type de liste existe. Il en existe pour grass (grass-fr par exemple).
Un serveur de dépôt de code source est un serveur qui permet à plusieurs développeurs de travailler ensemble sur le développement d'un logiciel sans que leurs modifications du code source soient écrasées par celles des autres développeurs. Ce serveur gère également un historique des modifications :
Voici quelques exemples
Un système de rapport de bug permet au projet de gérer les problèmes et les demandes de fonctionnalités. Il permet d'affecter ceux-ci à une version spécifique et permet de connaître la roadmap des futures versions. Voici celles pour QGIS : http://trac.osgeo.org/qgis/roadmap. Vous trouverez sur cette page la liste des bugs actifs, classés par type de bug : http://trac.osgeo.org/qgis/report/1?sort=type&asc=1
Bien sur, un projet a toujours son site, parfois une page, parfois plus, il présente le projet, rassemble la documentation, liste les liens pour télécharger les versions (source et binaires). Parfois un wiki est proposé. De plus en plus souvent les projets utilisent une application appelée Trac qui rassemble un wiki, un bugtracker, une navigation du svn, la roadmap et la timeline 1).
Dans le cas un peu spécial où le projet est hébergé par l'OSGeo, le projet se doit d'avoir un minimum de règle écrite pour définir le fonctionnement du comité en charge du projet. Ce n'est pas souvent aussi formalisé au sein d'un projet Open Source. L'OSGeo impose un certain nombre de règle lors de la phase d'incubation : révision du code concernant le copyright, ajout d'en en-tête dans tous les fichiers pour indiquer la licence et bien sur des règles écrites concernant le fonctionnement du projet. Voici par exemple celui du projet OpenLayers : http://trac.openlayers.org/wiki/SteeringCommittee
Vous trouverez chaque Comité de pilotage du projet pour les projets de l'OSGeo sur cette page : http://wiki.osgeo.org/wiki/Project_Steering_Committees#Project_Steering_Committees
Ces licences, ces modèles économiques, ces outils et cette organisation présentés dans les sections précédentes sont adaptés et ont été conçu pour des projets logiciels. La problématique pour les projets de données sont un peu différente. Cette section a pour but de tenter de proposer une définition pour chacun d'eux.
Il existe plusieurs licences de données libres :
Les licences libres doivent permettre :
Les travaux dérivés constituent une modification telle que l'accès aux données brutes n'est plus possible. Il en résulte selon les droits décrits plus haut, que le diffuseur doit fournir un accès aux données libres utilisées. Mais cela est un peu plus complexe qu'il n'y parait …
OpenStreetMap utilise jusqu'à présent la licence “Creative Common CC-BY-SA”. Cela signifie que vous avez le droit de copier et de diffuser le document en gardant l'auteur et les conditions originels. Cette licence pose un certain nombre de problème :
La nouvelle licence proposée par la Fondation OpenStreetMap (en réalité composée de deux licences : Open Data Licence combiné à l'ODL Factual Info Licence) est une licence adaptée aux bases de données et aux données. Ce projet de licence a été initiée en 2007 par Jordan Hatcher et Dr. Charlotte Waelde de l'Université d'Édimbourg et a proposé ces deux types licences complémentaires offrant une grande flexibilité d'utilisation. Elle est maintenant hébergée et gérée par l'Open Knowledge Foundation qui propose également d'autres projets.
La problématique des licences des données libres est donc non seulement différente de celle des logiciels libres mais beaucoup plus complexe. Comment définir un travail dérivé ? Des traitements spatiaux complexes sur les données devront elles être diffusés sous une licence libre ou bien pourrait on considérer ce travail de la même manière qu'écrire un document avec un logiciel de bureautique tel qu'OpenOffice ? Ces licences se doivent de préciser clairement ce qui est un traitement dérivé, les droits et devoirs qui s'y appliquent. D'autre part, est il souhaitable de faire la différence entre la structure de la table et son contenu ? Mais comment définir le “contenu” d'une base de données ?
D'autres parts, de nombreuses protections existent concernant les bases de données et les données : directive européenne, droit d'auteur, contrat, etc. L'auteur de la licence Opendatacommons explique : que «ce maquis de droits protégeant les bases de données et les données peuvent constituer un obstacle important pour l'utilisation et la réutilisation des données. Cela est vrai tant pour la communauté scientifique, qui souhaitent élargir sa connaissance grâce à l'utilisation des autres données et pour la communauté de la recherche et d'Internet avec pour ambition le Web sémantique.»
«This is true for both the scientific community wishing to expand knowledge through use of others' data and for the Internet and research community with aims to enable the semantic web.»
[source : Jordan Hatcher, http://www.osbr.ca/ojs/index.php/osbr/article/view/516/475]
Mais comme nous venons de le voir, un travail est mis en place tant du côté d'OpenStreetMap que du côté de l'OSGeo ou d'autres groupes de travail. Ceci peut être préjudiciable car une licence ne sera adoptée que si elle correspond aux besoins du plus grand nombre tout en étant la plus lisible possible. Auxquels cas nous verrons le jour à une multitude de licences de données libres, chacune avec ses imperfections.
Les modèles économiques des projets libres sont basés sur les services. Autant en matière de logiciels, ceux-ci ont pu être testé et ont pas mal évolué, en matière de données libres, tout reste à faire. Certaines sociétés ont tenté il y a quelques années de créer de la valeur ajoutée sur les données libres malheureusement la société n'a pas pu continuer à les proposer. Si on se réfère aux modèles économiques des logiciels libres, ceux-ci sont basées :
Peut-on se baser sur ces modèles pour élaborer ceux des données libres ? Quels services de données peut proposer une société ?
Une société peut proposer dans le cadre d'un modèle économique basé sur les services :
ou d'un modèle économique basé sur la valeur ajoutée :
Si son modèle économique est basé sur la double licence, elle peut proposer la mise à jour et la validation des données avec possibilité d'utiliser les données sous une licence commercial sans obligation de fournir les données brutes.
Enfin si son modèle économique est basée sur la mutualisation, elle peut proposer des améliorations qui seront financé par une communauté. Le projet OpenStreetMap peut être considéré comme étant basé sur un tel modèle économique dans le mesure où la fondation reçoit des dons et des financements en nature (matériel ou temps disponible des bénévoles) ou en argent (campagne de don). Aujourd'hui aucune société ne peut démarrer un projet de création de données libres concurrent à OSM à partir de zéro. Elle devra se focaliser sur d'autres type de données ou bien avoir déjà des données disponibles (libération de données).
Quelques sociétés ont commencé à proposer des webservices sur des données libres comme la société allemande WhereGroup. Deux solutions sont proposées : une gratuite, mise à jour deux fois par an, et une autre payante, mise à jour tous les jours. D'autres webservices peuvent être mise en place, comme les services WFS et WCS, mais également des services SLD de définition de style pour les couches proposées en WMS, des GeoDRM (accès à la données en fonction d'une identification).
Il existe peu d'outils, à ma connaissance, adaptés à la gestion des données (historique notamment). OpenStreetMap gère l'historique au moyen d'une table maître (master table) qui contient tout l'historique des éditions et d'une table “actuelle” (current table), en plus des tables d'administration et utilisateurs. OpenStreetMap est le projet de référence en matière de communauté de données libre bien qu'elle soit focalisée sur les données routières principalement, seul une société éditrice ayant déjà des données pourrait arriver à rivaliser avec elle (mais on a déjà vue des projets leader perde tout leadership suite à des mauvaises décisions comme par le changement de licence).
OpenSteetMap propose ainsi toute une suite de logicielle (Merkaator, potlach, etc.), une API, une bases de données avec des snapshots ou nightly build réguliers, des listes de diffusions, un wiki, etc. Nous retrouvons tout ce qui compose un projet de logiciel libre.
À noter deux applications web intéressantes. J'ai parlé de l'application web TRAC plus tôt. Application qui permet de gérer des tickets qui constituent des rapports de bugs relatif aux logiciels. L'équivalent existe pour les données, cela s'appelle OpenStreetBug ou RIPart (Remontée d'Informations Partagées) ou bien des tests "unitaires" pour vérifier la qualité des données. L'application RIPart n'est pas libre et se base sur l'API du Geoportail. Elle a pour objectif de faire remonter les informations qui sont incorrectes vers le fournisseur de données (l'IGN).
Vous trouverez quelques informations supplémentaires sur la base de données d'OpenStreetMap dans ces liens :
Le Power of Information Taskforce Report a réalisé 7 recommandation sur les données libres :
« Data and information are the lifeblood of the knowledge economy. The report’s recommendations on liberalising non-personal government information would provide an information stimulus if implemented.»
« La donnée et l'information sont le moteur de l'économie de la connaissance. Les recommandations du rapport sur la libéralisation des informations non personnelles du gouvernement pourrait fournir un stimulus de l'information si elle est appliquée. » Source : http://poit.cabinetoffice.gov.uk/poit/2009/02/introduction-to-the-taskforce-final
Une réflexion doit avoir lieu sur les données libres publiques et la possibilité d'innovation qu'elles permettent (http://poit.cabinetoffice.gov.uk/poit/2009/02/maps-and-geospatial-information/). En Angleterre, la task force a permis d'initier une telle réflexion avec les utilisateurs. Citons les une dernière fois :
«There is now a pressing need for reform at the Ordnance Survey. Shareholder Executive and HM Treasury are currently undertaking a review of the trading fund business model. They should seize the opportunity to recast the Ordnance Survey as a mapping agency for the 21st Century. Technological advances have shifted the fundamentals of the traditional Ordnance Survey business model and there is a real risk that it will find itself an anachronism as it is outpaced by more open alternatives such as Open Street Map, supported by cheap technology to support map-making.»
« Il y a maintenant un besoin urgent de réformer l'Ordnance Survey. Actionnaires exécutifs et ministère du Trésor sont actuellement en train de mettre en place un examen du modèle économique. Elles devraient saisir l'occasion de la refonte de l'Ordnance Survey en agence cartographique du 21e siècle. Les progrès technologiques ont modifié les fondements traditionnels du modèle d'entreprise de l'Ordnance Survey et il existe un risque réel qu'il se retrouve lui-même anachronique, il est dépassé par des alternatives ouvertes telles que OpenStreetMap, soutenue par des technologies bon marché comme appui à la création de carte.»
Des études ont montrées la pertinence des modèles économiques pour l'édition de logiciels libres, en France comme à l'étranger de nombres sociétés ont basées leur fonctionnement sur de tel modèle. D'ailleurs la France tient une place importante dans le monde de l'open source. Concernant les données libres, on voit ici et là, quelques initiatives mais très peu de véritable modèle économique sont mis en place, et un organisme public a toute sa pertinence pour mettre en place un tel modèle. Quelle sera la place de la France en terme de données libres ? Quel organisme public ou privé libérera le premier ses données et basera son fonctionnement sur un modèle économique innovant et original ?
Enfin comme la task force pour l'Angleterre, nous (communauté de la géomatique en France) devons être source de propositions et agir pour informer nos représentants politiques de la pertinence de ce modèle comme service publique. Agir non pas sur l'IGN mais directement sur les politiques et sur la tutelle de l'IGN qui définisent les missions et objectifs de l'IGN.