Accueil » big data

Étiquette : big data

La gratuité des données publiques, si chères au rapport Trojette

Les lecteurs de ce blog ont l’habitude de mes coups de gueule sur la façon dont l’Etat considère les données qu’il collecte au titre de ses obligations de service public comme une propriété privée dont il se réserve l’usage au mépris des directives communautaires et du plus élémentaire bon sens démocratique et économique. Une fois n’est pas coutume, la lecture du rapport Trojette, au demeurant évoqué et publié ici même la semaine dernière, et attendu depuis plusieurs semaines, ouvre un début de perspective favorable sur le sujet sensible de la gratuité des données publiques et de leur réutilisation.

Rappelons l’enjeu du débat en apparence technique: un levier important de prospérité dans la société de demain repose sur le traitement des données, qu’elles soient publiques ou privées. Entre open data et big data, l’innovation sociale a besoin d’avoir accès au maximum de données. En France, compte tenu de l’étendue des obligations de service public, le sujet concerne majoritairement le traitement des données collectées par les administrations.

Sur ce sujet, j’ai eu l’occasion, de façon éparse, de rappeler qu’il existe aujourd’hui trois types d’administration:

– celles qui font semblant d’ouvrir leurs données (un bon exemple est la DARES, qui fournit des données inutilisables par le public, et de façon extrêmement laconique),

– celles qui refusent d’ouvrir leurs données (l’exemple de plus en plus crispant est celui de l’assurance-maladie qui possède une mine d’informations totalement verrouillées ou presque), le plus souvent sous le prétexte fallacieux d’une incapacité du public à en faire bon usage (le récent Bras sur les données de santé présente très bien ce raisonnement, pour ainsi dire jusqu’au pastiche),

– celles qui font payer les informations qu’elles délivrent (le meilleur exemple étant celui de l’INSEE), le plus souvent à partir d’un appareil juridique bancal (je renvoie ici à mon article sur la base Sirene).

Cette réticence de l’administration française à laisser les citoyens réutiliser les données qu’elle collecte s’enracine dans l’histoire la plus profonde du pays. Certains observateurs aiment à rappeler que, sous l’Ancien Régime, les enquêtes statistiques n’étaient jamais publiées, et relevaient de la propriété personnelle des administrateurs de l’époque. Cette appétence pour le secret colle indéfectiblement au réflexe public français. Ce n’est donc pas une mince affaire de s’y attaquer.

Le rapport Trojette a le mérite de jeter, avec une placidité administrative louable, quelques pavés dans la mare officielle. Il plaide en effet ouvertement pour une préférence systématique accordée à la gratuité dans la réutilisation des données, et ne manque pas d’insister sur la nécessité de réduire les redevances au coût marginal d’utilisation, en évitant bien de les transformer en barrière à l’accès.

On se félicitera de cette inspiration, qui rencontre une préoccupation plusieurs fois exprimée sur ce blog. L’INSEE, par exemple, pratique volontiers des prix prohibitifs pour ses données, dont l’objectif évident est de limiter au maximum le nombre de réutilisateurs.

Sur ce point, on espère donc que le rapport Trojette sera lu, compris et entendu.

Cette empathie serait bien la moindre des choses, tant le rédacteur évite les sujets qui fâchent et demeure scrupuleusement dans le politiquement correct du jeune fonctionnaire qui veut faire carrière et craint comme la peste le faux pas qui lui ferait perdre du crédit auprès des vieux barbons qui sclérosent les bureaux. Autant de soin à ménager ses lecteurs valent bien une récompense.

Le rapporteur évite en effet de rappeler les nombreuses contraventions de l’administration française vis-à-vis de ses engagements communautaires. Les directives en vigueur encadrent de façon très précise les redevances applicables aux données publiques, et l’on regrettera quand même que le rapport n’ait pas commencé par ce point: l’état du droit applicable, et la distance qui sépare la France de ce droit auquel elle a librement souscrit. Rappelons que le principe de gratuité de la réutilisation des données publiques n’est pas posé par le droit français, mais par le droit de l’Union, et tout l’enjeu est de rendre ce droit effectif en France.

Le pari du rapport est de privilégier la conviction économique plutôt que le rappel des règles. Pourquoi pas? On lui adressera une critique amicale: le rapport reste trop évasif sur les conditions précises de mise en oeuvre des solutions qu’il préconise, et il ouvre trop la voie aux résistances ministérielles qui empêchent les évolutions. On les connaît, les fonctionnaires des services statistiques, à peu près immuables, qui voient les gouvernements passer et leurs collègues rester. Leur donner trop de champ, c’est se condamner à subir leur sclérose.

Le rapport aurait donc gagné à fermer les portes plutôt qu’à les ouvrir. En particulier, sur tous les sujets liés aux redevances progressives pour les utilisateurs des plate-formes ministérielles, quelques chiffres pour cadrer le débat eussent évité des interprétations malicieuses de la part des services concernés. Ce flou exigera donc une vigilance toute particulière dans l’usage qui sera fait du rapport.

En particulier, les conclusions du prochain CIMAP mériteront une lecture très attentive. La façon frileuse dont les ministères ont traité les données à l’occasion du débat budgétaire montre en effet que l’administration française est encore loin du compte et qu’il ne nous faudra ménager ni notre temps ni notre peine pour secouer le brontosaure.