B. LE DÉVELOPPEMENT DE L'OPEN DATA INDUIT DES PERTES DE RECETTES ET DES DÉPENSES QUE L'OPÉRATEUR NE DEVRAIT PAS AVOIR À ASSUMER SEUL
1. L'ouverture des données est déjà une réalité pour Météo-France
Depuis dix ans, Météo-France contribue au mouvement d'ouverture des données publiques. En application de la loi n° 2016-1321 du 7 octobre 2016 pour une République numérique , les données publiques de l'établissement sont mises à disposition gratuitement au bénéfice des administrations , des établissements publics, des collectivités territoriales, des entités privées exerçant une mission de service public ou encore du monde de l'enseignement supérieur et de la recherche. Pour les utilisateurs qui n'entrent pas dans ces catégories , l'accès aux données publiques de Météo-France peut, par exception, être soumis à des redevances dont le périmètre et les montants sont fixés par décret et réévalués tous les cinq ans.
À ce jour, 70 jeux de données du SMN sont déclarés sur le site data.gouv.fr. L'opérateur a mis en ligne ses premières données publiques en 2012. À compter de cette date, Météo-France a créé son propre portail de mise à disposition de données . En 2021, il permet d'accéder à 30 jeux de données. Actuellement, au titre des données issues de ses modèles de prévision numérique du temps (PNT), Météo-France met en ligne chaque jour un volume de 0,6 téraoctets (To) pour un volume de téléchargement quotidien de 1,5 To concernant environ 600 utilisateurs. Le volume de données disponibles sur le portail de l'établissement s'élève à 15 To . Les données publiques de l'opérateur qui ne sont pas disponibles sur le portail sont accessibles sur demande expresse.
Derrière un portail de données se cache une infrastructure technique d'hébergement, de mise à disposition et de diffusion des données robuste et efficace qui suppose des moyens financiers et humains . Aujourd'hui, la mise à disposition des données publiques mobilise à elle seule déjà 9 ETP et 100 000 euros par an .
2. Le développement de l'open data s'accélère
L'ouverture des données publiques , notamment les données météorologiques, constitue un levier de croissance économique et d'innovation en permettant le développement de nouvelles activités et la création de nouveaux produits à forte valeur ajoutée. Elle est aussi une opportunité pour Météo-France de valoriser son savoir-faire et d'accroitre les bénéfices socio-économiques qu'il génère . Ainsi, à titre d'exemple, l'opérateur a récemment mis en ligne un jeu de données d'archives météorologiques, baptisé « Météonet », sous un format adapté aux data scientists dans la perspective d' attirer les activités de recherches de laboratoires d'intelligence artificielle (IA) vers la météorologie . Néanmoins, au-delà du simple enjeu d'accessibilité, et parce que l'ouverture ne doit pas être considérée comme une fin en soi, la valorisation des données publiques de l'établissement suppose des démarches d'accompagnement des utilisateurs dans l'appropriation des données météorologiques. Cet enjeu va aller croissant avec la dilatation du volume de données mises en ligne et reste très largement à explorer et à traiter.
La mise en ligne des données publiques de l'opérateur s'accélère . Sur la seule année 2021, le volume de ses données accessibles gratuitement sur son portail doit être multiplié par trois . Le volume de données quotidiennes mises en lignes gratuitement doit ainsi passer de 600 à 2 000 giga-octets (Go). À horizon 2025, le volume devrait avoir plus que décuplé avec un objectif de 7 000 Go de données.
Aujourd'hui, l'intérêt de Météo-France serait de parvenir à maîtriser la progression de la mise à disposition de ses données pour que celle-ci ne vienne pas compromettre sa situation financière. Cependant, l'opérateur est tenu par des normes européennes et nationales de mettre en ligne gratuitement de nouvelles données dont certaines étaient jusqu'ici soumises à des redevances de réutilisation.
Sur le fondement de l'article L.324-1 du code des relations entre le public et l'administration, la circulaire du premier ministre n° 6224/SG du 27 avril 2021 prévoit notamment l'extinction, d'ici 2023, des redevances de réutilisation. Le droit européen, en introduisant la notion de « jeux de données à forte valeur » dites HVD (High Value Dataset) 95 ( * ) , qui s'applique notamment au domaine météorologique, va imposer, à Météo-France, dans un délai de deux ans, d'assurer la mise en ligne de nouveaux jeux de données accessible via des API (interface de programmation d'application).
Un autre sujet d'inquiétude pour Météo-France doublé d'un enjeu de souveraineté tient à la perspective d'ouverture des codes de calculs des modèles de PNT . Les codes de calcul du SMN français sont réputés être parmi les tout meilleurs au monde et leur mise à disposition pourrait être exploitée par de grands groupes privés ou des puissances étrangères disposant de capacités de calcul intensif supérieures à celle de Météo-France.
3. Un effet ciseau financier qui pourrait affecter le budget de Météo-France de 3 millions d'euros d'ici 2025
Le processus de développement et d'accélération de l'ouverture des données se traduit par un effet ciseau susceptible d'affecter la situation financière fragile de l'établissement . D'une part il induit une diminution des ressources de l'opérateur à travers l'extinction des redevances de réutilisation et d'autre part il suppose un accroissement des dépenses nécessaires à la mise en ligne des données dans de bonnes conditions d'accès.
Au regard des perspectives de développement du volume de données mises en ligne, les coûts supplémentaires induits sont estimés par l'opérateur entre 0,6 et 1,4 millions d'euros annuels selon le niveau de qualité d'accès retenu 96 ( * ) . Les baisses de recettes résultant de l'extinction des redevances de réutilisation sont quant à elles estimées à environ 1,6 millions d'euros par l'établissement. Le cumul des pertes de recettes et des hausses de dépenses pourrait ainsi atteindre jusqu'à 3 millions d'euros à horizon 2025 .
Par ailleurs, l'essor de la gratuité et le développement de la concurrence qui pourrait résulter de l'accroissement du volume de données libres d'accès pourrait provoquer des phénomènes indirects conduisant à une déflation sur le marché des services météorologiques . Cette conséquence serait susceptible d'affecter encore davantage le budget de Météo-France à travers une contraction de ses recettes commerciales . L'estimation de ces pertes est très difficile à ce stade et doit être interprétée avec toute la prudence requise. Néanmoins, selon Météo-France, ce phénomène indirect de l'ouverture des données pourrait, à terme, affecter encore davantage son budget que les conséquences financières directes . Sur un volume de recettes commerciales de 29,5 millions d'euros en 2020, s'il venait à se matérialiser, l'effet serait alors loin d'être négligeable.
4. Une compensation de l'État est nécessaire et des pistes de mutualisation doivent être recherchées
Une compensation financière de l'État sera nécessaire pour que le coût des obligations nouvelles imposées à Météo-France en termes d'ouverture des données publiques ne créée pas un effet d'éviction au détriment des dépenses d'investissements ou de recherche de l'opérateur.
Le rapporteur a pris note que cette question sera traitée dans des arbitrages prochains portant sur les enjeux de l'open data qui ne sont pas propres à Météo-France. Le 26 mai 2021, devant la commission des finances du Sénat, le rapporteur a également accueilli favorablement les propos de la ministre de la transition écologique, Madame Barbara Pompili , qui a indiqué que les dépenses liées à la mise à disposition de ses données publiques par Météo-France pourraient être au moins pour partie couverts par l'État.
En parallèle, pour réduire et mutualiser les coûts liés à la mise en ligne de nouvelles données, des partenariats européens doivent être explorés dans le but de standardiser les formats d'échanges d'informations ou encore d'assurer l'interopérabilité des plateforme d'accès.
Avec le CEPMMT et EUMETSAT, Météo-France est d'ores et déjà engagé dans la phase pilote d'un projet de mutualisation des infrastructures de technologie de cloud qui seront nécessaires à la mise à disposition de très gros volumes de données.
Recommandation n° 23 : promouvoir et concrétiser les projets de coopérations européens destinés à mutualiser les infrastructures informatiques, définir des standards ou encore harmoniser les règles relatives aux transferts et à la mise en ligne des données publiques.
Recommandation n° 25 : Compenser au moins pour partie les surcoûts engendrés par l'ouverture des données publiques.
* 95 À travers la directive (UE) 2019/1024 du Parlement européen et du Conseil du 20 juin 2019.
* 96 La mise en ligne via API, un standard de plus en plus généralisé car facilitant la récupération des données nécessite des développements importants et onéreux.