IV. TROUVER LE BON MODÈLE ÉCONOMIQUE

A. QUELLE PLACE FACE AUX GRANDS ACTEURS PRIVÉS INTERNATIONAUX ?

Face aux mastodontes internationaux, les acteurs de l'IA en France et en Europe évoluent dans un contexte concurrentiel asymétrique au regard des moyens colossaux investis par ces grandes entreprises. Quelle place pourront-ils occuper dans le domaine de l'IA dans la prochaine décennie ? Peut-on envisager des complémentarités ou ira-t-on inexorablement vers une accentuation de ce système à plusieurs vitesses ?

1. Des expertises à la fois concurrentes et complémentaires

Dans le domaine de la météorologie par exemple, de grandes entreprises privées telles que Nvidia, Huawei, DeepMind ou encore Microsoft ont investi des sommes considérables dans le développement d'émulateurs de systèmes de prévision dont les premiers résultats ont été rendus publics en 2022.

Ces modèles ont été entraînés sur les grandes bases de données météorologiques publiques, par exemple celle du Centre européen de prévision météorologique à moyen terme (CEPMMT)70(*).

De fait, comme l'indique Laure Raynaud, chercheur au Centre national de recherches météorologiques (CNRM) : « Contre toute attente, les modèles d'IA tels que Pangu Weather ou Graph-Cast [...] rivalisent désormais sur certains aspects avec le modèle physique du CEPMMT, considéré comme le meilleur modèle de prévision opérationnel actuellement» Au point que les prévisions quotidiennes de ces nouveaux modèles sont désormais diffusées sur le site du centre européen lui-même71(*).

Les cartes ci-après montrent un exemple de prévisions comparées de température et de vent en Europe de l'Ouest entre le modèle d'IA de Pangu Weather et le modèle Arpège de Météo-France.

Prévision de température (plage de couleur) et de vent (barbules), calculée par le modèle physique Arpège de Météo-France (à gauche) et le modèle IA Pangu Weather (à droite) sur le domaine Europe-Atlantique.

Source : Météo-France72(*)

Loin d'offrir des prévisions à une échelle suffisamment fine pour répondre aux enjeux d'un service climatique comme Météo-France73(*), ces modèles, malgré leurs imperfections, apportent la preuve que la combinaison de modèles physiques et d'IA permet d'améliorer la prévision d'une partie des variables météorologiques dans des temps de calcul très courts.

Reste que la capacité des entreprises privées à développer, à partir de données gratuites produites par des opérateurs publics, des produits commerciaux venant potentiellement concurrencer ces mêmes opérateurs doit être interrogée.

Les questions posées par la coexistence avec les géants du numérique : le cas des services météorologiques et climatiques

Dans les conditions actuelles, les outils conçus par les géants du numérique ne permettent pas d'atteindre des résultats suffisamment performants pour la prévision météorologique à une échelle fine. À ce stade, les Gafam ont en effet centré leurs développements sur des modèles globaux et non sur des modèles à petite échelle comme le modèle AROME de l'établissement Météo-France.

Ce dernier indique cependant se servir des outils des Gafam comme de briques technologiques pouvant être reprises en partie ou adaptées à ses propres besoins dans le cadre de l'utilisation de ses modèles d'IA. Il en va notamment ainsi dans le cadre :

- du développement de « py4cast » dont l'objectif est d'entraîner des modèles d'IA pour la prévision à aire limitée, cet outil intégrant, parmi différents types d'architecture de réseaux de neurones, une adaptation régionale de GraphCast (outil de Google) développée par un chercheur suédois ;

- de l'utilisation du modèle Pangu Weather de Huawei pour établir à titre expérimental des prévisions globales quotidiennes dans les mêmes conditions initiales que le modèle global ARPEGE de Météo-France ;

- des tests actuellement réalisés du modèle DGMR de DeepMind pour la prévision en quasi-temps réel des précipitations à une échelle régionale.

Avec toutes les réserves requises, le Centre européen pour les prévisions météorologiques à moyen terme (ECMWF) se sert lui aussi, à côté de son propre modèle d'IA, du modèle GraphCast de Google et de ceux des entreprises NVIDIA et Huawei.

Si la performance de ces modèles privés ne permet pas d'atteindre l'état de l'art en matière de prévisions météorologiques, les évolutions dans ce domaine sont rapides et la donne pourrait vite évoluer. Google Deep Mind est par exemple en passe de remplacer GraphCast par le nouvel algorithme GenCast, capable de prévoir l'occurrence d'événements comme les cyclones dans le cadre d'une approche probabiliste74(*).

Celle-ci fournit des résultats à une vitesse très supérieure à celle des modèles classiques qui reposent sur la résolution d'équations physiques. Selon Météo-France, le modèle pourrait se révéler très utile pour les prévisions de très court terme (entre 1 et 6 heures) qui correspondent à des échelles de temps trop courtes pour les modèles physiques, mais également pour des prévisions à 3 ou 4 semaines, dans l'hypothèse où des systèmes d'IA arriveraient à détecter des « signatures » dans l'atmosphère que les scientifiques n'auraient pas réussi à trouver afin de réaliser des prédictions fiables.

Cette évolution laisse entrevoir la possibilité de nouvelles synergies et les opérateurs publics ne peuvent se désintéresser des outils offerts par les géants du numérique.

Les enjeux de souveraineté et d'indépendance liés aux missions d'un opérateur national tel que Météo-France, au regard notamment de la sécurité des personnes et des biens, et, au-delà, pour des secteurs comme la défense ou l'aéronautique, justifient néanmoins une approche prudente et le maintien d'un haut niveau d'expertise.

La réflexion doit se poursuivre sur les moyens d'inciter les grandes entreprises privées qui utilisent les données mises à disposition par le secteur public de rendre elles aussi publics les modèles d'IA entraînés avec ces données. À défaut de conditions imposées en matière d'« open source », des exigences minimales en termes d' « open weights » paraîtraient justifiées.

2. Une fragilisation du modèle économique des opérateurs publics

Comme en témoigne la situation critique de l'IGN, la politique d'open data est venue fragiliser le modèle économique des opérateurs publics dont l'équilibre financier dépendait de la vente de données.

S'il a entrepris dès 2019 de refonder son modèle en recentrant ses missions sur la production de données socles souveraines et le pilotage de grands projets d'accompagnement de politiques publiques en réponse à des commandes diverses, l'IGN n'est pas parvenu à retrouver un point d'équilibre économique. Au contraire, le déficit de l'établissement s'est fortement aggravé du fait de l'augmentation des coûts de production de ses missions et de la mise à disposition gratuite de ses données75(*).

« Mis sous tension par les bouleversements du paysage de la donnée géolocalisée, concurrencé par l'émergence d'acteurs publics comme privés, affecté par l'essor des démarches collaboratives, l'IGN était il y a quelques années, remis en cause dans son identité et contesté dans sa légitimité. Le processus d'ouverture et de gratuité des données publiques, s'il lui ouvre de nouvelles perspectives de collaborations, implique une transformation du modèle d'un institut dont l'équilibre financier dépendait de la vente de ses données. »76(*)

La question du prix de la donnée reste ainsi posée.


* 70 Données ERA5. Il s'agit d'un ensemble de données prêt pour l'analyse et optimisé pour le cloud. Elles fournissent des estimations horaires sur un grand nombre de variables climatiques concernant l'atmosphère, les sols et l'océan pour la Terre entière. Ces données sont utilisées à des fins de réanalyse, c'est-à-dire pour la représentation la plus complète possible des conditions météorologiques et climatiques passées. Cette représentation est réalisée en assimilant de nombreuses sources de données dans le cadre d'un modèle de prévision numérique du temps.

* 71 Laure Raynaud, « L'intelligence artificielle pour la prévision du temps », Encyclopédie de l'environnement, 17 juin 2024 : https://www.encyclopedie-environnement.org/air/intelligence-artificielle-prevision-temps/

* 72 Ibid.

* 73 Météo-France souligne que ces démonstrateurs ne permettent en l'état qu'une représentation très partielle de l'atmosphère. Le nombre de variables est peu élevé et la résolution spatiale perfectible.

* 74 GraphCast fonctionne avec un algorithme entraîné sur un immense jeu de données afin d'anticiper l'évolution de l'état de l'atmosphère toutes les 6 heures sur 10 jours. GenCast utilise un algorithme proche de ceux utilisés pour la génération d'images, entraînés sur les données de l'ECMWF.

* 75 Voir la partie consacrée à l'IGN dans le rapport général n° 144 (2024-2025) de la commission des finances du 21 novembre 2024, dans le cadre du programme 159 « Expertise, information géographique et météorologie » de la mission budgétaire « Écologie, développement et mobilité durables » (tome III, annexe 11, volume 3). Le rapporteur spécial, M. Vincent Capo-Canellas, souligne l'existence d'un déficit structurel de 15 millions d'euros par an des missions de base de l'établissement, qui ont vocation à être couvertes par la subvention pour charges de service public. https://www.senat.fr/rap/l24-144-311-3/l24-144-311-31.pdf

* 76 Rapport d'information n° 17 (2022-2023) de M. Vincent Capo-Canellas, fait au nom de la commission des finances (2022).

Les thèmes associés à ce dossier

Partager cette page