B. DE NOMBREUX PROJETS EN PHASE DE RECHERCHE-DÉVELOPPEMENT

Cette évolution apparaît d'autant plus indispensable que les nombreuses réflexions et expérimentations qui foisonnent dans ce domaine ont besoin d'être ancrées dans le temps et dans l'espace.

1. Un foisonnement des réflexions et des expérimentations

Dans tous les champs de la transition écologique, la recherche sur les apports de l'IA est encore largement dans une phase d'exploration, le recours aux techniques avancées d'IA n'en étant qu'à ses débuts au sein des opérateurs publics.

À l'Inria par exemple, plus de la moitié des 230 équipes-projets réparties dans les 10 centres de recherche mènent des travaux en lien avec la préservation de l'environnement dans lesquels l'IA occupe une place de plus en plus importante.

Le BRGM indique quant à lui qu'il mobilise de plus en plus l'IA dans son activité scientifique dans différents champs mais que l'essentiel de ses activités en est encore au stade de la recherche-développement, avec peu de mise en place opérationnelle dans le cadre de ses activités de service public.

S'agissant de la gestion et la prévention des inondations, le Cerema indique explorer plusieurs pistes pour mobiliser l'IA dans :

- l'amélioration de la cartographie des zones inondables en utilisant des méthodes de machine learning pour exploiter les données historiques et les témoignages de crues ;

- le développement des outils de prévision des crues soudaines en utilisant des chaînes de prévision basées sur des modèles hydrologiques ;

- le développement des outils d'aide à la décision basés sur des modèles hydrologiques ou hydrauliques pour la prévision des risques en temps réel ;

- le traitement et l'analyse des images satellitaires afin de détecter les zones inondées et les dommages causés aux infrastructures et aux bâtiments ;

- le développement des applications mobiles pour faciliter le travail d'observation et de relevés de terrain post-inondations ;

- ou encore le développement d'outils pour préparer et effectuer les retours d'expérience.

De son côté, Météo-France explore de nouvelles utilisations des réseaux de neurones profonds, en particulier pour la détection de fronts sur les prévisions numériques du temps, la prévision à courte échéance de précipitations et, plus largement, pour enrichir les précisions d'ensemble et favoriser la mise en place d'émulateurs de modèles de prévision.

Dans le cadre de l'émulation de modèles climatiques régionaux, des améliorations sont également recherchées dans le calcul de l'évolution des variables dites de surface, c'est-à-dire non seulement la température et les précipitations mais aussi l'humidité relative, le vent et les composantes du rayonnement à la surface. L'établissement souhaite affiner les techniques utilisées pour pouvoir déployer les méthodes à l'échelle du kilomètre. Il souligne que la mise en oeuvre de ce projet nécessitera des données d'observation de haute qualité et des simulations de modèles climatiques à haute résolution.

L'ensemble de ces évolutions permet d'envisager au cours des prochaines années de nouvelles avancées très prometteuses dans le recours à l'IA dans les sciences de l'environnement.

2. Une appropriation plus récente et limitée de l'IA générative

Le potentiel de l'IA générative est également bien identifié, en particulier pour renforcer la capacité d'extraction d'informations pertinentes dans des corpus documentaires volumineux ou pour l'analyse de documents soumis à une évaluation environnementale.

Le CGDD utilise déjà le traitement automatique du langage pour aider les agents de l'Autorité de l'environnement à traiter les dossiers qui sont soumis à une évaluation environnementale (LIRIAe).

Son appropriation plus large et pour des usages plus avancés, en particulier au sein des opérateurs publics, est cependant récente et toujours en cours.

Le projet LIRIAe pour la pré-instruction de projets environnementaux

« Le projet LIRIAe (Liseuse et Recherche Intelligente pour les autorités environnementales), opéré par l'Écolab en lien avec l'Inria, est un premier pas vers l'utilisation d'outils d'aide au traitement de dossiers. Il s'agit d'une solution mise à disposition d'agents des autorités environnementales au niveau régional et national pour détecter la structure des dossiers, étiqueter automatiquement les thèmes d'intérêt dans les documents et faire des recherches avancées sur les dossiers soumis à évaluation environnementale.

L'objectif est de faciliter l'instruction des projets en temps contraint avec des ressources humaines limitées. Les prochains développements permettront d'améliorer la pertinence de la recherche et des étiquettes, de faciliter la formulation en langue naturelle des requêtes et de faire des suggestions pour aider à la rédaction d'avis. »

Source : Feuille de route IA et transition écologique, 2023-2025, p. 19

Au sein des opérateurs du réseau scientifique et technique, le BRGM envisage de mobiliser l'IA générative pour mieux exploiter les connaissances accumulées sous la forme de rapports. Il fait appel à deux familles d'algorithmes : ceux à base de grands modèles de langage (LLM) et les algorithmes antagonistes génératifs (GAN)52(*) :

- les algorithmes de type LLM et RAG53(*) sont mobilisés pour l'exploitation des données textuelles, dont certaines parfois anciennes comme les rapports de forage de la banque des données du sous-sol. Des projets sont également en cours pour extraire des données textuelles à partir des fiches de synthèse de forages pétroliers ou de rapports de forage de géothermie ;

- l'apport des algorithmes GAN est quant à lui étudié pour la génération de données synthétiques remédiant au caratère lacunaire des données du sous-sol, par exemple pour l'automatisation de la géomodélisation.

Météo-France étudie également depuis quelques mois la possibilité d'utiliser des grands modèles de langage. Dans ce domaine, la réflexion porte sur l'usage de l'IA pour la création de textes. De premiers développements portent sur la rédaction des Bulletins marine réguliers (BMR) et la proposition d'un chatbot sur le portail DRIAS (projections climatiques du futur pour l'adaptation des sociétés).

L'Ifremer indique quant à lui commencer à utiliser l'IA générative pour des activités générales comme la recherche documentaire et la réalisation de synthèses. Cependant, le cadre d'usage n'a pour l'instant pas été défini.


* 52 Les réseaux antagonistes génératifs ou GAN sont des algorithmes d'apprentissage non supervisé à base de réseaux de neurones artificiels, qui permettent de modéliser et d'imiter n'importe quelle distribution de données. Ils peuvent être utilisés dans différents domaines (traitement d'images, de texte, de sons). Les GANs sont des modèles dits génératifs qui diffèrent des techniques traditionnelles d'analyse de données comme la classification. Alors que cette technique vise à apprendre à discriminer les données issues de différentes classes en fonction de leurs descripteurs, les algorithmes génératifs visent à faire le contraire : étant donnée une classe, les GANs cherchent à générer des données qui lui seraient associées. Concrètement, l'architecture d'un GAN est composée de deux réseaux de neurones, mis en compétition. Le premier, appelé générateur, crée un échantillon de données. Le deuxième réseau, appelé discriminateur, tente de détecter si cet échantillon est originel ou s'il s'agit d'une création de son « adversaire », le générateur.

* 53 Retrieval augmented generation ou génération augmentée par récupération.

Les thèmes associés à ce dossier

Partager cette page