B. DES EFFORTS CERTAINS POUR INTÉGRER L'IA DANS L'ÉDUCATION EN FRANCE
En France, l'Éducation nationale s'est emparée du sujet de l'IA dès 2018 dans le cadre de la stratégie du numérique pour l'éducation et de la stratégie nationale pour l'intelligence artificielle (SNIA), rattachée au volet « maîtrise de technologies numériques souveraines et sûres » du plan France 2030. Des moyens non négligeables ont été consacrés à la définition de services numériques s'appuyant sur l'IA et à l'élaboration de ressources permettant aux enseignants de se former à l'IA.
1. Le succès mitigé des outils mis à la disposition des enseignants dans le cadre des P2IA
Plusieurs outils numériques intégrant des techniques d'IA, élaborés dans le cadre de partenariats d'innovation (P2IA), ont été mis à la disposition des professeurs des écoles pour accompagner l'apprentissage personnalisé du français et des mathématiques. Les dépenses associées à la première vague de P2IA s'élèvent à 17,76 millions d'euros à ce jour, incluant l'acquisition des licences d'utilisation.
Les premiers partenariats d'innovation en intelligence artificielle (P2IA)
Un premier marché public portant sur un partenariat d'innovation pour cinq services numériques pédagogiques basés sur l'IA a été lancé en 2018. Co-conçus par des entreprises de la filière EdTech, des laboratoires de recherche et des équipes pédagogiques (Dane, IEN, ERUN) dans le cadre d'adaptations continues à partir de retours d'expérience, ces services permettent de proposer une différenciation des exercices et d'évaluer régulièrement les compétences des élèves de CP, CE1 et CE2 en français et mathématiques. Le nombre d'utilisateurs potentiels est estimé à 53 000 professeurs et 1,3 million d'élèves.
Trois nouvelles séries de P2IA sont en cours de construction ou en projet avec :
· le lancement en 2024 d'un partenariat pour le cycle 3 (classes de CM1, CM2 et de 6e) en français, mathématiques et en langues vivantes (anglais, espagnol, italien et allemand), avec un budget dédié de 16 millions d'euros ;
· la publication imminente d'un partenariat pour les apprentissages fondamentaux des élèves du cycle 4 du collège et du lycée et pour les enseignants (assistance dans le suivi et analyses, évaluations et corrections, productions d'activités d'enseignement), avec un budget de 20 millions d'euros ;
· un projet de partenariat destiné aux enseignants du secondaire et éventuellement du supérieur (jusqu'à BAC+3), portant sur les « gestes enseignants » et visant à acculturer et outiller les enseignants pour les accompagner dans leurs pratiques professionnelles. Les services proposés incluraient les évaluations, en particulier les corrections de productions écrites ou orales réalisées par des élèves individuellement ou en groupe. Cette assistance permettrait d'accompagner les élèves dans les épreuves du brevet, du baccalauréat et, le cas échéant, du premier cycle du supérieur. Le service proposé s'appuierait sur un « mix » de technologies d'IA, dont de l'IA générative. Le budget prévisionnel est estimé à 14 millions d'euros.
De réels efforts sont ainsi réalisés pour la mise en place d'outils définis selon une logique participative, au plus près du terrain. Cependant, le nombre d'utilisateurs reste très variable si l'on se réfère au nombre de licences utilisées. Les services disponibles n'ont pas tous à ce jour connu une pleine montée en puissance.
Services numériques P2IA cycle 2 |
Nombre de licences utilisées au printemps-été 2024 |
Lalilo |
25 428 |
Navi |
5 044 |
Adaptiv'Math |
5 822 |
Mathia |
6 431 |
Smart Enseigno |
2 978 |
D'autres ressources acquises dans le cadre de la commande publique sont par ailleurs proposées aux enseignants, telles que « Captain Kelly », assistant vocal pour l'apprentissage de l'anglais à l'école élémentaire (du CP au CM2) permettant notamment de développer la compréhension orale et la prononciation26(*).
En dehors de ces outils, le ministère de l'éducation nationale identifie près d'une vingtaine de services d'IA utilisés de façon éparse dans le cadre d'initiatives individuelles pour les mathématiques, les lettres, les sciences ou encore les langues vivantes.
2. Les limites des grands modèles de langage dans le cadre scolaire
Pour l'ensemble des ressources existantes, les services ministériels se montrent particulièrement vigilants sur la question du traitement des données à caractère personnel.
Au-delà des services numériques qu'il fait développer ou qu'il soutient, le ministère souligne en effet ne pas être en mesure d'identifier des IA qui soient conformes aux exigences juridiques et éthiques dans les usages scolaires des élèves. Il s'agit notamment des enjeux liés à la mise à jour des données, aux biais, aux possibles erreurs factuelles, au droit d'auteur ou encore à l'absence d'informations sur les sources utilisées. Le ministère a d'ores et déjà indiqué, s'agissant de l'IA générative, que ChatGPT « n'est pas utilisable dans un cadre scolaire, seules sont possibles des utilisations à titre individuel, sous le régime du contrat privé »27(*).
Ignorant si d'autres applications complémentaires ou concurrentes comme Bing Chat (moteur de recherche de Microsoft qui intègre GPT-4) ou Perplexity respectent les règles du RGPD, il invite les enseignants à ne pas les faire utiliser directement par les élèves, d'autant plus que les conditions d'utilisation de ces services peuvent évoluer rapidement.
Les LLM : une performance élevée qui ne doit pas cacher leurs limites pour un usage scolaire
Les grands modèles de langage (LLM) sont des réseaux de neurones entraînés sur de grandes quantités de données. Il s'agit de modèles probabilistes, capables de prédire la suite d'une série de mots.
La pertinence des LLM est liée à leur sensibilité au contexte. Capables de fournir des réponses structurées dans n'importe quel langage et dans tous les formats, ils fluidifient les liens entre l'humain et la machine.
Ces modèles sont souples, le fine-tuning permettant de les modifier par une deuxième phase d'entraînement pour les adapter à nos besoins. Cependant, même après un entraînement qui permet de les améliorer afin d'en faire des outils efficaces dans une large variété de tâches, les LLM présentent toujours des limites :
- ils n'ont pas de mémoire à court terme, c'est-à-dire des conversations passées ;
- du fait de leur caractère probabiliste, ils peuvent répondre différemment à un même prompt ;
- les données dont ils dépendent sont souvent périmées, car liées aux données utilisées lors du premier entraînement ;
- leur grande envergure peut avoir pour corollaire un coût élevé et une lenteur dans la génération de réponses ;
- en raison de leur caractère généraliste, ils nécessitent des données spécifiques pour bien répondre dans un contexte particulier comme la salle de classe ;
- enfin, les LLM peuvent halluciner, notamment parce qu'ils ont tendance à répondre à un prompt même quand ils ne savent pas.
3. Se servir en classe d'une IA maîtrisée et conforme aux principes éthiques
Dans ce contexte, le développement d'un service d'IA générative souverain dédié à l'éducation est en cours avec le projet OpenLLM France. Celui-ci s'inscrit dans l'ambition plus vaste d'élaborer des « communs numériques » via un appel à projets financé par les crédits d'investissement de France 2030.
L'objectif poursuivi est de se fonder sur des corpus de données d'apprentissage publics et ouverts, des algorithmes documentés pour en assurer l'explicabilité et de proposer une licence d'utilisation libre. Les premiers usages en classe sont attendus courant 2024 dans les académies volontaires pour une utilisation plus généralisée à la rentrée 2025.
L'enjeu de la sensibilité et de la qualité des données est ainsi pris en compte, avec la nécessité d'accéder à des modèles d'IA formés sur des données validées au niveau institutionnel ou par les enseignants eux-mêmes.
Sans attendre l'élaboration de ce modèle, une initiative intéressante a vu le jour au sein de l'académie d'Aix-Marseille avec la mise au point expérimentale d'un petit langage de modèle (SML) mobilisable directement en classe, « IA AnSu ».
Il s'agit de « reprendre le pouvoir » face aux Gafam en gardant la maîtrise du système. Cette expérimentation bénéficie de l'intérêt fort pour l'IA de la direction régionale académique du numérique éducatif (Drane) de l'académie d'Aix-Marseille et de la mobilisation de la communauté de réflexion en éducation autour de l'intelligence artificielle (Creia).
« IA AnSu » : une expérimentation dans l'académie d'Aix-Marseille
Comment faire pour que l'IA devienne un agent utile en classe ? C'est la question posée par le projet « IA AnSu » engagé fin 2023 par la direction régionale académique du numérique éducatif (Drane) de l'académie d'Aix-Marseille.
Ce projet consiste à utiliser les propriétés du LLM, en l'occurrence celui de Mistral, pour l'adapter à des besoins éducatifs et en faire un assistant éducatif en classe au collège.
À l'issue d'un travail d'éducation du modèle, comportant à la fois une optimisation du contexte (enrichissement des informations) et celle de son comportement, les auteurs du projet ont mis au point un modèle de langage plus petit, plus rapide et plus économe en ressources.
Source : Alexandre Castanet et Jean-Baptiste Civet (Drane Paca)
https://www.pedagogie.ac-aix-marseille.fr/jcms/c_11193342/fr/ansu-une-ia-slm-en-classe
Une refonte en profondeur du modèle doit aboutir à une interface didactique grâce à une bonne ergonomie facilitant le prompt, dotée d'un indice de performance appelé « Score DNB » fondé sur des tests corrigés par un humain, nourrie de cours pour assurer une pertinence et dotée d'une posture pédagogique qui lui permet de se spécialiser (fine-tuning). Chacun de ces aspects doit faire l'objet de tests en classe. L'interface pourra être personnalisée en fonction des besoins spécifiques des enseignants et des élèves.
L'objectif est de pouvoir se servir d'une IA maîtrisée de bout en bout, experte, conforme au RGPD et frugale. Pour l'utilisateur, les avantages d'AnSu sont qu'elle utilise le langage naturel, adopte une forme dialectique avec des questions/réponses et peut jouer différents rôles (assistant pédagogique, correcteur, répétiteur, exerciseur, manuels scolaires...). L'outil doit s'adapter à tous les niveaux jusqu'au lycée et à toutes les disciplines. Il peut répondre à une diversité de profils et de besoins.
Question piège permettant d'évaluer la sensibilité au contexte : c'est quoi un polo crocodile ?
Réponse de AnSu : Un polo crocodile est en réalité une référence à la marque de vêtements « Lacoste ». Cette marque a été créée par le célèbre joueur de tennis français René Lacoste dans les années 1930. Le crocodile est le symbole et le logo de la marque, il est brodé sur les polos qu'elle produit.
Source : Alexandre Castanet et Jean-Baptiste Civet (Drane Paca)
La construction du projet doit se poursuivre grâce aux retours d'expérience de « testeurs ».
4. Les efforts pour développer des ressources sur l'IA en éducation pour les enseignants
Au-delà des outils, des initiatives visant à valoriser l'IA auprès des enseignants et aider la communauté éducative à acquérir une compréhension générale sur l'IA ont vu le jour dans le cadre de coopérations transfrontalières, à l'instar du projet européen « Intelligence artificielle pour et par les enseignants » (AI4T).
Il s'agit d'un projet Erasmus+ de trois ans, développé par la France, l'Irlande, l'Italie, le Luxembourg et la Slovénie, pour étudier et encourager l'utilisation de l'IA par les enseignants du cycle secondaire en mathématiques, en sciences et en anglais. Ce projet a débouché sur la mise à disposition d'un MOOC accessible en cinq langues et fournissant un ensemble cohérent de ressources sur l'IA en éducation. De façon complémentaire, un manuel ouvert, élaboré par la Chaire Unesco RELIA a été publié en octobre 2022 puis actualisé en janvier 2024 pour tenir compte de l'arrivée des IA génératives28(*).
Le réseau Canopé, opérateur du ministère chargé de la formation continue des enseignants depuis 2020, s'est quant à lui engagé dès décembre 2022 de manière proactive dans des actions de formation à l'intelligence artificielle en proposant des ressources pédagogiques ainsi que des études relatives aux IAG29(*).
Enfin, le ministère indique qu'un guide des usages numériques actuellement en préparation devrait être disponible durant l'année scolaire 2024-2025 avec des exemples d'usages pédagogiques et didactiques intégrant l'IA.
Du côté de l'enseignement supérieur public, les services d'ingénierie pédagogique des universités privilégient les démarches de remontée et de valorisation des initiatives individuelles ainsi que les échanges de bonnes pratiques. Certaines grandes écoles ont adopté des stratégies de formation plus vastes de leurs personnels aux enjeux de l'IA.
* 26 Il s'agit d'une application mobile qui utilise plusieurs solutions d'IA : elle peut analyser la voix humaine à travers un microphone pour la comparer à un modèle linguistique calibré pour les enfants francophones, puis catégorise la production selon qu'elle est acceptable, perfectible, ou incorrecte, afin de répondre de manière adaptée. Elle est également capable de reconnaître une image qu'on lui montre parmi les centaines de flashcards fournies avec la solution.
* 27 Ministère de l'éducation nationale et de la jeunesse, direction du numérique pour l'éducation, bureau du soutien à l'innovation numérique et à la recherche appliquée, Intelligence artificielle et éducation. Apports de la recherche et enjeux pour les politiques publiques, janvier 2024.
* 28 Colin de La Higuera et Jotsna Iyer, IA pour les enseignants : un manuel ouvert. L'intelligence artificielle par et pour les enseignants, janvier 2024.
* 29 Lignes directrices du Réseau Canopé pour la formation aux intelligences artificielles génératives, mars 2024.