Une IA plus efficace, sobre et utile : au cœur des recherches du CRI
L’IA n’a cessé d’évoluer au fil des décennies. D’abord fondée sur des systèmes experts reposant sur des règles codées à la main, elle a connu une première révolution avec l’apprentissage automatique ou machine learning, nécessitant de grandes quantités de données et des architectures de calcul parallèles. L’essor du deep learning, puis des grands modèles de langage (LLM), des réseaux de neurones comptant aujourd’hui des centaines de milliards de paramètres, a profondément fait changer l’IA d’échelle.
Cette évolution met en lumière une tension centrale : plus les modèles sont puissants, plus ils exigent de mémoire, de calcul… et d’énergie.
Or, ces ressources ne sont ni infinies ni neutres. Le coût énergétique de l’IA est devenu un enjeu scientifique, industriel et environnemental majeur. C’est précisément sur ce terrain que se positionnent les recherches du CRI.

Contrairement à une idée répandue, innover en IA ne signifie pas toujours créer de nouveaux modèles. Une grande partie des travaux du CRI consiste à optimiser l’existant :
Les avancées en IA irriguent un grand nombre de secteurs scientifiques.
Un exemple emblématique est le travail mené en collaboration avec le CERN (Organisation européenne pour la recherche nucléaire), dans le cadre des expériences d’irradiation à haute énergie. Ces infrastructures testent la résistance de matériaux et de composants électroniques aux radiations, un enjeu clé pour le spatial, le nucléaire ou la physique des particules.
Les chercheurs du CRI y mobilisent des réseaux de neurones capables d’apprendre une représentation compacte et pertinente des données complexes. Concrètement, ces modèles permettent :
Ces travaux ont un impact direct : des expériences plus fiables, plus rapides à analyser et mieux documentées, intégrées aux outils opérationnels du CERN.

Un autre défi majeur de l’IA moderne est le choix du bon modèle. Face à une multitude d’algorithmes et de paramètres, cette étape est souvent coûteuse, empirique et réservée à des experts.
Au CRI, les chercheurs développent des approches de méta-apprentissage, c’est-à-dire des méthodes capables de recommander automatiquement :
Parmi les résultats marquants :
La conséquence est un gain de temps considérable pour les chercheurs et ingénieurs, et une IA plus accessible, y compris pour des non-spécialistes.
Les grands modèles d’IA, notamment les LLM, reposent sur un mécanisme clé : l’attention. C’est lui qui permet au modèle de déterminer quelles informations d’un texte sont pertinentes pour produire une réponse. Mais ce mécanisme est extrêmement coûteux lorsque les textes deviennent très longs.
Les chercheurs du CRI exploitent une propriété clé de ces modèles : les matrices d’attention sont en pratique très creuses, c’est-à-dire que la majorité de leurs valeurs contribue peu ou pas au résultat final. En exploitant cette propriété, ils ont développé des méthodes de calculs creux pour l’attention, capables de :
D’autres travaux portent sur :
Ces recherches ont un effet concret, avec des modèles plus rapides, capables de traiter des documents massifs, et déployables sur des infrastructures plus variées.
L’un des résultats les plus concrets concerne la réduction de la consommation énergétique des infrastructures de calcul. En analysant finement le fonctionnement des architectures parallèles cibles, les chercheurs du CRI ont montré que l’efficacité énergétique peut être significativement améliorée grâce à un ordonnancement approprié des calculs, à tous les niveaux, depuis les instructions, les opérations jusqu’aux tâches exécutées sur les accélérateurs.
En développant :
Ils sont parvenus à réduire la consommation énergétique globale d’un cluster de calcul de plus de 10 %, sans ralentir la production scientifique. Un pas décisif vers une IA plus soutenable !
Ces recherches trouvent un prolongement stratégique dans le Programme et Équipements Prioritaires de Recherche (PEPR) sur les composants de l’IA, co-piloté par le https://www.cnrs.fr/frCEA et l’Inria, visant à accélérer le développement de l’intelligence artificielle en France. Financé par France 2030 et piloté par l’Agence nationale de la recherche (ANR), l’objectif du PEPR CAMELIA (Composants IA) est de concevoir un environnement matériel et logiciel complet permettant l’exécution efficace d’applications d’IA sur des cibles matérielles, développées dans le cadre du projet, constituant une alternative souveraine aux solutions aujourd’hui majoritairement étrangères.
Le CRI joue un rôle clé au sein de ce PEPR en co-pilotant le lot dédié à la conception et au développement des composants logiciels indispensables pour exploiter les architectures visées et garantir performance, portabilité et efficacité énergétique.
C’est un enjeu scientifique, industriel et de souveraineté technologique.

Ces travaux ont été mis en lumière lors du Workshop IA organisé en décembre 2025 à Mines Paris – PSL. Pensé comme un moment d’échange interne, l’événement a permis aux enseignants-chercheurs, doctorants et ingénieurs de présenter leurs projets, outils et plateformes, à travers des présentations orales et des posters.
Au-delà de la diversité des sujets, le workshop a souligné une dynamique commune : construire une IA ancrée dans le réel, capable de dialoguer avec les humains et de s’intégrer dans des systèmes complexes.
Au sein du centre, l’IA n’est pas seulement plus puissante, elle fait l’objet d’une compréhension approfondie, d’optimisations méthodiques et d’une intégration raisonnée dans les grands défis scientifiques, industriels et sociétaux. À travers ces recherches, le Centre de Recherche en Informatique (CRI) de Mines Paris – PSL affirme une vision claire : une IA qui calcule « moins, mais mieux », et dont l’impact dépasse le cadre des laboratoires, pour contribuer à la fois aux avancées de la recherche et à des applications concrètes, performantes et plus frugales.
Comprendre le fonctionnement intime des cellules, accélérer la découverte de nouveaux traitements et adapter la médecine à chaque patient figurent par...