Des images 3D plus réalistes que jamais grâce à l’IA : l’innovation RayGauss primée à la WACV 2025

Comparaison visuelle entre un filtre gaussien 3D et RayGauss
La synthèse de nouvelles vues est une technique qui permet de générer des images sous des angles qui n’ont pas été initialement capturés par une caméra. Cette technologie est essentielle pour de nombreuses applications, allant des effets spéciaux au cinéma à la cartographie 3D pour la navigation autonome, en passant par la réalité virtuelle.
Les approches récentes reposent souvent sur les Neural Radiance Fields (NeRF), des modèles d’apprentissage profond, ou deep learning, qui permettent de reconstruire une scène en simulant comment la lumière interagit avec l’environnement. Cependant, les NeRFs classiques ont des limites : ils demandent des temps de calcul très longs et peuvent générer des artefacts visuels, altérant la qualité du rendu final.
RayGauss propose une nouvelle façon de créer des images 3D réalistes en utilisant des techniques de rendu innovantes. Plutôt que de s’appuyer sur le ray tracing sur un maillage texturé classique, RayGauss adopte une approche différente : il utilise du ray tracing avec des primitives de type Gaussiennes, qui sont des formes mathématiques en ellipsoïdes, pour modéliser à la fois la densité de la matière et la lumière. Concrètement, au lieu de considérer une scène comme un simple ensemble de surfaces, cette méthode représente la matière sous forme de halos diffus, ce qui permet de mieux capturer la façon dont la lumière se propage et interagit avec les objets.
L’approche repose sur deux avancées majeures :
Algorithme de rendu volumétrique
L’une des grandes forces de RayGauss est son équilibre entre qualité et efficacité. Contrairement à d’autres techniques qui exigent plusieurs heures de calcul, cette méthode atteint une qualité d’image exceptionnelle tout en conservant un temps d’entraînement raisonnable et des performances temps réel exploitables dans des applications concrètes.
Ces avancées ouvrent la voie à des usages variés, notamment dans :
Comparaisons visuelles : ensemble de données Dex-NeRF
La distinction obtenue à la WACV 2025 est une reconnaissance majeure pour le travail accompli par l’équipe de Mines Paris – PSL. Cette réussite illustre l’excellence de la recherche française en intelligence artificielle et en vision par ordinateur, et met en avant le rôle du Centre de Robotique (CAOR) et de l’institut PR[AI]RIE-PSAI dans l’innovation scientifique.
L’équipe a rendu son code accessible au public sur GitHub, favorisant ainsi le partage et l’amélioration continue de cette technologie prometteuse. RayGauss marque une avancée déterminante dans le domaine de la synthèse d’images et pourrait bien redéfinir les standards du rendu photoréaliste dans les années à venir.
Le dernier film « Mission: Impossible – Dead Reckoning » tire son nom d’une méthode de navigation consistant à estimer sa position actuelle en se basa...