Projets
Les projets de recherche menés par le CBIO ont marqué les avancées en bio-informatique, en intelligence artificielle appliquée à la santé, et en biologie computationnelle.
Ces projets, souvent interdisciplinaires et partenariaux, ont donné lieu à des résultats majeurs, à des publications internationales et à des outils désormais utilisés dans la communauté scientifique.

Les projets de recherche en cours
Le CBIO mène plusieurs projets structurants, financés par des institutions nationales ou européennes, souvent en partenariat avec d’autres centres de recherche ou acteurs cliniques.
ANR – STEVE
Étude des éléments transposables et de leur variation épigénétique dans la relation génotype-phénotype. Ce projet, en partenariat avec des biologistes de l’ENS – PSL, explore l’impact de ces éléments dans les traits complexes, avec des applications en santé humaine et en agriculture.
Carnot M.I.N.E.S.
Développement d’un outil non invasif de diagnostic précoce du cancer du poumon, en collaboration avec l’Université de Cambridge. Le projet repose sur l’analyse d’images biomédicales et de données transcriptomiques à l’aide de méthodes statistiques et d’apprentissage automatique.
PRTK – SELECT
Modélisation prédictive de la survie des patients atteints d’un cancer de la vessie infiltrant le muscle, traités par chimiothérapie néoadjuvante. Le projet vise à améliorer la stratification des patients à partir de lames anatomopathologiques.
Les projets du CBIO
Les travaux antérieurs du CBIO ont donné lieu à des publications majeures et à des innovations méthodologiques en bio-informatique, santé et biologie computationnelle :
Komet – Prédiction d’interactions médicament-cible à grande échelle
- Objectif : Développer un algorithme capable de prédire les interactions entre molécules et cibles thérapeutiques à partir d’un jeu de données massif (LCIdb).
- Partenaires : CBIO, Institut Curie
- Publication : J. Chem. Inf. Model, 2024
ComSeg – Analyse des tissus complexes par transcriptomique spatiale
- Objectif : Mettre au point une méthode de segmentation cellulaire adaptée à la distribution spatiale des transcrits d’ARN dans les tissus.
- Partenaires : CBIO, Institut Curie, équipes de recherche en biologie spatiale
- Publication : Communications Biology, 2024
Modélisation évolutive des génomes bactériens
- Objectif : Reconstituer l’histoire évolutive des génomes bactériens en intégrant mutations et transferts horizontaux.
- Partenaires : CBIO, équipes en génomique évolutive
- Publication : PNAS, 2024
Détection de la déficience en recombinaison homologue (HRD)
- Objectif : Utiliser des méthodes de deep learning pour détecter la déficience en recombinaison homologue dans les cancers du sein à partir d’images histologiques.
- Partenaires : CBIO, Institut Curie, Centre Léon Bérard
- Publication : Cell Reports Medicine, 2022
Les projets par thématiques :
Nouvelles approches thérapeutiques et médecine personnalisée
- Nouveaux médicaments pour la mucoviscidose basés sur l’apprentissage automatique
Fondation Maladies Rares, 2020–2021
Utilisation de modèles de machine learning pour identifier des composés actifs contre la mucoviscidose. - Machine learning pour les études d’association pangénomiques (GWAS)
Collaboration avec SANOFI, 2016–2019
Développement d’algorithmes pour détecter des associations génome-phénotype dans des cohortes humaines. - MLPM – Machine Learning for Personalised Medicine
EC-FP7, 2012–2016
Réseau de formation doctorale autour de l’IA pour la médecine de précision. - AP’ONCALYPSE
ANR, 2012–2013
Validation d’une signature immunitaire prédictive de la réponse aux anthracyclines dans le cancer du sein. - TYRO3
INCA, 2012–2014
Ciblage de la protéine TYRO3 comme nouvelle piste thérapeutique contre le cancer.
Analyse omique et bio-informatique des données massives
- Hi-FISH
ANR, 2014–2018
Étude systématique de l’expression génique à l’échelle de la molécule d’ARN, par hybridation in situ. - ABS4NGS
ANR – Investissements d’avenir, 2012–2016
Algorithmes et logiciels pour le séquençage haut débit. - RADIANT
EC-FP7, 2012–2015
Développement rapide et diffusion d’outils statistiques pour le séquençage à haut débit. - Analyse intégrée des profils de méthylation dans le cancer du sein
Ligue contre le cancer, 2011–2014 - Structured machine learning for microbiology
Collaboration avec BioMérieux, 2011–2014
Apprentissage structuré appliqué à la spectrométrie de masse et au séquençage.
Réseaux de régulation et développement
- CRESTNETMETABO
ANR, 2015–2019
Étude des réseaux de régulation dans le développement des cellules de la crête neurale. - CRESTNET
ANR, 2012–2014
Approches intégratives pour modéliser les réseaux de régulation dans l’induction de la crête neurale. - CLARA
ANR, 2009–2013
Algorithmes de clustering en haute dimension.
Imagerie, microscopie et diagnostic
- RAMIS
2007–2011
Microscopes à haute résolution pour le criblage de molécules anticancéreuses. - ParTox
ANR, 2007–2009
Suivi de la toxicité des nanoparticules. - NADINE
EC-FP7, 2010–2015
Nanosystèmes pour le diagnostic précoce des maladies neurodégénératives. - Indigo
EC-FP7, 2005–2008
Biocapteurs fluorescents à haute sensibilité pour des applications diagnostiques.
Réseaux européens et infrastructures collaboratives
- Systems Microscopy Network of Excellence
EC-FP7, 2013–2015 - ESBIC-D – European Systems Biology Infrastructure for Complex Diseases
EC-FP7, 2005–2007
Méthodes statistiques et apprentissage automatique
- SMAC – Statistical Machine Learning for Complex Biological Data
ERC, 2012–2017
Algorithmes pour données biologiques complexes. - MGA – Modèles graphiques et applications
ANR, 2007–2011 - Sakura
JSPS, 2003–2005
Analyse statistique et combinatoire de réseaux biologiques. - Inference and learning in dynamic graphical models
France-Berkeley Fund, 2007–2009
Applications à la bio-informatique et à la reconnaissance vocale. - BioClassif
CNRS, 2004–2006
Théorie de l’apprentissage statistique pour données structurées. - Statistical learning for the analysis of transcriptome
CNRS, 2003–2004
Outils bio-informatiques et infrastructure
- iBioinfo
CEA, 2005–2006
Méthodes et outils bio-informatiques pour l’analyse de puces à ADN. - Kernelchip
CNRS, 2004–2007
Intégration des données d’expression et des réseaux de régulation. - GemBio
Mines Paris, 2004–2007
Analyse des effets de médicaments antipaludiques sur Plasmodium falciparum. - Développement de bases de données en cancérologie
JSPS, 2008–2010
Impact scientifique
Ces projets ont conduit à :
- des publications dans des journaux internationaux de référence,
- la création de logiciels et d’outils open source,
- le transfert de méthodologies vers des partenaires industriels et hospitaliers,
- la formation de jeunes chercheurs à l’interface entre science des données et biologie.