Le Data Challenge CardI-HACK

Améliorer l’évaluation du pronostic de sévérité et d’évolution des cardiomyopathies hypertrophiques, grâce à l’IA.

Partager
CardI-HACK

Lancé le 4 novembre 2025, le Data Challenge CardI-HACK est une compétition internationale en science des données organisée par l’IHU ICAN. Son objectif est de développer des outils pour identifier de nouveaux scores biocliniques, capables de mieux évaluer la sévérité et le pronostic des cardiomyopathies hypertrophiques. 

Des équipes du monde entier ont été mises en concurrence pour développer le modèle d’intelligence artificielle (IA) le plus performant dans l'identification de la ou des combinaisons de données génomiques permettant de prédire les événements cardiovasculaires indésirables majeurs, grâce à l’analyse d’une base de données cliniques et génétiques inédite de près de 500 patients
375 équipes ont participé et plus de 8 000 algorithmes ont été soumis par les participants.


Les modèles des lauréats seront disponibles en open source et référencés dans la BOAS et les données mobilisées seront accessibles en open data sur la plateforme data.gouv.
 

Ce challenge a été organisé dans le cadre de l’Appel à projets “Data Challenges en santé" et a bénéficié d’un soutien financier du plan France 2030 et d’un accompagnement par le Health Data Hub.

 

CardI-HACK : zoom sur la question médicale
 


Hôpital Pitié-Salpêtrière/AP-HP
 
 


Les maladies cardiaques héréditaires sont des causes majeures de mort subite et/ou d'insuffisance cardiaque chez les jeunes (<40 ans). La cardiomyopathie hypertrophique est définie par une augmentation d’épaisseur de la paroi du ventricule gauche du cœur, non expliquée par les conditions de charge. La maladie, relativement rare (1 personne sur 500 dans la population générale), est causée, dans environ la moitié des cas, par une mutation de gènes qui sont bien identifiés. 

Malgré l'amélioration des connaissances et de la prise en charge de cette maladie, la morbi-mortalité reste élevée et la sélection des patients pour des thérapeutiques invasives reste sous-optimale en raison de la capacité de prédiction limitée des stratégies actuelles.

Pour y remédier, l’IHU ICAN a lancé le challenge CardI-HACK dans le but d’améliorer, grâce à l’IA, l’évaluation de la sévérité et du pronostic à l'aide de nouveaux scores biocliniques.

Une base unique de données cliniques et génétiques

Une base de données inédite de 500 patients souffrant de cardiomyopathie hypertrophique contenant des données cliniques et génomiques a été constituée et annotée par des experts.

Cette base de données a été mise à disposition sur la plateforme en ligne Trustii.io pour une durée de 8 semaines, permettant ainsi à des équipes du monde entier de participer au challenge et de soumettre leurs modèles d’IA. Le but : créer un outil fiable et performant capable de prédire la sévérité de la maladie lorsqu’elle se manifeste, et la survenue d’événements cliniques majeurs.
 

Les résultats du Data Challenge 

375 équipes ont rejoint la compétition et ont proposé plus de 8 000 modèles. Les trois meilleurs modèles sont disponibles ici et seront publiés en open source et référencés sur la Bibliothèque Ouverte d'Algorithmes en Santé (BOAS).
 

1ère place - Équipe CyberBob (Rafael Sudbrack Zimmermann et Roberta Oriques Becker) - Brésil

L'équipe a combiné plusieurs modèles statistiques avec différentes configurations pour prédire de manière robuste le risque et la sévérité d'un événement cardiovasculaire majeur (MACE). Le risque MACE a été classé en trois niveaux et la sévérité exprimée en probabilités. Une attention particulière a été portée aux cas à haut risque pour améliorer leur détection.

Le modèle et sa documentation

 

2ème place - Équipe Fawda (Ayush Gupta, Tanish Yadav et Jaynab) - Inde

L’équipe a calculé un score génétique en utilisant toutes les variations génétiques et a créé de nouvelles variables pour améliorer les prédictions. Le risque MACE a été estimé avec une régression logistique aux seuils ajustés, tandis que la sévérité a été prédite avec un modèle CatBoost plus avancé.

Le modèle et sa documentation

 

3ème place - Équipe MyoPedict (Talissa Kassably, Lydia Srinivassan et Nawal Ahmed) - France

L’équipe a complété les données manquantes et créé un score génétique pour résumer les informations importantes. Elle a ensuite entraîné une régression logistique pour la sévérité et un ensemble de modèles combinés (LGBM, CatBoost et ExtraTrees) pour prédire le risque MACE. Les prédictions ont été transformées en catégories pour déterminer le niveau de risque.

Le modèle et sa documentation
 

Ouverture des résultats et perspectives 

La publication en open data offrira un accès libre et gratuit à cette base de données inédite et ouvrira la voie à de nouveaux travaux collaboratifs de recherche sur les maladies cardiaques. Cette base de données de grande qualité et richement annotée constituera également un support pédagogique précieux dans la formation des cardiologues. 

Les modèles en open source seront accessibles et déployables partout dans le monde, rendant l’expertise en cardiogénétique plus accessible et permettant la poursuite du développement d’outils d’évaluation du pronostic des cardiomyopathies hypertrophiques.
 

Les partenaires 

  • Pr Philippe Charron : Professeur de génétique à la Faculté de Santé Sorbonne Université, Cardiologie-généticien à l’hôpital de la Pitié-Salpêtrière
  • Aurélie Foucher : Chef de projet à l'IHU ICAN

Le programme Data Challenges en santé

Depuis 2020, par le biais des Appels à Projets “Data Challenges en santé”, le Health Data Hub accompagne des acteurs de l'écosystème de la santé dans l’organisation de projets de Data Challenge portant sur des thématiques médicales d’intérêt et à portée internationale. Ces projets bénéficient d’un soutien financier de Bpifrance ainsi que d’un accompagnement logistique, technique et organisationnel de bout en bout par les équipes du Health Data Hub. 

Découvrez l'ensemble des Data Challenges sur la page Les Data Challenges en santé.

En savoir plus sur les Data Challen…

Rejoignez la compétition !