Les Data Challenges en santé
“Une approche innovante et participative qui favorise l'émergence et le partage de solutions inédites en santé numérique”
Les Data Challenges sont des compétitions en science des données qui visent à répondre à des problématiques médicales précises à l’aide de l’analyse des données mises à disposition.
Il s’agit plus précisément de résoudre, en un temps imparti, une problématique spécifique de data science grâce à des solutions d’apprentissage automatique. Ces compétitions se déroulent en ligne et sont généralement des problèmes de prédiction, de régression ou de classification, préalablement formulés sur la base de larges jeux de données et mis à disposition des compétiteurs.
En s’inscrivant dans une démarche d’intelligence collective et d’ouverture de la science, l’idée pour les organisateurs et les compétiteurs est de mettre leurs forces en commun afin d’accéder, à l’état de l’art de la problématique scientifique, statistique ou technique posée.
L’origine de l’initiative Data Challenges en santé
Dans le cadre du plan France 2030, le Gouvernement a lancé la stratégie d’accélération « Santé Numérique » visant à préparer l’avenir et faire de la France un leader en santé numérique. C’est dans ce contexte que la Délégation ministérielle au Numérique en Santé, le Secrétariat général pour l’investissement, chargé de France 2030, et le Health Data Hub ont lancé l’initiative Data Challenges en santé.
Ainsi, depuis 2020, par le biais des appels à projets “Data Challenges en santé”, le HDH accompagne des acteurs de l'écosystème de la santé dans l’organisation de projets de Data Challenges portant sur des thématiques médicales d’intérêt et à portée internationale. Ces projets bénéficient d’un soutien financier de Bpifrance ainsi que d’un accompagnement logistique, technique et organisationnel de bout en bout par les équipes du Health Data Hub.
Découvrez et participez aux compétitions Data Challenges en santé
Les Data Challenges en santé sont des compétitions ouvertes à tous et d’envergure internationale. Aucun prérequis n’est nécessaire, l’inscription et la participation sont gratuites.
Pour ne rien rater, vous pouvez vous inscrire à notre newsletter pour être informé du lancement de tous nos Data Challenges.
Les Data Challenges en cours et sur point d'être lancés
- Le Data Challenge DigiLUT :
Début du Data Challenge le 14 juin 2024 (durée : 2 mois)
Participez ici
Ce Data Challenge, porté par l’Hôpital Foch, a pour objectif de faire émerger une solution d’aide à l’analyse des biopsies transbronchiques de greffons pulmonaires chez les patients greffés. En effet, le diagnostic de rejet en transplantation est une étape clef de la prise en charge des patients transplantés pulmonaires. Cependant, ce diagnostic est actuellement peu reproductible et sous-détecté, impliquant un impact négatif majeur pour les patients concernés.
Nos Data Challenges en santé en cours d’organisation
- Le Data Challenge CYTOLOGIA : porté par le Groupe Francophone d’Hématologie Cellulaire en partenariat avec Algoscope, le challenge repose sur l’analyse d’une très large base d’images de leucocytes normaux et pathologiques issus de frottis sanguins. L’objectif du projet est de développer une solution de classification automatique des leucocytes afin de standardiser les pratiques et d’homogénéiser les compétences diagnostiques.
- Le Data Challenge Dat-Hub : dans le domaine de la neurologie, la Société Française de Médecine Nucléaire organise un challenge consacré aux syndrômes parkinsoniens. Les participants auront pour mission de développer un algorithme contribuant au diagnostic de ces syndrômes aux formes multiples. Des données d’imagerie cérébrale, appelées DatScan, de plusieurs milliers de patients seront mises à disposition pour le challenge.
- Le Data Challenge Annit-IA : organisée par une équipe de l’IHU ICAN, cette compétition portera sur la stéatose hépatique non alcoolique (NAFLD), une maladie caractérisée par une accumulation excessive de graisse du foie, qui toucherait aujourd’hui 25% de la population générale. Ce Data Challenge aura pour objectif de stratifier le risque de progression de la maladie en modélisant l’évolution de l’état de santé du patient.
- Le Data Challenge CardI-HACK : porté par une autre équipe projet de l’IHU ICAN, cette compétition se penchera sur les cardiomyopathies hypertrophiques (CMH) chez les moins de 40 ans, afin d’identifier de nouveaux scores biocliniques capables de mieux prédire leur diagnostic. Le Data Challenge combinera des données génétiques et cliniques.
- Le Data Challenge C-Plu-Net : proposé par la Société Française de Chirurgie Thoracique et Cardiovasculaire, le challenge s’intéressera à la problématique du cancer du poumon. L’objectif pour les participants sera de définir une classification histopronostique des tumeurs neuroendocrines pulmonaires, à partir de données d’imagerie cellulaire.
Retour sur nos Data Challenges finalisés
- Le Data Challenge TissueNet : porté par la Société Française de Pathologie, les participants ont eu pour objectif de créer des modèles d’apprentissage automatique capables de détecter les lésions épithéliales les plus sévères du col utérin sur la base de l’analyse de près de 5 000 lames de biopsie numérisées. La compétition s’est déroulée de septembre à octobre 2020 et a rassemblée près de 550 compétiteurs. Les résultats sont prometteurs avec des scores de performance allant jusqu’à 95% de prédictions correctes.
Retrouvez les algorithmes lauréats du Data Challenge TissueNet publiés en Open Source ici.
Découvrez les publications en lien avec le Data Challenge TissueNet :
-> Plus d’informations sur les résultats de la compétition ici.
- Le Data Challenge VisioMel : porté par la Société Française de Pathologie, la Société Française de Dermatologie, le Groupe de Cancérologie Cutanée et le Conseil National Professionnel des Pathologistes , ce Data Challenge a eu pour objectif de prédire la probabilité de récidive de mélanomes dans les cinq ans suivant le diagnostic initial à partir de l’analyse de lames de biopsies numérisées de près de 2 000 patients. La compétition s’est déroulée de mars à mai 2023 et a rassemblée près de 600 participants venant du monde entier. 637 algorithmes ont été soumis jusqu’à la clôture de la compétition, donnant lieu à des résultats très encourageants : en moyenne, les algorithmes des lauréats ont correctement détecté 73 % des cas de rechutes et 75 % des cas qui n’ont pas rechuté à cinq ans. Des analyses supplémentaires sont actuellement en cours pour déterminer si les algorithmes se révèlent performants dans certaines catégories diagnostiques spécifiques.
Une cérémonie de remise des prix, organisée le 25 mai 2023 à PariSanté Campus, a permis de récompenser les lauréats à la compétition et de présenter les premiers résultats.
Retrouvez les algorithmes lauréats du Data Challenge D-IA-GNO-DENT publiés en Open Source ici.
Découvrez les résultats et les interviews des lauréats à la compétition ici.
- Le Data Challenge D-IA-GNO-DENT : porté par les Hôpitaux Universitaires de Strasbourg, cette compétition s’est concentrée sur le sujet des maladies orales et dentaires rares. L’objectif pour les participants était de proposer des algorithmes de diagnostic automatique à partir de photographies de dents de 200 patients en identifiant les traits caractéristiques de ces maladies génétiques. La compétition a eu lieu d’avril à juillet 2023, et a rassemblée une centaine d’équipes qui ont soumis plus de 1 450 modèles, avec des scores allant jusqu’à 0,8385. Une cérémonie de remise des prix, organisée en décembre 2023, afin de récompenser les gagnants et de présenter les premiers résultats et la suite des travaux.
Retrouvez les algorithmes lauréats du Data Challenge D-IA-GNO-DENT publiés en Open Source ici.
Découvrez les résultats et les interviews des lauréats à la compétition ici.
-> Plus d’informations sur les résultats de D-IA-GNO-DENT ici.
- L’Allergen Chip Challenge : mené par la Société Française d’Allergologie, ce Data Challenge a eu comme objectif de développer un algorithme capable de prédire la présence ou non d’une maladie allergique et sa sévérité à partir de données immunologiques de près de 3 000 patients. Ce challenge espère voir émerger des solutions innovantes qui pourront améliorer la prise en charge des patients allergiques. Clôturée mi-juillet 2023, la compétition a rassemblée près de 300 participants qui ont soumis plus de 3 000 algorithmes à travers le monde. Une remise des prix a été organisée en novembre 2023, afin de récompenser les lauréats.
Retrouvez les algorithmes lauréats du Data Challenge D-IA-GNO-DENT publiés en Open Source ici.
Porteur de projet ? Organisez votre compétition sur une thématique médicale d’intérêt !
La Délégation ministérielle au Numérique en Santé, le Secrétariat général pour l’investissement, echargé de France 2030, et le Health Data Hub sont à l’origine d’appels à projets (AAP) “Data Challenges en santé” auxquels les acteurs de l’écosystème désireux d’organiser leur propre compétition peuvent candidater. A l’occasion d’une troisième édition, l'initiative est renouvelée à travers un appel à projets du même nom.
L’appel à projets sera ouvert de juillet 2023 à juin 2025. Trois relèves espacées d’environ huit mois seront organisées, la première étant prévue le 29 février 2024. A l’issue de chaque relève, les candidatures seront étudiées par un jury afin d’établir une présélection sur la base de critères prédéfinis.
Déposez votre candidature ici.
Le 11 octobre 2023, le Health Data Hub organisait un webinaire dédié à la présentation de l’AAP et aux modalités de candidature. Le replay du webinaire est disponible suivant ce lien.
Vous pouvez également retrouver toutes les informations sur l’AAP “Data Challenges en santé” sur le lien suivant ou en nous contactant à l’adresse suivante : data.challenge@health-data-hub.fr
Les lauréats bénéficient d’un soutien financier de Bpifrance dans le cadre du programme Grand Défi et d’un accompagnement du Health Data Hub sur les plans organisationnel, logistique et technique.
Les bonnes pratiques pour organiser un Data Challenge en Santé
L’organisation d’un Data Challenge en santé requiert des étapes de cadrage scientifique, méthodologique, financier et règlementaire spécifiques à la réutilisation de données de santé.
Pour mener un projet de ce type de façon conforme, en particulier sur le plan réglementaire, et obtenir des résultats robustes, il est important de s’informer sur les bonnes pratiques à suivre pour organiser un Data Challenge en santé.
Découvrez le MOOC “Data Challenges en santé” pour vous former sur ces bonnes pratiques.
Retrouvez également tous les éléments de bonnes pratiques en téléchargeant notre Kit Data Challenge.
Les publications en lien avec les Data Challenges en santé :