09/08/2023

Data Challenge VisioMel : témoignage des lauréats et premiers résultats

À la une
Appel à projet
Partager
DC

Le Data Challenge VisioMel, axé sur le mélanome et porté par la Société Française de Pathologie, la Société Française de Dermatologie, le Groupe de Cancérologie Cutanée et le Conseil National Professionnel des Pathologistes fait partie des projets Data Challenge retenus par l’appel à manifestation d’intérêt lancé au printemps 2021 par le HDH. Après plusieurs mois d’organisation et sept semaines de compétition intense, le Data Challenge VisioMel s’est clôturé en mai 2023. Découvrez les lauréats de cette compétition et leur approche de la problématique.

 

Des résultats encourageants obtenus à l’occasion du Data Challenge VisioMel et des perspectives d’études secondaires 

L’objectif du Data Challenge VisioMel était de prédire, à l’aide d’images numériques de lames histologiques de mélanome et de variables cliniques, la récidive à cinq ans des patients atteints de mélanome. Les compétiteurs devaient prédire une probabilité de rechute (entre 0 et 1) pour chaque patient. La compétition s’est déroulée du 23 mars au 11 mai 2023 et a attiré un total de 541 participants qui ont soumis 637 algorithmes. 

Une première analyse des prédictions calculées par les algorithmes les plus performants a été réalisée à travers la métrique de l’aire sous la courbe ROC (ROC-AUC). Cette métrique permet de mesurer à quel point les modèles séparent efficacement les cas de rechute des autres cas. Les résultats de ces trois modèles sont très proches avec une valeur d’AUC supérieure à 0.80.

ROC curve VisioMel

De même, pour ces trois modèles, une matrice de confusion a été calculée (détaillant les proportions de vrais/faux positifs et de vrais/faux négatifs). Cette matrice permet par la suite de calculer d’autres métriques comme la sensibilité, la spécificité, etc. 

Matrice de confusion des proportions (%) de vrais ou faux positifs et négatifs :

Matrice de confusion VisioMel

En moyenne, les algorithmes des lauréats ont correctement détecté 73 % des cas de rechutes et 75 % des cas “sans rechute”. 

Ces premières analyses ont de plus permis de mettre en évidence que les prédictions correctes des évènements de rechute sont plus importantes chez les patients présentant  une ulcération de l’épiderme ainsi qu’un Breslow épais. 

Des analyses supplémentaires sont actuellement en cours pour déterminer si les algorithmes se révèlent performants dans certaines catégories diagnostiques spécifiques. 

 

Rencontrez les lauréats à la compétition !

  1. Raphael Kiminya 

Data scientist indépendant originaire du Kenya, Raphael Kiminya a participé en 2020 au Data Challenge portant sur les lésions cancéreuses et précancéreuses du col de l’utérus. Son approche consiste à pré-entraîner un réseau de neurones convolutif (CNN) avec des cibles spécifiques, puis à l’affiner pour prédire les rechutes. Il a notamment utilisé l’apprentissage multi-instances (MIL) pour classifier les images de lames entières. 

  1. Lucas Robinet et Ziad Kheil 

Lucas Robinet est étudiant en première année de doctorat et travaille sur l’utilisation de l’apprentissage profond multimodal pour le traitement personnalisé du glioblastome, Ziad Kheil est également en première année de doctorat et développe de l’apprentissage profond sur des images médicales. Pour répondre à la problématique, ils ont utilisé un modèle de réseau de neurones convolutif appelé ResNet. 

  1. Marvin Lerousseau et Grégoire Gessain 

Marvin Lerousseau, chercheur à Mines Paris et à l’Institut Curie, et Grégoire Gessain, pathologiste interne, ont été classés troisième avec des résultats prometteurs et une approche intéressante. 

Les Data Challenges en santé s’inscrivent dans une démarche d’open source et d’open data. En refusant de partager leurs algorithmes, les compétiteurs n’ont pas reçu le prix, un quatrième lauréat a donc été désigné.

  1. Tristan Lazard

Tristan Lazard termine son doctorat en pathologie computationnelle à Mines Paristech et à l’Institut Curie. Il a utilisé une approche en deux temps : une phase d’apprentissage autosupervisé, avec un réseau de neurones non conscient de l’espace (“spatially unaware”), puis une phase d’apprentissage spécifique à la tâche du challenge avec un modèle d’apprentissage automatique conventionnel.

 

Découvrez le portrait des lauréats ainsi que leur approche pour résoudre la problématique ! 

Vidéo Grégoire Gressain et Marvin Lerousseau

Vidéo Lucas Robinet et Zias Kheil

Le Health Data Hub félicite tous les participants ainsi que les gagnants. En partenariat avec la Délégation ministérielle au numérique en santé et BpiFrance, il remercie également le consortium VisioMel pour son implication dans l’initiative Data Challenges en santé et pour sa contribution à l’émergence de solutions innovantes en open source.

01/08/2023

Relance de l’appel à projets Data C…

À la une
Appel à projet
25/07/2023

Ouverture des inscriptions 2024 au …

À la une