Publication en open data de VisioMel : une base de données anonymisées composée d’images microscopiques de mélanomes et de données cliniques

La base de données VisioMel est désormais disponible en open data. Cette base est issue du data challenge éponyme - porté par la Société Française de Pathologie (SFP), le Groupe de Cancérologie Cutanée (GCC) et le Conseil National Professionnel des Pathologistes (CNPath) - avait pour objectif la prédiction de la récidive à 5 ans des mélanomes diagnostiqués à des stades précoces.
A travers ce challenge, les compétiteurs devaient développer des modèles d’apprentissage automatique capables de prédire la probabilité de récidive de mélanomes dans les cinq ans suivant le diagnostic initial. Pour relever ce défi, ils ont eu accès à une base de données multicentrique inédite, combinant données cliniques et lames d’histopathologie numérisées issues de près de 2 000 patients.
La compétition a rassemblé plus de 600 participants du monde entier ayant produit des algorithmes prometteurs avec des scores de performance allant jusqu’à 80 % de prédictions correctes. Les meilleurs modèles ont été publiés en open source afin de favoriser leur réutilisation et de maximiser leur impact au sein de la communauté scientifique.
Mise en open data de la base de données anonymisées VisioMel
Au-delà du développement et de la publication d’algorithmes d’intelligence artificielle performants, ce data challenge a également permis de soutenir la création d’une base de données anonymisées unique et de grande qualité rassemblant près de 2 000 données cliniques associées aux données d’imagerie collectées dans 40 centres français.
La base de données anonymisées VisioMel rejoint les six autres précédemment mises en ligne. Le Health Data Hub accompagne les porteurs de projet à chaque étape de l’ouverture de leurs ressources : évaluation de l’anonymisation et de l’interopérabilité des données, documentation de la base, choix de la licence de diffusion… mais aussi attribution de DOI, garantissant la traçabilité, la reconnaissance et la citation des ressources ouvertes.
Pour en savoir plus sur l’offre de service du Health Data Hub et sur ses initiatives en faveur de la science, vous pouvez nous contacter à l’adresse opensource@health-data-hub.fr et également visionner le replay d’une intervention dédiée en suivant ce lien.