03/02/2025

Publication en open data de TissueNet : une base de données anonymes inédite de biopsies du col de l'utérus

À la une
Partager
TissueNet

La base de données du data challenge TissueNet “détection des lésions du col de l’utérus” est disponible en open data. Cette base a été créée grâce au data challenge lancé en 2020 et porté par la Société Française de Pathologie. Ce dernier avait pour objectif d’optimiser le diagnostic du cancer du col de l’utérus.

 

L’ouverture de la base de données TissueNet marque une étape importante pour la science ouverte en santé, illustrant l’importance des initiatives collaboratives pour faire avancer les connaissances médicales. Il s’agit de la quatrième base de données de santé ouverte par le Health Data Hub.

Le data challenge TissueNet, porté par la Société Française de Pathologie, avait pour ambition de développer des outils basés sur l’intelligence artificielle afin d’améliorer le diagnostic des lésions du col de l’utérus. Ce projet repose sur un corpus unique de près de 5 000 lames histopathologiques numérisées, représentant des biopsies utérines.

Ouverture des résultats et mise en open data de la base de données anonymisées TissueNet

Au-delà du développement et de la publication d’algorithmes d’intelligence artificielle performants en open source, ce data challenge a permis de soutenir la création d’une base de données inédite et de grande qualité. En effet, près de 5 000 images numérisées de biopsies du col de l’utérus ont été collectées puis anonymisées et annotées par des experts. Ainsi, une base de données d’environ 1 000 images a été ouverte. 

La numérisation des lames histologiques à fort grossissement génère des fichiers extrêmement volumineux. Pour répondre à cette contrainte technique, le Health Data Hub a mis en place une infrastructure de stockage adaptée. Cette solution est mise à disposition gratuitement pour les porteurs de projets partenaires souhaitant ouvrir des bases de données anonymisées dépassant 1 Go. 

Les données sont accessibles dès maintenant :

LIEN BASE DE DONNÉES TISSUENET *

 

Pour plus de détails sur l’ouverture de la base de données TissueNet, vous pouvez visionner l’intervention du Pr Philippe Bertheau, médecin pathologiste à l’hôpital Saint-Louis (AP-HP), lors de la journée open science organisée en avril 2024 : 

Ouvrir une base de données en open data dans le domaine de la recherche médicale offre de nombreux bénéfices tant pour l’avancée des connaissances que pour l’amélioration de la santé publique. De plus, cette démarche favorise les collaborations internationales entre équipes scientifiques. En rendant les données accessibles, elle améliore également la reproductibilité des études, ce qui renforce la fiabilité des résultats et promeut une transparence essentielle en science. Enfin, l’ouverture des données stimule l’innovation, en offrant à une grande diversité d’acteurs la possibilité de développer des solutions médicales novatrices et performantes.

 

Accompagner les porteurs de projets dans l’ouverture des données 

L'ouverture des bases de données s'inscrit dans l’offre de services proposée par le Health Data Hub pour aider les porteurs de projets à partager leurs ressources avec la communauté. 

Cet accompagnement s’opère à toutes les étapes, qu’il s’agisse de l’évaluation du caractère anonyme des données et de leur interopérabilité, de la documentation de la base, ou encore, du choix de la licence. Le Health Data Hub propose également l’attribution de DOI au contenu ouvert afin de garantir la parentalité et la citation de la base.

Pour en savoir plus sur l’offre de services : opensource@health-data-hub.fr. Le replay d’une intervention dédiée est également disponible en suivant ce lien.

31/01/2025

Séminaire de la cordée de la réussi…

À la une
Citoyen
30/01/2025

Panorama de solutions de valorisati…

À la une
Partenaires