APRIORICS - Apprentissage Profond Renforcé pour l’ImmunohistOchimie pour la Requalification d’Images de Cancers du Sein

Partager

Identification de la base

Référence catalogue du SNDS

Non attribuée à date

Responsable scientifique

Camille Franchet
Camille Franchet

Valorisation scientifique

Référence à utiliser pour la citation de la base dans les publications scientifiques

Pas de DOI (digital object identifier) à date 

Remerciement

Si un article scientifique utilisant les données de la base APRIORICS via le catalogue de données du Système National des Données de Santé (SNDS) était publié par un porteur de projet (autre que le responsable des données), la formulation des remerciements serait : “This paper has benefited from the APRIORICS database.”.

Règles de signature du Responsable de Données pour un article scientifique utilisant les données

En cas de collaboration scientifique l’International Committee of Medical Journal Editors recommande que la règle générale pour être signataire d’une publication suive quatre critères cumulatifs stricts :

  • contribution substantielle dans la conception ou le design de l’étude ; ou l’acquisition, l’analyse, ou l’interprétation des données de l’étude ;
  • écriture du travail ou relecture du travail de manière approfondie pour ses conclusions et interprétations ;
  • approbation finale de la version soumise pour publication ; 
  • acceptation d’être responsable de tous les aspects du travail en s’étant assuré que toutes les questions relatives à la véracité et l’intégrité de toutes les parties du travail ont été investiguées et résolues.

En l’absence de collaboration scientifique entre le responsable des données et un porteur de projet, les règles de signatures sont les suivantes : 

  • pour les publications qui entrent dans le périmètre de journaux du CHU de Toulouse : la signature peut se faire de façon nominative dans la limite de deux auteurs (Dr Camille Franchet et Robin Schwob) ;
  • pour les publications en dehors du périmètre de journaux du CHU de Toulouse : la signature se fait via un nom collectif : ‘the APRIORICS project” 

Le périmètre de journaux défini par le CHU de Toulouse est le suivant : revues de cancérologie, pathologie, imagerie, analyse d’images.

Caractéristiques des données

Objectif initial de la base

L’objectif est d’injecter aux algorithmes d’analyse d’images histologiques des connaissances biologiques a priori permettant de développer des outils d’intelligence artificielle fiables, reproductibles et généralisables. Notre modèle portera sur le cancer du sein, l’un de nos domaines de prédilection et enjeu majeur de santé publique, mais se veut généralisable à tout type de pathologie faisant intervenir une analyse histologique.

1) Création des neuf datasets annotés par immunohistochimie

  • Réalisation et numérisation de 9000 lames pseudonymisées, avec une coloration l'hématoxyline et à l'éosine (H&E)
  • Réalisation et numérisation des IHC (immunohistochimie) sur les mêmes lames, extraction de patches
  • Déconvolution des images (IHC), traitement des images / masques (annotations)

A la fin de cette étape, seront générés plusieurs millions de patches H&E avec annotation sous forme d’un masque (annotation) correspondant à une structure biologique d’intérêt.
 

2) Entraînement d’algorithmes de segmentation pour chaque structure biologique (infrastructure HDH, GPU)

  • Réseaux de type U-Net / Mask-RCNN / deep watershed. Prédiction des masques (annotations) à partir des patches H&E.
     

3) Création d’une interface homme-machine sous forme d’une application modulaire utilisant une API REST et un framework Vue.JS pour l’interface utilisateur, qui permettra de fournir un descripteur intelligible de la morphologie tumorale à partir d’une WSI (whole slide image) :

  • en détaillant les caractéristiques de chacun des composants de la tumeur
  • en détaillant leurs situations respectives dans la tumeur (statistiques spatiales).

Domaine médical

Cancérologie
Gynécologie obstétrique

Population d'intérêt

Patients atteints de cancer du sein (stade précoce, chirurgie première et chirurgie après chimiothérapie néoadjuvante)

Effectif cible

1263 patients

Géographie

Patients ayant consulté à l’Institut Universitaire du Cancer de Toulouse - Oncopole (IUCT-O)

Profondeur historique

De 2018 à 2021

Mise à jour

La collecte des données est terminée, les données ne sont pas actualisées après 2021.

La cohorte est figée et une collecte rétrospective des données est encore en cours pour les personnes incluses.

Catégories des données

Informations relatives aux conditions sociales, environnementales, aux habitudes de vie et au contexte socio-économique des personnes concernées

Source(s) de données/Origine

Dossiers médicaux

Périmètre des données

Les données sont donc organisées de la façon suivante :

  1. lames virtuelles appariées en coloration standard et en immunohistochimie disponibles à la date de transfert sur la plateforme technologique du HDH
  2. documentation associée aux lames virtuelles (convention de nommage) en lien vers le GitHub du projet APRIORICS
  3. Table comprenant 4 colonnes : identifiant du cas, grade selon Elston et Ellis, item architecture (stade 1 à 3), item atypies nucléaires (score 1 à 3), index mitotique (score 1 à 3)

Nature des données

Les données de la base APRIORICS sont de 2 types :   

  • Données cliniques 
  • Données d'imagerie (lames virtuelles)

Appariement avec le NIR

Le NIR (Numéro d’Inscription au Répertoire, ou encore numéro de sécurité sociale) peut être utilisé pour apparier deux bases de données entre elles.

La base de données APRIORICS ne contient pas le NIR et n’a pas vocation à être appariée avec la base principale du SNDS pour le moment.

Le CHU de Toulouse n’a aujourd’hui pas d’objectif d’appariement de cette base avec le SNDS. Cela pourrait avoir un intérêt pour d’autres besoins/acteurs, mais la faisabilité de cet appariement n’a cependant pas été prouvée à ce stade.

Documentation de la base

Programmes facilitant l'exploitation des données

Qualité

Processus de collecte

La collecte des données est rétrospective et faite à partir des dossiers médicaux des patients. Elle a été effectuée par le Docteur Camille Franchet dans le cadre du projet APRIORICS.

Contexte de saisie le cas échéant

Les informations ont été collectées dans le cadre des consultations et dans les comptes-rendus d’anatomo-pathologie.

Processus qualité

Collecte rétrospective à partir des dossiers médicaux contrôlés par le département d’information médicale (DIM) du CHU de Toulouse.

Délégué à la protection des données (DPD)

Délégué à la protection des données du CHU de Toulouse

Hôtel Dieu
2 rue Viguerie - TSA 80035
3059 TOULOUSE Cedex 9

CHU de Toulouse

DPO@chu-toulouse.fr

Réglementaire

Encadrement réglementaire de la base

Déclaration de conformité selon la méthodologie de référence MR-004 pour les recherches n’impliquant pas la personne humaine, études et évaluation dans le domaine de la santé (N° d’enregistrement : 2206723)

Durée de conservation des données

La durée de conservation des données dans le cadre du projet pilote est de 2 ans.

La durée de conservation des données de la base APRIORICS dans le cadre du catalogue du SNDS est alignée à celle des données du SNDS, c'est-à-dire une durée de 19 ans en plus de l’année en cours.

Modalités d’information des personnes concernées

Information individuelle :

  • Information des patients via une note d’information envoyée par courrier ;
  • non opposition du patient.

Information collective :

  • livret d’accueil du CHU de Toulouse
  • une information est prévue sur le site internet du CHU de Toulouse

Exercer ses droits

Pour exercer ces droits, vous pouvez contacter le délégué à la protection des données du CHU de Toulouse.