Apprentissage machine pour prédire la probabilité et le délai de guérison : une étude de cohorte basée sur les patients du registre de cancérologie Poitou-Charentes.
Objectif(s) de la recherche et intérêt pour la santé publique
Finalité de l'étude
Objectifs poursuivis
Domaines médicaux investigués
Bénéfices attendus
Individualiser la prédiction de la proportion et du délai de guérison est essentiel pour répondre aux attentes d’information des patients. La guérison ne correspondant pas à un événement observé de santé, informer le patient du temps à partir duquel il peut être considéré comme guéri est donc central pour aider à formaliser son retour à une vie sociale normalisée.
L’objectif du projet est de prédire la proportion de patients guéris et le délai de guérison après un cancer du poumon en fonction des caractéristiques des patients et de leur pathologie. Nous souhaitons proposer une approche originale basée sur l’apprentissage machine et utiliser l’opportunité des données d’une cohorte enrichie issue du registre des cancers de Poitou-Charentes.
Les données seront issues du registre des cancers de Poitou-Charentes (RGCPC). Le RGCPC est une structure de santé publique et de recherche du CHU de Poitiers, qui collecte de façon exhaustive et continue tout nouveau cas de cancer survenu chez les personnes résidant dans l’un des quatre départements de l’ex-région Poitou-Charentes.
Nous étudierons les patients avec un cancer du poumon issus du registre des cancers de Poitou-Charentes et ayant un diagnostic sur la période 2008-19. Il s’agit d’une cohorte enrichie des variables pronostiques telles que le stade d’extension au diagnostic, le type histologique et le profil moléculaire de la tumeur, le type de traitement, ou les caractéristiques sociodémographiques des patients. La cohorte est composée de 16 951 patients sur la période 2008-1019. Le suivi médian est de 9,7 mois (étendue de 0 à 16,8 ans). On compte 14 995 décès dans cet échantillon.
Données utilisées
Catégories de données utilisées
Source de données utilisées
Autre(s) source(s) de donnée(s) mobilisée(s)
Appariement entre les sources de données mobilisées
Variables sensibles utilisées
Justification du recours à cette(ces) variable(s) sensible(s)
Uniquement l'année de naissance sera utilisée. Pour la date de décès : uniquement les temps entre le diagnostic et le décès (pas de date).
Nous souhaitons soustraire la mortalité attendue en population générale des patients de même âge, année de naissance et sexe à la mortalité observée après le diagnostic d’un cancer du poumon. Ainsi, nous pourrons identifier le temps post-diagnostique à partir duquel un patient peut être considéré comme guéri : une différence négligeable. Ces analyses nécessitent l’année de naissance, le sexe, l’année du diagnostic, et le temps entre le diagnostic et le décès.
Recours au numéro d'identification des professionnels de santé
Plateforme utilisée pour l'analyse des données
Acteurs finançant et participant à l'étude
Responsable(s) de traitement
Type de responsable de traitement 1
Responsable de traitement 1
Localisation du responsable de traitement 1
Représentant du responsable de traitement 1
Calendrier du projet
Base légale pour accéder aux données
Encadrement réglementaire
Durée de conservation aux fins du projet (en années)
5
Existence d'une prise de décision automatisée
Fondement juridique
Article 6 du RGPD (Licéité du traitement)
Article 9 du RGPD (Exception permettant de traiter des données de santé)
Transfert de données personnelles vers un pays hors UE
Droits des personnes
Les patients sont informés individuellement que leurs cancers peuvent être enregistrés dans la base de données du registre via les dispositions suivantes :
- De façon orale par le médecin spécialiste (Conformément à l’article L1111-2 du Code de la santé publique et de l’article 69 de la loi n°78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés ; seul le médecin, responsable de la prise en charge thérapeutique et en contact direct avec le patient, est en mesure de procéder, au moment qu’il estimera le plus opportun et en conscience à cette information) ;
- De façon écrite : à partir d’une note d’information que le Registre fournit à ses partenaires / aux établissements de soins. A travers les conventions de transfert de données à caractère personnel concernant la santé, le Registre sollicite ses partenaires pour informer les patients, dans la mesure du possible, en diffusant cette notice d’information et en rappelant aux professionnels de santé concernés la nécessité de cette information individuelle.
La note d’information est disponible en ligne sur le site internet du Registre (https://www.registre-cancers-poitou-charentes.fr/confidentialite_1067.h…). La finalité à visée de recherche est clairement stipulée.
De ce fait, dans le respect du cadre défini par la MR-004, l’information individuelle de l’utilisation des données du patient à visée de recherche est considérée comme actée par la note d’information générale portant sur le Registre. Une information complémentaire collective sera réalisée via le portail de transparence du Registre et/ou du CHU de Poitiers.