LOKAN
Partenaires
- Registre général des cancers de Poitou-Charentes
- Registre général des cancers de la Gironde
- Institut National du cancer
Contexte
Les cancers du sein, de la prostate, du côlon-rectum et du poumon figurent parmi les plus fréquents en France. En 2023, ces quatre localisations à elles seules ont représenté près de 221 000 nouveaux cas de cancer en France métropolitaine (Lapotre-Ledoux, 2023).
Disposer de données qualifiées sur les cancers – en termes d’incidence, de localisation et de caractères invasifs (cancers qui se propagent) ou in situ (cancers localisés) – est essentiel pour conduire des études en vie réelle. Or, il n’existe pas d’algorithme unique permettant d’identifier et de qualifier les cas de cancer dans la base principale du SNDS. Les approches actuelles reposent sur des algorithmes multiples, élaborés par des experts pour des études ad hoc, ce qui mobilise beaucoup de temps et complique la standardisation des travaux de recherche.
Objectif du projet
Le projet LOKAN, co-porté par l’Institut National du Cancer (INCa) et les registres des Cancers du Poitou-Charentes et de la Gironde, a pour objectif de développer et valider des algorithmes de ciblage dans la base principale du SNDS permettant d’identifier les cancers incidents (nouveaux cas) du sein, de la prostate, du poumon et du côlon-rectum. Ces algorithmes visent à déterminer, pour chaque cas, la date de diagnostic, ainsi que le caractère invasif ou in situ de la tumeur. Leur construction s’appuie sur l’appariement des données de la base principale du SNDS et avec celles des registres de cancers, utilisés comme référence (gold standard).
Méthodologie et caractère innovant
Ce projet est réalisé sur la Plateforme de Données en Cancérologie de l’INCa, qui comprend la Cohorte Cancer, qui est une extraction de la base principale du SNDS concernant les patients atteints de cancer en France.
Les registres de cancers, qui collectent de manière exhaustive et vérifiée les données des patients sur un territoire donné grâce à une revue complète des dossiers médicaux, constituent la référence (gold standard) en matière de données d’oncologie. Après un appariement des données des registres généraux Poitou-Charentes et Gironde avec la Cohorte Cancer, plusieurs algorithmes seront générés et testés afin d’identifier les plus efficaces à déterminer la localisation, la date de diagnostic, ainsi que le caractère invasif ou in situ des cancers incidents du sein, de la prostate, du côlon-rectum et du poumon.
Les indicateurs de performance (sensibilité, spécificité, etc.) seront calculés en comparant les résultats des algorithmes aux données issues des registres.
Les algorithmes développés et validés dans le cadre de ce projet pourront ensuite être réutilisés dans d’autres études ne disposant pas des données des registres, afin d’accélérer les analyses et d’améliorer la qualification des cancers en vie réelle. L’innovation du projet repose à la fois sur l’exhaustivité et la qualité des données issues des registres de cancers (validées par retour aux dossiers médicaux), et sur la disponibilité des données PMSI en Poitou-Charentes et en Gironde, qui permet un appariement très fiable.
Le projet LOKAN est lauréat de l’appel à manifestation d’intérêt visant à alimenter la Bibliothèque Ouverte d’Algorithmes en Santé (BOAS). Dans ce cadre, les porteurs bénéficient d’un soutien financier et d’un accompagnement dans l’ouverture de leurs résultats.
Résultat / Livrable attendu
À l’issue de ce travail, les porteurs du projet partagerons en open source le programme SAS contenant les algorithmes validés de détermination des localisations, des comportements et des dates diagnostiques des cas incidents des cancers du sein, de la prostate, du côlon-rectum et du poumon, ainsi qu’un rapport explicatif de l’ensemble des étapes de production de ces algorithmes.