Etude des marqueurs de risque de survenue d’une mort subite
Objectif(s) de la recherche et intérêt pour la santé publique
Finalité de l'étude
Objectifs poursuivis
Domaines médicaux investigués
Bénéfices attendus
Cette étude vise à mettre en évidence les facteurs de risque de survenue d’une MS en population générale, afin de permettre une meilleure prévention médicamenteuse et non médicamenteuse d’une pathologie dont le traitement post évènement reste très difficile.
Cet algorithme, n’impliquant qu’un traitement informatique de données préexistante est peu couteux et transparent pour les patients et les professionnels de santé et permettra à terme de faciliter la détection et la prise en charge des patients à risque sans générer de couts ni examens supplémentaires.
Trois populations constituent l’étude :
o Comme cas, les patients issus du registre exhaustif de la mort subite du CEMS (sujets majeurs victimes de mort subite de Paris et sa petite couronne, avec des contrôles qualités fréquents permettent d'évaluer l'exhaustivité à 99 % des cas) constituant une cohorte prospective des MS de mai 2011 à aout 2024 de l’aire géographique concernée. Cette cohorte sera appariée au SNDS afin d’obtenir les antériorités des patients. Il n’y a pas de critère d’exclusion en dehors de la minorité civile.
o Comme témoins, l’ensemble des résidents de cette même zone géographique en aout 2024, sans critère d’exclusion en dehors de la minorité civile et la mort subite (définie comme appartenant au groupe des cas), constituant une cohorte transversale.
o Comme témoins décédés, les habitants décédés de cette même zone géographique, majeurs au moment du décès et en excluant les MS, sur la même période (mai 2011 à aout 2024), constituant une cohorte rétrospective longitudinale qui servira aux études de sensibilité.
Pour toutes ces populations : De mai 2011 à aout 2024 (ciblage) et de mai 2006 à aout 2024 (inclusion)
L’algorithme sera dans un premier temps un CatBoost entrainé dans une tache de classification sur les cohortes des cas et des témoins avec une cross validation. Dans un second temps, Dans un second temps, un modèle concurrent basé sur G-BERT sera utilisé. Les performances des algorithmes seront évaluées avec des indicateurs de performances habituels (AUC, F1-score, sensibilité et spécificité pour chaque classe).
L’analyse de l’importance des marqueurs de risque sera effectuée à l’aide des SHAP values et comparée aux données issues de la bibliographie mais aussi des autre méthodes d’appréciation de l’importance des variables propres à chaque modèle.
Les analyses de sensibilité seront constituées de comparaison avec des modèles habituels (régression logistique), une analyse de la capacité du modèle à différencier mort subite et mort autres causes, ainsi qu’une comparaison avec un modèle entrainé uniquement sur un set de variables cardiovasculaires prédéfinies. La calibration du modèle sera vérifiée visuellement.
Données utilisées
Catégories de données utilisées
Autre(s) catégorie(s) de donnée(s) utilisée(s)
Aucune
Source de données utilisées
Composante(s) de la base principale du SNDS mobilisée(s)
Autre(s) source(s) de donnée(s) mobilisée(s)
Appariement entre les sources de données mobilisées
Source(s) de données appariées
Le registre de la mort subite du CEMS
Le Centre d’Expertise Mort subite collige depuis mai 2011 l’ensemble des cas de morts subites survenus dans une zone géographique donnée (Paris et les 3 départements adjacents, Hauts de Seine, Seine-Saint-Denis, Val de Marne), qui représente au total un bassin de population de 4.5 millions d’habitants. Cette collection a été, rendue possible par une collaboration étagée entre les services de secours préhospitaliers (Brigade des Sapeurs-pompiers de Paris, SAMU), hospitaliers (services de réanimation et de cardiologie) et l’Institut Médico-Légal de Paris. Pour l’ensemble des cas inclus, les informations relatives à la survenue de l’événement (critères Utstein), à la prise en charge (pré et intra hospitalière) et au devenir des patients (en termes de survie et de pronostic neurologique) sont recueillies prospectivement, avec des sources multiples et des contrôles qualités fréquents (permettant d’évaluer l’exhaustivité à 99% des cas dans la zone d’intérêt). Cette collection a d’ores et déjà fait l’objet d’un avis favorable du CCTIRS (dossier N12.336) et d’une autorisation de la CNIL (décision DR-2012-445). Ce registre a fait l’objet de plusieurs publications internationales.
Type d'appariement
Variables sensibles utilisées
Justification du recours à cette(ces) variable(s) sensible(s)
Les données suivantes sont nécessaires pour l'appariement indirect :
- Sexe
- Date de Naissance : mois, année (jour non disponible dans le SNDS)
- Date de décès : jours, mois, année (pour les patients décédés)
- Commune du décès
- Hôpital destinataire le jour de l’arrêt cardiaque (code FINESS géographique)
- Si sorti vivant, date de sortie : jour, mois, année
- Si décédé, date du décès : jour, mois, année
- En cas de doute entre deux patients décédés et qui ne pourraient pas être départagés selon les règles précédentes, la table KI_CCI_R des causes de décès permet de savoir s’il s’agit d’une mort subite. Cette variable n’étant pas toujours fiable (de nombreux cas de mort subite ne sont pas classés comme tel), elle ne pourra être utile que pour départager des patients dans le cas où l’un des patients serait classé comme mort subite sans que les autres le soient.
Les données de dates de soins et de décès sont directement nécessaires a l'entrainement du modèle et à la prédiction de l'évènement d'intérêt (arrêt cardiaque).
Recours au numéro d'identification des professionnels de santé
Plateforme utilisée pour l'analyse des données
Acteurs finançant et participant à l'étude
Responsable(s) de traitement
Type de responsable de traitement 1
Responsable de traitement 1
Localisation du responsable de traitement 1
Représentant du responsable de traitement 1
Responsable(s) de mise en oeuvre non cités comme responsable de traitement
Responsable de mise en oeuvre non cité comme responsable de traitement 1
Calendrier du projet
Base légale pour accéder aux données
Encadrement réglementaire
Durée de conservation aux fins du projet (en années)
3
Existence d'une prise de décision automatisée
Fondement juridique
Article 6 du RGPD (Licéité du traitement)
Article 9 du RGPD (Exception permettant de traiter des données de santé)
Transfert de données personnelles vers un pays hors UE
Droits des personnes
L’application des droits prévus aux articles 15 à 20 du RGPD (droit d’accès, de rectification, d’effacement, de limitation, d’opposition et à la portabilité) s’exerce donc.
Les personnes concernées peuvent exercer leurs droits auprès de ces responsables de traitement, selon les modalités prévues par leurs procédures internes. Ces droits sont mentionnés dans la note d'information ou dans les supports de communication associés au projet (décrites dans l'AIPD, conformément aux obligations d'information prévues à l’article 14 du RGPD.