Les Mardis de la donnée de santé : chaîner une base de données avec le SNDS
Le SNDS, comme patrimoine collectif de données de santé. Que contient-il ?
Le SNDS contient les données associées à chaque remboursement de l’Assurance Maladie : consultation, délivrance de médicament, biologie, imagerie, hospitalisation, etc. Il contient donc des informations de santé sur l’ensemble des Français. Toutefois, il ne contient pas le “résultat” de biologie suite à une prise de sang, les données sur le mode de vie des personnes comme le tabagisme, la consommation d’alcool, ni les diagnostics effectués par un médecin généraliste ou spécialiste, en ville. Il représente tout de même un énorme patrimoine collectif à disposition de la recherche et de l’innovation.
Existe-t-il d’autres bases de données ? Peuvent-elles être utilisées pour la recherche ?
Des bases de données sont conçues par des équipes de recherche pour être partagées avec d’autres équipes en cas de besoin. Via le site dédié de la base concernée, il est parfois possible de télécharger un jeu de données anonyme de la base, mis en accès libre : c’est une version qui ne permet pas de remonter aux individus qui la composent. Plutôt que de repartir de zéro et constituer sa propre base de données, une équipe de recherche peut donc regarder si des données anonymes d’une base existante sont accessibles. Toutefois, si ces bases sont utiles pour la recherche en santé, le contenu de chaque base est limité.
Comment compléter une base de données existante avec les données du SNDS ?
Il faut pour cela procéder à un “appariement de données”, c'est-à-dire enrichir une base de données avec des informations complémentaires issues d’une (ou plusieurs) autre(s) base(s) en les reliant entre elles. Il peut être direct ou indirect. Pour l’appariement direct, les données des bases sont reliées directement lorsqu’un patient d’une des bases peut être directement relié à un patient du SNDS grâce au numéro de sécurité sociale ou aux éléments permettant de le reconstruire. Pour l’appariement indirect, la base de données et le SNDS n’ont pas d’identifiant unique commun mais peuvent être reliés en rassemblant un ensemble d‘informations communes dont la combinaison est suffisamment précise pour retrouver le patient de la base dans le SNDS. Par exemple, en connaissant le sexe du patient, son année de naissance, sa commune de résidence et sa date d’hospitalisation, il est possible de le retrouver. Toutefois, seuls des experts autorisés sont habilités à le faire.
Et le cadre légal dans tout ça ?
Un projet d’utilisation de données est régi par un cadre réglementaire strict qui dépend de l’origine, du moment et du moyen de collecte des données, ainsi que de la finalité du projet. Les projets utilisant des bases de données de santé déjà existantes sont des études de type “recherche n’impliquant pas la personne humaine”, qui doivent être validées sur les plans scientifique, méthodologique et éthique par un comité éthique et scientifique national (CESREES). Ils doivent ensuite obtenir une autorisation réglementaire de conformité par la CNIL, une autorité indépendante de protection des données personnelles.
Inscrivez-vous au prochain webinaire du 3 octobre, à 12h, pour découvrir l’exemple d’Hydro, un projet d’intelligence artificielle qui a eu recours aux données du SNDS.
Le replay du webinaire sur les chaînages de données est disponible ici.