05/12/2023

Les Mardis de la donnée de santé : la démarche d’open data

À la une
Citoyen
Partager
Header

Les webinaires "Les Mardis de la donnée de santé" ont lieu tous les premiers mardis de chaque mois avec les experts du Health Data Hub, de la CNAM, de la CNIL, de la DREES et de France Assos Santé. Le webinaire du 21 novembre a permis d’expliquer la démarche d’open data : l’anonymisation d’une base de données de santé.

 

D’abord, pseudonymiser une base de données pour mener une étude sur un ensemble de patients… 

Lorsqu’un patient se présente pour passer un examen à l’hôpital, y compris aux urgences, toutes les informations concernant ce soin sont enregistrées dans la base de données interne de l’hôpital par les soignants pour réaliser le suivi des patients. L’ensemble de ces enregistrements constitue le dossier médical du patient au sein de l’hôpital. Les données nominatives sont accessibles uniquement par le personnel soignant autorisé. Un médecin de l’hôpital peut accéder aux données de ses patients dans leurs dossiers médicaux et peut faire des statistiques, mais son analyse est limitée à ses seuls patients.

Dans le cadre d’un projet interne à l’hôpital, sur les données des patients, une équipe mêlant différentes compétences et services de l’hôpital peut se constituer pour créer une base de données d’étude. Elle doit d’abord prendre le soin de créer une base de données pseudonymisée : c’est le premier niveau de protection de l’identité des patients car sont retirées toutes les informations directement identifiantes (ex : nom, prénom, adresse, numéro de sécurité sociale, IPP, etc.). 

 

Puis, mettre cette base - une partie - en accès libre pour la partager à d’autres… 

Cette base peut se partager à d’autres. Mais dans ce cas, elle doit d’abord être anonymisée ; et une vérification de cette anonymisation doit être réalisée. Une base de données anonyme ne permet pas en pratique de retrouver l’identité d’un individu. Pour réaliser cette anonymisation, certaines données vont donc être supprimées (nom, numéro de sécurité sociale, etc.), et d’autres vont être “généralisées” (la date de naissance limitée sera à l’année par exemple). 

Pour vérifier cette anonymisation, des principes clairs doivent être respectés : aucune donnée ne doit permettre d’isoler une personne précisément dans la base de données (non-individualisation) ; la base de données ne doit pas pouvoir être reliée à d’autres données existantes pour identifier des individus ; il ne doit pas être possible de déduire de façon quasi certaine de nouvelles informations sur un individu. Une fois anonymisées, les données peuvent ensuite être utilisées par tout chercheur ou toute personne souhaitant les utiliser, et ce quel que soit l’usage qu’il souhaite en faire. 

 

Des sites proposent déjà des bases de données en accès libre ! 

Il existe en France des bases de données publiques, ainsi que des analyses produites par divers acteurs de la santé publique en accès libre pour tous (data.gouv.fr, data.ameli, Data.Drees…). Le Health Data Hub s’inscrit d’ores et déjà dans cette dynamique d’ouverture en proposant de nombreuses ressources en ligne en accès libre telles que le starter kit, la documentation collaborative au SNDS ou encore des sessions d’information et réunions en ligne.

Vous avez entendu parler du projet inter-associatif VivreCovid19 ? Pour découvrir comment des associations ont mis en place un projet de création de base de données, rendez-vous le 12 décembre à 12h pour le dernier webinaire du programme SNDS.

 

Inscription

 

Le replay du webinaire sur la démarche open data est disponible ici

30/11/2023

Comité stratégique des données de s…

À la une
29/11/2023

Comité stratégique des données de s…

À la une