Le Health Data Hub lauréat d’un second appel à projet EHDEN
Le Health Data Hub est lauréat pour la seconde fois d’un appel à projet du consortium européen EHDEN, ayant pour objectif de transformer les données du SNDS dans le modèle de données commun OMOP afin de faciliter son utilisation pour des projets de recherche.
La France est dotée de l’une des bases de données médico-administratives les plus complètes du monde, liées aux remboursements des actes et des soins des bénéficiaires de l’ensemble des régimes d’assurance maladie obligatoire (Système National des Données de Santé, SNDS). Chaque porteur de projet doit fournir un investissement conséquent afin de comprendre les données, leurs organisations, biais et limites. L’utilisation du SNDS pour des projets de recherche est aujourd’hui réservée à un petit nombre d’experts, et mener des projets à l’échelle européenne reste un véritable défi. Pour repousser ces limites, un axe de travail repose sur la standardisation des données et l’utilisation de modèles de données communs, favorisant l’interopérabilité et ainsi le partage et la réutilisation de programmes. Plusieurs initiatives sont menées en ce sens, notamment par le consortium EHDEN (European Health Data & Evidence Network) qui, via des appels à projet, soutient au niveau européen la transformation de données de santé vers le modèle OMOP-CDM (Observational medical outcomes partnership - Common Data Model). D’autres projets européens, tels que TEHDAS et l’EHDS auxquels le HDH participe, étudient plus largement la nécessité et les modalités d'utilisation de modèles de données communs.
En décembre 2021, le HDH est lauréat pour la seconde fois d’un appel à projet EHDEN, avec l’objectif d’aligner les données du SNDS sur le modèle de données OMOP-CDM. Ce format de données, contenant 14 tables principales, est centré sur la table Patient et permet de reconstruire très facilement les parcours de soin. Depuis 2020, une dizaine de collaborateurs du HDH sont chargés de mettre au format international OMOP-CDM les données sur la Covid-19 présentes dans le SNDS sur une sélection de 62 tables pour les années 2019/2020. La transformation du SNDS historique vers le format OMOP comporte deux volets. Le premier concerne un alignement des schémas de données ; des groupes de travail sur l’OMOP-isation des bases de données de santé françaises sont menés en ce sens avec l’AP-HP, et Bordeaux-BPE afin d’harmoniser les règles de transformation à l’échelle nationale. Le second volet concerne les alignements des nomenclatures et vocabulaires utilisés ; des travaux d’alignement des plus de 70 000 concepts utilisés dans le SNDS vers des terminologies standard sont en cours.
Le nouvel appel à projet EHDEN dont le HDH est lauréat permettra de continuer les travaux de transformation et d’étendre le périmètre à l’ensemble des bénéficiaires, l’ensemble des 180 tables du SNDS, et les années antérieures à 2019.
Des travaux dans la lignée de la démarche science ouverte du HDH
Ces travaux de standardisation s’inscrivent plus largement dans la démarche science ouverte / open source menée depuis 2019 par le HDH. Cette démarche a pour objectif, dans le respect de la sécurité et de la confidentialité des données, de faciliter et accélérer les projets de recherche en mutualisant les efforts et connaissances. La démarche open source et science ouverte est centrée autour d’un outil, la documentation ouverte collaborative, et est une initiative commune entre le Health Data Hub et ses partenaires (Drees, Santé publique France, CNAM, ANSM, ARS, ATIH, ReDSiam etc.). Cette dernière propose notamment des notebooks pour se former au SNDS, un générateur de données de synthèse, de nombreuses fiches thématiques regroupant les spécificités du SNDS, une section open data listant toutes les ressources accessibles sur le thème des données de santé, ainsi que des programmes utilisés par les data scientist et staticiens (initiative soutenue par l’AMI BOAS). Un dictionnaire interactif permettant de visualiser sous la forme de graph le schéma de donnée, ainsi qu’un forum d’entraide viennent compléter la documentation. Ces outils, comptabilisant plus de 500 vues/ jours et dont les codes sources sont en open source, sont alimentés par le Health Data Hub et ses partenaires mais également par les utilisateurs. Les outils et la démarche sont régulièrement présentés à la communauté Meetup rassemblant plus de 1600 membres début 2022. Ces événements attirent chacun plus de 130 personnes en moyenne, et les présentations peuvent être visualisées ultérieurement sur la chaîne youtube du HDH.