Approches statistiques en pharmacoépidémiologie pour la confusion non mesurée : application aux effets indésirables des médicaments pris au cours de la grossesse

Objectif(s) de la recherche et intérêt pour la santé publique

Finalité de l'étude

Surveillance, veille et sécurité sanitaires

Recherche, étude, évaluation

Objectifs poursuivis

Autre

Domaines médicaux investigués

Gynécologie obstétrique

Bénéfices attendus

Dans les études pharmacoépidémiologiques, la confusion induite par des facteurs de risque mesurés pour une association [exposition médicamenteuse, événement d’intérêt (EI)] est généralement prise en compte au moyen de modèles de régression multiple intégrant ces facteurs de risque ou au moyen de scores de propension. Pour les études pharmacoépidémiologiques conduites à partir de bases de données médico-administratives, une difficulté majeure est que très peu d’informations “directes” concernant l’état de santé des individus est disponible ; en particulier des facteurs de risque aussi classiques que le tabagisme ou l’obésité ne sont pas directement accessibles. Les facteurs de risque ou les facteurs de confusion doivent donc être inférés à partir des informations enregistrées dans la base, telles que la délivrance de médicaments, les codes diagnostiques d’hospitalisation, d’actes médicaux, d’examens biologiques ou du statut d’affection longues durée. Cela se fait souvent à partir d’algorithmes établis par des experts afin d’approcher au plus près ces facteurs. Un autre moyen avancé récemment pour tenir compte de ces facteurs de confusion non directement mesurés consiste à cribler de manière automatisée l’ensemble des variables enregistrées dans les bases de données médico-administratives afin de sélectionner des combinaisons de ces dernières pouvant constituer des proxies de ces facteurs. En partant de cette idée, Schneeweiss et al. ont développé une extension du score de propension, le score de propension en grande dimension (high dimensional propensity score, HDPS). A la différence du score de propension classique, l’HDPS consiste à cribler l’ensemble des variables disponibles afin de sélectionner un sous-ensemble de variables apparaissant comme marginalement associées à l’exposition et à l’EI. Capturer une partie de la confusion indirectement mesurée en prenant en compte un très grand ensemble de variables dans la construction d’un score de propension nécessite le développement de stratégies de sélection automatisée de variables, ce qui est l’objet d’HDPS. Cette méthode a constitué le point de départ d’un ensemble de travaux méthodologiques visant à son extension directe ou à la proposition de méthodes alternatives pour la construction de scores de propension en grande dimension. Plus généralement, il existe actuellement plusieurs approches issues du champ de la causalité pouvant s’étendre à la sélection automatisée et à la prise en compte d’un grand nombre de facteurs de confusion potentiels, à savoir la G-computation, le recours à des scores pronostiques en grande dimension ou l’estimateur du maximum de vraisemblance ciblé (targeted maximum likelihood estimator, TMLE), sorte de synthèse entre le score de propension et la G-computation. Enfin, une autre manière d’approcher le problème de la confusion non mesurée est de recourir à l’utilisation de variables instrumentales (VI).

L’objectif général de ce projet est de mettre en œuvre et de comparer les approches citées précédemment dans le cadre général de la pharmacoépidémiologie chez la femme enceinte. Cette comparaison sera conduite à partir d’un ensemble de référence de 42 témoins négatifs (absence d’association entre EI et médicaments) et 13 témoins positifs (association avérée entre EI et médicaments) ayant trait à la prématurité récemment publié dans l’équipe. Nous projetons aussi de comparer ces approches sur des associations ciblées, choisies soit parce qu’elles sont relativement établies, soit parce qu’elles sont discutées dans la littérature. Ainsi, nous nous intéresserons spécifiquement aux inhibiteurs de la recapture de la sérotonine en lien avec la prématurité. Nous avons aussi identifié en concertation avec EPI-PHARE deux associations en lien avec les fausses couches spontanées (FCS) : les anti-inflammatoire non stéroïdien (AINS) or aspirine et les statines. Enfin, nous souhaitons aussi travailler sur deux associations en lien avec les malformations congénitales majeures (MCM) : les inhibiteurs de la pompe à protons (IPP) et l'ondensétron.

Données utilisées

Catégories de données utilisées

Informations relatives aux bénéficiaires de soins et de prestations médico-sociales

Informations relatives aux pathologies des personnes concernées

Autre(s) catégorie(s) de donnée(s) utilisée(s)

Composante(s) de la base principale du SNDS mobilisée(s)

DCIR

PMSI

Variables sensibles utilisées

Année et mois de naissance

Commune de résidence de la personne étudiée

Date de soins (JJ/MM/AAAA)

Date de décès (JJ/MM/AAAA)

Justification du recours à cette(ces) variable(s) sensible(s)

Nous avons besoin de la date de soins précise (jour mois année), de l'âge en année puisque nous évaluons des risques liés à des expositions médicamenteuses au cours de la grossesse.. Pour l’étude des malformations chez les enfants, nous aurons besoin de connaitre l’éventuelle date de décès (en mois année). La commune de résidence ne nous sera utile qu'au travers de la variable FDep

Recours au numéro d'identification des professionnels de santé

Oui

Justification de l'utilisation du numéro d'identification des professionnels de santé

Nous pourrons être amenés à considérer une population plus large que la seule population des femmes enceintes
concernant le volet méthodologique sur les variables instrumentales. En effet, ce volet repose sur
l’établissement d’un indicateur de la préférence de prescription des professionnels de santé
comme variable instrumentale (proportion de prescriptions d’une molécule). Si la seule population
des femmes enceintes s’avère insuffisante pour constituer un instrument suffisamment précis,
nous pensons l’établir sur la population plus large des femmes en âge de procréer constituant la
patientèle des prescripteurs de notre échantillon.

Plateforme utilisée pour l'analyse des données

Portail de la CNAM

Acteurs finançant et participant à l'étude

Responsable(s) de traitement

Type de responsable de traitement 1

INSERM

Responsable de traitement 1

INSERM

101 Rue de Tolbiac 75013 Paris 75013 PARIS France

Représentant du responsable de traitement 1

AHMED Ismaïl

ismail.ahmed@inserm.fr

Le responsable de traitement est également responsable de mise en oeuvre

Oui

Responsable(s) de mise en oeuvre non cités comme responsable de traitement

Responsable de mise en oeuvre non cité comme responsable de traitement 1

INSERM

101 Rue de Tolbiac 75013 Paris 75013 Paris

Calendrier du projet

Date de début : 01/01/2023 – Date de fin : 01/12/2027 Durée de l'étude : 72

Etape 1 : Dépôt du projet

01/01/2023

Base légale pour accéder aux données

Encadrement réglementaire

Accès permanent

Durée de conservation aux fins du projet (en années)

Existence d'une prise de décision automatisée

Non

Fondement juridique

Article 6 du RGPD (Licéité du traitement)

(1)(e) exécution d’une mission d’intérêt public

Article 9 du RGPD (Exception permettant de traiter des données de santé)

(2)(i) intérêt public dans le domaine de la santé publique

Transfert de données personnelles vers un pays hors UE

Non

Délégué à la protection des données

Inserm

101 Rue de Tolbiac 75013 Paris 75013 Paris France