N° 25854090

POPGEN : Diversité génomique de la population française Volet rétrospectif : analyse comparative des données génétiques générées dans le cadre de la recherche POPGEN avec les panels de données génétiques de référence

Partager

Objectif(s) de la recherche et intérêt pour la santé publique

Finalité de l'étude

Recherche, étude, évaluation

Objectifs poursuivis

Compréhension des maladies

Domaines médicaux investigués

Biologie

Bénéfices attendus

Les données sont traitées dans le cadre du projet de recherche POPGEN intitulé « Diversité génomique de la population française ».
Le projet POPGEN est un des quatre projets pilotes du Plan France Médecine Génomique 2025 (PFMG2025) soutenu par l'Etat. Ce plan vise à intégrer le séquençage du génome dans le parcours de soin pour permettre à un nombre important de patients de bénéficier d’une prise en charge personnalisée et de développer une filière nationale de la médecine génomique capable d’être un levier d’innovation et de croissance économique. L'ambition est de doter le pays d'une organisation nationale visant à positionner la France parmi les grands pays engagés dans la médecine génomique.
L’une des mesures du PFMG2025 consiste à mettre en place des projets pilotes afin de « tester in situ la fonctionnalité et la cohérence du parcours de soin incluant la mise en œuvre du séquençage à haut débit avec des cohortes de patients appropriées ».
Quatre projets pilotes ont ainsi été mis en place, trois projets pilotes portant sur des pathologies (cancer, déficience intellectuelle et diabète atypique) et un projet pilote en population générale destiné à établir une base de référence sur la population française, préalable indispensable pour exploiter l’information génétique apportée par le séquençage. C'est l'objet de la présente demande d’avis et d'autorisation.

Le projet pilote POPGEN est une recherche hors produit de santé visant à constituer un catalogue des variations génétiques de la population générale en France métropolitaine, avec leurs fréquences régionales. Cette base de référence, inexistante à ce jour, est essentielle pour interpréter les génomes de patients et distinguer les variations pathogènes des variantes fréquentes et bénignes. Les participants sont sélectionnés dans la cohorte Constances, en privilégiant ceux dont les ascendants sont nés dans un rayon < 100 km, afin de refléter la diversité génétique régionale du début du XXᵉ siècle. Cette approche permet d’identifier des variations locales, souvent issues de mutations anciennes, et d’améliorer l’efficacité du diagnostic génétique. POPGEN séquence 3 998 volontaires et génotype environ 6 000 autres, avec imputation des données grâce à des panels internationaux (1000G, HGDP, SGDP) et nationaux (FranceGenRef). Ces références externes servent aux contrôles qualité, à la comparaison mondiale et au calibrage bioinformatique. Le projet est stratégique pour le PFMG2025 et les plateformes nationales de séquençage. Il contribuera à améliorer le diagnostic, la prévention et la prise en charge des maladies génétiques, tout en enrichissant les connaissances sur la diversité génomique humaine.

Données utilisées

Catégories de données utilisées

Autre

Autre(s) catégorie(s) de donnée(s) utilisée(s)

Variables communes aux panels 1000G, HGDP, SGDP, FGR :
• Identifiant : code alphanumérique pseudonymisé, format spécifique à chaque panel.
• Origine : Super Population (continent) + Population (pays/zone géographique/cohorte d’origine).
• Localisation : coordonnées géographiques associées à l’origine (population ou grands-parents pour FGR).
• Données génétiques : données de séquençage (VCF, WGS selon panel).
Variables spécifiques :
• 1000G : sexe déclaré, lien de parenté éventuel.
• FGR : code INSEE et coordonnées géographiques attitrées des communes de naissance des 4 grands-parents, barycentre géographique, sexe déclaré.

Source de données utilisées

Autres sources

Autre(s) source(s) de donnée(s) mobilisée(s)

Autre(s)

Appariement entre les sources de données mobilisées

  Non

Variables sensibles utilisées

Aucune

Recours au numéro d'identification des professionnels de santé

  Non

Plateforme utilisée pour l'analyse des données

Autre (système fils)

Acteurs finançant et participant à l'étude

Responsable(s) de traitement

Type de responsable de traitement 1

INSERM

Responsable de traitement 1

INSERM

101 Rue de Tolbiac 75013 Paris 75013 Paris France

Localisation du responsable de traitement 1
  Dans l'UE
Représentant du responsable de traitement 1

Responsable(s) de mise en oeuvre non cités comme responsable de traitement

Responsable de mise en oeuvre non cité comme responsable de traitement 1

Unité Mixte de Recherche Inserm 1078

101 Rue de Tolbiac 75013 Paris 75013 Paris France

Calendrier du projet

Date de début : 15/11/2025 – Date de fin : 15/11/2034 Durée de l'étude : 108
Etape 1 : Dépôt du projet
20/08/2025
Etape 2 : Complétude
21/08/2025
Etape 3 : Avis CEREES/CESREES
11/09/2025

Base légale pour accéder aux données

Encadrement réglementaire

Autorisation CNIL

Destinataire(s) des données

Destinataire des données 1

UMR1078

101 Rue de Tolbiac 75013 Paris 75013 Paris France

Destinataire des données 2

UMR7206

17 Place du Trocadéro et du Onze Novembre 75016 Paris 75116 Paris France

Durée de conservation aux fins du projet (en années)

9

Existence d'une prise de décision automatisée

  Non

Fondement juridique

Article 6 du RGPD (Licéité du traitement)

4; 5

Article 9 du RGPD (Exception permettant de traiter des données de santé)

(2)(i) intérêt public dans le domaine de la santé publique

Transfert de données personnelles vers un pays hors UE

  Non

Droits des personnes

Concernant les panels, les données utilisées sont soit en accès public, soit issues de projets pour lesquels les participants ont accepté l’usage scientifique sans ré-information possible. Une dérogation à l’obligation d’information est demandée sur le fondement de l’article 14-5(b) du RGPD, compte tenu de l’impossibilité matérielle ou des efforts disproportionnés que représenterait cette information.
Les responsables de traitement de ces panels n’ont pas prévu de moyens de ré-information des volontaires qui ont fournis les données à caractère personnel et/ou les échantillons biologiques permettant de générer les données génétiques. Le montage de certains de ces panels, remontant souvent à plus de 10 ans, reposent sur la réutilisation d’échantillons et/ou données collectées dans le cadre d’autres projets (cohorte, étude clinique hors d’Europe, collecte en population générale, etc.) ne permettant pas une ré-information dans des délais raisonnables sans moyens disproportionnés déployés par l’Inserm.

Une note d’information collective a été rédigée conformément aux articles 13 et 14 du RGPD. Cette note décrit les objectifs de la recherche, les données utilisées, les droits des participants et les contacts pour exercer ces droits.
La note d’information est mise à disposition des participants aux panels et publiée sur le site web du Plan France Génomique, afin de garantir la transparence et l’accès permanent à ces informations pour toute personne intéressée. https://pfmg2025.fr/le-plan/projets-pilotes/popgen/

Délégué à la protection des données

INSERM

101 Rue de Tolbiac 75013 Paris 75013 Paris France