STORM
Partenaires
RCTs est une CRO (société de recherche sous contrat) de 40 personnes spécialisée dans la recherche interventionnelle et non interventionnelle avec plus de 30 ans d'expérience. Avec plus de 800 projets, dont la moitié correspondant à des études non-interventionnelles, RCTs est un acteur clé des études en vie réelle et sur données secondaires.
Roche est une entreprise pharmaceutique qui s'appuie sur l'innovation et les nouvelles technologies pour faire avancer la science et aider les patients à vivre mieux et plus longtemps.
Contexte
Les données de vie réelle en santé (ou real-world data, RWD) sont des informations collectées en dehors des cadres expérimentaux contrôlés, comme les essais cliniques. Elles reflètent la façon dont les soins sont réellement dispensés et permettent de mieux comprendre l’expérience des patients au quotidien. Toutefois, l’hétérogénéité et le manque d’interopérabilité de ces données posent un défi majeur à leur exploitation. Pour y remédier, l’adoption d’un modèle de données commun, à l’instar du standard OMOP-CDM, dont l’efficacité a déjà été démontrée par plusieurs études, est essentielle, car elle garantit une meilleure qualité et cohérence des informations tout en facilitant leur utilisation dans la recherche.
Objectif du projet
Le projet STORM, porté par RCTs, vise à évaluer et documenter la transformation de la base de données PRM cancer du sein, fournie par Roche, vers le format OMOP-CDM. Au-delà de l’aspect technique, il s’agit de s’assurer que cette standardisation préserve l’intégrité des données d’origine et que les analyses réalisées sur les données transformées restent fidèles aux analyses effectuées sur les données sources.
Méthodologie et caractère innovant
La conversion des données suit trois grandes étapes :
- Définition des règles de transformation vers le format OMOP-CDM
- Mise en œuvre du processus ETL (Extract, Transform, Load)
- Validation des données standardisées pour garantir leur qualité et leur fiabilité
Pour assurer la robustesse des résultats, des statisticiens indépendants compareront les analyses réalisées sur les données sources et sur les données converties. Parmi les analyses effectuées : des descriptions statistiques, des courbes de Kaplan-Meier et des visualisations avancées comme les diagrammes sunburst.
L’outil Athena sera utilisé pour la gestion des vocabulaires standardisés, tandis qu’Achilles permettra d’évaluer la qualité des données.
Le projet STORM est lauréat de l’appel à manifestation d’intérêt “Partage de données industrielles, porté en collaboration avec Roche et MEDIPATH. Dans ce cadre, le projet bénéficie d’un soutien technique et financier de la part du Health Data Hub.
Résultat / Livrable attendu
Ce projet apportera une avancée majeure pour la recherche en santé en facilitant l’utilisation de données standardisées et interopérables. Il permettra aux chercheurs d’accéder à des données de qualité, réutilisables dans d’autres études. Il pourra également servir de modèle pour la standardisation d’autres bases de données en oncologie.
Les livrables incluront :
- La conversion de la base PRM cancer du sein au format OMOP-CDM 5.4 avec l’extension Oncology
- La mise à disposition des scripts de transformation en open source, favorisant la reproductibilité et la transparence scientifique
- La présentation des résultats lors de congrès et leur publication dans des revues scientifiques à comité de lecture