Notre démarche open science

Convaincu que les découvertes les plus impactantes seront issues de l’intelligence collective, le Health Data Hub soutient et accompagne l’écosystème de la santé numérique dans la démarche open science.

Partager

Avec ses partenaires, le Health Data Hub  développe, met à disposition et maintient à jour une série d’outils visant à faciliter la prise en main des données de santé. Comprendre les données, tant leur organisation que leurs biais, leurs potentiels et leurs limites, constitue un effort important pour chaque porteur de projet. C'est pourquoi le HDH propose de mutualiser et partager les connaissances, en mettant en place une démarche open science destinée à l’écosystème de la santé.

 

La démarche open science du Health Data Hub

Fort de son engagement en faveur de l’open science, le Health Data Hub (HDH) accompagne les acteurs de l’écosystème de santé dans l’ouverture de leurs ressources en proposant des solutions simplifiées et adaptées. 

Pour centraliser les codes et algorithmes disponibles en open source, nous avons créé la Bibliothèque Ouverte d'Algorithmes en Santé (BOAS). Ce projet collaboratif vise à référencer, documenter et rendre accessibles ces ressources, facilitant ainsi leur réutilisation par la communauté. 

Nous proposons également une solution dédiée au partage des données de santé anonymisées en open data. Cet accompagnement couvre toutes les étapes opérationnelles, techniques et réglementaires de l'ouverture des données.

Pour en savoir plus sur les démarches open source et open data du HDH, vous pouvez télécharger les guides de contribution et visionner les replays des interventions dédiées à lors de la journée Open Science 2024 : 

⏩ Guides de contribution : open source // open data

⏩ Présentations lors de la Journée open science 2024 : open source // open data

Au-delà de cet accompagnement, nous partageons également nos bonnes pratiques pour garantir une ouverture optimale et efficace des ressources. Nous avons notamment mis en place des templates de documentation standardisés pour la documentation des ressources à ouvrir :

⏩ En open source 

⏩ En open data

En complément de ces outils et ressources, le Health Data Hub accorde également une place essentielle à la diffusion d’une culture de la science ouverte au sein de l’écosystème. Dans cette optique, nous organisons régulièrement des événements fédérateurs dans le but de rassembler les acteurs de l’innovation et contribuer à l’ouverture des connaissances dans le domaine des données de santé. 

Des meetups thématiques destinés à promouvoir les travaux d’ouverture des acteurs de l’écosystème sont proposés tout au long de l’année. Ces moments d’échange conviviaux favorisent la collaboration et le partage des connaissances. Pour rester informés des prochains meetups, rejoignez notre communauté et inscrivez-vous à notre newsletter.

Ces initiatives témoignent de notre engagement continu dans la promotion et le soutien vis-à-vis de l’ouverture et de l'accessibilité de la science dans le domaine de la santé. 

Pour en savoir plus sur l’offre de service du HDH, vous pouvez nous contacter à l’adresse opensource@health-data-hub.fr

 

Les contributions open science du Health Data Hub et de ses partenaires

Pour accéder à l’ensemble des ressources ouvertes via notre offre de service : 

⏩ Tous les algorithmes et codes sources sont référencés dans la Bibliothèque ouverte d’algorithmes en santé (BOAS) du HDH 

⏩ Toutes les bases de données sont ouvertes en open data et également accessibles via cette page data.gouv.fr : 

  • Données synthétiques du Top Diabète (Health Data Hub) : base de données tabulaire créée dans le cadre de la traduction et l’implémentation de l’algorithme utilisé par la CNAM pour construire le top diabète.
  • Données synthétiques de la base principale du SNDS (Health Data Hub) : base de données tabulaire générée en utilisant le schéma des tables de la base principale du SNDS de l’année 2019 pour 50 patients fictifs. 
  • Allergen Chip Challenge (Société Française d’Allergologie) : base de données multicentrique regroupant 4 000 bilans allergologiques et données cliniques. Créée dans le cadre du data challenge éponyme, elle vise à identifier les allergènes responsables et à prédire la sévérité des réactions allergiques.
  • TissueNet (Société Française de Pathologie) : base de données d’imagerie de plus de 1000 lames histopathologiques de biopsies utérines numérisées. Cette base a été conçue dans le cadre du data challenge du même nom ayant pour ambition de développer des outils basés sur l’IA permettant d’améliorer le diagnostic des lésions du col de l’utérus. 
  • DigiLut (Hôpital Foch) : base de données de 500 images de lames d’anatomopathologie de biopsies pulmonaires, collectées dans le cadre du data challenge du même nom, visant à développer un modèle d’apprentissage automatique pour prédire les signes de rejet chez les patients greffés du poumon.
  • Cytolog-IA (Groupement Francophone d’Hématologie Cellulaire, Algoscope) : base de données d’imagerie créée dans le cadre du data challenge éponyme et composée de près de 75 000 images de leucocytes normaux et pathologiques classées selon 23 classes, ayant pour objectif d’améliorer le diagnostic en hématologie biologique grâce à l’IA.

 

Retrouvez aussi...

Une représentation du modèle des données sur le dictionnaire interactif. 

Une documentation collaborative décrivant certaines tables et variables. Un espace pour partager des programmes est prévu. 
 

Des données totalement synthétiques permettant de tester vos programmes du point de vue fonctionnel.

Replay de la journée de l'open…

Documentation collaborative

Dictionnaire interactif

Forum d'entraide

Données synthétiques

Notebook de prise en main du SNDS

Meetups à venir

Présentations passées

Starter Kit

utilisateur-de-donnees

Utilisateur de données

Chercheurs, start-ups, organismes de santé, associations, industriels, nous sommes votre guichet...

chercheurs-affilies

Notre réseau

Nous rassemblons une communauté de 167 chercheurs affiliés pour favoriser le partage ...