L’open science au cœur de l’engagement du Health Data Hub : retour sur les actions menées

Depuis sa création en 2019, le Health Data Hub soutient et accompagne l’écosystème des données de santé dans l’ouverture des savoirs. Dans le cadre de son engagement en faveur de l’open science et pour répondre aux enjeux liés à l’ouverture des données de santé, le Health Data Hub a structuré ses actions en créant un pôle dédié au pilotage et à la coordination de l’ensemble de ces sujets en janvier 2024.
Le domaine des données de santé est marqué par une forte complexité et d’importants enjeux de fiabilité qui nécessitent une approche collaborative et ouverte. Ainsi depuis sa création, le Health Data Hub s’engage à faciliter l’accès à des ressources et outils essentiels pour la recherche en santé, contribuant à l’innovation dans ce secteur.
L’open science au cœur des activités du Health Data Hub
Depuis 2019, le Health Data Hub concrétise son engagement pour l’open science à travers des initiatives variées qui favorisent le partage et la valorisation des données de santé. Une collaboration étroite avec des acteurs comme la DREES, Santé publique France, la CNAM, l’ANSM, les ARS et l’ATIH a permis de développer une documentation ouverte et collaborative, régulièrement mise à jour pour accompagner les utilisateurs.
Le Health Data Hub soutient également l’exploration des données grâce au dictionnaire des variables, élaboré avec la DREES, qui offre une navigation simplifiée et intègre les évolutions régulières des terminologies de la base principale du SNDS. Aussi, la communauté d’utilisateurs du forum d’entraide destiné aussi bien aux débutants qu’aux experts s’étoffe, alors qu’en parallèle, le groupe Meetup, lancé en 2019, rassemble aujourd’hui plus de 3 600 membres.
L’innovation technique est également au cœur des actions menées avec la Bibliothèque Ouverte d’Algorithmes en Santé (BOAS), rassemblant 23 ressources documentées et accessibles, dont 16 dédiées à la base principale du SNDS. Ce projet collaboratif est soutenu par sept vagues d’appels à projets, dont deux lancées en 2024.
Par ailleurs, le Health Data Hub s’investit dans l’open data en proposant des services et solutions pour la publication sécurisée de données de santé anonymisées. En 2024, ces efforts ont abouti à l’ouverture de deux bases de données synthétiques et d’une base issue d’un data challenge, accessibles sur data.gouv.fr.
Enfin, l’offre de formations continue de s’élargir avec l’ambition de toucher un public toujours plus diversifié, renforçant ainsi une communauté engagée pour une science ouverte et collaborative.
L’initiative Data Challenges catalysatrice d’innovations et de collaborations
Le Health Data Hub, dans sa mission d’animation de l’écosystème, organise des Data Challenges depuis 2020. Ces compétitions internationales visent à développer des algorithmes et bases de données innovants pour répondre à des problématiques médicales d’actualité. En six projets, elles ont rassemblé plus de 2500 participants et favorisé des collaborations post-compétitions entre médecins et data scientists.
Deux Data Challenges ont marqué l’année 2024 :
- DigiLut, porté par l’hôpital Foch, a mobilisé plus de 250 équipes internationales pendant deux mois pour développer des modèles prédictifs de rejet chez les patients greffés pulmonaires. La compétition a produit 1 200 modèles testés et une cérémonie dédiée en novembre a présenté ses résultats (le replay de l’événement est accessible ici).
- CytologIA, porté par le Groupe Francophone d’Hématologie Cellulaire et Algoscope, a été lancé en novembre. Il s’est concentré sur le diagnostic en hématologie biologique, réunissant près de 250 équipes pendant six semaines pour élaborer des modèles de classification des leucocytes. Ce projet a été retenu parmi les défis “Convergence IA” et sera présenté au Sommet pour l’action sur l’intelligence artificielle (IA) en février 2025.
Des événements fédérateurs favorisant le partage des savoirs
Enfin, le Health Data Hub organise régulièrement des événements pour fédérer les acteurs de l’innovation et encourager l’ouverture des connaissances en santé. Le 30 avril 2024, s’est tenue la première Journée de l’open science en santé. Elle a permis de mettre en lumière les bénéfices concrets du partage de ressources à travers des exemples inspirants (le replay est disponible ici).
Des meetups thématiques, dédiés à la promotion des initiatives d’ouverture dans l’écosystème sont régulièrement proposés à la communauté.Trois rencontres ont rythmé l’année 2024 et ont abordé des sujets variés, comme les grands modèles de langage appliqués aux données de santé, attirant plusieurs centaines de participants (l’ensemble des replays est disponible ici).
Structuration de l’action open science avec la création d’un pôle dédié
Afin de structurer, organiser et renforcer ces actions, le pôle Open Science a été créé en janvier 2024. Ses missions premières ont été notamment le pilotage et la coordination de l’ensemble des initiatives dans ce domaine afin d’en accroître l’ampleur, la visibilité et l’impact.
Dans cette perspective, une autre mission du pôle open science a été de cartographier les acteurs clés de l’open science dans le domaine des données de santé et d’aller à leur rencontre afin d’alimenter et de faire évoluer la démarche proposée. Ceci s’est notamment traduit par la participation à un groupe de travail mené par l’Administration ministérielle des données, des algorithmes et des codes sources au cours duquel un guide d’accompagnement à l’ouverture d’un code source a été produit.
Pour en savoir plus sur l’offre de services du Health Data Hub, une page dédiée est disponible ainsi qu’une adresse email : opensource@health-data-hub.fr.