Etude « CHOICED » : Choix entre la médecine libérale ou les urgences
Objectif(s) de la recherche et intérêt pour la santé publique
Finalité de l'étude
Objectifs poursuivis
Domaines médicaux investigués
Bénéfices attendus
L’objectif principal de cette étude est de décrire les propriétés diagnostiques (sensibilité, spécificité et valeurs prédictives) de l’outil « CHOICED ». CHOICED est un outil d’aide à la décision pour l’assistant de régulation médicale (ARM) de premier décroché au SAMU-centre 15 pour l’orientation des patients vers la médecine générale ou l’orientation vers les urgences.
CHOICED utilisera des techniques d’IA liées à l’écoute vocale (décodage du contenu de l’échange, analyse des rythmes de parole, des bruits environnants, etc.) couplées à l’analyse des informations recueillies par le régulateur.
Les objectifs secondaires permettront une recherche plus épidémiologique, mais également l’affinement de l’outil de prédiction dans certains cadres nosologiques :
- Décrire le parcours patient en fonction du choix initial de régulation par l’ARM de niveau I dans le cadre du SAS (MG ou AMU) ou par l’ARM de niveau II (ou niveau I dans le cadre du SAMU) (MG ou MU).
- Décrire l’impact de la décision d’orientation initiale sur la sécurité et la qualité des soins grâce au recueil du devenir du patient.
- Comprendre le raisonnement médical en régulation médicale et l’impact de l’intuition dans ce dernier.
- Evaluer les potentiels freins humains et à l’utilisation de l’outil CHOICED.
Notre étude est originale et n’a encore pas été réalisée. Le choix du critère de jugement le plus adapté a alors été défini en fonction d’études similaires.
Cette étude va permettre une étude de la qualité de la prise en charge de nos SAMU par l’étude en vie réelle du devenir des patients. En sus, nous allons pouvoir valider un outil d’aide à la décision permettant d’augmenter notre qualité et notre sécurité de soins. Notre projet promet une vaste retombée en matière de qualité et sécurité des soins, ayant un impact direct pour les patients. En effet, au vu de l’enjeu de qualité précédemment décrit au niveau des SAMU et de la charge de travail allant à l’exponentiel, le développement d’un outil sécuritaire d’aide à la décision est aujourd’hui primordial.
- Phase 1 : Collecte de données et développement de CHOICED (concernée par la présente demande)
Nous réaliserons l’acquisition des données d’environ 300 000 patients de manière rétrospective sur l’année 2025:
** extraction de façon automatique du logiciel patient EXOS des éléments suivants : dossier de régulation du patient, les enregistrements des bandes de régulation
** extraction de façon automatique pour les patients hospitalisés et en fonction de leur orientation par le SAMU des : données de mortalité intra-hospitalière, actes CCAM et diagnostics en hospitalisation (CCAM ou DXCARE, diagnostics PMSI), échelle de tri par l’infirmière d’orientation et de l’accueil, diagnostics aux urgences, en UHCD et d’hospitalisation.
Ces données vont permettre la création globale de l’algorithme CHOICED. Ce jeu de données sera découpé en trois de manière classique afin d’obtenir des jeux d’apprentissage (70%), de validation (10%) et de test (exclusion – 20%). L’objectif est ici d’avoir un jeu de données le plus important possible, obtenu de manière (semi) automatique, afin d’entraîner le modèle sur un maximum d’exemples. Ce modèle sera validé sur l’ensemble de test issu de ce jeu de données et exclu de la phase d’apprentissage. Pour permettre un développement efficace et basé sur des méthodes reconnues, un état de l’art des architectures de réseau de neurones permettant d’analyser des données sonores (ou des séquences temporelles plus généralement) sera établi. Ensuite, une étude des approches hybrides (permettant l’intégration de sources de données hétérogènes) sera faite. En effet, il sera nécessaire de fusionner les informations extraites de la bande sonore, avec celles des textes saisis par les régulateurs. Le modèle global développé se basera sur l’utilisation d’un réseau de neurones profond avec une architecture originale permettant la fusion des informations extraites des différentes sources de données. L’idée est d’associer les informations issues d’une part de l’enregistrement sonore et d’autre part des éléments du rapport saisi par le régulateur. Pour cela, une branche sous forme d’un autoencodeur variationnel (VAE LSTM) pour l’analyse du son issu du dialogue téléphonique sera combinée avec un modèle de transformer analysant les informations obtenues lors de la saisie par le régulateur et extraites du rapport écrit. Ce transformer, à l’image de ce qui a pu être fait [55] sera pré-entraîné de manière non supervisée sur un très grand jeu de données non annoté afin d’apprendre à générer des textes de même nature que ceux rédigés par les régulateurs. Ensuite, il sera entraîné de manière supervisée sur un ensemble de données labélisées afin de savoir reconnaître le type d’intervention nécessaire pour ce cas. L’architecture multimodale complète sera ensuite évaluée sur sa capacité à prédire la bonne orientation du patient à partir des données de test (exclue de la phase d’apprentissage). La variable à prédire (gold standard) sera le type d’orientation du patient : médecine générale ou urgences. Le patient sera considéré comme relevant de la médecine générale s’il n’a pas été admis aux urgences, ou si son passage aux urgences n’a pas donné lieu ni à un geste technique hospitalier (liste CCAM prédéfinie), ni à une hospitalisation, ni à un décès hospitalier dans les 24h. Ces données seront extraites du système d’information hospitalier.
La phase de développement de CHOICED et la phase de validation de ses propriétés diagnostiques se feront sur deux échantillons différents d’appels au SAMU.
Chaque centre reçoit environ 500 000 appels par an, 300 000 appels SAMU seront tirés au sort sur l’année 2025 dans les deux centres.
Données utilisées
Catégories de données utilisées
Autre(s) catégorie(s) de donnée(s) utilisée(s)
- Données du logiciel de régulation SAMU (type audio et données structurées)
- Interrogation des données INSEE : date de décès
- Données passage aux urgences
- Données hospitalisation
Source de données utilisées
Autre(s) source(s) de donnée(s) mobilisée(s)
Appariement entre les sources de données mobilisées
Source(s) de données appariées
Le nom, prénom et date de naissance des patients vont être utilisés pour apparier les données de régulation et les données patients hospitalières ou de ville. L’appariement entre les données audio transcrites et les données de suite d’hospitalisation sera réalisé de manière probabiliste par Datastorm en s’appuyant sur les traits d’identités au sein d’une bulle sécurisée dédiée.
Les données audio seront transformées en forme texte (via un algorithme de type Speech To Text). Seules les données transformées et pseudonymisées seront accessibles à des fins de traitement.
Les données seront transformées. L’appariement sera fait, les données non appariées seront supprimées, et les identifiants directs seront pseudonymisées subséquemment.
Type d'appariement
Variables sensibles utilisées
Justification du recours à cette(ces) variable(s) sensible(s)
Le nom, prénom et date de naissance des patients seront nécessaires pour apparier les données de régulation et les données patients hospitalières ou de ville.
La date de soins, de la date de décès et de la commune de résidence seront nécessaires afin de vérifier la variable à prédire (gold standard) qui est le type d’orientation du patient : médecine générale ou urgences.
Recours au numéro d'identification des professionnels de santé
Plateforme utilisée pour l'analyse des données
Acteurs finançant et participant à l'étude
Responsable(s) de traitement
Type de responsable de traitement 1
Responsable de traitement 1
Localisation du responsable de traitement 1
Représentant du responsable de traitement 1
Responsable(s) de mise en oeuvre non cités comme responsable de traitement
Responsable de mise en oeuvre non cité comme responsable de traitement 1
Calendrier du projet
Base légale pour accéder aux données
Encadrement réglementaire
Durée de conservation aux fins du projet (en années)
15
Existence d'une prise de décision automatisée
Fondement juridique
Article 6 du RGPD (Licéité du traitement)
Article 9 du RGPD (Exception permettant de traiter des données de santé)
Transfert de données personnelles vers un pays hors UE
Droits des personnes
Le responsable de traitement sollicite, conformément à l’article 23 du RGPD et aux articles 107 et suivants de la loi Informatique et Libertés, une dérogation aux droits prévus aux articles 15 à 20 du RGPD dans le cadre du traitement des données de l'étude CHOICED.
En raison du caractère collectif du traitement et du nombre important de personnes concernées (300 000), une information individuelle ne serait pas possible.
Une information collective est mise en œuvre sur le site internet du CHR Metz-Thionville et du CHRU de Strasbourg, ainsi qu'une note d’information publique spécifique à l'étude.
Des garanties appropriées ont été prévues pour préserver les droits et libertés des personnes : mesures de sécurité, anonymisation, possibilité de contacter le DPO.