EIMLIA-3M-TEU: Étude des Impacts Médico-Financiers, Logistiques de l'Intelligence Artificielle avec 3 Modèles Triant à l’Entrée des Urgences
Objectif(s) de la recherche et intérêt pour la santé publique
Finalité de l'étude
Objectifs poursuivis
Domaines médicaux investigués
Bénéfices attendus
Contexte
Les services d'urgence hospitaliers connaissent une saturation chronique aggravée par des erreurs de triage (10-15% de sous-triage, 20-30% de sur-triage). Les méthodes traditionnelles, basées sur l'expertise subjective et soumises à la variabilité inter-opérateurs, ne permettent pas une priorisation optimale face à l'hétérogénéité croissante des patients. L'intelligence artificielle (IA) émerge comme solution prometteuse, mais son évaluation reste fragmentée : la majorité des études se concentrent sur la performance prédictive isolée, négligeant les dimensions organisationnelles, économiques et techniques d'une implémentation réelle.
Objectif principal
Évaluer, par simulation prospective validée rétrospectivement, les performances multidimensionnelles de trois architectures d'IA pour le triage aux urgences, selon une approche intégrée combinant critères cliniques, organisationnels, économiques et techniques.
Objectifs secondaires
Comparer l'exactitude diagnostique des modèles NLP, LLM et JEPA au référentiel FRENCH validé par experts
Quantifier l'impact médico-économique (réduction d'hospitalisations inappropriées, examens redondants, coûts GHS)
Mesurer la performance opérationnelle (temps d'attente, gestion des flux, stabilité technique en conditions dégradées)
Identifier les synergies architecturales optimales pour un déploiement clinique futur
Méthodologie
Simulation prospective multimodale combinant simulation à événements discrets (DES) et systèmes multi-agents (SMA), enrichie de jumeaux numériques et de process mining. Données : 600 000 patients anonymisés des urgences adultes CHU de Lille (2018-2023). Trois scénarios testés : (1) triage manuel de référence, (2) IA isolées sous charge normale avec stress-tests prolongés, (3) scénario de crise sanitaire (charge à 200%) testant une architecture hybride LLM-JEPA. Validation clinique indépendante par panel d'experts sur 500 dossiers randomisés.
Résultats attendus
Identification de l'architecture d'IA optimale pour le triage, avec une réduction anticipée de 25% des temps d'attente, 20% des hospitalisations inappropriées et 15% des examens redondants, tout en maintenant une disponibilité ≥ 99% et une concordance κ ≥ 0,80 avec les experts. Ces résultats fourniront les fondations méthodologiques pour de futures études cliniques prospectives.
Données utilisées
Catégories de données utilisées
Source de données utilisées
Autre(s) source(s) de donnée(s) mobilisée(s)
Appariement entre les sources de données mobilisées
Variables sensibles utilisées
Justification du recours à cette(ces) variable(s) sensible(s)
Les variables temporelles sont indispensables au fonctionnement méthodologique du projet et ne peuvent être supprimées sans compromettre la validité des analyses.
Date de naissance : nécessaire pour le calcul de l’âge exact au moment du passage, variable fortement corrélée à la gravité, aux trajectoires de soins et aux durées opératoires. Elle permet la calibration des modèles d’IA et des simulations DES–SMA, la génération de cohortes synthétiques fidèles et l’ajustement des risques. Une simple classe d’âge ne permettrait pas de préserver les corrélations fines indispensables au jumeau numérique.
Date de décès : essentielle pour identifier les issues vitales post-prise en charge, qualifier la sécurité du triage (sous-triages graves), et éviter la confusion entre décès et pertes de suivi. Elle conditionne la constitution du gold standard de référence et la validation des modèles prédictifs.
Dates et horodatages de soins : nécessaires à la reconstruction exacte des parcours via process mining, au calcul des durées entre événements (triage, consultation, examens), et à l’alimentation des modèles temporels (JEPA). Elles permettent la modélisation des flux, la simulation organisationnelle et l’évaluation médico-économique. L’absence d’horodatages rendrait impossible toute analyse dynamique et invaliderait les scénarios simulés.
Ces données sont utilisées exclusivement pour des finalités de modélisation, de simulation et d’évaluation, selon les principes de proportionnalité et de minimisation. Elles sont traitées dans un environnement sécurisé conforme aux exigences du HDH.
Recours au numéro d'identification des professionnels de santé
Plateforme utilisée pour l'analyse des données
Acteurs finançant et participant à l'étude
Responsable(s) de traitement
Type de responsable de traitement 1
Responsable de traitement 1
Localisation du responsable de traitement 1
Représentant du responsable de traitement 1
Responsable(s) de mise en oeuvre non cités comme responsable de traitement
Responsable de mise en oeuvre non cité comme responsable de traitement 1
Calendrier du projet
Base légale pour accéder aux données
Encadrement réglementaire
Durée de conservation aux fins du projet (en années)
15
Existence d'une prise de décision automatisée
Fondement juridique
Article 6 du RGPD (Licéité du traitement)
Article 9 du RGPD (Exception permettant de traiter des données de santé)
Transfert de données personnelles vers un pays hors UE
Droits des personnes
Les droits des personnes s’appliquent via le responsable de traitement (CHU) conformément à la MR-004 :
Accès (art. 15) : possible sur les données sources du dossier patient, auprès du CHU. Les données pseudonymisées utilisées dans le projet ne permettent pas une identification directe.
Rectification (art. 16) : exercée sur le dossier patient ; les mises à jour sont répercutées dans les extractions ultérieures.
Effacement (art. 17) : peut s’exercer sur les données sources, sous réserve des obligations légales. L’effacement des données déjà pseudonymisées peut être limité lorsque la ré-identification n’est plus possible (art. 17(3)(d)).
Limitation (art. 18) : possible au niveau des données hospitalières identifiantes ; non applicable directement aux données pseudonymisées du projet.
Portabilité (art. 20) : s’applique aux données du dossier patient ; non applicable aux données pseudonymisées utilisées pour la recherche.
Toutes les demandes sont traitées par le DPO du CHU. Le projet n’a pas la capacité de ré-identifier les personnes et ne peut donc pas traiter directement leurs droits.