Chercheuses principales - ERC 28
Chercheuses principales : Eleanor Pullenayegum, Mireille Schnitzer, Grace Y. Yi

Projets des équipes de recherche collaborative – Projet 28

Gestion de la complexité des données dans les dossiers médicaux électroniques : stratégies statistiques pour un apprentissage amélioré

Des initiatives mondiales permettent de mettre les dossiers de santé électroniques (DSE) à la disposition de la recherche, ajoutant ainsi un niveau d’informations cliniques aux données administratives de santé qui manquait jusqu’à présent. Cependant, les chercheurs qui utilisent les données des DSE sont confrontés à des problèmes importants : absence de données, schémas d’observation informatifs, confusion, erreur de mesure, mauvaise classification et dimensionnalité élevée. Ce projet élargira les capacités de recherche sur les DSE et améliorera la base de données probantes sur laquelle se fondent les décisions en matière de santé.

Catégorie de recherche : Région : Nationale Date : 2025–2028

Pourquoi avons-nous besoin de nouvelles méthodologies pour gérer les données des DSE ?

Les chercheurs ont de plus en plus accès aux données contenues dans les DSE. L’utilisation des DSE pour éclairer les décisions en matière de soins de santé nécessite de faire face aux réalités des données qui n’ont pas été collectées à des fins de recherche : données manquantes, schémas d’observation informatifs, facteurs de confusion, erreurs de mesure, classification erronée et grande dimensionnalité. De plus, ces problèmes se manifestent souvent simultanément et sous leurs formes les plus difficiles : par exemple, les données manquantes non aléatoires sont souvent le mécanisme de manque le plus plausible, et une classification erronée différentielle est susceptible d’être présente. En outre, bien que l’hypothèse de randomisation séquentielle nécessaire pour faire des inférences causales soit souvent plus plausible dans les données des DSE que dans les données des demandes administratives, les approches classiques visant à réduire la dimension de l’ensemble de facteurs de confusion risquent de violer la randomisation séquentielle. Des innovations méthodologiques sont donc nécessaires.

Problèmes abordés et résultats attendus

Les problèmes décrits dans ce projet ont été développés de manière collaborative et abordent les problèmes rencontrés dans la recherche basée sur les DSE menée par nos collaborateurs cliniques :

  • Biais de présence informatif
  • La gestion des visites et des absences non aléatoires
  • Inférence causale avec des expositions longitudinales variant dans le temps
  • Inférence causale avec facteurs de confusion de grande dimension

L’équipe du projet travaillera à la réalisation de trois résultats :

  • Une série d’approches méthodologiques pour les inférences causales à partir des données des DSE, adaptées à la complexité des données et qui amélioreront notre capacité à utiliser les données des DSE.
  • Une équipe de collaborateurs travaillant à la pointe de l’innovation dans leurs propres disciplines qui appliqueront nos outils et méthodes aux questions auxquelles ils s’attaquent actuellement
  • Une cohorte de nouveaux chercheurs (étudiants) équipés pour gérer les complexités liées aux données des DSE et capables de contribuer au développement méthodologique grâce à un travail collaboratif avec des collègues des sciences de la santé

Les gens derrière le projet

Membres du groupe

Eleanor Pullenayegum | Université de Toronto, Hôpital pour enfants malades Mireille Schnitzer | Université de Montréal Grace Y. Yi | Université Western Ontario

Collaborateurs

Geneviève Lefebvre | Université du Québec à Montréal Janie Coulombe | Université de Montréal, Hôpital Sainte-Justine David Benkeser | Université Emory Cristina Longo | Université de Montréal, Hôpital Sainte-Justine Sonia Grandi | Université de Toronto, Hôpital pour enfants malades Brian Feldman | Université de Toronto, Hôpital pour enfants malades