Projets d’équipe de recherche collaborative
Inférence statistique pour les enquêtes complexes avec observations manquantes
Ce projet explore des méthodes d’analyse d’ensembles de données de grande dimension avec des valeurs manquantes.
Catégorie de recherche : Sciences de l’information
Région : Nationale
Date : 2015-2018
Pourquoi étudier des sondages complexes ?
Les enquêtes complexes jouent un rôle important dans la fourniture d’informations pour la science et la société. Pour une utilisation efficace de ces informations, les données d’enquête doivent être fiables et représentatives.
Au cours des trois dernières décennies, l’un des points centraux de la recherche par sondage a été de savoir comment traiter les données manquantes. L’imputation est une technique de plus en plus utilisée. Cependant, il est notoirement difficile d’imputer des données multivariées ayant un motif manquant arbitraire si la structure de covariance doit être préservée. La résolution de ce problème constituera une partie importante de la recherche prévue.
Zones d’exploration
Données d’enquête complexes
Comprend la collaboration avec des chercheurs de Statistique Canada et de Westat sur des problèmes de données d’enquête à grande échelle et de grande dimension avec des valeurs manquantes.
Techniques pour les données incomplètes
Comprend l’extension des techniques d’imputation fractionnaire et des méthodes doublement robustes pour traiter les valeurs manquantes dans les données de grande dimension.
Inférence statistique et applications
Comprend l’exploration du domaine relativement nouveau du développement de l’inférence à partir de données d’enquête fonctionnelles incomplètes, avec application à de grands ensembles de données fonctionnelles, telles que les données de consommation d’électricité.
Résoudre les défis mondiaux
Objectif de l’équipe de recherche
Effectuer des recherches et de la formation en analyse de données d’enquête à grande dimension, en mettant l’accent sur les défis de la collecte de données résultant de la non-réponse et des valeurs manquantes.
Événements connexes
École de printemps sur l’inférence statistique pour les données d’enquête avec observations manquantes | 6-9 juin 2017 à l’Institut Fields
Apprendre encore plus
Série de séminaires sur l’inférence statistique pour les enquêtes complexes avec observations manquantes | 2015-2016
Les séminaires comprennent :
- Enquêtes à partir de grands ensembles de données fonctionnelles et estimation de la courbe moyenne et médiane avec des données complètes et manquantes
- Estimation des quantiles sur petits domaines
- Validité et efficacité de l’analyse des réponses ordinales avec des observations manquantes
- Problèmes inférentiels en présence d’imputation pour les données d’enquête manquantes
- Application de l’estimation sur petits domaines aux données de l’Enquête sur la population active
- Quelques sujets récents sur l’échantillonnage informatif
- Inférence de vraisemblance empirique avec des données d’enquête à grande diffusion
Les gens derrière le projet
Membres du groupe
David Haziza | Université de Montréal
Collaborateurs
Jean-François Beaumont | Statistique Canada
Michel Brique | Westat (Rockville, États-Unis)
Herve Cardot | Université de Bourgogne
Camélia Goga | Université de Bourgogne
Jiahua Chen | Université de la Colombie-Britannique
Jae-Kwang Kim | Université d’État de l’Iowa
Wilson Lu | Université Acadie
Changbao Wu | Université de Waterloo
Publications pertinentes
- Chen, S et Haziza, D. (2015). Multiplier les procédures d’imputation robustes pour le traitement de la non-réponse partielle dans les enquêtes. En cours de révision pour Biometrika.
- En ligneHAZIZA, D. & BEAUMONT, JF (2017). Construction des poids dans les enquêtes : un bilan. À paraître dans Statistical Science.
- CHEN, S. & HAZIZA, D. (2017). Multiplier les procédures d’imputation robustes pour le traitement de la non-réponse partielle dans les enquêtes. A paraître dans Biometrika.
- SHE, X. et WU, C. (2015). Analyse des réponses à l’enquête ordinale avec des valeurs manquantes. Actes de la Section des méthodes d’enquête de la SSC, Halifax, 1-8.
- ELLE, X. (2016). Imputation fractionnaire conjointe entièrement efficace pour les réponses ordinales bivariées incomplètes. Actes de la Section des méthodes d’enquête de la SSC, St. Catherines, 1-10.
- SHE, X. et WU, C. (2016). Validité et efficacité dans l’analyse des réponses ordinales avec des observations manquantes. En cours de révision pour Biometrika.
- ELLE, X. (2016). Imputation fractionnaire conjointe entièrement efficace pour les réponses ordinales bivariées incomplètes avec observations manquantes. En cours d’examen par Statistica Sinica.
- ELLE, X. (2016). Imputation fractionnaire pour les réponses de type ordinal et mixte avec observations manquantes. Thèse de doctorat, Département de statistique et de science actuarielle, Université de Waterloo.
- RAO, JNK et WU, C. (2016). Inférence de vraisemblance empirique avec des données d’enquête à grande diffusion. En cours de révision pour Biometrika.
- En ligneZHAO, P., HAZIZA, D. & WU, C. (2016). Inférence de vraisemblance empirique pour les enquêtes complexes et la théorie de la sélection des variables Oracle basée sur la conception. Soumis aux Annales de statistique.
- CHEN, S. & HAZIZA, D. (2017). Multiplication de l’imputation multiple non paramétrique robuste pour le traitement des données manquantes. Soumis à Biometrika.
- LEFEBVRE, I. (2016) Estimation simplifiée de la variance pour des plans complexes. Mémoire de maîtrise, Département de mathématiques et statistique, Université de Montréal.
- CARDOT, H., DE MOLINER, A., et GOGA, C. (2017). Estimation d’une courbe de consommation moyenne d’électricité en présence de données manquantes à l’aide de techniques d’échantillonnage d’enquête. À soumettre au numéro spécial de la Revue canadienne de statistique.
- CHEN, S. & HAZIZA, D. (2017). Multiplier les procédures d’imputation robustes pour les distributions gonflées par zéro dans les enquêtes. Article invité pour un numéro spécial de Metron.
- ZHAO, P., GHOSH, M., RAO, JNK et WU, C. (2017). Inférence de vraisemblance empirique bayésienne avec des données d’enquête complexes. Invité pour une nouvelle soumission par le Journal of the Royal Statistical Society B.
- CARDOT, H., DE MOLINER, A., et GOGA, C. (2017). Estimation d’une courbe de consommation moyenne d’électricité en présence de données manquantes à l’aide de techniques d’échantillonnage d’enquête. En révision pour le numéro spécial de la Revue canadienne de statistique.
- LEFEBVRE, I. (2016) Estimation simplifiée de la variance pour des plans complexes. Mémoire de maîtrise, Département de mathématiques et statistique, Université de Montréal
Explorez plus d’histoires
Trouver des programmes connexes
L’inférence statistique pour les enquêtes complexes avec observations manquantes est un projet de l’équipe de recherche collaborative. Ce programme aborde des problèmes complexes à travers un programme de recherche et de formation de trois ans.
L’INCASS offre environ 200 000 $ pour ce type de projet, qui nécessite une équipe de professeurs, de postdoctorants et d’étudiants.