Modèles de mélanges en régression
Séminaire Probabilités & Statistique
10/03/2016 - 14:00 Emilie DEVIJVER (Université Paris Sud) Salle 1 - Tour IRMA
Nous introduisons des modèles de mélanges en régression, où, dans chaque classe, les données sont reliées par un modèle linéaire gaussien. Les régresseurs et la variable réponse peuvent être de grande dimension, typiquement des données fonctionnelles. Nous proposons deux méthodes pour résoudre ce problème de classification non-supervisée, utilisant l'estimateur du Lasso pour sélectionner des variables, et l'estimateur du maximum de vraisemblance, sous contrainte de faible rang ou non, pour réduire le biais. Nous construisons une collection de modèles plus ou moins parcimonieux, avec plus ou moins de classes, et nous sélectionnons un modèle avec l'heuristique des pentes. Cette étape de sélection de modèles est justifiée par des inégalités oracles. Nous illustrons l'une des méthodes sur des données réelles électriques, le but étant de classifier les individus sur deux jours consécutifs.