Regression modeling on stratified data: automatic and covariate-specific selection of the reference stratum with simple L_1-norm penalties

English

Séminaire Probabilités & Statistique

12/05/2016 - 14:00 Edouard OLLIER (ENS Lyon) Salle 1 - Tour IRMA

Nous proposons une approche simple et rapide pour l'estimation conjointe de modèles de régression. La méthode présentée repose sur l'utilisation de pénalité de type L1. Ce type de données se rencontre très fréquemment en épidémiologie lorsque l'observation est réalisée au sein de plusieurs strates. L'intérêt principal de l'approche proposée est qu'elle peut être réécrite comme un simple Lasso pondéré et peut donc être directement implémentée en utilisant les packages R disponible pour le Lasso (glmnet par exemple). Les propriétés oraculaires non asymptotiques ainsi que les propriétés empiriques (via une étude de simulations) seront présentés. Pour finir nous l'illustrerons sur un jeu de donnée portant sur l'épidémiologie des accidents de la route. Ce travail à été réalisé en collaboration avec Vivian Viallon (ICJ).