Estimation adaptative dans le cadre d'une modélisation d'interaction poissonienne et application à des données génomiques

English

Séminaire Probabilités & Statistique

24/11/2011 - 14:00 Laure Sansonnet (Université Paris-Sud) Salle 1 - Tour IRMA

L'objet de cet exposé est de présenter une approche statistique pour étudier les dépendances entre deux événements modélisés par des processus ponctuels. On s'intéressera en particulier au domaine de la génomique afin de détecter des distances favorisées ou évitées entre deux motifs le long d'un génome suggérant de possibles interactions à un niveau moléculaire. Pour cela, on introduira une fonction dite de reproduction qui permet de quantifier les positions préférentielles des motifs et qui est modélisée par l'intensité d'un processus de Poisson. On s'intéressera d'abord à l'estimation de cette fonction que l'on suppose très localisée. A l'aide des bases d'ondelettes (en pratique, la base de Haar) et des techniques de seuillage, on construira un estimateur adaptatif qui satisfait une inégalité de type oracle. On présentera ensuite des simulations qui permettent la calibration de paramètres d'un point de vue numérique et qui mettent en avant la robustesse de la procédure d'estimation. Enfin, on appliquera la méthode à l'analyse de la dépendance entre les sites promoteurs et les gènes chez la bactérie E. coli en s'appuyant sur un jeu de données réelles.