Détection de ruptures sur arbre pour l'inférence de scénarios évolutifs à partir de l'observation d'espèces actuelles

français

Seminar Probabilités & Statistique

27/09/2018 - 14:00 Mr Paul Bastide (KU Leuven) Salle 106 - Batiment IMAG

En écologie comparative et évolutive, les traits quantitatifs d'un jeu d'espèces actuelles peuvent être vus comme le résultat d'un processus stochastique courant le long d'un arbre phylogénétique. Cette modélisation permet de prendre en compte les corrélations produites par une histoire évolutive partagée. Le processus stochastique est choisi afin de de capturer les mécanismes qui gouvernent l'évolution des traits dans le temps. On s'intéresse ici à la présence de sauts dans la valeur des paramètres de ce processus, qui peuvent mettre en évidence une réponse adaptative rapide à un changement d'environnement. A nombre de sauts donné, un estimateur du maximum de vraisemblance des paramètres et de la position des sauts sur l'arbre peut être obtenu grâce à un modèle à données incomplètes. Des problèmes d'identifiabilité se posent pour la localisation des sauts sur l'arbre, plusieurs allocations différentes pouvant produire la même distribution jointe pour les traits observés aux feuilles. On se propose alors de dénombrer, d'une part, les allocations non-identifiables équivalentes, et, d'autre part, les solutions distinctes identifiables. Cette dernière quantité nous sert alors à calibrer une pénalité de sélection de modèle, pour laquelle on est capable de montrer une inégalité de type oracle dans le cas univarié. Dans le cas multivarié, une extension du modèle est proposée, qui permet la gestion des corrélations possibles entre les traits étudiés, ainsi que des éventuelles données manquantes.

Mots-clefs:
Sélection de modèle; Méthodes Comparatives Phylogénétiques; EM; Processus Stochastiques; Identifiabilité

Citations:
- Bastide, Mariadassou, Robin (2017). Detection of adaptive shifts on phylogenies by using shifted stochastic processes on a tree. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 79(4), 1067-1093.
- Bastide, Ané, Robin, Mariadassou (2018): Inference of Adaptive Shifts for Multivariate Correlated Traits. Systematic Biology, 67(4), 662-680.

Références utiles:
- Sélection de modèle: approche "LINselect"
Baraud, Giraud, Huet (2009). Gaussian model selection with an unknown variance. Annals of Statistics, 37(2), 630-672
- Méthodes comparatives phylogénétiques: modélisation par un Ornstein-Uhlenbeck avec plusieurs régimes
Butler & King (2004). Phylogenetic Comparative Analysis: A Modeling Approach for Adaptive Evolution. The American Naturalist, 164(6), 683-695.