Un cadre de modélisation statistique pour l'analyse de données indexées par des arborescences
Seminar Probabilités & Statistique
15/01/2015 - 14:00 Pierre Fernique (Inria Virtual Plants, Montpellier) Salle 1 - Tour IRMA
Nous nous intéressons à des modèles statistiques pour données indexées par des arborescences. Dans le contexte de l'équipe Virtual Plants, les applications portent sur le développement de la plante et sa modulation par des facteurs génétiques et environnementaux. Les modèles statistiques pour données indexées par des arborescences sont beaucoup moins développés que ceux pour séquences ou séries temporelles. Cette thèse vise à proposer un cadre de modélisation statistique pour l'identification de patterns dans des données indexées par des arborescences. Deux classes de modèles statistiques, les modèles de Markov et leur extension aux modèles de Markov cachés et les modèles de détection de ruptures multiples, sont étudiés. Nous proposons notamment de nouvelles méthodes d'inférence de la structure d'indépendance conditionnelle entre nœuds parent et enfants dans les modèles de Markov reposant sur des algorithmes de sélection de graphes dans des modèles graphiques probabilistes. Les modèles étudiés sont appliqués d'une part à des arborescences de lignage cellulaire à l'échelle microscopique et d'autre part à des systèmes ramifiés à l'échelle macroscopique. Mots-clés : données indexées par des arborescences ; modèle graphique ; modèle de Markov ; modèle de détection de ruptures multiples ; architecture des plantes ; lignage cellulaire.