Modèles de mutation : étude paramétrique et estimation paramétrique
Spécialité : Mathématiques Appliquées
4/07/2017 - 14:30 Mr Adrien Mazoyer Amphithéâtre Bernard Vauquois - UFR IMAG F 018
Mots clé :
- Loi de Luria-Delbrück
- Analyse de fluctuations
- Processus de branchement
- Processus inhomogènes
Les modèles de mutations décrivent le processus d'apparitions rares et aléatoires de mutations au cours de la croissance d'une population de cellules. Les échantillons obtenus sont constitués de nombres finaux de cellules mutantes, qui peuvent être couplés avec des nombres totaux de cellules ou un nombre moyen de cellules en fin d'expérience. La loi du nombre final de mutantes est une loi à queue lourde : de grands décomptes, appelés "jackpots", apparaissent fréquemment dans les données. Une construction générale des modèles se décompose en trois niveaux. Le premier niveau est l'apparition de mutations aléatoires au cours d'un processus de croissance de population. En pratique, les divisions cellulaires sont très nombreuses, et la probabilité qu'une de ces divisions conduise à une mutation est faible, ce qui justifie une approximation poissonnienne pour le nombre de mutations survenant pendant un temps d'observation donné. Le second niveau est celui des durées de développement des clones issus de cellules mutantes. Du fait de la croissance exponentielle, la majeure partie des mutations ont lieu à la fin du processus, et les durées de développement sont alors indépendantes et exponentiellement distribuées. Le troisième niveau concerne le nombre de cellules qu'un clone issu d'une cellule mutante atteint pendant une durée de développement donnée. La loi de ce nombre dépend principalement de la loi des instants de division des mutantes. Le modèle classique, dit de Luria- Delbrück, suppose que les développements cellulaires des cellules normales aussi bien que mutantes s'effectue selon un processus de Yule. On peut dans ce cas expliciter la loi du nombre final de mutantes. Elle dépend de deux paramètres, qui sont le nombre moyen de mutations et le paramètre de fitness (rapport des taux de croissance des deux types de cellules). Le problème statistique consiste à estimer ces deux paramètres au vu d'un échantillon de nombres finaux de mutantes. Il peut être résolu par maximisation de la vraisemblance, ou bien par une méthode basée sur la fonction génératrice. Diviser l'estimation du nombre moyen de mutations par le nombre total de cellules permet alors d'estimer la probabilité d'apparition d'une mutation au cours d'une division cellulaire. L'estimation de cette probabilité est d'une importance cruciale dans plusieurs domaines de la médecine et de biologie : rechute de cancer, résistance aux antibiotiques de Mycobacterium Tuberculosis, etc. La difficulté provient de ce que les hypothèses de modélisation sous lesquelles la distribution du nombre final de mutants est explicite sont irréalistes. Or estimer les paramètres d'un modèle quand la réalité en suit un autre conduit nécessairement à un biais d'estimation. Il est donc nécessaire de disposer de méthodes d'estimation robustes pour lesquelles le biais, en particulier sur la probabilité de mutation, reste le moins sensible possible aux hypothèses de modélisation. Cette thèse contient une étude probabiliste et statistique de modèles de mutations prenant en compte les sources de biais suivantes : durées de vie non exponentielles, morts cellulaires, variabilité du nombre final de cellules, durées de vie non-exponentielles et non-identiquement distribuées, dilution de la population initiale. Des études par simulation des méthodes considérées sont effectuées afin de proposer, selon les caractéristiques du modèle, l'estimation la plus fiable possible. Ces méthodes ont également été appliquées à des jeux de données réelles, afin de comparer les résultats avec les estimations obtenues sous les modèles classiques. Un package R a été implémenté en collaboration avec Rémy Drouilhet et Stéphane Despréaux et est disponible sur le CRAN. Ce package contient les différents résultats obtenus au cours de ce travail. Il contient des fonctions dédiées aux modèles de mutations, ainsi qu'à l'estimation des paramètres. Les applications ont été en partie développées pour le Labex TOUCAN (Toulouse Cancer).
Directeurs:
- Mr Bernard Ycart (Professeur - Université Grenoble Alpes )
Raporteurs:
- Mr Philip J. Gerrish (Directeur de Recherche - Georgia Institute of Technology )
- Mme Sylvie Méléard (Professeure - École Polytechnique )
Examinateurs:
- Mme Adeline Samson-Leclercq (Professeure - Université Grenoble Alpes )
- Mme Agnes Hamon (Maître de Conférénces - Université Grenoble Alpes )
- Mr Martin Guillaume (Chargé de Recherche - ISEM Montpellier )