Modèles de mutation : étude paramétrique et estimation paramétrique

English

Spécialité : Mathématiques Appliquées

4/07/2017 - 14:30 Mr Adrien Mazoyer Amphithéâtre Bernard Vauquois - UFR IMAG F 018

Mots clé :
  • Loi de Luria-Delbrück
  • Analyse de fluctuations
  • Processus de branchement
  • Processus inhomogènes
Les modèles de mutations décrivent le processus d'apparitions rares et aléatoires
de mutations au cours de la croissance d'une population de cellules. Les
échantillons obtenus sont constitués de nombres finaux de cellules mutantes, qui
peuvent être couplés avec des nombres totaux de cellules ou un nombre moyen de
cellules en fin d'expérience. La loi du nombre final de mutantes est une loi à
queue lourde : de grands décomptes, appelés "jackpots", apparaissent
fréquemment dans les données. Une construction générale des modèles se
décompose en trois niveaux. Le premier niveau est l'apparition de mutations
aléatoires au cours d'un processus de croissance de population. En pratique, les
divisions cellulaires sont très nombreuses, et la probabilité qu'une de ces divisions
conduise à une mutation est faible, ce qui justifie une approximation poissonnienne
pour le nombre de mutations survenant pendant un temps d'observation donné. Le
second niveau est celui des durées de développement des clones issus de cellules
mutantes. Du fait de la croissance exponentielle, la majeure partie des mutations
ont lieu à la fin du processus, et les durées de développement sont alors
indépendantes et exponentiellement distribuées. Le troisième niveau concerne le
nombre de cellules qu'un clone issu d'une cellule mutante atteint pendant
une durée de développement donnée. La loi de ce nombre dépend principalement
de la loi des instants de division des mutantes. Le modèle classique, dit de Luria-
Delbrück, suppose que les développements cellulaires des cellules normales aussi
bien que mutantes s'effectue selon un processus de Yule. On peut dans ce cas
expliciter la loi du nombre final de mutantes. Elle dépend de deux paramètres, qui
sont le nombre moyen de mutations et le paramètre de fitness (rapport des taux de
croissance des deux types de cellules). Le problème statistique consiste à estimer
ces deux paramètres au vu d'un échantillon de nombres finaux de mutantes. Il peut
être résolu par maximisation de la vraisemblance, ou bien par une méthode basée
sur la fonction génératrice. Diviser l'estimation du nombre moyen de mutations par
le nombre total de cellules permet alors d'estimer la probabilité d'apparition
d'une mutation au cours d'une division cellulaire. L'estimation de cette probabilité
est d'une importance cruciale dans plusieurs domaines de la médecine et de
biologie : rechute de cancer, résistance aux antibiotiques de Mycobacterium
Tuberculosis, etc. La difficulté provient de ce que les hypothèses de modélisation
sous lesquelles la distribution du nombre final de mutants est explicite sont
irréalistes. Or estimer les paramètres d'un modèle quand la réalité en suit un autre
conduit nécessairement à un biais d'estimation. Il est donc nécessaire de disposer
de méthodes d'estimation robustes pour lesquelles le biais, en particulier sur la
probabilité de mutation, reste le moins sensible possible aux hypothèses de
modélisation. Cette thèse contient une étude probabiliste et statistique de
modèles de mutations prenant en compte les sources de biais suivantes : durées de
vie non exponentielles, morts cellulaires, variabilité du nombre final de cellules,
durées de vie non-exponentielles et non-identiquement distribuées, dilution de la
population initiale. Des études par simulation des méthodes considérées sont
effectuées afin de proposer, selon les caractéristiques du modèle, l'estimation la
plus fiable possible. Ces méthodes ont également été appliquées à des jeux de
données réelles, afin de comparer les résultats avec les estimations obtenues sous
les modèles classiques. Un package R a été implémenté en collaboration avec Rémy
Drouilhet et Stéphane Despréaux et est disponible sur le CRAN. Ce package
contient les différents résultats obtenus au cours de ce travail. Il contient des
fonctions dédiées aux modèles de mutations, ainsi qu'à l'estimation des
paramètres. Les applications ont été en partie développées pour le Labex TOUCAN
(Toulouse Cancer).

Directeurs:

  • Mr Bernard Ycart (Professeur - Université Grenoble Alpes )

Raporteurs:

  • Mr Philip J. Gerrish (Directeur de Recherche - Georgia Institute of Technology )
  • Mme Sylvie Méléard (Professeure - École Polytechnique )

Examinateurs:

  • Mme Adeline Samson-Leclercq (Professeure - Université Grenoble Alpes )
  • Mme Agnes Hamon (Maître de Conférénces - Université Grenoble Alpes )
  • Mr Martin Guillaume (Chargé de Recherche - ISEM Montpellier )