Sélection de variables pour des processus ponctuels spatiaux

English

Spécialité : Mathématiques Appliquées

15/09/2017 - 14:00 Mr Achmad Choiruddin Amphithéâtre Noël Gastinel - UFR IMAG F 022

Mots clé :
  • sélecteur de Dantzig
  • lasso
  • vraisemblance de la régression logistique
  • vraisemblance de Poisson
  • Campbell theorem
  • Dantzig selector
  • logistic regression likelihood
  • Poisson likelihood
Les applications récentes telles que les bases de données forestières impliquent des observations de données spatiales associées à l'observation de nombreuses covariables spatiales. Nous considérons dans cette thèse le problème de l'estimation d'une forme paramétrique de la fonction d'intensité dans un tel contexte. Cette thèse développe les procédures de sélection des variables et donne des garanties quant à leur validité. En particulier, nous proposons deux approches différentes pour la sélection de variables: les méthodes de type lasso et les procédures de type sélecteur de Dantzig. Pour les méthodes envisageant les techniques de type lasso, nous dérivons les propriétés asymptotiques des estimations obtenues par les équations estimantes dérivées des vraisemblances de Poisson et de la régression logistique pénalisées par une grande classe de pénalités. Nous prouvons que les estimations obtenues par de ces procédures satisfont la consistance, sparsité et la normalité asymptotique. Pour la partie sélecteur de Dantzig, nous développons une version modifiée du sélecteur de Dantzig, que nous appelons le sélecteur Dantzig linéarisé adaptatif (ALDS), pour obtenir les estimations d'intensité. Plus précisément, les estimations ALDS sont définies comme la solution à un problème d'optimisation qui minimise la somme des coefficients des estimations sous contrainte de la norme d'une approximation linéaire du vecteur score. Nous constatons que les estimations obtenues par de ces méthodes ont des propriétés asymptotiques semblables à celles proposées précédemment à l'aide de méthode régularisation du lasso adaptatif. Nous étudions les aspects computationnels des méthodes développées en utilisant les procédures de type lasso et de type Sélector Dantzig. Nous établissons des liens entre l'estimation de l'intensité des processus ponctuels spatiaux et les modèles linéaires généralisés (GLM). Ainsi, des procédures de calcul plus faciles sont implémentées et un algorithme rapide est proposé. Des études de simulation sont menées pour évaluer les performances des estimations de chacune des deux approches proposées. Enfin, nos méthodes sont appliquées pour modéliser positions d'arbres observées avec un grand nombre de facteurs environnementaux.

Directeurs:

  • Mme Frédérique Letué (Maître de Conférénces - Université Grenoble Alpes )
  • Mr Jean François Coeurjolly (Professeur - Université du Québec à Montréal )

Raporteurs:

  • Mr Vivian Viallon (Maitre de conférences - Université Claude Bernard, Lyon )
  • Mr Jorge Mateu (Professeur - Universitat Jaume I )

Examinateurs:

  • Mme Hermine Bierme (Professeur - Université de Poitiers )
  • Mr Frédéric Lavancier (Maitre de conférences - Université de Nantes )
  • Mr Stéphane Girard (Directeur de Recherche - INRIA Grenoble Rhône-Alpes )