Habilitation à Diriger des Recherches de l'Université Joseph Fourier

Spécialité: Mathématiques Appliquées

Mme Sophie LAMBERT-LACROIX (MCF, UJF)

soutiendra le Lundi 8 Décembre 2008 à 14h00 Amphithéâtre Noël Gastinel - UFR IMAG F 022

Titre:

Processus et champs aléatoires. Données de grandes dimensions et sciences du vivant.

Résumé:

La première partie est consacrée aux processus non stationnaires à temps discret et aux champs aléatoires. Après avoir introduit la fonction d'autocorrélation partielle des processus à temps discret non stationnaires, on présente quelques applications dans le domaine spectral et dans le cadre des processus périodiquement corrélés. La fonction d'autocorrélation partielle, qui fournit une nouvelle paramétrisation, permet, en particulier, d'étendre de façon naturelle la méthode du maximum d'entropie. Par la suite nous nous sommes intéressés au problème plus délicat du prolongement par maximum d'entropie à partir d'une séquence de coefficients d'autocovariance non consécutifs. Nous présentons ensuite la simulation de champs aléatoires fractionnaires. Du fait de sa rapidité, la méthode du "déplacement du point milieu" est souvent utilisée pour simuler des champs browniens fractionnaires. Dans le même esprit, nous avons proposé une méthode rapide et efficace mais pour simuler n'importe quel champ aléatoire, pas seulement brownien fractionnaire. La deuxième partie est consacrée aux données de grandes dimensions, fréquemment rencontrées en sciences du vivant. On s'intéresse dans un premier temps à la réduction de dimension dans les modèles linéaires généralisés et son application à la classification de données issues de biopuces. Le but de l'analyse de ces données est celui de la classification d'individus selon leur pathologie. Une des particularités de ces données réside dans le fait que le nombre de données est relativement faible (de l'ordre de la centaine) par rapport au nombre de gènes (de l'ordre de quelques milliers). Sans préalablement réduire la dimension, les méthodes standards de statistique en classification supervisée, même utilisables, ne sont pas très performantes. Nous avons étudié et proposé plusieurs méthodes de réduction de dimension dans ce cadre. Leur performances sont comparées sur des jeux de données connus dans la littérature des biopuces. Dans un deuxième temps on s'intéressera à l'analyse de données de spectrométrie de masse. Il existe actuellement un grand intérêt dans l'étude des protéines avec espoir qu'elle conduise à une façon plus directe d'appréhender les fonctions biologiques d'un profil de maladie. Nous avons considéré plusieurs problèmes relatifs au traitement de telles données (estimation du bruit de fond, fléau de la dimension, alignement des spectres, analyses de variance type FANOVA) Notre approche a été comparée avec les différentes approches utilisées dans la littérature et testée sur des données simulées et réelles.

Mots-Clés:

Processus non stationnaires, champs aléatoires, réduction de dimension, modèles linéaires, biopuces, spectrométrie de masse.

Membres du Jury:

Mr Anestis ANTONIADIS (PR, UJF), proposé président.

Rapporteurs:

Mr Fabrice GAMBOA (PR, Univ. P. Sabatier, IMT)
Mme Irène GIJBELS (PR, Katholieke Univ., Leuven)
Mr Georges OPPENHEIM (PR, Univ. Paris-Est)

Examinateur:

Mr Jacques ISTAS (PR, Univ. P. Mendès-France)