Méthodes de sélection de variables en régression multi-cibles et en contexte non supervisé

English

Séminaire Données et Aléatoire Théorie & Applications

20/11/2025 - 14:00 Mamadou Kanouté Salle 106

Lors de la conception d’un modèle d’apprentissage, les méthodes de sélection de variables permettent d’identifier un sous-ensemble de variables pertinentes parmi l’ensemble initial, ce qui peut réduire la complexité du modèle et en améliorer les performances. Selon le type d’apprentissage, cette sélection peut être supervisée (par rapport à une ou plusieurs variables cibles) ou non supervisée, lorsque l’objectif est d’identifier un sous-ensemble de variables pertinentes sans disposer de labels, en particulier en sélectionnant des variables permettant de reconstruire les autres. Dans cette présentation, nous nous intéresserons à la sélection de variables pour la régression multi-cibles et à la sélection non supervisée de variables. Nous commencerons par une introduction à la régression multi-cibles, puis passerons en revue les méthodes utilisées pour la sélection de variables adaptées à ce type de régression, ainsi que celles utilisées en sélection non supervisée de variables. Nous présenterons ensuite notre approche de sélection non linéaire de variables pour la régression multi-cibles, basée sur un réseau de neurones à une seule couche cachée, dans lequel un terme de régularisation est intégré pour sélectionner les variables prédictives pertinentes tout en tenant compte des relations non linéaires entre les variables cibles et entre variables cibles et prédictives. Enfin, nous présenterons une extension de cette approche au cas non supervisé, permettant d’identifier un sous-ensemble de variables capable de reconstruire les autres, en incorporant en plus un terme de régularisation laplacienne afin de préserver la structure locale des données.