Non asymptotic bounds for the PLS estimator

English

Séminaire Données et Aléatoire Théorie & Applications

19/12/2024 - 14:00 Luca Castelli Salle 106

La réduction de dimension est un concept clé dans l'analyse de données et la modélisation statistique. Elle vise à extraire les informations les plus importantes d'un ensemble de données complexes tout en réduisant sa dimensionnalité. Au cours de cet exposé nous introduirons la régression PLS (Partial Least Square) qui permet de traiter efficacement la multicollinéarité et le cas de la grande dimension. Nous nous focaliserons d'abord sur le cas d'une composante qui fournit un cadre utile pour comprendre le mécanisme sous-jacent. Nous fournissons une borne non-asymptotique sur la perte quadratique en prédiction. Nous généralisons ensuite ce résultat pour l'estimateur PLS sur K composantes.  Nous présentons quelques scénarios pour lesquels la PLS manque de variabilité et nous prouvons qu'il est possible de contourner ces situations en introduisant une étape de régularisation Ridge.