Modèles à blocs stochastiques, classifications et applications dans le domaine du text mining et dans le domaine du traitements cognitifs.
Séminaire Données et Aléatoire Théorie & Applications
23/01/2020 - 15:00 Mr Yousri Slaoui (Univ. Poitiers) Salle 106 - Batiment IMAG
Cette présentation porte sur l'analyse de réseaux pondérés, graphes finis où chaque arête est associée à un poids représentant l'intensité de sa force. Dans la première partie nous proposons une extension du modèle à blocs stochastiques (SBM) binaire, appelée modèle à blocs stochastiques binomial (bSBM). Cette extension est motivée par l'étude des réseaux de co-citations dans un contexte des données textuelles où les données sont représentées par un graphe. Les noeuds sont des mots et chaque arête joignant deux mots est pondérée par le nombre de documents inclus dans le corpus citant simultanément cette paire de mots. Nous proposons par la suite une méthode d'inférence basée sur l'algorithme espérance maximisation variationnel (EMV) afin de pouvoir estimer les paramètres du modèle proposé ce qui nous permet de classifier les mots du réseau. Nous adoptons par la suite une méthode qui repose sur la maximisation d'un critère ICL (Integrated Classification Likelihood) afin de pouvoir sélectionner un modèle optimal ainsi le nombre de clusters. Nous développons aussi une approche variationnelle pour traiter le réseau et nous comparons cette approche avec celle développée dans la partie précédente. Dans la dernière partie, nous développons un SBM avec plusieurs attributs pour traiter les réseaux ayant des poids associés aux noeuds. Nous motivons cette méthode par une application qui vise au développement d'un outil d'aide à la spécification de différents traitements cognitifs réalisés par le cerveau lors de la préparation à l'écriture. La détection des différents types d'activité cognitive, de leur enchaînement, de leur temps d'activation, de leur durée sont des informations importantes pour comprendre les processus d'apprentissage de mots, de reconnaissance visuelle. Cette approche est d'un intérêt majeur pour les données éducationnelles de l'administration scolaire et universitaire dans le but de détecter, à terme, des étudiants/élèves qui décrochent. Ce travail est en collaboration avec Abir EL HAJ, Pierre-Yves Louis et Cyril Perret.