Propriétés Oracles des estimateurs BIC pour l'estimation d'arbre de contexte

English

Séminaire Probabilités & Statistique

31/03/2011 - 14:00 Matthieu Lerasle (Université de São Paulo) Salle 1 - Tour IRMA

Les arbres de contexte probabilistes, introduits par Rissanen [3], permettent de représenter de
façon économique les chaines de mémoires infinies. Dans ces mod`eles, le premier problème statistique
est celui de l’estimation de l’arbre des contextes, c’est à dire des parties du passé nécessaires à la
prédiction d’un symbole à partir de l’observation d’une réalisation de la chaîne. Les estimateurs BIC
sont consistents lorsque les contextes sont uniformément bornés et “fortement consistents”
sinon (Csiszar et Talata [2]), quelque soit la constante c dans la pénalité BIC. De plus, ces estimateurs
sont calculables de façon efficace. Dans cet exposé, nous nous intéresserons aux propriétés oracles
des estimateurs d’arbre de contexte probabiliste associés. Nous prouvons une inégalité
oracle pour le risque de Küllback de ces estimateurs lorsque la constante c est suffisamment grande
et que le processus X(n) est suffisamment mélangeant. Nous étudions ensuite l’heuristique de pente
de [1] dans ce problème afin de justifier l’usage de l’algorithme de pente pour la calibration pratique
de la constante c de la pénalité BIC.

References
[1] L. Birgé and P. Massart. Minimal penalties for Gaussian model selection. Probab. Theory Related
Fields, 138(1-2):33–73, 2007.
[2] I. Csiszar and Z. Talata. Context tree estimation for not necessarily finite memory processes, via
BIC and MDL. IEEE Trans. Inform. Theory, 52(3):1007–1016, 2006.
[3] J. Rissanen. A universal data compression system. IEEE Trans. Inform. Theory, 29(5):656–664,
1983.