Sección : Teoremas límites
Previo : Ley de los Grandes
Siguiente : Intervalos de confianza


Teorema del Límite Centrado

En simulación, la situación típica es aquella en la que uno ejecuta un gran número de veces un lazo, calculando en cada pasada la realización de variables aleatorias independientes. El resultado que esperamos obtener es en general estimar una esperanza. También en simulación, como sucede en la Física o en la Biología, debemos dar un resultado indicando su exactitud. El Teorema del Límite Centrado es el que nos permite calcular esta exactitud.

Teorema 4.2   Sea $ (X_n), n\in \mathbb {N}^*$, una sucesión de variables aleatorias independientes con una misma ley, de esperanza $ \mu$ y de varianza $ \sigma^2$ ambas finitas. Denotemos:

$\displaystyle \forall n\in \mathbb {N}^*\;,\quad
\overline X_n = \frac{X_1+\cdots +X_n}{n}$   y$\displaystyle \quad
Z_n
=\sqrt{n}\, \frac{\overline X_n - \mu}{\sigma}
\;.
$


La ley de $ Z_n$ converge a la ley normal $ {\cal N}(0,1)$, es decir para todo $ a<b$ :

$\displaystyle \lim_{n\rightarrow\infty}\,\mathbb {P}[a<Z_n<b]\;=\;
\int_a^b \frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx
\;.
$


Interpretación:

En el Teorema del Límite Centrado, $ \mu$ es el valor que hay que estimar. Los $ n$ valores $ X_1,\ldots,X_n$ constituyen una muestra de mediciones aleatorias independientes de esperanza $ \mu$. La cantidad $ (X_1+\cdots
+X_n)/n$ es la media empírica de la muestra, la cual según la Ley de los Grandes Números debe converger a la esperanza $ \mu$. El Teorema del Límite Centrado da la exactitud de esta aproximación. Podemos leerlo intuitivamente de la siguiente manera. Si $ n$ es lo suficientemente grande entonces $ Z_n$ se encuentra muy probablemente comprendida entre $ -3$ y $ 3$ (la probabilidad es $ 0.9973$). Tenemos además:

$\displaystyle \frac{X_1+\cdots +X_n}{n} - \mu\;\in\;
\left[-\frac{3\sigma}{\sqrt n}\;;\;
+\frac{3\sigma}{\sqrt n}\right]
\;,
$

o bien $ \overline X_n$ (media empírica) es igual a $ \mu$ con una aproximación de $ 3 \sigma /\sqrt{n}$. Esto lo formalizamos con la noción de intervalo de confianza.

El Teorema del Límite Centrado se utiliza para valores finitos de $ n$. La idea concreta es la siguiente. Si $ n$ es lo suficientemente grande, la variable centrada y reducida (esperanza 0 y varianza $ 1$) $ Z_n$ asociada a la suma de $ n$ variables independientes sigue aproximadamente la ley $ {\cal N}(0,1)$. Si se realiza una cantidad suficiente de simulaciones de $ Z_n$ y si trazamos un histograma de los valores obtenidos, este no estará muy alejado de la curva $ \frac{ 1}{\sqrt{2\pi}}e^{-x^2/2}$. No más lejos en todo caso que si hubiésemos simulado variables aleatorias de ley $ {\cal N}(0,1)$. Si $ Z$ sigue la ley $ {\cal N}(0,1)$, entonces $ Y=\sigma Z+\mu$ sigue la ley $ {\cal N}(\mu,\sigma^2)$.

También podemos decir que para $ n$ lo suficientemente grande una suma de $ n$ variables aleatorias independientes sigue aproximadamente una ley normal, cuya esperanza y cuya varianza son respectivamente la suma de las esperanzas y la suma de las varianzas de las variables que se suman. El problema es saber a partir de qué valor $ n$ es ``lo suficientemente grande'', para obtener la exactitud que se desea. Esto depende mucho de la ley de las $ X_n$. La aproximación es mejor según que esta ley sea más simétrica. En particular el buen comportamiento de la ley uniforme, a la vista de lo que plantea el Teorema del Límite Centrado, conduce a un algoritmo aproximado de simulación para la ley $ {\cal N}(0,1)$.

$ X\longleftarrow -6$
Repetir $ 12$ veces
$ X\longleftarrow X+$ Random
finRepetir

Justificación:

Si $ (R_n)$ designa la sucesión de llamadas de Random (sucesión de variables independientes de ley uniforme en $ [0,1])$, se tiene:

$\displaystyle \frac{R_1+\cdots +R_n-n/2}{\sqrt n\sqrt{1/12}}
\stackrel {\cal L} \longrightarrow
{\cal N}(0,1)\;.
$

Se evita una división y se obtiene una aproximación que ya es buena tomando $ n=12$. Este algoritmo no es aconsejado su empleo con los generadores clásicos. Su inconveniente principal es que realiza muchas llamadas a Random, lo que plantea el problema de la independencia de las realizaciones sucesivas. Para las leyes más disimétricas como la ley exponencial, la aproximación normal no es válida para la suma de algunas decenas de variables. Se puede considerar justificada a partir de la suma de algunos centenares. En simulación, son miles, si no millones, de variables que son engendradas, y el usar la aproximación normal es completamente legítimo.



Sección : Teoremas límites
Previo : Ley de los Grandes
Siguiente : Intervalos de confianza