Sección : Teoremas límites
Previo : Teorema del Límite Centrado
Siguiente : Ejercicios


Intervalos de confianza


La idea de la estimación por intervalo de confianza es definir, alrededor de la media empírica, un intervalo aleatorio (que depende de $ n$ experimentos) que contiene a $ \mu$ con una probabilidad alta. La longitud de este intervalo es la que mide la exactitud de la estimación.

Teorema 4.3   Sea $ (X_n), n\in \mathbb {N}^*$ una sucesión de variables aleatorias independientes con una misma ley, de esperanza $ \mu$ y varianza $ \sigma^2$ ambas finitas. Para todo $ n\in\mathbb {N}$ denotemos por:

$\displaystyle \overline X_n = \frac{X_1+\cdots +X_n}{n}\;,\quad
S_n^2 = \frac{X_1^2+\cdots +X_n^2}{n} - \overline X_n^2$   y$\displaystyle \quad S_n = \sqrt{S_n^2} \;.
$

Sea $ \alpha$ un número real $ >0$ (pequeño). Sea $ z_\alpha$ el número real $ >0$ tal que:

$\displaystyle \int_{-z_\alpha}^{+z_\alpha}\frac{1}{\sqrt{2\pi}}e^{-x^2/2}\,dx
=1-\alpha
\;.
$

Denotemos:
\begin{displaymath}
\begin{array}{cclcccl}
T_1& =& \overline X_n-
\displayst...
...\displaystyle{\frac{z_\alpha S_n }{\sqrt{n}}}\;.
\end{array}
\end{displaymath}
Entonces:

$\displaystyle \lim_{n\rightarrow \infty}\,
\mathbb {P}[\,\mu\in[T_1,T_2]\,] \;...
...ightarrow \infty}
\mathbb {P}[\,\mu\in[T'_1,T'_2]\,] \;=\;
1-\alpha \,
\;.
$

Se dice que los intervalos aleatorios $ [T_1,T_2]$ y $ [T'_1,T'_2]$ son intervalos de confianza para $ \mu$, de nivel de confianza asintótico $ 1-\alpha$.

Interpretación:

Como el valor de $ \mu$ es desconocido no hay ninguna razón a priori para que la desviación estándar $ \sigma$ sea conocida. Si es desconocida, se la estima por la desviación estándar empírica $ S_n$. Esta es la razón por la cual damos dos intervalos de confianza. El valor de $ z_\alpha$ se obtiene a partir de un módulo de cálculo numérico. Los valores más usados son los siguientes:

$\displaystyle \begin{array}{\vert c\vert c\vert c\vert c\vert}
\hline \alpha &...
... 0.05
\\  \hline
z_\alpha & 2.5758 & 2.3263 & 1.96
\\  \hline
\end{array}
$


Los intervalos $ [T_1,T_2]$ y $ [T'_1,T'_2]$ son aleatorios. Como resultado de la sucesión de experimentos , $ T_1$ y $ T_2$ habrán tomado valores particulares $ t_1$ y $ t_2$. No se podrá decir que la probabilidad de que $ \mu$ pertenezca a $ [t_1, t_2]$ es de $ 1-\alpha$. Tanto $ \mu$ como $ t_1$ y $ t_2$ son números reales fijos y el resultado $ \mu\in [t_1,t_2]$ será verdadero o falso, pero no dependerá ya del azar. Lo que podremos decir es que este encuadre (de $ \mu$ entre $ t_1$ y $ t_2$) se obtiene como resultado de un experimento que tenia un porcentaje alto de posibilidades de dar un resultado verdadero. Para $ \alpha =0.01$, si repetimos $ 100$ veces la serie de $ n$ experimentos para obtener $ 100$ intervalos, podemos esperar que uno de ellos sea falso. Hay que ver un intervalo de confianza como una precisión que se da del valor estimado de $ \mu$:

$\displaystyle \mu =\overline X_n \pm \frac{z_\alpha \sigma }{\sqrt{n}}$   ó$\displaystyle \qquad \mu =\overline X_n \pm \frac{z_\alpha S_n
}{\sqrt{n}}\;.
$


Estimación de una probabilidad.

Supongamos que el valor que hay que estimar sea la probabilidad $ p$ de un evento. Se realizan una serie de experimentos independientes anotando, cada vez, si el evento se realiza ($ 1$) o no (0). La variable aleatoria correspondiente a el $ n$-ésimo experimento se denota por $ X_n$. Las $ X_n$ siguen la ley de Bernoulli de parámetro $ p$:

$\displaystyle \mathbb {P}[X_n=0]=1\!-\!p\;,\quad
\mathbb {P}[X_n=1]=p\;,
$

$\displaystyle \mu =\mathbb {E}[X_n]=p$   y$\displaystyle \quad
\sigma^2 =Var[X_n]=p(1\!-\!p)\;.
$

La suma $ X_1+\cdots +X_n$ (número de veces que sucedió el evento en los $ n$ experimentos) sigue la ley binomial $ {\cal B}(n,p)$. La media empírica $ \overline X_n$ de la muestra es en este caso la frecuencia experimental del evento. La varianza empírica $ S_n^2$ es igual a $ \overline X_n(1-\overline X_n)$. Podemos observar en este caso que la varianza y la varianza empírica están acotadas por $ 1/4$.

Volvamos a la experiencia de la aguja de Buffon. Esta consiste en lanzar al azar una aguja sobre un parqué. Si el ancho de las láminas de madera es igual a la longitud de la aguja, hemos visto que la probabilidad (teórica) para que la aguja caiga sobre 2 láminas a la vez es $ 2/\pi$. Supongamos que repetimos el experimento $ n$ veces, físicamente o por simulación. Como resultado de las $ n$ repeticiones obtenemos un valor para la frecuencia experimental $ \overline X_n$ y por tanto un intervalo de confianza $ [T_1,T_2]$. El intervalo $ [2/T_2,2/T_1]$ es también un intervalo de confianza para el valor de $ \pi$. He aquí , por ejemplo, un resultado obtenido con $ n=10^6$ experimentos.

$\displaystyle \overline X_n=0.636438\;,\;
\frac{2n}{\overline X_n}=3.14249\;.
$

Para $ \alpha =0.01$ ( $ z_\alpha=2.5758$) y $ \alpha=0.05$ ( $ z_\alpha=1.96$), los intervalos de confianza de nivel $ 1\!-\!\alpha$ para la probabilidad son respectivamente:

$\displaystyle [0.6352\,;\,0.6377]\;$ y $\displaystyle \;[0.6355\,;\,0.6374]\;.
$


Ellos corresponden a los intervalos siguientes para $ \pi$ :

$\displaystyle [3.1364\,;\, 3.1486]\;$ y $\displaystyle \;[3.1378\,;\, 3.14715]\;.
$



Sección : Teoremas límites
Previo : Teorema del Límite Centrado
Siguiente : Ejercicios