Sección : Variables aleatorias
Previo : Función de distribución
Siguiente : Esperanza


Función cuantil


La función cuantil de una variable aleatoria (o de una ley de probabilidad) es la inversa de su función de distribución. Cuando la función de distribución es estrictamente creciente, su inversa está definida sin ambigüedad. Pero una función de distribución se mantiene constante en todo intervalo en el cual la variable aleatoria no puede tomar valores. Es por esto que se introduce la siguiente definición.

Definición 3.8   Sea $ X$ una variable aleatoria con valores en $ \mathbb {R}$, y $ F_X$ su función de distribución. Se llama función cuantil de $ X$ a la función de $ ]0,1[$ en $ \mathbb {R}$, denotada por $ Q_X$, que a $ u\in
]0,1[$ hace corresponder:

$\displaystyle Q_X(u) = \inf\{x\;:\; F_X(x)\geq u\}\;.
$

Por convención, podemos decidir que $ Q_X(0)$ es el menor de los valores posibles de $ X$ y $ Q_X(1)$ es el mayor; pueden ser eventualmente infinitos.

Leyes discretas.

La función cuantil de una variable aleatoria discreta es una función en escalera, al igual que su función de distribución. Si $ X$ toma los valores $ x_k\,,\;k=1,2\ldots$, puestos en orden creciente, la función de distribución es igual a:

$\displaystyle F_k = \mathbb {P}[X=x_1]+\cdots+\mathbb {P}[X=x_k]\;,
$

en el intervalo $ [x_k,x_{k+1}[$. La función cuantil vale:

\begin{displaymath}
Q_X(u)=\left\{
\begin{array}{lcl}
x_1&&\mbox{para } u\in ...
...para } u\in ]F_k,F_{k+1}]\\
\vdots&&
\end{array}
\right.
\end{displaymath}

Por ejemplo, para la ley geométrica $ {\cal G}(p)$, la función cuantil es la función que, para todo $ k=1,2,\ldots$, vale $ k$ en el intervalo $ ]1-(1\!-\!p)^{k-1},1-(1\!-\!p)^k]$.

Leyes continuas.

Vamos a situarnos en el caso más frecuente, en el que la densidad $ f_X$ es estrictamente creciente en un intervalo de $ \mathbb {R}$ (su soporte) y nula fuera de él. Si el intervalo es $ [a,b]$, la función de distribución se anula antes de $ a$, si $ a$ es finito, crece estrictamente de 0 a $ 1$ entre $ a$ y $ b$ y vale $ 1$ después de $ b$, si $ b$ es finito. Todo valor $ u$ estrictamente comprendido entre 0 y $ 1$ se alcanza una vez y una sola por $ F_X$. El valor de $ Q_X(u)$ es el único punto $ x$, comprendido entre $ a$ y $ b$, tal que $ F_X(x) =
u$.

Calculemos como ejemplo la función cuantil de la ley exponencial $ {\cal E}(\lambda )$, con función de distribución $ (1-e^{-\lambda
x})\mathbb {I}_{\mathbb {R}^+}(x)$. Para todo $ u\in
]0,1[$:

$\displaystyle (1-e^{-\lambda x}) = u\;\Longleftrightarrow x=Q_X(u) =
-\frac{1}{\lambda}\log(1-u)\;.
$


La función cuantil es un instrumento para describir la dispersión de una ley. Si se realizan un gran número llamadas independientes de la misma ley (obtención de una muestra), se debe esperar que una proporción $ u$ de los valores sea inferior a $ Q_X(u)$. Un valor importante es la mediana, $ Q_X(0.5)$. Los valores de la función cuantil son empleados más frecuentemente en estadística que los valores de la función de distribución. Se utiliza frecuentemente en especial los intervalos de dispersión, entendiendo esto como que deben contener una proporción grande de los datos.

Definición 3.9   Sea $ X$ una variable aleatoria y $ \alpha$ un número real entre 0 y $ 1$. Se llama intervalo de dispersión de nivel $ 1\!-\!\alpha$ a todo intervalo de la forma:

$\displaystyle [\,Q_X(\beta),Q_X(1-\alpha+\beta)\,]\;,$   donde $\displaystyle 0\leq
\beta\leq \alpha\;.
$


En estadística emplear números reales $ \alpha$ entre 0 y $ 1$ constituye una tradición. La misma tradición hace que se les asigne prioritariamente los valores $ 0.05$ y $ 0.01$, menos frecuentemente $ 0.02$, $ 0.005$ ó $ 0.001$. Por tanto debemos leer $ \alpha$ como ``una proporción débil'', y $ 1\!-\!\alpha$ como ``una proporción fuerte''. Un intervalo de dispersión de nivel $ 1\!-\!\alpha$ para $ X$ es uno tal que $ X$ pertenece a ese intervalo con probabilidad $ 1\!-\!\alpha$: el contiene, por tanto, a una fuerte proporción de la densidad, aún si el es, en general, mucho más pequeño que el soporte de la ley. Existen, en general, una infinidad de intervalos de dispersión de un nivel dado.

Presentamos algunos de nivel $ 0.99$ para la ley normal $ {\cal N}(0,1)$.

\begin{displaymath}
\begin{array}{\vert c\vert c\vert c\vert}
\hline
\beta&Q_...
...089&2.8782\\
0.01&-2.3263&+\infty\\
\hline
\end{array}
\end{displaymath}


Según sean los valores de $ \beta$, decimos que un intervalo de dispersión de nivel $ 1\!-\!\alpha$ es:

$ \bullet$
unilateral inferior si $ \beta=0$,
$ \bullet$
unilateral superior si $ \beta=\alpha$,
$ \bullet$
simétrico si $ \beta=\alpha/2$,
$ \bullet$
optimal si su amplitud es la más pequeña de entre todos los intervalos de dispersión de nivel $ 1\!-\!\alpha$.

Determinar un intervalo de dispersión optimal requiere, en general, de un cálculo especial salvo en el caso en que la ley es simétrica, como una ley normal o una ley de Student. Decimos que la ley de $ X$ es simétrica si para todo $ u\in [0,1]$,

$\displaystyle Q_X(u) - Q_X(0.5) = Q_X(0.5) - Q_X(1-u)\;.
$


Se demuestra que si la ley de $ X$ es simétrica, entonces el intervalo de dispersión simétrico es optimal. Otra aplicación importante de la función cuantil es el método de inversión, el cual es un método general que consiste en simular una variable aleatoria de cualquier ley, combinando el empleo de la función Random con el de la función cuantil de la variable.

Proposición 3.10   Sea $ F$ una función de distribución real, $ Q$ la función cuantil correspondiente y $ U$ una variable aleatoria de ley uniforme en $ [0,1]$. La variable aleatoria $ X=Q(U)$ tiene a $ F$ por función de distribución.


Demostración : Para todo $ x\in \mathbb {R}$, tenemos:

$\displaystyle \mathbb {P}[X\leq x]$ $\displaystyle =$ $\displaystyle \mathbb {P}[Q(U)\leq x]$  
  $\displaystyle =$ $\displaystyle \mathbb {P}[\,\inf\,\{y\; :\; F(y)\geq U\}\leq x\,]$  
  $\displaystyle =$ $\displaystyle \mathbb {P}[\,U\leq F(x)\,]$  
  $\displaystyle =$ $\displaystyle F(x)\;.$  

$ \square$

Ejemplo :

La función cuantil de la ley exponencial $ {\cal E}(\lambda )$ hace corresponder a $ u\in
]0,1[$ el valor:

$\displaystyle Q(u)=-\frac{1}{\lambda}\log (1-u)\;.
$

De aquí obtenemos el algoritmo de simulación:

$ X\longleftarrow -\log ($ Random$ )/\lambda\;.$

No vale la pena calcular $ -\log (1\!-\!$ Random$ )/\lambda$ porque Random y $ 1-$ Random tienen la misma ley.

El método de inversión no es exacto, a menos que se conozca la expresión explícita de $ F^{-1}$, como es el caso de la ley exponencial. Esto raramente sucede. Si queremos aplicar el método a la ley normal, por ejemplo, será necesario utilizar un algoritmo de aproximación. Además de la imprecisión, el método de inversión será relativamente lento. Aún cuando se conoce explícitamente la expresión de $ F^{-1}$, el método de inversión es raramente el más eficaz para las variables continuas. Sin embargo es aplicable a gran cantidad de leyes discretas.

Supongamos que $ X$ toma los valores $ x_1, x_2,\ldots$, ordenados por orden creciente. Denotemos por $ F_k$ el valor de la función de distribución en el intervalo $ [x_k,x_{k+1}[$. El algoritmo de simulación por inversión es el siguiente.

$ k\longleftarrow 1$
$ U \longleftarrow $ Random
MientrasQue ($ U > F_k$)
$ k\longleftarrow k+1$
finMientrasQue
$ X\longleftarrow x_k$

Modifiquemos ligeramente el algoritmo añadiéndole una interpolación lineal. Cuando $ U$ cae en el intervalo $ ]F_{k-1},F_k]$, en lugar de dar $ x_k$, como inicialmente, ahora va a dar el valor:

$\displaystyle x_{k-1}+(x_k-x_{k-1})*
\frac{U-F_{k-1}}{F_k-F_{k-1}}
\;.
$


El resultado es reemplazar la función de distribución en escalera por una función de distribución lineal a trozos que pasa por los puntos $ (x_k, F_k)$. La distribución de probabilidad correspondiente tiene como densidad a una función en escalera (constante en cada intervalo $ ]x_{k-1},x_k[$). Es un histograma.



Sección : Variables aleatorias
Previo : Función de distribución
Siguiente : Esperanza