El test de Kolmogorov-Smirnov
es un
test de ajuste
a una ley continua que tiene en cuenta el
conjunto de los
cuantiles, en
contraposición al
test local del
parrafo anterior. El caso típico sigue siendo que se tiene
una muestra
de una ley
desconocida. La
hipótesis nula es:
donde es la función de distribución de una ley continua
dada.
La idea es la siguiente: si la hipótesis
es
correcta, entonces la
función de
distribución empírica
de la muestra debe parecerse a la función
.
La
función de
distribución empírica es la función que va
de
en
, y que toma los valores:
Medimos el ajuste de la función de distribución empírica a
la función por la
distancia de Kolmogorov-Smirnov,
la cual es la distancia
asociada a la norma uniforme entre funciones de distribución.
Para calcularla basta evaluar la diferencia entre
y
en los puntos
.
Bajo la hipótesis
, la ley del estadígrafo
no depende de
, porque los valores
que toma
en los
son variables aleatorias de ley
. Pero la función de distribución de
no tiene una expresión explícita
simple y debe ser calculada numéricamente. Para muestras de tamaño
suficientemente grande, se emplea el siguiente resultado
asintótico:
La serie converge muy rápidamente. En la práctica, para , la suma de los tres primeros términos ya da una
aproximación excelente.
Si la hipótesis
es falsa,
tiende a
con
. El
test es por tanto necesariamente
unilateral
a la derecha (rechazo
de valores muy grandes). Supongamos que la distancia
toma el valor
para una muestra
de tamaño
. El estadígrafo
vale
. El
p-valor
correspondiente es:
El
test
de Kolmogorov-Smirnov se extiende a la comparación de
dos funciones de distribución empíricas y permite entonces
poner a prueba la hipótesis de si dos muestras salieron de la
misma ley. Se pueden utilizar muchos otros
tests de ajuste, como
los de Stephens, Anderson-Darling y Cramer-von Mises.