2014-11-10

Test de normalidad Shapiro–Wilk en R

Title La prueba de Shapiro-Wilk es un test estadístico empleado para contrastar la normalidad de un conjunto de datos. Publicado en 1965 por Samuel Shapiro y Martin Wilk.

El test utiliza el contraste de hipótesis para rechazar la normalidad de la muestra. La hipótesis nula asume que la muestra proviene de una población distribuida normalmente. Si el valor p es menor al nivel de significación establecido (convencionalmente un 0.05) se rechaza la hipótesis nula y se considera que hay evidencia para concluir que la muestra no proviene de una distribución normal. Sin embargo, conviene recordar que en caso contrario —el valor p es mayor que el nivel de significación establecido— no se acepta la hipótesis alternativa, simplemente no se rechaza la hipótesis nula. No se demuestra nada.

Test Shapiro-Wilk

set.seed(2001)
serie <- rnorm(100)
qqnorm(serie)
qqline(serie)
shapiro.test(serie)
Shapiro-Wilk normality test

data:  serie
W = 0.9867, p-value = 0.4204
Como el valor p = 0.4204 es mayor que 0.05, no se rechaza la hipótesis nula.

Gráfico Q-Q

En general, el test está influenciado por el tamaño de la muestra. Para muestras muy pequeñas no se detectarán incluso grandes desviaciones de la normalidad, y para muestras muy grandes, incluso pequeñas desviaciones de la normalidad provocarán rechazar la hipótesis nula. Por ello, adicionalmente, es necesario contrastar la normalidad mediante otras pruebas o visualmente, como por ejemplo, con un gráfico Q-Q.

Referencias

No hay comentarios:

Publicar un comentario

Nube de datos