Prueba de Normalidad Shapiro-Wilk vs Kolmogorov-Smirnov: Cuándo Usar Cada Una e Interpretar los Resultados en SPSS

Prueba de Normalidad Shapiro-Wilk vs Kolmogorov-Smirnov: Cuándo Usar Cada Una e Interpretar los Resultados en SPSS

Antes de aplicar pruebas paramétricas como el test t, el ANOVA o la regresión lineal, debes verificar si tu variable dependiente sigue una distribución normal. Las dos pruebas de normalidad más usadas en investigación académica son la Shapiro-Wilk y la Kolmogorov-Smirnov —la segunda, en su versión corregida de Lilliefors para SPSS. Elegir la incorrecta, o interpretar mal el p-valor, es uno de los errores metodológicos más habituales en TFG de ciencias sociales y de la salud.

Regla práctica: Usa Shapiro-Wilk cuando n < 50 por grupo (mayor potencia para muestras pequeñas). Usa Kolmogorov-Smirnov-Lilliefors cuando n ≥ 50. En ambos casos: si p ≥ .05, no se rechaza normalidad; si p < .05, los datos no son normales y debes usar pruebas no paramétricas (o justificar robustez por TCL si n ≥ 30).

¿Por qué verificar la normalidad?

Las pruebas paramétricas asumen que la variable dependiente sigue una distribución normal en la población. Cuando este supuesto se viola con muestras pequeñas, los valores p pueden estar inflados (mayor riesgo de error tipo I) o deflados (mayor riesgo de tipo II), comprometiendo la validez de las conclusiones. Verificar la normalidad es, por tanto, el primer paso del análisis estadístico inferencial en cualquier TFG cuantitativo.

La prueba de Shapiro-Wilk

Desarrollada por Samuel S. Shapiro y Martin B. Wilk en 1965, esta prueba mide la correlación entre los datos observados y los cuantiles de una distribución normal teórica. El estadístico W toma valores entre 0 y 1: cuanto más se acerque a 1, más normales son los datos.

Es la prueba con mayor potencia estadística para detectar desviaciones de la normalidad, especialmente con n < 50. Esto significa que, bajo no normalidad, Shapiro-Wilk detecta el problema con mayor fiabilidad que Kolmogorov-Smirnov. Está recomendada por la práctica totalidad de los manuales de estadística aplicada para ciencias de la salud y psicología.

La prueba de Kolmogorov-Smirnov-Lilliefors

La prueba de Kolmogorov-Smirnov original compara la función de distribución empírica con una distribución teórica especificada a priori. La versión que SPSS implementa para contrastar normalidad es la corrección de Lilliefors (1967), que ajusta los valores críticos para el caso en que los parámetros (media y varianza) se estiman a partir de la propia muestra.

El estadístico D mide la máxima diferencia absoluta entre la distribución empírica acumulada y la distribución normal acumulada. Es adecuada para muestras medianas y grandes (n ≥ 50), pero su potencia cae significativamente por debajo de ese umbral.

Comparativa: cuándo usar cada una

Característica Shapiro-Wilk K-S Lilliefors
Tamaño muestral óptimo n < 50 n ≥ 50
Potencia con n pequeño Alta Baja
Disponible en SPSS Sí (versión Lilliefors)
Sensible a muestras muy grandes Moderadamente Muy sensible
Estadístico reportado W D
Advertencia sobre muestras grandes: Con n > 200, ambas pruebas se vuelven extremadamente sensibles y rechazarán la normalidad ante desviaciones triviales e irrelevantes para la robustez del ANOVA o test t. Con n > 200, complementa las pruebas formales con el análisis visual (Q-Q plot, histograma) y la inspección de asimetría y curtosis.

Cómo ejecutarlas en SPSS

  1. Ir a Analizar → Estadísticos descriptivos → Explorar.
  2. Desplazar la variable dependiente al cuadro Variable(s) dependiente(s).
  3. Si quieres verificar la normalidad por grupos, añade la variable de agrupación en Factor(es).
  4. Clic en el botón Gráficos: marcar Gráficos de normalidad con pruebas (esto activa automáticamente Shapiro-Wilk y K-S Lilliefors).
  5. Hacer clic en Aceptar.

SPSS reportará ambas pruebas simultáneamente en la Tabla de Pruebas de normalidad.

Interpretación del output paso a paso

El output de SPSS muestra una tabla con los estadísticos W (Shapiro-Wilk) y D (K-S) junto a sus grados de libertad y el valor de significación. La lógica de interpretación es siempre la misma:

  • p ≥ .05: No se rechaza H₀ (distribución normal). Los datos son compatibles con la normalidad. Se puede proceder con pruebas paramétricas.
  • p < .05: Se rechaza H₀. Existen evidencias de que los datos no siguen distribución normal. Se recomienda usar pruebas no paramétricas o transformaciones.

Ejemplo de interpretación

Un TFG de Educación mide el rendimiento académico de dos grupos (n = 28 y n = 31). SPSS reporta:

  • Grupo A: Shapiro-Wilk W = 0.967, p = .483 → normalidad no rechazada.
  • Grupo B: Shapiro-Wilk W = 0.891, p = .021 → normalidad rechazada.

Dado que uno de los grupos viola la normalidad y n < 30 por grupo, se recomienda usar la prueba U de Mann-Whitney en lugar del test t de Student.

Herramientas gráficas complementarias

Las pruebas formales deben complementarse siempre con inspección visual. SPSS genera dos gráficos en el procedimiento Explorar:

  • Histograma con curva normal superpuesta: permite ver la forma de la distribución. Busca asimetría pronunciada (cola larga a un lado) o bimodalidad.
  • Gráfico Q-Q (cuantil-cuantil): compara los cuantiles observados con los esperados bajo normalidad. Si los puntos se alinean sobre la diagonal, los datos son normales; si se curvan sistemáticamente, hay desviación.

Además, la inspección de asimetría y curtosis estandarizadas (valor/error estándar) es útil: valores entre −2 y +2 generalmente indican una distribución suficientemente normal para el ANOVA (Field, 2018).

¿Qué hacer si los datos no son normales?

Tienes cuatro opciones ordenadas por preferencia:

  1. Pruebas no paramétricas: Mann-Whitney (dos grupos), Kruskal-Wallis (varios grupos), Wilcoxon (medidas repetidas), Friedman (ANOVA de medidas repetidas no paramétrico).
  2. Transformaciones de datos: logarítmica (para distribuciones sesgadas positivas), raíz cuadrada (para datos de recuento), inversa (para distribuciones muy asimétricas). Aplícalas con cautela y justifica teóricamente.
  3. Robustez del TCL: con n ≥ 30 por grupo, el teorema central del límite garantiza que las medias muestrales son aproximadamente normales incluso si los datos individuales no lo son. En este caso, mantener el test t es metodológicamente defendible.
  4. Bootstrap: métodos de remuestreo que no asumen distribución específica. SPSS ofrece intervalos de confianza con bootstrap para muchos análisis. Adecuado para muestras pequeñas no normales cuando no existe alternativa no paramétrica directa.

Preguntas frecuentes

Si Shapiro-Wilk da p = .048, ¿debo necesariamente usar Mann-Whitney?

Depende del tamaño muestral. Si n ≥ 30 por grupo, el test t es robusto gracias al TCL y los p-valores serán fiables aunque los datos no sean estrictamente normales. Si n < 30, sí es recomendable Mann-Whitney. Además, complementa la prueba formal con el Q-Q plot: si los puntos se desvían ligeramente de la diagonal sin patrón claro, la violación es leve y el test t puede mantenerse. Documenta tu decisión y justifícala en metodología.

¿Por qué SPSS reporta la prueba de Kolmogorov-Smirnov “con corrección de Lilliefors” y no la original?

La prueba K-S original requiere que los parámetros de la distribución de referencia (media y varianza) sean conocidos a priori, no estimados de la muestra. Como en la práctica siempre estimamos media y varianza a partir de los datos, Lilliefors (1967) ajustó los valores críticos para esta situación, generando una prueba con mayor potencia. Sin la corrección de Lilliefors, los p-valores serían conservadores y con frecuencia indicarían normalidad incorrectamente.

¿Es necesario verificar normalidad si mi muestra tiene n = 200?

Con n = 200, tanto Shapiro-Wilk como K-S detectarán como “significativa” cualquier desviación de la normalidad, incluso si es mínima y metodológicamente irrelevante. Lo que sí debes verificar con n grande es si hay outliers extremos o distribuciones bimodales que podrían distorsionar las medias. Usa histogramas, Q-Q plots y la inspección visual de asimetría y curtosis. El ANOVA y el test t son muy robustos a la no normalidad con n = 200.

Conclusión

La verificación de normalidad es el punto de partida de cualquier análisis estadístico paramétrico. Shapiro-Wilk y Kolmogorov-Smirnov-Lilliefors son herramientas complementarias: la primera para muestras pequeñas, la segunda para muestras medianas y grandes. Ninguna debe usarse de forma mecánica: el Q-Q plot y la exploración de asimetría y curtosis son siempre aliados imprescindibles.

Lee también nuestra guía sobre test t de Student vs Mann-Whitney, ANOVA factorial en el TFG y análisis de datos en el TFG. Tesify puede ayudarte a redactar el apartado de análisis estadístico con el rigor que requiere tu tribunal.

Leave a Reply

Your email address will not be published. Required fields are marked *