Test t de Student vs Mann-Whitney en el TFG: Cuándo Usar Cada Uno y Cómo Interpretarlos (2026)

Test t de Student vs Mann-Whitney en el TFG: Cuándo Usar Cada Uno y Cómo Interpretarlos (2026)

Una de las decisiones metodológicas más habituales en cualquier TFG cuantitativo es elegir entre el test t de Student y la prueba U de Mann-Whitney para comparar dos grupos. Ambas pruebas responden a la misma pregunta —¿difieren significativamente estos dos grupos?— pero bajo condiciones estadísticas distintas. Elegir incorrectamente compromete la validez de tus resultados y genera observaciones negativas en la defensa. Esta guía te ofrece el criterio preciso para tomar esa decisión con rigor, ejecutar el análisis en SPSS e interpretar correctamente el output.

La confusión entre ambas pruebas es frecuente porque comparten el mismo objetivo inferencial pero operan sobre supuestos diferentes: mientras el test t asume que los datos provienen de una distribución normal (es una prueba paramétrica), la U de Mann-Whitney no requiere ese supuesto (es no paramétrica). Entender esta distinción es fundamental para cualquier investigación empírica en ciencias sociales, de la salud o educación.

Respuesta rápida: Usa el test t de Student cuando los datos son continuos, tienen distribución normal en ambos grupos y las varianzas son homogéneas. Usa Mann-Whitney cuando los datos son ordinales, no siguen distribución normal o el tamaño muestral es pequeño (n < 30 por grupo). Mann-Whitney es la alternativa no paramétrica directa al test t para muestras independientes.

Fundamentos: paramétrico vs. no paramétrico

Las pruebas paramétricas como el test t asumen que la variable sigue una distribución conocida (habitualmente la normal) y trabajan directamente con los parámetros poblacionales (medias, varianzas). Son más potentes cuando sus supuestos se cumplen, es decir, tienen mayor probabilidad de detectar un efecto real.

Las pruebas no paramétricas como Mann-Whitney no asumen ninguna distribución específica. Trabajan con los rangos de los datos en lugar de sus valores brutos, lo que las hace más robustas frente a valores extremos, distribuciones asimétricas y escalas ordinales. La contrapartida es una ligera pérdida de potencia estadística —aproximadamente del 5 %— cuando los supuestos paramétricos sí se cumplen.

El test t de Student para muestras independientes

El test t para muestras independientes contrasta la hipótesis nula de que las medias poblacionales de dos grupos son iguales (H₀: μ₁ = μ₂). El estadístico t se calcula como la diferencia entre medias dividida por el error estándar de esa diferencia:

t = (M₁ − M₂) / √[(s²₁/n₁) + (s²₂/n₂)]

Supuestos del test t

  1. Normalidad: La VD se distribuye normalmente en cada grupo. Se verifica con Shapiro-Wilk (n < 50) o Kolmogorov-Smirnov-Lilliefors (n ≥ 50).
  2. Independencia: Las observaciones de un grupo no influyen en las del otro.
  3. Escala de medición: La VD es continua (intervalo o razón).
  4. Homogeneidad de varianzas: Las varianzas poblacionales son iguales. Se verifica con la prueba de Levene. Si p < .05, se usa la corrección de Welch (que SPSS reporta automáticamente en la segunda fila de la tabla).

Robustez del test t

El test t es relativamente robusto a la violación del supuesto de normalidad cuando n ≥ 30 por grupo, gracias al teorema central del límite. Sin embargo, con muestras pequeñas y datos claramente no normales (asimetría > 2, curtosis > 7), la tasa de error tipo I se incrementa y Mann-Whitney se convierte en la opción recomendable.

La prueba U de Mann-Whitney

La prueba U de Mann-Whitney (también denominada Wilcoxon de rangos-suma para muestras independientes) contrasta si dos muestras independientes proceden de la misma distribución poblacional. Opera asignando rangos a todas las observaciones conjuntamente y comparando la suma de rangos de cada grupo.

El estadístico U refleja el número de veces que una observación del grupo A precede a una del grupo B en orden de magnitud. La hipótesis nula establece que las distribuciones de ambos grupos son iguales (no solo las medianas, como erróneamente se afirma en algunos manuales).

Cuándo usar Mann-Whitney obligatoriamente

  • Variable dependiente en escala ordinal (p. ej., escalas Likert de ítem individual, rankings).
  • Distribución claramente no normal en grupos con n < 30 (confirmada por Shapiro-Wilk, p < .05).
  • Presencia de valores extremos influyentes que no pueden eliminarse justificadamente.
  • Tamaños de grupo muy desiguales y pequeños.

Árbol de decisión: ¿cuándo usar cada prueba?

Pregunta de verificación Sí → usar No → usar
¿Es la VD continua (intervalo/razón)? Continuar Mann-Whitney
¿Shapiro-Wilk: p ≥ .05 en ambos grupos? Continuar Mann-Whitney
¿n ≥ 30 por grupo? (robustez del TCL) Test t aceptable Mann-Whitney recomendado si no normalidad
¿Levene: p ≥ .05? (varianzas iguales) Test t (varianzas iguales) Test t con corrección Welch

Ejecución en SPSS: paso a paso

Test t de Student en SPSS

  1. Ir a Analizar → Comparar medias → Prueba T para muestras independientes.
  2. Introduce la VD en el cuadro Variable(s) de contraste.
  3. Introduce la variable de agrupación (factor con dos niveles) en Variable de agrupación.
  4. Clic en Definir grupos e indica los códigos de cada grupo (ej.: 1 y 2).
  5. Clic en Aceptar.

Prueba U de Mann-Whitney en SPSS

  1. Ir a Analizar → Pruebas no paramétricas → Muestras independientes (SPSS ≥ 20) o Analizar → Pruebas no paramétricas → Cuadros de diálogo heredados → 2 muestras independientes (versiones anteriores).
  2. Seleccionar la prueba de Mann-Whitney.
  3. Introduce la VD en Variables de contraste y la variable de agrupación en Variable de agrupación.
  4. Define los grupos y haz clic en Aceptar.

Interpretación del output: diferencias clave

Output del test t

SPSS produce dos tablas principales:

  • Tabla 1 — Estadísticas de grupo: Medias, desviaciones típicas y errores típicos de cada grupo.
  • Tabla 2 — Prueba de muestras independientes: Muestra la prueba de Levene (igualdad de varianzas) y dos filas de resultados del test t: una asumiendo varianzas iguales y otra con la corrección de Welch. Usa la fila que corresponda según el p-valor de Levene.

Los valores clave son: t, gl, p (significación bilateral) y la diferencia de medias con su intervalo de confianza al 95 %. Calcula el tamaño del efecto d de Cohen: d = t / √(n₁+n₂) / √(n₁·n₂/( n₁+n₂)).

Output de Mann-Whitney

SPSS reporta:

  • Estadístico U de Mann-Whitney y el estadístico W de Wilcoxon.
  • Estadístico Z (con corrección por empates).
  • Sig. asintótica (bilateral): el valor p.

El tamaño del efecto para Mann-Whitney se calcula como r = Z / √N (donde N es el total de observaciones). Convenciones de Cohen: r = .10 (pequeño), r = .30 (mediano), r = .50 (grande).

Potencia estadística: ¿cuál es más robusta?

Cuando los datos son normales, el test t es aproximadamente un 5 % más potente que Mann-Whitney. Esta diferencia es negligible en la práctica. Cuando los datos no son normales, Mann-Whitney puede ser considerablemente más potente, especialmente con distribuciones con colas pesadas o asimétricas.

Un metaanálisis citado habitualmente en metodología indica que la eficiencia asintótica relativa (ARE) de Mann-Whitney respecto al test t es siempre ≥ 0.864 bajo normalidad, y puede ser infinita bajo ciertas distribuciones no normales (Hodges y Lehmann, 1956). Esto significa que Mann-Whitney nunca es drásticamente inferior al test t y puede ser muy superior cuando la normalidad falla.

Redacción de resultados en APA 7

Test t

«Los participantes que recibieron la intervención (M = 74.3, DT = 8.2) obtuvieron puntuaciones significativamente más altas que los del grupo control (M = 66.7, DT = 9.5), t(58) = 3.24, p = .002, d = 0.84.»

Mann-Whitney

«Los participantes que recibieron la intervención (Mdn = 76) presentaron puntuaciones significativamente más altas que los del grupo control (Mdn = 68), U = 287, Z = −2.89, p = .004, r = .37.»

Nótese que en Mann-Whitney se reporta la mediana como estadístico de centralidad, no la media.

Ejemplos de TFG reales

Ejemplo 1 — TFG de Enfermería (test t apropiado)

Un TFG compara el nivel de dolor (EVA 0-10, n = 45 por grupo) antes y después de una intervención. Shapiro-Wilk: p = .312 y p = .287 (normalidad confirmada). Levene: p = .441 (varianzas iguales). Se usa test t: t(88) = −4.12, p < .001, d = 0.87 (efecto grande).

Ejemplo 2 — TFG de Psicología (Mann-Whitney apropiado)

Un TFG mide satisfacción laboral con ítem Likert único (1-7, n = 22 por grupo). Los datos son claramente ordinales con asimetría negativa. Shapiro-Wilk: p = .003. Se usa Mann-Whitney: U = 168, Z = −2.41, p = .016, r = .36 (efecto mediano).

Ejemplo 3 — TFG de Ciencias del Deporte (varianzas heterogéneas)

Comparación del VO₂max entre deportistas de resistencia y fuerza (n = 35 y n = 28). Normalidad confirmada, pero Levene: p = .012. Se usa test t con corrección de Welch: t(48.3) = 6.78, p < .001, d = 1.54 (efecto muy grande).

Preguntas frecuentes

¿Puedo usar el test t con n = 15 por grupo si los datos son normales?

Sí, siempre que Shapiro-Wilk confirme la normalidad (p ≥ .05) y las varianzas sean homogéneas. Con n = 15, la potencia estadística para detectar un efecto mediano (d = 0.50) es de aproximadamente 0.38 con α = .05, lo que es baja. Se recomienda aumentar la muestra o justificar la limitación en el apartado de discusión. Con datos no normales y n = 15, Mann-Whitney es la opción correcta.

¿Qué hago si Shapiro-Wilk da p = .04 en un grupo y p = .23 en el otro?

Si uno de los grupos viola la normalidad, lo conservador y metodológicamente correcto es usar Mann-Whitney, ya que el test t requiere normalidad en ambos grupos. Sin embargo, si n ≥ 30 en ese grupo, el teorema central del límite proporciona robustez suficiente y el test t puede mantenerse. Justifica la decisión explícitamente en el apartado de metodología y reporta ambos resultados si hay incertidumbre (análisis de sensibilidad).

¿Mann-Whitney compara medianas o distribuciones?

La hipótesis nula formal de Mann-Whitney es que las distribuciones de ambas poblaciones son idénticas, no solo que sus medianas son iguales. La interpretación como «comparación de medianas» solo es válida si se asume adicionalmente que las distribuciones tienen la misma forma (solo difieren en localización). Si las formas difieren sustancialmente, el test contrasta distribuciones, no medianas. En la práctica del TFG, si las distribuciones tienen formas similares, es razonable afirmar que se comparan posiciones centrales.

¿Existe una versión del test t para muestras relacionadas con alternativa no paramétrica?

Sí. El test t para muestras relacionadas (medidas pre-post del mismo grupo) tiene como alternativa no paramétrica la prueba de Wilcoxon de rangos con signo (no confundir con Mann-Whitney, que es para muestras independientes). En SPSS se ejecuta en Analizar → Pruebas no paramétricas → Cuadros de diálogo heredados → 2 muestras relacionadas → Wilcoxon.

Conclusión

La elección entre el test t de Student y la U de Mann-Whitney no es una cuestión de preferencia, sino de rigor metodológico. Verificar los supuestos de normalidad y homogeneidad de varianzas antes de elegir la prueba protege la validez de tus conclusiones y demuestra al tribunal que has aplicado un criterio estadístico fundamentado.

Consulta también nuestros artículos sobre ANOVA factorial en el TFG, análisis de datos en el TFG y investigación cuantitativa con ejemplos. Si quieres ayuda con la interpretación estadística de tu trabajo, Tesify está diseñado para acompañarte en cada etapa del análisis.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *