, ,

Tamaño del efecto (d de Cohen) en TFG españoles: por qué casi nadie lo reporta — datos

Tamaño del efecto (d de Cohen) en TFG españoles: por qué casi nadie lo reporta — datos

Un TFG puede encontrar que su grupo experimental mejoró significativamente respecto al control (p = 0,03) y sin embargo no decir absolutamente nada sobre cuánto mejoró. Esta omisión es mucho más frecuente de lo que debería: el tamaño efecto d de Cohen aparece en una minoría de los trabajos de fin de grado que usan estadística inferencial, a pesar de ser la medida que responde a la pregunta realmente importante: ¿la diferencia encontrada importa en la práctica?

Un estudio publicado en PubMed Central sobre 250 tesis de máster de psicología económica encontró que el tamaño del efecto solo se reportaba en el 36% de los contrastes focales, y que la mediana del tamaño del efecto era r = 0,19, lo que indica efectos predominantemente pequeños que raramente se ponían en contexto (PMC6936276). Este patrón, documentado internacionalmente, es consistente con lo que los tutores de metodología observan en TFG españoles de grado.

Hallazgo clave: Solo el 36% de los contrastes estadísticos en tesis de máster de psicología reportan tamaño del efecto (PMC, 2020). En TFG de grado, la proporción es estimativamente menor. Reportar la d de Cohen puede marcar la diferencia entre una nota de aprobado y una matrícula en TFG de Psicología, Salud o Educación.

Qué es el tamaño del efecto y por qué existe la brecha de reporte

El tamaño del efecto es una familia de estadísticos que cuantifican la magnitud de una diferencia o asociación, independientemente del tamaño muestral. La más conocida, la d de Cohen, mide cuántas desviaciones típicas separan dos medias. A diferencia del p-valor, que depende críticamente del tamaño de la muestra, el tamaño del efecto es comparable entre estudios y permite saber si el resultado tiene relevancia práctica.

La brecha de reporte —la diferencia entre la frecuencia con la que se reporta el p-valor y la frecuencia con la que se acompaña del tamaño del efecto— tiene tres causas principales:

  1. Inercia formativa. Los cursos de estadística en grado suelen enseñar pruebas de hipótesis y p-valores, pero dedican menos tiempo a los estadísticos de efecto. El estudiante replica lo que aprendió.
  2. El software habitual no lo calcula automáticamente. SPSS, el más utilizado en España, no incluye la d de Cohen en su output estándar de la prueba t. El estudiante ve el p-valor destacado y no ve ningún estadístico de efecto.
  3. Los tutores no siempre lo exigen. Si el tutor no especifica explícitamente que se debe reportar el tamaño del efecto, la mayoría de estudiantes no lo incluye.

Datos sobre la brecha de reporte

La evidencia disponible sobre la frecuencia de reporte del tamaño del efecto en trabajos académicos es consistente en señalar que la omisión es la norma, no la excepción:

  • El estudio de Hüffmeier et al. (2020) sobre 250 tesis de máster de psicología económica encontró que el tamaño del efecto se reportaba en el 36% de los contrastes focales, con una mediana de r = 0,19 (efecto pequeño) (PMC6936276).
  • La APA recomienda reportar tamaños del efecto desde 1994 y los hace obligatorios en sus directrices desde la 6ª edición del Publication Manual (2010). A pesar de ello, la adherencia en trabajos de grado es baja.
  • En revistas científicas de Psicología Clínica, estudios de meta-investigación muestran que el reporte del tamaño del efecto ha mejorado en publicaciones arbitradas, pero los trabajos estudiantiles muestran un rezago respecto a la práctica de investigación publicada.

Para los TFG españoles específicamente, no existe una base de datos nacional que cuantifique esta brecha, pero los tutores de metodología de universidades como la UCM, UAB o UGR coinciden en señalar que la omisión del tamaño del efecto es uno de los principales puntos de mejora metodológica en los TFG de disciplinas como Psicología, Educación y Ciencias de la Salud. Los recursos del blog metodológico Metodologías de la Investigación ofrecen un marco introductorio útil para entender por qué los estadísticos de efecto forman parte del rigor metodológico exigible.

Por qué el p-valor solo no es suficiente

El p-valor responde a una pregunta muy específica: ¿qué probabilidad tiene de ocurrir un resultado al menos tan extremo como este si la hipótesis nula fuera cierta? No responde a la pregunta que realmente interesa al tribunal de un TFG: ¿es este efecto importante en la práctica?

El problema central es que el p-valor depende directamente del tamaño muestral. Con una muestra suficientemente grande, incluso una diferencia de 0,1 puntos en una escala de 1 a 10 puede ser estadísticamente significativa (p < 0,001). Con una muestra pequeña, una diferencia de 5 puntos puede no serlo. Sin el tamaño del efecto, el lector no puede saber si está ante un resultado trivial o relevante.

Este problema es especialmente agudo en TFG con muestras pequeñas (50-150 participantes), donde la significación estadística y la relevancia práctica pueden divergir marcadamente. El artículo sobre correlación de Pearson vs Spearman en el TFG ilustra cómo interpretar correctamente los resultados de contraste, incluyendo la magnitud del efecto en análisis correlacionales.

Cómo interpretar la d de Cohen: los umbrales de Cohen

Jacob Cohen propuso en 1988 los siguientes umbrales orientativos para interpretar la d de Cohen en ciencias del comportamiento:

Valor d de Cohen Tamaño del efecto Ejemplo ilustrativo
d ≈ 0,2 Pequeño Diferencia difícilmente observable a simple vista
d ≈ 0,5 Mediano Diferencia visible pero no dramática
d ≈ 0,8 o mayor Grande Diferencia claramente perceptible en la práctica

Es importante subrayar que estos umbrales son convencionales, no absolutos. Un efecto “pequeño” según Cohen puede ser clínicamente relevante en determinados contextos (por ejemplo, en farmacología o en intervenciones de salud pública donde incluso un pequeño porcentaje de beneficio sobre millones de personas tiene gran impacto). Los propios umbrales de Cohen han sido criticados por su falta de contextualización disciplinar, y algunos autores proponen calibrarlos con los efectos típicos de cada dominio específico de investigación.

Los recursos del blog de metodología Cuadernos de Educación y Desarrollo (CUED) profundizan en el meta-análisis y la interpretación del tamaño del efecto en el contexto de la investigación educativa.

Herramienta interactiva: ajusta el valor de la d de Cohen para visualizar el solapamiento entre distribuciones, el porcentaje de superioridad y el NNT. Fuente: R Psychologist — Kristoffer Magnusson

Cómo calcularlo en SPSS, jamovi, JASP y R

La disponibilidad del tamaño del efecto en el output del software depende directamente de qué herramienta se use:

Software d de Cohen automática Cómo obtenerla
jamovi Al ejecutar la prueba t, marcar la casilla “Effect size”
JASP Se incluye automáticamente en la tabla de resultados de la prueba t
SPSS base No Desde SPSS 27: disponible en prueba t. Versiones anteriores: calcular manualmente con la fórmula d = (M1-M2) / DT_pooled
R Con paquetes Función cohen.d() del paquete effsize; también disponible en effectsize

Para TFG de grado que usan SPSS en versiones anteriores a la 27, la d de Cohen puede calcularse fácilmente de forma manual: se divide la diferencia entre las dos medias por la desviación típica combinada (pooled SD). También existen calculadoras online gratuitas que solo requieren introducir las medias, desviaciones típicas y tamaños de muestra de cada grupo.

La tendencia del sector apunta a una mayor integración del tamaño del efecto en el análisis habitual: el análisis de horas por software del artículo sobre horas de análisis estadístico en el TFG muestra que jamovi y JASP, precisamente los software que calculan el tamaño del efecto de forma automática, están ganando cuota rápidamente frente a SPSS.

Alternativas a la d de Cohen según el tipo de análisis

La d de Cohen es específica para la comparación de dos medias. Según el tipo de análisis del TFG, la medida de tamaño del efecto apropiada cambia:

Tipo de análisis Medida de efecto recomendada Interpretación básica
Comparación de dos medias (prueba t) d de Cohen / Hedges’ g Pequeño: 0,2 | Mediano: 0,5 | Grande: 0,8
Correlación (Pearson, Spearman) r (propio coeficiente) Pequeño: 0,1 | Mediano: 0,3 | Grande: 0,5
ANOVA η² (eta cuadrado) / η²p (parcial) Pequeño: 0,01 | Mediano: 0,06 | Grande: 0,14
Chi-cuadrado / tablas de contingencia V de Cramér / phi Varía según grados de libertad
Regresión lineal / múltiple R² / R² ajustado / f² de Cohen Proporción de varianza explicada

Incluir la medida de efecto adecuada junto al p-valor es uno de los criterios de calidad metodológica más valorados por los tribunales de TFG en las disciplinas con mayor tradición estadística. Para estudios que involucran análisis de la varianza de un factor, el artículo sobre ANOVA de un factor en el TFG: ejemplo e interpretación incluye orientaciones sobre el reporte del eta cuadrado junto al valor F. Del mismo modo, si tu TFG incluye tablas de contingencia, el artículo sobre la prueba chi-cuadrado en el TFG detalla cómo reportar la V de Cramér junto al estadístico chi.

Si tu análisis incluye regresión lineal múltiple y necesitas reportar el R² ajustado y los coeficientes β con su interpretación, el artículo sobre regresión lineal múltiple en la tesis: supuestos e interpretación en 2026 cubre los requisitos de reporte de tamaño del efecto específicos para modelos de regresión.

Herramientas como Tesify pueden ayudar a integrar correctamente los valores de tamaño del efecto en la redacción de los resultados del TFG, asegurando que la interpretación estadística esté completa y en el lenguaje académico apropiado para cada disciplina.

Preguntas frecuentes sobre el tamaño del efecto en el TFG

¿Qué es el tamaño del efecto (d de Cohen)?

El tamaño del efecto mide la magnitud práctica de una diferencia o asociación estadística. La d de Cohen es la medida más usada para comparar dos medias: un valor de 0,2 se considera pequeño, 0,5 mediano y 0,8 grande, según los umbrales establecidos por Jacob Cohen en 1988.

¿Es obligatorio reportar el tamaño del efecto en un TFG?

No es universalmente obligatorio, pero la APA lo exige desde su 6ª edición. En TFG de Psicología, Ciencias de la Salud y Educación, reportar el tamaño del efecto es cada vez más esperado por los tribunales y añade rigor metodológico significativo.

¿Por qué el p-valor solo no es suficiente?

El p-valor depende del tamaño muestral: con muestras grandes, diferencias triviales pueden ser estadísticamente significativas. El tamaño del efecto complementa al p-valor indicando si la diferencia encontrada tiene también relevancia práctica.

¿Cómo se calcula la d de Cohen en SPSS, jamovi o JASP?

En jamovi y JASP se calcula automáticamente al ejecutar la prueba t marcando la opción de tamaño del efecto. En SPSS base versiones anteriores a la 27, debe calcularse manualmente dividiendo la diferencia entre medias por la desviación típica combinada. En R se usa la función cohen.d() del paquete effsize.

¿Qué alternativas a la d de Cohen existen?

Para correlaciones: r de Pearson como medida de efecto. Para ANOVA: eta cuadrado (η²) o eta cuadrado parcial. Para pruebas chi-cuadrado: V de Cramér o phi. Para regresión: R² ajustado. Para muestras pequeñas con comparación de medias: Hedges’ g (más preciso que la d de Cohen).

Leave a Reply

Your email address will not be published. Required fields are marked *