Tamaño del efecto (d de Cohen) en TFG españoles: por qué casi nadie lo reporta — datos
Un TFG puede encontrar que su grupo experimental mejoró significativamente respecto al control (p = 0,03) y sin embargo no decir absolutamente nada sobre cuánto mejoró. Esta omisión es mucho más frecuente de lo que debería: el tamaño efecto d de Cohen aparece en una minoría de los trabajos de fin de grado que usan estadística inferencial, a pesar de ser la medida que responde a la pregunta realmente importante: ¿la diferencia encontrada importa en la práctica?
Un estudio publicado en PubMed Central sobre 250 tesis de máster de psicología económica encontró que el tamaño del efecto solo se reportaba en el 36% de los contrastes focales, y que la mediana del tamaño del efecto era r = 0,19, lo que indica efectos predominantemente pequeños que raramente se ponían en contexto (PMC6936276). Este patrón, documentado internacionalmente, es consistente con lo que los tutores de metodología observan en TFG españoles de grado.
Qué es el tamaño del efecto y por qué existe la brecha de reporte
El tamaño del efecto es una familia de estadísticos que cuantifican la magnitud de una diferencia o asociación, independientemente del tamaño muestral. La más conocida, la d de Cohen, mide cuántas desviaciones típicas separan dos medias. A diferencia del p-valor, que depende críticamente del tamaño de la muestra, el tamaño del efecto es comparable entre estudios y permite saber si el resultado tiene relevancia práctica.
La brecha de reporte —la diferencia entre la frecuencia con la que se reporta el p-valor y la frecuencia con la que se acompaña del tamaño del efecto— tiene tres causas principales:
- Inercia formativa. Los cursos de estadística en grado suelen enseñar pruebas de hipótesis y p-valores, pero dedican menos tiempo a los estadísticos de efecto. El estudiante replica lo que aprendió.
- El software habitual no lo calcula automáticamente. SPSS, el más utilizado en España, no incluye la d de Cohen en su output estándar de la prueba t. El estudiante ve el p-valor destacado y no ve ningún estadístico de efecto.
- Los tutores no siempre lo exigen. Si el tutor no especifica explícitamente que se debe reportar el tamaño del efecto, la mayoría de estudiantes no lo incluye.
Datos sobre la brecha de reporte
La evidencia disponible sobre la frecuencia de reporte del tamaño del efecto en trabajos académicos es consistente en señalar que la omisión es la norma, no la excepción:
- El estudio de Hüffmeier et al. (2020) sobre 250 tesis de máster de psicología económica encontró que el tamaño del efecto se reportaba en el 36% de los contrastes focales, con una mediana de r = 0,19 (efecto pequeño) (PMC6936276).
- La APA recomienda reportar tamaños del efecto desde 1994 y los hace obligatorios en sus directrices desde la 6ª edición del Publication Manual (2010). A pesar de ello, la adherencia en trabajos de grado es baja.
- En revistas científicas de Psicología Clínica, estudios de meta-investigación muestran que el reporte del tamaño del efecto ha mejorado en publicaciones arbitradas, pero los trabajos estudiantiles muestran un rezago respecto a la práctica de investigación publicada.
Para los TFG españoles específicamente, no existe una base de datos nacional que cuantifique esta brecha, pero los tutores de metodología de universidades como la UCM, UAB o UGR coinciden en señalar que la omisión del tamaño del efecto es uno de los principales puntos de mejora metodológica en los TFG de disciplinas como Psicología, Educación y Ciencias de la Salud. Los recursos del blog metodológico Metodologías de la Investigación ofrecen un marco introductorio útil para entender por qué los estadísticos de efecto forman parte del rigor metodológico exigible.
Por qué el p-valor solo no es suficiente
El p-valor responde a una pregunta muy específica: ¿qué probabilidad tiene de ocurrir un resultado al menos tan extremo como este si la hipótesis nula fuera cierta? No responde a la pregunta que realmente interesa al tribunal de un TFG: ¿es este efecto importante en la práctica?
El problema central es que el p-valor depende directamente del tamaño muestral. Con una muestra suficientemente grande, incluso una diferencia de 0,1 puntos en una escala de 1 a 10 puede ser estadísticamente significativa (p < 0,001). Con una muestra pequeña, una diferencia de 5 puntos puede no serlo. Sin el tamaño del efecto, el lector no puede saber si está ante un resultado trivial o relevante.
Este problema es especialmente agudo en TFG con muestras pequeñas (50-150 participantes), donde la significación estadística y la relevancia práctica pueden divergir marcadamente. El artículo sobre correlación de Pearson vs Spearman en el TFG ilustra cómo interpretar correctamente los resultados de contraste, incluyendo la magnitud del efecto en análisis correlacionales.
Cómo interpretar la d de Cohen: los umbrales de Cohen
Jacob Cohen propuso en 1988 los siguientes umbrales orientativos para interpretar la d de Cohen en ciencias del comportamiento:
| Valor d de Cohen | Tamaño del efecto | Ejemplo ilustrativo |
|---|---|---|
| d ≈ 0,2 | Pequeño | Diferencia difícilmente observable a simple vista |
| d ≈ 0,5 | Mediano | Diferencia visible pero no dramática |
| d ≈ 0,8 o mayor | Grande | Diferencia claramente perceptible en la práctica |
Es importante subrayar que estos umbrales son convencionales, no absolutos. Un efecto “pequeño” según Cohen puede ser clínicamente relevante en determinados contextos (por ejemplo, en farmacología o en intervenciones de salud pública donde incluso un pequeño porcentaje de beneficio sobre millones de personas tiene gran impacto). Los propios umbrales de Cohen han sido criticados por su falta de contextualización disciplinar, y algunos autores proponen calibrarlos con los efectos típicos de cada dominio específico de investigación.
Los recursos del blog de metodología Cuadernos de Educación y Desarrollo (CUED) profundizan en el meta-análisis y la interpretación del tamaño del efecto en el contexto de la investigación educativa.
Cómo calcularlo en SPSS, jamovi, JASP y R
La disponibilidad del tamaño del efecto en el output del software depende directamente de qué herramienta se use:
| Software | d de Cohen automática | Cómo obtenerla |
|---|---|---|
| jamovi | Sí | Al ejecutar la prueba t, marcar la casilla “Effect size” |
| JASP | Sí | Se incluye automáticamente en la tabla de resultados de la prueba t |
| SPSS base | No | Desde SPSS 27: disponible en prueba t. Versiones anteriores: calcular manualmente con la fórmula d = (M1-M2) / DT_pooled |
| R | Con paquetes | Función cohen.d() del paquete effsize; también disponible en effectsize |
Para TFG de grado que usan SPSS en versiones anteriores a la 27, la d de Cohen puede calcularse fácilmente de forma manual: se divide la diferencia entre las dos medias por la desviación típica combinada (pooled SD). También existen calculadoras online gratuitas que solo requieren introducir las medias, desviaciones típicas y tamaños de muestra de cada grupo.
La tendencia del sector apunta a una mayor integración del tamaño del efecto en el análisis habitual: el análisis de horas por software del artículo sobre horas de análisis estadístico en el TFG muestra que jamovi y JASP, precisamente los software que calculan el tamaño del efecto de forma automática, están ganando cuota rápidamente frente a SPSS.
Alternativas a la d de Cohen según el tipo de análisis
La d de Cohen es específica para la comparación de dos medias. Según el tipo de análisis del TFG, la medida de tamaño del efecto apropiada cambia:
| Tipo de análisis | Medida de efecto recomendada | Interpretación básica |
|---|---|---|
| Comparación de dos medias (prueba t) | d de Cohen / Hedges’ g | Pequeño: 0,2 | Mediano: 0,5 | Grande: 0,8 |
| Correlación (Pearson, Spearman) | r (propio coeficiente) | Pequeño: 0,1 | Mediano: 0,3 | Grande: 0,5 |
| ANOVA | η² (eta cuadrado) / η²p (parcial) | Pequeño: 0,01 | Mediano: 0,06 | Grande: 0,14 |
| Chi-cuadrado / tablas de contingencia | V de Cramér / phi | Varía según grados de libertad |
| Regresión lineal / múltiple | R² / R² ajustado / f² de Cohen | Proporción de varianza explicada |
Incluir la medida de efecto adecuada junto al p-valor es uno de los criterios de calidad metodológica más valorados por los tribunales de TFG en las disciplinas con mayor tradición estadística. Para estudios que involucran análisis de la varianza de un factor, el artículo sobre ANOVA de un factor en el TFG: ejemplo e interpretación incluye orientaciones sobre el reporte del eta cuadrado junto al valor F. Del mismo modo, si tu TFG incluye tablas de contingencia, el artículo sobre la prueba chi-cuadrado en el TFG detalla cómo reportar la V de Cramér junto al estadístico chi.
Si tu análisis incluye regresión lineal múltiple y necesitas reportar el R² ajustado y los coeficientes β con su interpretación, el artículo sobre regresión lineal múltiple en la tesis: supuestos e interpretación en 2026 cubre los requisitos de reporte de tamaño del efecto específicos para modelos de regresión.
Herramientas como Tesify pueden ayudar a integrar correctamente los valores de tamaño del efecto en la redacción de los resultados del TFG, asegurando que la interpretación estadística esté completa y en el lenguaje académico apropiado para cada disciplina.
Preguntas frecuentes sobre el tamaño del efecto en el TFG
¿Qué es el tamaño del efecto (d de Cohen)?
El tamaño del efecto mide la magnitud práctica de una diferencia o asociación estadística. La d de Cohen es la medida más usada para comparar dos medias: un valor de 0,2 se considera pequeño, 0,5 mediano y 0,8 grande, según los umbrales establecidos por Jacob Cohen en 1988.
¿Es obligatorio reportar el tamaño del efecto en un TFG?
No es universalmente obligatorio, pero la APA lo exige desde su 6ª edición. En TFG de Psicología, Ciencias de la Salud y Educación, reportar el tamaño del efecto es cada vez más esperado por los tribunales y añade rigor metodológico significativo.
¿Por qué el p-valor solo no es suficiente?
El p-valor depende del tamaño muestral: con muestras grandes, diferencias triviales pueden ser estadísticamente significativas. El tamaño del efecto complementa al p-valor indicando si la diferencia encontrada tiene también relevancia práctica.
¿Cómo se calcula la d de Cohen en SPSS, jamovi o JASP?
En jamovi y JASP se calcula automáticamente al ejecutar la prueba t marcando la opción de tamaño del efecto. En SPSS base versiones anteriores a la 27, debe calcularse manualmente dividiendo la diferencia entre medias por la desviación típica combinada. En R se usa la función cohen.d() del paquete effsize.
¿Qué alternativas a la d de Cohen existen?
Para correlaciones: r de Pearson como medida de efecto. Para ANOVA: eta cuadrado (η²) o eta cuadrado parcial. Para pruebas chi-cuadrado: V de Cramér o phi. Para regresión: R² ajustado. Para muestras pequeñas con comparación de medias: Hedges’ g (más preciso que la d de Cohen).

Leave a Reply