La prueba chi-cuadrado en el TFG: cuándo usarla e interpretarla paso a paso (2026)

La prueba chi-cuadrado en el TFG: cuándo usarla e interpretarla paso a paso (2026)

Tienes dos variables categóricas en tu TFG —género y tipo de titulación, por ejemplo— y necesitas saber si están relacionadas. La prueba chi-cuadrado TFG interpretación es la herramienta estadística diseñada exactamente para esa situación: contrastar si la distribución de una variable depende de la otra, sin asumir normalidad ni escalas de intervalo. Sin embargo, aplicarla mal o interpretarla superficialmente es uno de los errores que los tribunales de TFG detectan con más frecuencia en 2026. Esta guía te lleva desde la lógica del estadístico hasta el informe en APA 7, con un ejemplo trabajado y los pasos exactos en SPSS y Jamovi.

La chi-cuadrado (χ²) fue desarrollada por Karl Pearson a finales del siglo XIX y sigue siendo, más de un siglo después, una de las pruebas de contraste de hipótesis más utilizadas en ciencias sociales, educación, enfermería y psicología. Su popularidad se debe a dos razones: es conceptualmente transparente y sus supuestos son fáciles de verificar. Pero esa aparente sencillez lleva a errores frecuentes —aplicarla a variables continuas, ignorar las frecuencias esperadas o no reportar el tamaño del efecto— que comprometen la solidez metodológica del trabajo.

Respuesta rápida

La prueba chi-cuadrado de independencia se aplica cuando tienes dos variables categóricas y quieres comprobar si están asociadas. Calcula si las frecuencias observadas se desvían de lo que se esperaría bajo independencia, reporta un p-valor y necesita complementarse con la V de Cramér como tamaño del efecto. El formato APA 7 es: χ²(gl, N = n) = valor, p = .xxx, V = .xx.

¿Qué mide la prueba chi-cuadrado?

La prueba chi-cuadrado de independencia de Pearson contrasta la hipótesis nula de que dos variables categóricas son independientes en la población. Su lógica es comparar las frecuencias que realmente observas en tu muestra con las que cabría esperar si las dos variables no tuvieran ninguna relación. Cuanto más se alejen las frecuencias observadas de las esperadas, mayor será el estadístico χ² y más evidencia tendrás en contra de la hipótesis nula.

Formalmente, el estadístico se calcula como:

χ² = Σ [ (Oij − Eij)² / Eij ]

Donde Oij es la frecuencia observada en la celda (i, j) de la tabla de contingencia y Eij es la frecuencia esperada bajo independencia. La suma recorre todas las celdas de la tabla. El resultado sigue una distribución chi-cuadrado con (f − 1) × (c − 1) grados de libertad, donde f es el número de filas y c el de columnas.

Es importante distinguir tres tipos de chi-cuadrado que puede generar SPSS:

  • Chi-cuadrado de Pearson: la versión estándar, la que usarás en prácticamente todos los casos.
  • Corrección de continuidad de Yates: se aplica solo a tablas 2×2 con muestras pequeñas; en la mayoría de los TFG se prefiere la prueba exacta de Fisher cuando la muestra es pequeña.
  • Razón de verosimilitud (G²): teóricamente equivalente a la chi-cuadrado para muestras grandes; se usa menos en TFG de grado.

¿Cuándo usarla en el TFG?

La chi-cuadrado de independencia es la elección adecuada cuando se cumplen estas tres condiciones:

  1. Ambas variables son categóricas: nominales (género, titulación, región) u ordinales con pocos niveles tratados como categorías (nivel de satisfacción en tres grupos: bajo/medio/alto).
  2. Cada participante contribuye a una sola celda: si tienes medidas repetidas o datos emparejados, la prueba chi-cuadrado de McNemar es la alternativa correcta.
  3. Tu pregunta de investigación es de asociación o independencia: «¿Existe relación entre el género del encuestado y el tipo de beca que solicita?», «¿La titulación de origen es independiente de la preferencia de modalidad de defensa?»

La prueba chi-cuadrado no es adecuada cuando:

  • Las variables son continuas (temperatura, puntuación en una escala 0-100): utiliza correlación de Pearson o Spearman.
  • Quieres comparar medias entre grupos: usa la t de Student o ANOVA.
  • Los grupos no son independientes entre sí.

Para orientarte sobre qué prueba corresponde a cada diseño en tu TFG, el artículo «Qué prueba estadística usar en tu TFG en 2026: árbol de decisión paso a paso» recorre todos los escenarios posibles con un árbol de decisión visual.

Supuestos que debes verificar antes de ejecutarla

La chi-cuadrado descansa en tres supuestos que debes contrastar antes de interpretar los resultados:

1. Independencia de las observaciones

Cada individuo de tu muestra debe aparecer exactamente una vez en la tabla. Si has encuestado a los mismos sujetos en dos momentos distintos o tienes datos de parejas, la chi-cuadrado estándar no es válida.

2. Variables de nivel nominal u ordinal

Los valores de las variables deben ser categorías mutuamente excluyentes y exhaustivas. Antes de ejecutar la prueba, asegúrate de que las variables están correctamente codificadas en SPSS/Jamovi como nominales u ordinales.

3. Frecuencias esperadas ≥ 5 (la regla del 80%)

Este es el supuesto que más estudiantes incumplen sin darse cuenta. La aproximación chi-cuadrado funciona bien cuando:

  • Ninguna celda tiene frecuencia esperada menor que 1.
  • Como máximo el 20% de las celdas tiene frecuencia esperada menor que 5.

Si no se cumple, tienes tres vías de salida: (a) aumentar el tamaño muestral, (b) agrupar categorías con pocas observaciones, o (c) usar la prueba exacta de Fisher (disponible en SPSS y Jamovi, recomendada para tablas 2×2 con muestras pequeñas).

Nota metodológica. SPSS te avisa automáticamente si se incumple la regla del 80%. En la salida de «Pruebas de chi-cuadrado» aparece una nota al pie indicando cuántas celdas tienen frecuencia esperada inferior a 5. Jamovi también lo señala en el panel de resultados. Nunca ignores esa nota en tu TFG.

Ejemplo trabajado: tabla de contingencia real

Imaginemos un TFG de Psicología Educativa en la Universidad de Salamanca. La pregunta de investigación es: «¿Existe asociación entre la modalidad de estudios (presencial vs. semipresencial) y la preferencia de horario de tutorías (mañana vs. tarde)?»

Se encuesta a N = 120 estudiantes de primer curso. Los resultados son los siguientes:

Tabla 1. Frecuencias observadas: Modalidad × Preferencia de horario
Modalidad Mañana Tarde Total fila
Presencial 52 28 80
Semipresencial 18 22 40
Total columna 70 50 120

El cálculo paso a paso

Paso 1: Formular las hipótesis

  • H₀: La modalidad de estudios y la preferencia de horario son independientes (no existe asociación).
  • H₁: Existe asociación entre la modalidad de estudios y la preferencia de horario.

Paso 2: Calcular las frecuencias esperadas

La fórmula para cada celda es: Eij = (Total fila i × Total columna j) / N

Tabla 2. Frecuencias esperadas bajo H₀
Modalidad Mañana (E) Tarde (E)
Presencial (80 × 70) / 120 = 46.67 (80 × 50) / 120 = 33.33
Semipresencial (40 × 70) / 120 = 23.33 (40 × 50) / 120 = 16.67

Todas las frecuencias esperadas superan 5, por lo que el supuesto se cumple correctamente.

Paso 3: Calcular el estadístico χ²

Aplicamos la fórmula a cada celda y sumamos:

  • Celda (Presencial, Mañana): (52 − 46.67)² / 46.67 = (5.33)² / 46.67 = 28.41 / 46.67 = 0.609
  • Celda (Presencial, Tarde): (28 − 33.33)² / 33.33 = (−5.33)² / 33.33 = 28.41 / 33.33 = 0.853
  • Celda (Semipresencial, Mañana): (18 − 23.33)² / 23.33 = (−5.33)² / 23.33 = 28.41 / 23.33 = 1.218
  • Celda (Semipresencial, Tarde): (22 − 16.67)² / 16.67 = (5.33)² / 16.67 = 28.41 / 16.67 = 1.704

χ² = 0.609 + 0.853 + 1.218 + 1.704 = 4.384

Paso 4: Determinar los grados de libertad y el p-valor

Para una tabla 2×2: gl = (2 − 1) × (2 − 1) = 1

Con χ²(1) = 4.384 y nivel de significación α = .05, el valor crítico tabulado es 3.841. Como 4.384 > 3.841, rechazamos H₀. El p-valor exacto es p = .036 (SPSS/Jamovi lo calculan automáticamente).

Paso 5: Interpretación sustantiva

Existe una asociación estadísticamente significativa entre la modalidad de estudios y la preferencia de horario. Los estudiantes presenciales prefieren mañana en mayor proporción (65%) que los semipresenciales (45%), mientras que los semipresenciales se inclinan más por la tarde (55% vs. 35%). Antes de dar por terminado el análisis, necesitas cuantificar cuán fuerte es esa asociación.

Tamaño del efecto: la V de Cramér

El p-valor solo dice si la asociación es estadísticamente significativa; no dice nada sobre su magnitud. Con muestras grandes, cualquier asociación mínima puede resultar significativa. Por eso, en el TFG debes reportar siempre el tamaño del efecto, y para la chi-cuadrado el índice más utilizado es la V de Cramér.

V = √[ χ² / (N × min(f−1, c−1)) ]

Con nuestros datos: V = √[ 4.384 / (120 × 1) ] = √0.03653 = 0.191

Los umbrales de interpretación para tablas 2×2, según Cohen (1988), son:

V de Cramér Magnitud
.10 Efecto pequeño
.30 Efecto mediano
.50 Efecto grande

Una V = .191 indica un efecto entre pequeño y mediano: la asociación es real, pero la modalidad de estudios explica solo una parte de la variación en la preferencia de horario. Esta matización es exactamente lo que distingue un TFG metodológicamente sólido de uno superficial.

Para poner el análisis estadístico en contexto dentro de tu metodología general, consulta el artículo «Diseño, enfoque y alcance metodológico del TFG en 2026: cómo no confundirlos», que explica cómo articular el análisis cuantitativo dentro del marco metodológico global del trabajo.

Cómo ejecutarla en SPSS

  1. Abre tu archivo de datos en SPSS. Comprueba que las variables están codificadas como Nominal en la vista de variables.
  2. Ve al menú Analizar → Estadísticos descriptivos → Tablas de contingencia.
  3. Arrastra una variable al cuadro Filas y la otra al cuadro Columnas.
  4. Haz clic en el botón Estadísticos y marca: Chi-cuadrado y Phi y V de Cramer. Haz clic en Continuar.
  5. Haz clic en el botón Casillas y marca: Recuentos observados, Recuentos esperados y Porcentajes de fila. Haz clic en Continuar.
  6. Haz clic en Aceptar.

Qué mirar en la salida:

  • En la tabla «Pruebas de chi-cuadrado», fíjate en la fila Chi-cuadrado de Pearson: el valor del estadístico, los grados de libertad (gl) y la significación asintótica (Sig.).
  • Lee la nota al pie: si más del 20% de celdas tiene frecuencias esperadas inferiores a 5, considera la prueba exacta de Fisher.
  • En la tabla «Medidas simétricas», toma el valor de la V de Cramer.
Consejo. Activa siempre los porcentajes de fila (o columna) en las casillas. La tabla de contingencia sin porcentajes no te permite explicar la dirección de la asociación. Un p significativo sin describir la dirección de la diferencia no tiene valor narrativo en la discusión.

Cómo ejecutarla en Jamovi

Jamovi es la alternativa gratuita y de código abierto preferida por muchos departamentos de metodología. Los pasos son ligeramente distintos a SPSS:

  1. Abre tu conjunto de datos en Jamovi. Verifica que las variables tienen nivel de medición Nominal (icono de etiquetas).
  2. En el menú superior, haz clic en Frecuencias.
  3. Selecciona Muestras Independientes — Prueba de asociación de χ².
  4. En el panel de configuración, arrastra una variable al cuadro Filas y la otra a Columnas.
  5. En la sección de estadísticos, activa: χ² de Pearson, Prueba exacta de Fisher (como alternativa por si se incumple el supuesto), V de Cramér y, opcionalmente, Phi.
  6. Activa también Porcentajes de fila en la sección de casillas.

Los resultados aparecen en tiempo real en el panel derecho. Jamovi señala con una advertencia si las frecuencias esperadas son demasiado bajas. Para un análisis previo de las características de tus variables, el artículo «Metodología del TFG: enfoques, instrumentos y justificación» puede ayudarte a decidir qué tipo de instrumento de recogida de datos es más adecuado para tus objetivos.

Cómo reportarla en formato APA 7

El informe en texto debe seguir el patrón establecido por la APA 7.ª edición. El formato estándar es:

Se realizó una prueba chi-cuadrado de independencia para examinar la relación entre [variable 1] y [variable 2]. Los resultados indicaron [una asociación estadísticamente significativa / que no se encontró asociación significativa], χ²(gl, N = [N]) = [valor], p = [.xxx], V = [.xx].

Aplicado a nuestro ejemplo:

Se realizó una prueba chi-cuadrado de independencia para examinar la relación entre la modalidad de estudios (presencial vs. semipresencial) y la preferencia de horario de tutorías (mañana vs. tarde). Se encontró una asociación estadísticamente significativa entre ambas variables, χ²(1, N = 120) = 4.38, p = .036, V = .19. Los estudiantes presenciales prefirieron la mañana en mayor proporción (65%) que los semipresenciales (45%), quienes se inclinaron más por el horario de tarde (55%).

Reglas de formato APA 7 para chi-cuadrado:

  • Escribe el símbolo χ² en cursiva (en Word: Insertar símbolo, o el atajo ALT+0967 seguido de superíndice 2).
  • Redondea χ² a dos decimales y el p-valor a tres decimales.
  • Omite el cero inicial en el p-valor (p = .036, no p = 0.036).
  • Si p < .001, escribe p < .001, no el valor exacto.
  • Incluye siempre la tabla de contingencia con los recuentos y al menos un tipo de porcentaje; referencia la tabla en el texto («véase Tabla 1»).
  • Reporta la V de Cramér con su interpretación cualitativa (efecto pequeño/mediano/grande).

Para integrar correctamente este análisis en el apartado de resultados y luego articularla en la discusión, el artículo «Cómo redactar la discusión del TFG paso a paso: referencia académica 2026» detalla cómo conectar los resultados estadísticos con la bibliografía y las implicaciones del estudio.

Errores frecuentes que penalizan los tribunales

Basándose en los criterios de evaluación metodológica de los TFG en las universidades españolas, estos son los errores más habituales con la chi-cuadrado:

  1. No verificar las frecuencias esperadas. El software ejecuta la prueba independientemente de si el supuesto se cumple. Si el 30% de tus celdas tiene E < 5 y no lo comentas, el tribunal lo detectará.
  2. Reportar solo el p-valor. Un p = .03 sin V de Cramér no dice nada sobre la relevancia práctica del hallazgo. Es un error metodológico reconocido por la APA desde la 6.ª edición.
  3. Confundir significación estadística con importancia práctica. Con N = 2.000, una diferencia de dos puntos porcentuales puede resultar significativa. La V de Cramér te protege de este error.
  4. No describir la dirección de la asociación. Decir «existe asociación significativa» sin explicar quién prefiere qué, es incompleto. Describe siempre la pauta con porcentajes.
  5. Usar chi-cuadrado con variables continuas. Si tienes la edad como variable continua y la discretizas en grupos solo para poder aplicar chi-cuadrado, pierdes información y potencia estadística innecesariamente.
  6. No referenciar la tabla en el texto. APA exige que toda tabla sea mencionada explícitamente en el cuerpo del texto.
  7. Ignorar el aviso del software sobre frecuencias esperadas. SPSS y Jamovi muestran ese aviso por una razón. Documentarlo o no en el TFG marca la diferencia entre un análisis riguroso y uno descuidado.

Para un repaso de los errores metodológicos que más penalizan en la fase de redacción, el artículo «Los 12 errores de redacción académica que más penalizan los tribunales en 2026» complementa esta guía con perspectiva de escritura.

Recursos externos de referencia: el repositorio de apuntes de estadística para investigadores de Italo FV desarrolla en detalle el análisis de la relación entre variables cualitativas, y el proceso de diseño de encuestas detallado en Metodologías de la Investigación contextualiza cuándo la chi-cuadrado entra en juego dentro de un proyecto de investigación completo.

Preguntas frecuentes

¿Cuándo se usa la prueba chi-cuadrado en el TFG?

La prueba chi-cuadrado de independencia se usa cuando ambas variables son categóricas (nominales u ordinales con pocos niveles) y quieres comprobar si existe asociación entre ellas. No sirve para variables continuas ni para muestras relacionadas.

¿Qué supuestos debe cumplir la chi-cuadrado?

Tres supuestos fundamentales: (1) observaciones independientes —cada sujeto aparece en una sola celda—, (2) variables medidas a nivel nominal u ordinal, y (3) frecuencias esperadas ≥ 5 en al menos el 80% de las celdas; ninguna celda debe tener frecuencia esperada menor que 1.

¿Cómo se calculan las frecuencias esperadas?

La frecuencia esperada para cada celda se calcula como: E = (Total de la fila × Total de la columna) / Total global. Si cualquier celda obtiene E < 5 en más del 20% de las celdas, la aproximación chi-cuadrado no es fiable y debes recurrir a la prueba exacta de Fisher o agrupar categorías.

¿Qué significa p < .05 en la chi-cuadrado?

Un p-valor inferior a .05 indica que rechazas la hipótesis nula de independencia: existe asociación estadísticamente significativa entre las dos variables en tu muestra. No indica la magnitud de esa asociación; para eso necesitas la V de Cramér.

¿Qué es la V de Cramér y cómo se interpreta?

La V de Cramér es el tamaño del efecto para la chi-cuadrado. Oscila entre 0 (sin asociación) y 1 (asociación perfecta). Según Cohen (1988), para una tabla 2×2: V ≈ .10 efecto pequeño, V ≈ .30 efecto mediano, V ≈ .50 efecto grande. Para tablas mayores los umbrales varían ligeramente.

¿Cómo se reporta la chi-cuadrado en formato APA 7?

El formato estándar es: χ²(gl, N = n) = valor, p = .xxx, V = .xx. Ejemplo: «Se encontró una asociación estadísticamente significativa entre el tipo de titulación y la preferencia de horario, χ²(1, N = 120) = 4.38, p = .036, V = .19.»

¿Qué diferencia hay entre chi-cuadrado de independencia y de bondad de ajuste?

La chi-cuadrado de independencia contrasta si dos variables categóricas están asociadas (tabla de contingencia). La de bondad de ajuste comprueba si la distribución observada de una sola variable se ajusta a una distribución teórica esperada. En el TFG, la de independencia es la más habitual.

¿Qué hacer si las frecuencias esperadas son menores de 5?

Tienes tres opciones: (1) aplicar la corrección de Yates (solo para tablas 2×2), (2) usar la prueba exacta de Fisher (recomendada con muestras pequeñas en tablas 2×2), o (3) agrupar categorías con pocas observaciones para aumentar las frecuencias esperadas.

¿Puedo usar la chi-cuadrado con datos de encuesta Likert?

Sí, pero con precaución. Si tratas las respuestas Likert como categorías nominales u ordinales (p. ej., «De acuerdo» / «En desacuerdo»), la chi-cuadrado es aplicable. Si las tratas como continuas para calcular medias, necesitarías pruebas paramétricas o no paramétricas distintas.

¿La chi-cuadrado sirve para más de dos variables?

La chi-cuadrado estándar analiza la relación entre dos variables. Para analizar simultáneamente tres o más variables categóricas necesitas análisis log-lineal o regresión logística, técnicas más avanzadas que se suelen reservar para TFM o tesis doctorales.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *