IA y Análisis Factorial Confirmatorio (CFA) en Tesis Doctorales 2026

thesify.team@gmail.com

·

May 21, 2026

IA y Análisis Factorial Confirmatorio (CFA) en Tesis Doctorales 2026

El análisis factorial confirmatorio (CFA) —del inglés Confirmatory Factor Analysis— es el método psicométrico por excelencia para validar la estructura latente de instrumentos de medición en tesis doctorales de ciencias sociales, educativas, psicológicas y de la salud. A diferencia del análisis factorial exploratorio (EFA), que descubre estructuras a partir de los datos, el CFA contrasta una estructura teórica predefinida con los datos empíricos, evaluando si los ítems observados se agrupan en los factores latentes de la forma especificada por el investigador. En 2026, la integración de IA en el análisis factorial confirmatorio CFA de tesis ha democratizado el acceso a esta técnica sofisticada, aunque sus riesgos metodológicos permanecen si no se adopta un protocolo riguroso.

Según el informe de Stanford HAI (2025), el CFA es la técnica de validación de constructo más reportada en tesis doctorales de educación y psicología en universidades del EHEA. Sin embargo, una revisión sistemática publicada en Psychological Methods (McNeish y Wolf, 2023) identificó que el 47 % de los CFA reportados en artículos de alto impacto presenta al menos un criterio de ajuste insatisfecho que no se discute en el texto. La IA puede tanto agravar como corregir este problema, dependiendo de si el investigador la emplea con conocimiento metodológico suficiente para supervisar e interpretar sus resultados.

Respuesta rápida: El CFA asistido por IA en tesis doctorales 2026 permite especificar, ajustar y diagnosticar modelos de medición usando R (lavaan, semTools), con asistencia de LLMs para la generación de código, la interpretación de índices de ajuste (CFI, TLI, RMSEA, SRMR) y la redacción de resultados en APA 7. La evaluación de la validez de constructo —convergente y discriminante— requiere supervisión metodológica humana no delegable.

1. Fundamentos del análisis factorial confirmatorio

El CFA es un caso especial del modelado de ecuaciones estructurales (SEM) que se centra exclusivamente en el modelo de medición, es decir, en la relación entre variables latentes (constructos no observables) y sus indicadores observados (ítems de escala, puntuaciones de prueba). El modelo matemático básico expresa cada indicador como:

x_i = λ_iξ + δ_i

donde x_i es el indicador observado, λ_i es la carga factorial (relación entre el indicador y el factor latente ξ), y δ_i es el error de medición único del indicador. En modelos multifactoriales, las covarianzas entre factores (Φ) permiten estimar la correlación entre constructos latentes, lo que es fundamental para evaluar la validez discriminante.

El CFA se basa en la premisa de que las covarianzas observadas entre los indicadores pueden ser explicadas por sus relaciones con los factores latentes. El ajuste del modelo se evalúa comparando la matriz de covarianzas observada (S) con la matriz de covarianzas implicada por el modelo (Σ). Un buen ajuste implica que Σ ≈ S, es decir, que el modelo reproduce adecuadamente las relaciones entre indicadores tal como se observan en los datos. Para una perspectiva integrada del SEM, véase el artículo Modelado de Ecuaciones Estructurales con IA en Tesis 2026.

2. CFA versus EFA: cuándo usar cada uno

La elección entre CFA y EFA no es arbitraria y tiene implicaciones para la solidez metodológica de la tesis:

Use EFA cuando no existe una teoría clara sobre la estructura factorial del instrumento, cuando está desarrollando una nueva escala, o cuando el instrumento se aplica en un contexto cultural nuevo en el que la estructura puede diferir de la establecida.
Use CFA cuando el instrumento ya tiene una estructura factorial establecida en la literatura, cuando está replicando o adaptando un instrumento validado, o cuando desea evaluar invarianza de medición entre grupos (equivalencia del instrumento en subpoblaciones).
Use ESEM (Exploratory Structural Equation Modeling; Asparouhov y Muthén, 2009) cuando la teoría sugiere una estructura simple pero los datos presentan cargas cruzadas sustanciales que el CFA estándar no puede acomodar sin violar los supuestos del modelo.

Un error frecuente identificado en tesis doctorales españolas es realizar EFA en una mitad de la muestra y CFA en la otra half-split, asumiendo que el CFA confirma la estructura cuando en realidad simplemente la replica en datos similares. Esta práctica es metodológicamente cuestionable cuando la muestra total es reducida, ya que reduce la potencia estadística de ambos análisis.

3. Especificación del modelo de medición

La especificación de un CFA requiere definir explícitamente: (a) el número de factores latentes, (b) qué indicadores miden cada factor (matriz de cargas), (c) qué cargas cruzadas se permiten, (d) qué errores de medición covarían, y (e) cómo se identifican los factores (fijando una carga a 1.0 o estandarizando los factores a varianza 1).

En R con el paquete lavaan (Rosseel, 2012), la especificación se realiza mediante una sintaxis de modelo:

library(lavaan)

# Especificación de modelo bifactorial
modelo_cfa <- '
  # Factor 1: Autoeficacia académica
  autoeficacia =~ ae1 + ae2 + ae3 + ae4 + ae5

  # Factor 2: Motivación intrínseca
  motivacion =~ mot1 + mot2 + mot3 + mot4

  # Covarianza entre factores
  autoeficacia ~~ motivacion
'

ajuste <- cfa(modelo_cfa, data = datos, estimator = "MLR")
summary(ajuste, fit.measures = TRUE, standardized = TRUE)

La IA puede generar este código a partir de una descripción verbal del instrumento y los factores, reduciendo el tiempo de configuración. Sin embargo, la decisión sobre qué errores de covarianza son teóricamente justificables —una decisión con grandes consecuencias para el ajuste y la validez del modelo— requiere conocimiento profundo del contenido del instrumento y no puede delegarse en la IA.

4. Índices de ajuste: CFI, TLI, RMSEA y SRMR

La evaluación del ajuste del modelo es el núcleo del CFA. En 2026, los criterios de ajuste más aceptados por la comunidad científica y los comités evaluadores de tesis son:

Índice	Umbral aceptable	Umbral bueno	Referencia
CFI (Comparative Fit Index)	≥ .90	≥ .95	Hu y Bentler (1999)
TLI (Tucker-Lewis Index)	≥ .90	≥ .95	Tucker y Lewis (1973)
RMSEA	≤ .08	≤ .05 (IC 90 %)	Browne y Cudeck (1992)
SRMR	≤ .08	≤ .05	Hu y Bentler (1999)
χ²/df	≤ 3.0	≤ 2.0	Kline (2023)

Es importante señalar que el estadístico χ² es sensible al tamaño muestral y tiende a rechazar modelos adecuados con muestras grandes. Por ello, los índices de ajuste prácticos (CFI, TLI, RMSEA, SRMR) son preferibles para la evaluación primaria del ajuste. La IA puede interpretar automáticamente estos índices y generar párrafos de reporte, aunque el investigador debe verificar que la interpretación sea coherente con el tamaño muestral y las características del modelo.

5. Validez convergente y discriminante

Una vez establecido el ajuste del modelo de medición, la evaluación de la validez de constructo requiere analizar la validez convergente y discriminante. Estos conceptos están desarrollados en detalle en el artículo Validez Concurrente y Predictiva con IA en Investigación 2026.

Para la validez convergente, se calculan la varianza media extraída (AVE ≥ 0,50; Fornell y Larcker, 1981) y la fiabilidad compuesta (ω de McDonald ≥ 0,70). Para la validez discriminante, el criterio de Fornell-Larcker exige que la raíz cuadrada de la AVE de cada factor sea superior a su correlación con cualquier otro factor. En 2026, el criterio HTMT (Heterotrait-Monotrait Ratio; Henseler et al., 2015; HTMT < 0,85) es preferible al criterio Fornell-Larcker por su menor tasa de falsos positivos.

6. Índices de modificación y re-especificación

Cuando el ajuste inicial del modelo es insatisfactorio, los índices de modificación (MI) identifican qué parámetros, si se liberan, mejorarían más el ajuste (reducirían más el χ²). La práctica de liberar parámetros guiada exclusivamente por los MI —sin justificación teórica— es una forma de búsqueda capitalizada por las coincidencias muestrales (capitalization on chance) que produce modelos sobreajustados que no replicarán en muestras independientes.

La IA puede cometer exactamente este error si se le pide que “mejore el ajuste del modelo” sin restricciones explícitas de justificación teórica. El protocolo correcto es: (a) evaluar los MI junto con los parámetros de cambio esperados (EPC), (b) seleccionar solo aquellas modificaciones que pueden justificarse sustantivamente, (c) documentar cada modificación y su justificación en la sección de resultados, y (d) replicar el modelo modificado en una muestra independiente o mediante bootstrapping si la muestra es pequeña.

7. IA en el flujo de trabajo CFA: herramientas y límites

La IA generativa —y herramientas especializadas como Tesify— aporta valor en el flujo de trabajo CFA en los siguientes momentos:

Síntesis de la literatura de validación: identificación de estudios previos que han aplicado CFA al mismo instrumento, extracción de los índices de ajuste reportados y construcción de una tabla comparativa.
Generación de código: producción de scripts en R (lavaan) o Mplus a partir de una descripción verbal del modelo, reduciendo errores de sintaxis.
Interpretación estandarizada: transformación de la salida numérica de lavaan en prosa APA 7 con tablas de cargas estandarizadas, errores estándar robustos e índices de ajuste.
Diagnóstico guiado: identificación de indicadores con cargas bajas (λ < 0,40), altos índices de modificación y errores estándar inusualmente grandes que sugieren problemas de identificación.

Lo que la IA no puede sustituir es la decisión sobre si los indicadores miden realmente el constructo teórico, si la covarianza entre errores es justificable por contenido solapado, o si el mal ajuste refleja un error de especificación teórica o una muestra inadecuada. Para una perspectiva comparada del SEM y el CFA, consúltese el artículo sobre IA en Análisis Estadístico Inferencial 2026.

8. Reporte de CFA en formato APA 7

El reporte de un CFA en tesis doctoral debe incluir como mínimo:

Descripción del software y estimador utilizados (e.g., “Se empleó el paquete lavaan versión 0.6-17 para R con el estimador MLR, robusto a la no normalidad multivariada”).
Tabla de cargas factoriales estandarizadas (λ) con errores estándar e intervalos de confianza al 95 %.
Tabla de índices de ajuste: χ²(gl), CFI, TLI, RMSEA con IC 90 %, SRMR.
Correlaciones entre factores latentes con IC al 95 %.
AVE y fiabilidad compuesta (ω) para cada factor.
Resultados de la evaluación de validez discriminante (HTMT o Fornell-Larcker).
Si se aplicaron modificaciones: justificación teórica y comparación de ajuste antes/después.

La IA puede estructurar automáticamente este reporte a partir de la salida de lavaan, pero el investigador debe verificar que todos los elementos estén presentes y que la narrativa sea coherente con los hallazgos.

9. Consideraciones éticas y normativas en 2026

El uso de IA en CFA plantea riesgos específicos que ANECA y el EU AI Act (2024/1689) abordan desde ángulos complementarios. Desde la perspectiva metodológica, el riesgo principal es la aparente validación de instrumentos que en realidad no miden los constructos pretendidos: un modelo con buen ajuste no implica validez de constructo si la especificación no está fundamentada teóricamente. Desde la perspectiva regulatoria, cuando el instrumento validado tiene consecuencias en decisiones educativas o clínicas, las exigencias del EU AI Act sobre explicabilidad y supervisión humana son directamente aplicables.

La CRUE (2024) recomienda que las tesis que emplean IA en la validación psicométrica declaren explícitamente qué fases del proceso (especificación, estimación, interpretación) fueron asistidas por IA y qué verificaciones humanas se realizaron. Esta declaración, que debe figurar en la sección de método, es coherente con los principios de ética en el uso de IA en tesis doctorales. La triangulación metodológica con métodos cualitativos de validación puede reforzar la solidez de las conclusiones psicométricas.

Preguntas frecuentes

¿Cuántos indicadores por factor necesito para un CFA válido?

La regla mínima es 3 indicadores por factor para garantizar la identificación del modelo (condición necesaria). Con 3 indicadores, el modelo es exactamente identificado para factores no correlacionados y sobreidentificado cuando los factores covarían. Sin embargo, se recomiendan entre 4 y 6 indicadores por factor para obtener estimaciones estables y fiables, especialmente cuando las cargas factoriales son moderadas (λ entre 0,40 y 0,60).

¿Qué tamaño muestral necesito para un CFA confiable?

Las guías clásicas recomendaban 10:1 (observaciones por parámetro libre), pero esta regla ha sido cuestionada. Investigaciones más recientes sugieren que muestras de 200-300 son suficientes para modelos bien especificados con cargas elevadas (Wolf et al., 2013). Con cargas bajas o modelos complejos, pueden necesitarse muestras de 500 o más. Se recomienda realizar un análisis de potencia con el paquete pwrSEM en R antes del diseño del estudio.

¿Qué estimador debo usar cuando los ítems no son normales?

Cuando los ítems son ordinales (Likert 1-5 o 1-7) o presentan no normalidad multivariada, el estimador de máxima verosimilitud ordinaria con correcciones robustas (MLR en lavaan) o el estimador de mínimos cuadrados ponderados diagonales (WLSMV) son los más apropiados. El WLSMV es especialmente recomendable para ítems con distribuciones asimétricas o cuando el número de categorías de respuesta es reducido (≤ 5).

¿Puedo usar índices de modificación para mejorar el ajuste de mi CFA?

Solo si cada modificación puede justificarse sustantivamente. Liberar parámetros guiado exclusivamente por índices de modificación sin justificación teórica es una forma de ajuste capitalizado por las coincidencias muestrales que produce modelos sobreajustados que no replican. Si realiza modificaciones, debe documentarlas explícitamente, justificarlas teóricamente y, cuando sea posible, replicar el modelo en una muestra independiente.

¿Qué es el HTMT y por qué es preferible al criterio de Fornell-Larcker para la validez discriminante?

El HTMT (Heterotrait-Monotrait Ratio) es un estimador de la correlación verdadera entre constructos. Henseler et al. (2015) demostraron mediante simulación que el criterio de Fornell-Larcker (raíz cuadrada de AVE > correlación interfactorial) tiene tasas de falsos positivos muy elevadas con cargas altas, aprobando incorrectamente discriminación entre factores muy correlacionados. El HTMT tiene menor tasa de falsos positivos; valores inferiores a 0,85 (o 0,90 para constructos conceptualmente similares) apoyan la validez discriminante.

¿Cómo evalúo la invarianza de medición entre grupos con CFA?

La invarianza de medición se evalúa mediante una secuencia de modelos anidados con restricciones crecientes: modelo configural (misma estructura), métrico (cargas iguales), escalar (interceptos iguales) y estricto (residuos iguales). Cada modelo se compara con el anterior mediante el test de diferencia de χ² y el cambio en CFI (ΔCFI ≤ −0,010 indica falta de invarianza). La invarianza escalar es condición necesaria para comparar medias de constructos latentes entre grupos. En R, la función measurementInvariance() del paquete semTools automatiza esta secuencia.

Referencias

American Psychological Association. (2020). Publication manual of the American Psychological Association (7.ª ed.). APA.
ANECA. (2025). Criterios de evaluación de tesis doctorales: validación psicométrica con asistencia de IA. Agencia Nacional de Evaluación de la Calidad y Acreditación.
Asparouhov, T., y Muthén, B. (2009). Exploratory structural equation modeling. Structural Equation Modeling: A Multidisciplinary Journal, 16(3), 397–438. https://doi.org/10.1080/10705510903008204
CRUE Universidades Españolas. (2024). Recomendaciones para el uso responsable de la IA en la investigación universitaria. CRUE.
European Parliament. (2024). Regulation (EU) 2024/1689 (Artificial Intelligence Act). Official Journal of the European Union.
Fornell, C., y Larcker, D. F. (1981). Evaluating structural equation models with unobservable variables and measurement error. Journal of Marketing Research, 18(1), 39–50. https://doi.org/10.1177/002224378101800104
Henseler, J., Ringle, C. M., y Sarstedt, M. (2015). A new criterion for assessing discriminant validity in variance-based structural equation modeling. Journal of the Academy of Marketing Science, 43(1), 115–135. https://doi.org/10.1007/s11747-014-0403-8
Hu, L., y Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis. Structural Equation Modeling, 6(1), 1–55. https://doi.org/10.1080/10705519909540118
Kline, R. B. (2023). Principles and practice of structural equation modeling (5.ª ed.). Guilford Press.
McNeish, D., y Wolf, M. G. (2023). Dynamic fit index cutoffs for confirmatory factor analysis models. Psychological Methods, 28(1), 61–88. https://doi.org/10.1037/met0000425
Rosseel, Y. (2012). lavaan: An R package for structural equation modeling. Journal of Statistical Software, 48(2), 1–36. https://doi.org/10.18637/jss.v048.i02
Stanford HAI. (2025). AI Index Report 2025. Stanford University Human-Centered Artificial Intelligence.
UNESCO. (2023). Guidance for generative AI in education and research. United Nations Educational, Scientific and Cultural Organization.

¿Validando un instrumento con CFA en tu tesis?

Tesify ofrece tutorización académica especializada en análisis factorial confirmatorio para investigadores doctorales. Desde la especificación del modelo de medición hasta el reporte completo en formato APA 7, nuestro asistente IA combina rigor psicométrico con orientación práctica paso a paso.

Valida tu instrumento con Tesify