Modelado de Ecuaciones Estructurales con IA en Tesis Doctorales 2026
El modelado ecuaciones estructurales IA tesis articula dos tradiciones metodológicas complementarias: la potencia analítica de los modelos de ecuaciones estructurales (SEM, del inglés Structural Equation Modeling) y las capacidades emergentes de la inteligencia artificial para la especificación, estimación y validación de modelos teóricos complejos. En 2026, esta convergencia está transformando la investigación doctoral en ciencias sociales, educación, psicología, gestión empresarial y ciencias de la salud, donde el SEM lleva décadas siendo el método de referencia para contrastar modelos causales con datos observacionales.
Esta guía responde a una necesidad concreta: cada año, miles de doctores españoles y latinoamericanos emplean SEM en sus tesis sin haber recibido formación sistemática sobre las decisiones metodológicas críticas que determinan la validez de sus conclusiones. La incorporación de la IA a este proceso —desde la selección de indicadores hasta la detección de violaciones de supuestos— amplía las posibilidades del método, pero también introduce nuevas fuentes de error si no se gestiona con rigor. El marco ético y epistemológico de referencia lo proporciona el marco ético para el uso de IA en tesis doctorales, que debe leerse en paralelo a este artículo.
Fundamentos del SEM y su lugar en la tesis doctoral
El SEM es una familia de técnicas multivariadas que combina el análisis factorial confirmatorio (CFA) con la regresión múltiple para estimar relaciones entre variables latentes —constructos no observados directamente— y sus indicadores manifiestos. Su ventaja principal sobre la regresión lineal clásica es la capacidad de modelar simultáneamente múltiples relaciones causales, controlar el error de medida y contrastar la estructura teórica completa de un modelo frente a los datos (Bollen, 1989).
En el contexto doctoral, el SEM es especialmente apropiado cuando la tesis formula un modelo teórico que establece relaciones entre constructos abstractos como «calidad percibida», «compromiso organizacional», «autoeficacia académica» o «capital social». Estos constructos no son observables directamente; se miden a través de ítems en escalas validadas, y el SEM permite evaluar si la estructura de medida es coherente con la teoría antes de estimar las relaciones causales entre constructos.
La distinción entre el modelo de medida (relaciones entre constructos e indicadores) y el modelo estructural (relaciones causales entre constructos) es el fundamento metodológico del SEM. Omitir la validación del modelo de medida antes de interpretar las relaciones estructurales es el error más grave y más frecuente en tesis que emplean esta técnica.
Variantes del SEM: CB-SEM, PLS-SEM y BSEM
En 2026 coexisten tres variantes principales del SEM, cada una con supuestos y campos de aplicación distintos:
CB-SEM: SEM basado en covarianzas
El CB-SEM es la variante original, implementada en software como Mplus, LISREL y el paquete lavaan de R. Estima los parámetros del modelo minimizando la discrepancia entre la matriz de covarianzas observada y la reproducida por el modelo. Requiere normalidad multivariada, tamaños muestrales grandes (generalmente n > 200) y es sensible a la especificación del modelo. Es el estándar en psicología, sociología y ciencias de la educación.
PLS-SEM: SEM de mínimos cuadrados parciales
El PLS-SEM, implementado principalmente en SmartPLS, es una alternativa orientada a la predicción que trabaja con muestras más pequeñas y no requiere distribución normal de los datos. Es el estándar en investigación en gestión empresarial, sistemas de información y marketing. Sin embargo, su uso indiscriminado en contextos donde el CB-SEM sería más apropiado ha generado controversia metodológica (Rönkkö & Evermann, 2013). La elección entre CB-SEM y PLS-SEM debe justificarse explícitamente en la tesis.
BSEM: SEM bayesiano
El SEM bayesiano (Muthén & Asparouhov, 2012) combina el enfoque SEM con la inferencia bayesiana, permitiendo incorporar información a priori sobre los parámetros, trabajar con modelos complejos con muestras reducidas y obtener distribuciones posteriores completas en lugar de estimaciones puntuales. La IA contribuye aquí en la especificación de distribuciones a priori informativas basadas en meta-análisis previos y en la aceleración del muestreo MCMC. Esta variante está ganando terreno en tesis doctorales de neurociencia cognitiva y psicología clínica.
| Variante | Muestra mínima | Software | Orientación | Campos típicos |
|---|---|---|---|---|
| CB-SEM | n > 200 | Mplus, lavaan, AMOS | Confirmatorio | Psicología, educación, sociología |
| PLS-SEM | n > 30-100 | SmartPLS, plspm (R) | Predictivo | Gestión, sistemas información |
| BSEM | Variable | Mplus, Stan, brms | Probabilístico | Neurociencia, psicología clínica |
Cómo contribuye la IA al proceso SEM
La IA interviene en el proceso SEM en varias fases diferenciadas:
Especificación del modelo
Los modelos de lenguaje de gran escala (LLM) pueden asistir en la revisión sistemática de la literatura para identificar las relaciones entre constructos más respaldadas empíricamente, en la selección de indicadores de escalas validadas y en la detección de problemas de especificación (constructos con indicadores insuficientes, modelos no identificados). Esta asistencia debe complementarse con el juicio teórico del investigador; la IA no puede reemplazar el conocimiento del dominio disciplinar.
Detección de supuestos violados
Los algoritmos de IA pueden detectar automáticamente violaciones de los supuestos del SEM: no normalidad multivariada, outliers influyentes, multicolinealidad entre indicadores y datos ausentes no aleatorios (MNAR). Herramientas como el paquete semTools en R incorporan funciones automatizadas para estos diagnósticos.
Modificación del modelo
El SEM genera índices de modificación que sugieren relaciones adicionales que mejorarían el ajuste del modelo. La IA puede priorizar estos índices según su plausibilidad teórica, evitando la práctica metodológicamente reprobable del specification searching ateórico —modificar el modelo iterativamente solo para mejorar los índices de ajuste sin justificación sustantiva.
Análisis multigrupo automatizado
El análisis multigrupo en SEM (para probar invarianza de medida entre grupos demográficos o culturales) implica una secuencia de modelos anidados con complejidad creciente. Los algoritmos de IA pueden automatizar esta secuencia y generar reportes de invarianza conforme al protocolo de Vandenberg y Lance (2000), reduciendo significativamente el tiempo de análisis.
Validación del modelo de medida
La validación del modelo de medida es el paso previo e imprescindible antes de interpretar cualquier relación estructural. Los criterios estándar en 2026 son los siguientes:
- Fiabilidad compuesta (CR): valores superiores a 0,70 indican consistencia interna aceptable del constructo.
- Varianza media extraída (AVE): valores superiores a 0,50 indican que el constructo explica más varianza de sus indicadores que el error de medida. Es el criterio de validez convergente de Fornell y Larcker (1981).
- Validez discriminante: cada constructo debe compartir más varianza con sus indicadores que con otros constructos. El criterio HTMT (Heterotrait-Monotrait ratio) de Henseler et al. (2015) es el estándar actual: valores < 0,85 confirman validez discriminante.
- Cargas factoriales: todas las cargas estandarizadas deben ser estadísticamente significativas y superiores a 0,70 para indicadores reflectivos.
La herramienta Tesify puede asistir en la verificación de estos criterios y en la redacción del apartado de validación del modelo de medida, asegurando que el lenguaje empleado sea preciso y coherente con los estándares de reporte APA. La guía sobre validez concurrente y predictiva en investigación con IA proporciona el marco conceptual complementario para esta fase.
Evaluación del modelo estructural
Una vez validado el modelo de medida, la evaluación del modelo estructural examina las relaciones causales hipotéticas entre los constructos. Los criterios de evaluación incluyen:
Índices de ajuste global
Los índices de ajuste global evalúan en qué medida el modelo reproduce la matriz de covarianzas observada. Los criterios de aceptabilidad estándar en 2026 (Hu & Bentler, 1999; Kline, 2023) son:
- CFI (Comparative Fit Index): > 0,95 para ajuste excelente; > 0,90 para ajuste aceptable.
- RMSEA (Root Mean Square Error of Approximation): < 0,06 excelente; < 0,08 aceptable. Reportar con intervalo de confianza al 90%.
- SRMR (Standardized Root Mean Square Residual): < 0,08.
- Chi-cuadrado: estadísticamente significativo casi siempre con muestras grandes; debe reportarse junto con los grados de libertad, pero no usarse como criterio de aceptación único.
Coeficientes de trayectoria y tamaños del efecto
Los coeficientes de trayectoria estandarizados (betas) deben reportarse con sus errores estándar, estadísticos t o z y valores p. Además, deben incluirse los tamaños del efecto (f² para el CB-SEM) y los coeficientes de determinación (R²) de cada variable endógena. En PLS-SEM, la relevancia predictiva se evalúa con el estadístico Q² de Stone-Geisser mediante blindfolding.
Software: SmartPLS, lavaan, Mplus y herramientas con IA
El panorama de software para SEM en 2026 incluye tanto herramientas consolidadas como nuevas soluciones que integran asistencia de IA:
- Mplus 8.x: el software más completo y utilizado en investigación doctoral internacional, con soporte para CB-SEM, BSEM, análisis multigrupo, datos categóricos y modelos de crecimiento latente. Licencia de pago; las universidades españolas suelen disponer de licencias institucionales.
- lavaan (R): alternativa gratuita y de código abierto al CB-SEM. Sintaxis basada en el lenguaje de especificación de modelos SEM (Rosseel, 2012). Integración con semTools para análisis complementarios.
- SmartPLS 4: estándar de facto para PLS-SEM. La versión 4 incorpora asistentes de IA para la interpretación de resultados y la detección de problemas de especificación.
- JASP con módulo SEM: interfaz gráfica accesible que implementa SEM clásico y bayesiano, con salidas directamente formateadas en APA. Gratuito y recomendado para usuarios sin experiencia en programación.
La integración de IA en estos flujos de trabajo requiere mantener la supervisión humana sobre todas las decisiones de especificación y modificación del modelo. Como señala la revisión del estado del arte de la IA generativa en investigación, la automatización de decisiones metodológicas sin supervisión es una de las principales fuentes de sesgo en la investigación asistida por IA.
Estándares de reporte en APA 7
El reporte de resultados SEM en una tesis doctoral debe seguir las directrices de Kline (2023) y las normas APA 7. Los elementos mínimos exigibles son:
- Descripción completa del software utilizado (nombre, versión, referencia).
- Justificación de la variante SEM empleada (CB-SEM vs. PLS-SEM vs. BSEM) y del estimador utilizado (ML, MLR, WLSMV para datos ordinales).
- Tabla de cargas factoriales, errores estándar, fiabilidad compuesta y AVE.
- Tabla o figura del modelo estructural con coeficientes de trayectoria estandarizados, valores p y R².
- Índices de ajuste global con sus criterios de aceptabilidad citados.
- Declaración del uso de IA en el proceso analítico, especificando qué tareas realizó la IA y qué supervisión humana se ejerció.
La bibliometría con IA para el mapeo de citas puede complementar el análisis SEM identificando los autores y trabajos semilla del modelo teórico que se contrasta.
Errores críticos y buenas prácticas
La revisión de tesis doctorales que emplean SEM revela un conjunto de errores recurrentes que deterioran gravemente la validez de las conclusiones:
- Omitir la validación del modelo de medida: interpretar las relaciones estructurales sin verificar que los constructos están bien medidos invalida toda la inferencia posterior.
- Usar criterios de ajuste obsoletos: reportar solo el estadístico chi-cuadrado o el GFI, criterios desaconsejados en la literatura contemporánea (Kline, 2023).
- Specification searching ateórico: modificar el modelo basándose exclusivamente en los índices de modificación, sin justificación teórica, equivale a hacer análisis exploratorio presentado como confirmatorio.
- Confundir constructos reflectivos y formativos: los indicadores formativos no deben tratarse como indicadores reflectivos; requieren evaluaciones de validez completamente distintas (Hair et al., 2022).
- Tamaños muestrales insuficientes para CB-SEM: con n < 100, los estimadores de máxima verosimilitud son inestables. Usar bootstrap o considerar PLS-SEM o BSEM como alternativas.
Los sesgos que la IA puede introducir en la especificación y estimación de modelos SEM se analizan en detalle en la guía sobre sesgos en IA generativa y sus implicaciones para tesis.
Preguntas frecuentes
¿Cuándo debo usar CB-SEM y cuándo PLS-SEM en mi tesis doctoral?
La regla básica es: CB-SEM cuando el objetivo es contrastar una teoría establecida y se dispone de una muestra grande (n > 200) con datos continuos aproximadamente normales; PLS-SEM cuando el objetivo principal es la predicción, la muestra es pequeña o los datos son no normales. La elección debe justificarse teórica y metodológicamente en la tesis, citando las diferencias epistemológicas entre ambos enfoques.
¿Qué índices de ajuste debo reportar obligatoriamente en una tesis con SEM?
Como mínimo: CFI, RMSEA (con intervalo de confianza al 90%) y SRMR, junto con el chi-cuadrado y sus grados de libertad. Algunos comités evaluadores exigen también el TLI (Tucker-Lewis Index). Todos los índices deben reportarse con sus criterios de aceptabilidad de referencia (citando a Hu y Bentler, 1999, o Kline, 2023).
¿Puede la IA especificar automáticamente un modelo SEM para mi tesis?
La IA puede asistir en la revisión de la literatura para identificar relaciones teóricas plausibles y en la selección de indicadores de escalas validadas. Sin embargo, la especificación del modelo debe estar fundamentada en la teoría disciplinar del investigador. Delegar completamente la especificación a la IA produce modelos ateóricos cuya validez epistémica es cuestionable. El investigador debe ser capaz de justificar cada relación causal incluida en el modelo.
¿Qué es el HTMT y por qué es importante para la validez discriminante?
El HTMT (Heterotrait-Monotrait ratio) es el criterio más robusto disponible en 2026 para evaluar la validez discriminante en SEM con indicadores reflectivos. Compara la correlación promedio entre indicadores de distintos constructos (heterotrait-heteromethod) con la correlación promedio entre indicadores del mismo constructo (monotrait-heteromethod). Valores < 0,85 indican validez discriminante aceptable; valores < 0,90 son el umbral menos estricto defendido por algunos autores. Ha sustituido al criterio de Fornell-Larcker porque es más sensible a problemas de discriminación entre constructos altamente correlacionados.
¿Cómo declaro en APA 7 el uso de IA en el análisis SEM de mi tesis?
En el apartado de «Análisis de datos» del capítulo metodológico, incluye una subsección específica: «Uso de inteligencia artificial en el proceso analítico». Especifica: (1) la herramienta de IA utilizada y su versión; (2) las tareas concretas en que intervino (revisión de literatura, detección de violaciones de supuestos, diagnóstico de modificación del modelo); (3) cómo verificaste y supervisaste los resultados generados por la IA; (4) las decisiones que mantuviste bajo tu criterio exclusivo.
¿Cuál es el tamaño muestral mínimo para un modelo SEM en una tesis doctoral?
Para CB-SEM, la regla de referencia es n > 200, aunque modelos sencillos (menos de 20 parámetros libres) pueden ser estables con n = 100-150. Una aproximación más precisa es el análisis de potencia estadística con el paquete semPower en R, que calcula el tamaño muestral necesario para detectar un efecto de tamaño dado con la potencia deseada. Para PLS-SEM, el criterio del «diez veces la mayor cantidad de caminos dirigidos a un constructo endógeno» es una guía conservadora ampliamente usada.
¿Puedo usar Tesify para preparar el capítulo de resultados del análisis SEM?
Sí. Tesify puede asistirte en la estructuración del capítulo de resultados, en la redacción de las interpretaciones de los índices de ajuste y los coeficientes de trayectoria, y en la verificación de que el lenguaje empleado es coherente con los estándares de reporte APA 7 y las convenciones de tu disciplina. La interpretación sustantiva de los resultados —qué significan para tu pregunta de investigación— es responsabilidad exclusiva del investigador.
¿Qué es el SEM bayesiano y en qué contextos doctorales es más adecuado?
El SEM bayesiano (BSEM) estima los parámetros del modelo como distribuciones de probabilidad posteriores, combinando datos observados con conocimiento previo (distribuciones a priori). Es especialmente adecuado cuando: (a) se dispone de información teórica sólida sobre la magnitud de los parámetros (por ejemplo, de meta-análisis previos); (b) la muestra es pequeña y los estimadores frecuentistas son inestables; (c) el modelo es muy complejo con muchos parámetros libres. La principal barrera de adopción es la curva de aprendizaje del muestreo MCMC y la especificación de distribuciones a priori.
Referencias
- Bollen, K. A. (1989). Structural equations with latent variables. Wiley. https://doi.org/10.1002/9781118619179
- Fornell, C., & Larcker, D. F. (1981). Evaluating structural equation models with unobservable variables and measurement error. Journal of Marketing Research, 18(1), 39–50. https://doi.org/10.2307/3151312
- Hair, J. F., Risher, J. J., Sarstedt, M., & Ringle, C. M. (2022). A primer on partial least squares structural equation modeling (PLS-SEM) (3rd ed.). SAGE Publications.
- Henseler, J., Ringle, C. M., & Sarstedt, M. (2015). A new criterion for assessing discriminant validity in variance-based structural equation modeling. Journal of the Academy of Marketing Science, 43(1), 115–135. https://doi.org/10.1007/s11747-014-0403-8
- Hu, L., & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis. Structural Equation Modeling, 6(1), 1–55. https://doi.org/10.1080/10705519909540118
- Kline, R. B. (2023). Principles and practice of structural equation modeling (5th ed.). Guilford Press.
- Muthén, B., & Asparouhov, T. (2012). Bayesian structural equation modeling: A more flexible representation of substantive theory. Psychological Methods, 17(3), 313–335. https://doi.org/10.1037/a0026802
- OECD. (2024). Recommendation of the Council on Artificial Intelligence. OECD Publishing.
- Rönkkö, M., & Evermann, J. (2013). A critical examination of common beliefs about partial least squares path modeling. Organizational Research Methods, 16(3), 425–448. https://doi.org/10.1177/1094428112474693
- Rosseel, Y. (2012). lavaan: An R package for structural equation modeling. Journal of Statistical Software, 48(2), 1–36. https://doi.org/10.18637/jss.v048.i02
- Vandenberg, R. J., & Lance, C. E. (2000). A review and synthesis of the measurement invariance literature. Organizational Research Methods, 3(1), 4–70. https://doi.org/10.1177/109442810031002

Deja una respuesta