IA y Análisis Causal en Tesis Doctorales 2026: DAGs y el Marco de Pearl

thesify.team@gmail.com

·

May 21, 2026

IA y Análisis Causal en Tesis Doctorales 2026: DAGs y el Marco de Pearl

Durante décadas, la investigación doctoral en ciencias sociales y educativas ha conflado asociación estadística con causalidad, produciendo conclusiones que los propios datos no podían sostener. La inferencia causal —y en particular el marco formal desarrollado por Judea Pearl (2000, 2009) basado en grafos acíclicos dirigidos (DAGs) y el do-cálculo— ofrece las herramientas matemáticas necesarias para responder preguntas causales de manera rigurosa sin necesidad de experimentos aleatorizados. En 2026, la integración de IA en el análisis causal de tesis con DAGs y Pearl ha hecho este marco accesible a investigadores sin formación matemática avanzada, transformando el estándar metodológico esperado en tesis doctorales del EHEA.

El Nobel de Economía 2021, concedido a David Card, Joshua Angrist e Guido Imbens por sus contribuciones a la inferencia causal con datos observacionales, consolidó definitivamente la legitimidad académica de estos métodos. ANECA y la CRUE (2024) han incorporado explícitamente la comprensión de la distinción correlación-causalidad como competencia doctoral esperada. La IA generativa —y herramientas como Tesify— permiten ahora a cualquier doctorando construir DAGs, identificar variables de confusión y aplicar estrategias de identificación causal sin necesidad de dominar el álgebra matricial subyacente, aunque sí con comprensión conceptual de los supuestos que cada estrategia requiere.

Respuesta rápida: El análisis causal con DAGs y el marco de Pearl asistido por IA en tesis doctorales 2026 permite: (1) representar explícitamente las relaciones causales hipotéticas mediante DAGs; (2) identificar variables de confusión, mediadores y colisionadores; (3) aplicar el criterio de puerta trasera (backdoor criterion) o de puerta delantera (frontdoor criterion) para identificar efectos causales en datos observacionales; y (4) estimar el efecto causal con métodos como el matching, la ponderación por propensión o variables instrumentales. Herramientas como dagitty y ggdag en R facilitan este flujo con asistencia de LLMs.

1. Por qué la causalidad importa en la investigación doctoral

La pregunta fundamental que diferencia la investigación confirmatoria de la exploratoria es: ¿este efecto es causal o meramente correlacional? La respuesta tiene consecuencias prácticas directas: una política educativa, una intervención clínica o un programa de formación solo merecen implementación si se ha establecido que el factor intervenido causa el resultado deseado, no simplemente que covaría con él.

En la práctica doctoral, las preguntas causales son ubiquas: ¿Causa el uso de metodologías activas un mejor rendimiento académico, o simplemente los docentes más motivados adoptan simultáneamente metodologías activas y obtienen mejores resultados? ¿Reduce la intervención cognitivo-conductual la ansiedad, o los pacientes con menor severidad inicial buscan más activamente tratamiento? Estas preguntas no pueden responderse con regresión múltiple ordinaria sin explicitar y controlar las rutas causales alternativas, algo que el marco de Pearl hace posible de forma sistemática.

El movimiento de ciencia abierta —abordado en el artículo sobre Reproducibilidad Científica con IA 2026— exige que los investigadores preregistren sus hipótesis causales y los supuestos de identificación antes de analizar los datos. La combinación de DAGs preregistrados con análisis de sensibilidad causal es el estándar emergente en 2026 para tesis doctorales con datos observacionales.

2. DAGs: representación formal del conocimiento causal

Un grafo acíclico dirigido (DAG) es una representación visual y matemática de las hipótesis causales del investigador. Consta de nodos (variables) y aristas dirigidas (flechas que representan efectos causales directos). La condición de aciclicidad implica que ninguna variable puede ser causa de sí misma (no existen bucles causales). Esta representación formaliza el conocimiento previo —teórico, empírico o de experto— sobre las relaciones entre variables de una forma que puede someterse a prueba empírica.

Las propiedades más importantes de los DAGs para la inferencia causal son:

d-separación: una noción de independencia condicional que permite leer directamente del DAG qué pares de variables son estadísticamente independientes dado un conjunto de variables de control. Esto permite derivar las implicaciones observacionales del modelo causal sin necesidad de cálculo.
Criterio de Markov: cada variable es independiente de sus no-descendientes dado el conjunto de sus padres directos en el grafo. Este criterio conecta la estructura causal con la estructura probabilística de los datos.
Equivalencia de Markov: múltiples DAGs pueden implicar las mismas independencias condicionales y son por tanto observacionalmente equivalentes; la distinción entre ellos requiere conocimiento causal a priori que los datos no pueden proporcionar por sí solos.

En R, el paquete dagitty (Textor et al., 2016) permite construir DAGs, evaluar d-separación, identificar conjuntos de ajuste mínimo y generar las implicaciones testables del modelo. El paquete ggdag produce visualizaciones publicables de alta calidad. La IA puede asistir en la traducción de hipótesis teóricas en código dagitty, en la verificación de la consistencia lógica del DAG y en la identificación de supuestos implícitos que el investigador no había considerado explícitamente.

3. El marco de Pearl: do-cálculo y modelos causales estructurales

Judea Pearl formalizó la inferencia causal a través del do-cálculo (Pearl, 1995), un álgebra de tres reglas que transforma expresiones interventivas P(Y | do(X)) —la distribución de Y cuando se interviene y se fija X a un valor— en expresiones observacionales que pueden ser estimadas con datos. La notación do(X = x) representa una intervención ideal que corta todas las causas entrantes de X, análoga a la manipulación experimental.

El marco de Pearl distingue tres niveles de la escalera de la causalidad (Pearl y Mackenzie, 2018):

Asociación (ver): P(Y | X) — correlaciones y regresiones estándar.
Intervención (hacer): P(Y | do(X)) — efectos causales de intervenciones; requiere un DAG válido para su identificación.
Contrafácticos (imaginar): P(Y_x = y | X = x’, Y = y’) — razonamiento sobre qué hubiera ocurrido bajo condiciones distintas a las observadas; requiere modelos causales estructurales completos.

La mayoría de las preguntas doctorales se ubican en el nivel 2 (efectos de intervenciones o políticas) o el nivel 3 (efecto del tratamiento en los tratados, decisiones médicas individualizadas). La regresión estándar opera exclusivamente en el nivel 1 y solo responde preguntas causales si todas las variables de confusión están controladas —condición que los DAGs permiten verificar formalmente.

Este marco se articula de forma natural con los Métodos Bayesianos con IA en Tesis 2026, donde los DAGs bayesianos (redes bayesianas causales) permiten combinar conocimiento previo con evidencia empírica para la estimación de efectos causales bajo incertidumbre.

4. Confusores, mediadores y colisionadores

El manejo correcto de las variables intermedias es el error metodológico más frecuente en tesis doctorales con datos observacionales. El marco de Pearl distingue tres tipos de variables que requieren tratamiento estadístico diferente:

4.1 Confusores

Una variable C es un confusor de la relación X → Y si C causa tanto X como Y, creando una asociación espuria entre ellas. Para estimar el efecto causal de X sobre Y, es necesario controlar C (incluirla como covariable en la regresión, realizar matching o estratificación). El no controlar un confusor produce sesgo de omisión de variable relevante.

4.2 Mediadores

Una variable M es un mediador de la relación X → Y si el efecto de X sobre Y opera a través de M (X → M → Y). Controlar un mediador bloquea el efecto causal que se pretende estimar (si se quiere el efecto total) o permite estimar efectos directos e indirectos (análisis de mediación). Incluir un mediador como covariable cuando el objetivo es estimar el efecto total es un error frecuente que produce estimaciones sesgadas.

4.3 Colisionadores

Una variable K es un colisionador si es causada simultáneamente por X y por Y (X → K ← Y). Controlar un colisionador —incluirlo en la regresión o condicionar en él mediante la selección de la muestra— crea asociación espuria entre X e Y que no existía en la población. El sesgo por colisionador es el origen de muchas asociaciones paradójicas en la literatura científica (e.g., la paradoja de Simpson, el sesgo de Berkson en estudios hospitalarios).

Advertencia metodológica: Los LLMs que asisten en el análisis estadístico pueden sugerir incluir variables de control sin verificar si son confusores, mediadores o colisionadores en el DAG del investigador. El doctorando debe especificar explícitamente el DAG antes de solicitar asistencia de IA para la estrategia de ajuste.

5. Criterio de puerta trasera y frontdoor

El criterio de puerta trasera (backdoor criterion; Pearl, 1993) establece las condiciones bajo las cuales un conjunto de variables de ajuste Z identifica el efecto causal de X sobre Y bloqueando todas las rutas de puerta trasera (caminos no dirigidos desde X a Y que pasan por variables que causan X) sin bloquear rutas causales directas ni abrir rutas de colisionador:

Z bloquea todas las rutas de puerta trasera entre X e Y.
Z no incluye ningún descendiente de X en el camino causal hacia Y.

Cuando no existe ningún conjunto de observables que satisfaga el criterio de puerta trasera (porque la variable de confusión no es observable), el criterio de puerta delantera (frontdoor criterion) puede identificar el efecto causal si existe un mediador M observable que capta todo el efecto de X sobre Y y no comparte causas no observadas con Y. El do-cálculo garantiza la completitud de estas reglas: si un efecto causal es identificable, el do-cálculo puede demostrarlo (Shpitser y Pearl, 2006).

La IA puede verificar automáticamente si un conjunto de variables de ajuste propuesto satisface el criterio de puerta trasera dado un DAG especificado en dagitty, evitando errores de razonamiento gráfico que serían difíciles de detectar manualmente en DAGs complejos. Esta capacidad complementa los análisis de triangulación metodológica al proporcionar una verificación formal de la estrategia de identificación.

6. Métodos de estimación causal con datos observacionales

Una vez identificado el efecto causal mediante los criterios del DAG, la estimación puede realizarse con varios métodos complementarios:

Método	Supuesto principal	Herramienta en R	Contexto de aplicación
Regresión ajustada	Backdoor criterion satisfecho	`lm()`, `glm()`	Confusión medible y lineal
Matching por puntuación de propensión	Ignorabilidad condicional	`MatchIt`	Comparación de grupos no equivalentes
Doble diferencia (DiD)	Tendencias paralelas pre-intervención	`did`	Datos de panel con intervención natural
Variables instrumentales (IV)	Instrumento relevante y exógeno	`AER::ivreg()`	Confusión no observable
Regresión discontinua (RD)	Continuidad en el umbral de asignación	`rdrobust`	Tratamientos asignados por umbral
G-computation / TMLE	Backdoor criterion + correcta especificación	`tmle`	Efectos causales promedio con confusión alta-dimensional

La IA puede asistir en la selección del método más apropiado dado el DAG, el diseño del estudio y los datos disponibles, y generar el código correspondiente. Sin embargo, la verificación de los supuestos de identificación —especialmente la validez del instrumento en IV o la continuidad en RD— requiere argumentación teórica y evidencia empírica que el investigador debe construir.

7. IA y herramientas para análisis causal en 2026

El ecosistema de herramientas de IA para inferencia causal ha madurado significativamente en 2025-2026:

dagitty.net: aplicación web que permite construir DAGs de forma visual, evaluar d-separación, identificar conjuntos de ajuste y generar las implicaciones testables del modelo. La integración con LLMs permite describir el DAG en lenguaje natural y obtener el modelo formalizado.
R + dagitty + ggdag: pipeline completo para análisis causal reproducible, desde la especificación del DAG hasta la visualización publicable.
DoWhy (Python/Microsoft): librería de inferencia causal que integra el marco de Pearl con estimación estadística, incluyendo análisis de sensibilidad automático para supuestos no testeables.
CausalPy: librería Python para inferencia causal bayesiana que combina DAGs con modelos probabilísticos en PyMC.
Tesify: plataforma de tutorización doctoral que asiste en la construcción y validación de DAGs para tesis, integrando el marco de Pearl con los estándares metodológicos de ANECA y el EHEA.

La integración de IA en el análisis causal también facilita la conexión con series temporales y modelos de ecuaciones estructurales, donde la identificación causal es igualmente crítica.

8. Integración con otros métodos estadísticos de la tesis

El análisis causal con DAGs no es un método aislado sino un marco que debe integrarse con la estrategia metodológica general de la tesis:

8.1 DAGs y modelos de ecuaciones estructurales

Los modelos de ecuaciones estructurales (SEM) pueden interpretarse como DAGs con restricciones de linealidad. La especificación de un SEM sin el DAG subyacente es una de las principales fuentes de modelos identificados estadísticamente pero no causalmente. El artículo sobre Modelado de Ecuaciones Estructurales con IA 2026 desarrolla esta integración en detalle.

8.2 DAGs y análisis multinivel

En diseños multinivel, los DAGs deben especificarse para cada nivel jerárquico, distinguiendo los mecanismos causales que operan dentro de los grupos de los que operan entre grupos. La confusión puede ocurrir en cualquier nivel, y el ajuste incorrecto puede producir el fenómeno conocido como ecological fallacy o su opuesto, el atomistic fallacy.

8.3 DAGs y análisis de mediación

El análisis de mediación con la perspectiva de efectos directos naturales (NDE) y efectos indirectos naturales (NIE) de Pearl (2001) resuelve los problemas del análisis de mediación tradicional de Baron y Kenny en presencia de confusión del mediador, interacción exposición-mediador y mediadores múltiples. La IA puede generar el código para este análisis con el paquete mediation o CMAverse en R.

9. Límites éticos y epistémicos del análisis causal

El análisis causal con DAGs introduce transparencia sobre los supuestos del análisis, pero no los elimina. Los principales límites que deben reconocerse en la tesis doctoral son:

Supuestos no testeables: la exogeneidad de los instrumentos en IV o la ausencia de confusores no medidos nunca pueden verificarse empíricamente con total certeza. El análisis de sensibilidad (e-values, intervalos de Rosenbaum) cuantifica cuánto sesgo no medido se necesitaría para nular los resultados.
Validez externa del DAG: el DAG representa el conocimiento del investigador sobre los mecanismos causales del fenómeno, no la realidad causal objetiva. Mecanismos causales ignorados por desconocimiento teórico no pueden identificarse ni controlarse.
Heterogeneidad del efecto causal: el Efecto Causal Promedio (ATE) puede enmascarar efectos heterogéneos que son más relevantes para las decisiones de política. El análisis de heterogeneidad causal (Efecto del Tratamiento en los Tratados, CATE) es un área activa de desarrollo metodológico en 2026.

El EU AI Act (2024/1689) y las directrices de la UNESCO (2023) exigen que los investigadores que emplean IA en el diseño y análisis de estudios con potenciales consecuencias para individuos o grupos declaren los supuestos causales adoptados y las limitaciones del análisis. Esta transparencia es un requisito ético que, más allá del cumplimiento regulatorio, fortalece la credibilidad científica de la tesis. El artículo sobre Marco Ético del Uso de IA en Tesis 2026 desarrolla estas consideraciones en su totalidad.

Preguntas frecuentes

¿Qué es un DAG y para qué sirve en una tesis doctoral?

Un DAG (grafo acíclico dirigido) es una representación visual de las hipótesis causales del investigador: qué variables causan a cuáles, de forma directa. En una tesis doctoral, el DAG sirve para: (1) hacer explícitas las suposiciones causales que de otro modo permanecerían implícitas; (2) identificar qué variables deben controlarse para estimar el efecto causal de interés; (3) detectar posibles colisionadores que no deben controlarse; y (4) generar implicaciones testables del modelo causal que pueden contrastarse con los datos.

¿La inferencia causal requiere datos experimentales?

No. El marco de Pearl y los métodos de inferencia causal con datos observacionales (matching, variables instrumentales, diferencias en diferencias, regresión discontinua) permiten estimar efectos causales a partir de datos no experimentales, siempre que los supuestos de identificación sean plausibles y se pueda argumentar que todas las rutas causales confundentes están controladas. Los experimentos aleatorizados siguen siendo el estándar de oro cuando son éticamente y logísticamente viables.

¿Cuál es la diferencia entre un confounder y un collider?

Un confusor es una variable que causa tanto la exposición como el resultado (X ← C → Y); controlarlo bloquea la asociación espuria y permite estimar el efecto causal. Un colisionador es una variable causada simultáneamente por la exposición y el resultado (X → K ← Y); controlarlo abre una ruta espuria y crea sesgo donde no existía. La confusión de ambos tipos de variable es uno de los errores metodológicos más frecuentes en tesis doctorales con datos observacionales.

¿Puede la IA construir el DAG por mí?

La IA puede sugerir estructuras causales plausibles basándose en la literatura existente y en la descripción del problema de investigación, pero el DAG debe reflejar el conocimiento teórico del investigador sobre el fenómeno, no solo patrones estadísticos en los datos. Construir un DAG a partir de datos (búsqueda causal automatizada) es posible algorítmicamente, pero el resultado es observacionalmente equivalente a múltiples DAGs alternativos que el investigador debe discriminar con teoría.

¿Cómo valido los supuestos de mi modelo causal?

Los supuestos testables del DAG (implicaciones de independencia condicional) pueden verificarse estadísticamente usando tests de independencia condicional en los datos. Los supuestos no testables (exogeneidad del instrumento, ausencia de confusión residual) requieren argumentación teórica y análisis de sensibilidad. La función impliedConditionalIndependencies() de dagitty extrae automáticamente todas las independencias condicionales implicadas por el DAG para su verificación empírica.

¿Cómo reporto el análisis causal con DAGs en formato APA 7?

El reporte debe incluir: (1) figura del DAG con descripción de cada nodo y arista; (2) justificación teórica de la estructura causal; (3) descripción del conjunto de ajuste utilizado y su justificación mediante el criterio de puerta trasera; (4) estimación del efecto causal con intervalo de confianza; (5) resultados del análisis de sensibilidad; y (6) discusión de las limitaciones relacionadas con supuestos no verificables. La APA 7 no tiene sección específica para DAGs, pero las normas de transparencia metodológica aplican.

¿El análisis de mediación tradicional de Baron y Kenny es válido en 2026?

El procedimiento de Baron y Kenny (1986) ha sido superado metodológicamente. Sus limitaciones principales son: no puede manejar la confusión del mediador, asume linealidad y ausencia de interacción exposición-mediador, y sus condiciones de mediación completa son demasiado restrictivas. En 2026, el estándar es el marco de efectos directos e indirectos naturales de Pearl (2001), implementado en R con los paquetes mediation o CMAverse, que manejan estas limitaciones explícitamente.

Referencias

American Psychological Association. (2020). Publication manual of the American Psychological Association (7.ª ed.). APA.
ANECA. (2025). Criterios de evaluación de tesis doctorales: inferencia causal y uso de IA en metodología cuantitativa. Agencia Nacional de Evaluación de la Calidad y Acreditación.
CRUE Universidades Españolas. (2024). Recomendaciones para el uso responsable de la IA en la investigación universitaria. CRUE.
European Parliament. (2024). Regulation (EU) 2024/1689 (Artificial Intelligence Act). Official Journal of the European Union.
Pearl, J. (1993). Comment: Graphical models, causality and intervention. Statistical Science, 8(3), 266–269. https://doi.org/10.1214/ss/1177010894
Pearl, J. (2000). Causality: Models, reasoning, and inference. Cambridge University Press.
Pearl, J. (2001). Direct and indirect effects. En Proceedings of the Seventeenth Conference on Uncertainty in Artificial Intelligence (pp. 411–420). Morgan Kaufmann.
Pearl, J., Glymour, M., y Jewell, N. P. (2016). Causal inference in statistics: A primer. Wiley.
Pearl, J., y Mackenzie, D. (2018). The book of why: The new science of cause and effect. Basic Books.
Shpitser, I., y Pearl, J. (2006). Identification of joint interventional distributions in recursive semi-Markovian causal models. En Proceedings of AAAI-2006 (pp. 1219–1226). AAAI Press.
Stanford HAI. (2025). AI Index Report 2025. Stanford University Human-Centered Artificial Intelligence.
Textor, J., van der Zander, B., Gilthorpe, M. K., Liskiewicz, M., y Ellison, G. T. (2016). Robust causal inference using directed acyclic graphs: The R package ‘dagitty’. International Journal of Epidemiology, 45(6), 1887–1894. https://doi.org/10.1093/ije/dyw341
UNESCO. (2023). Guidance for generative AI in education and research. United Nations Educational, Scientific and Cultural Organization.

¿Quieres incorporar inferencia causal a tu tesis doctoral?

Tesify te guía en la construcción de DAGs, la selección del método de identificación causal y la estimación de efectos causales con datos observacionales. Combina el rigor del marco de Pearl con los estándares académicos de ANECA y el EHEA para una tesis metodológicamente robusta en 2026.

Aprende inferencia causal con Tesify