,

IA y Ciencia Abierta en 2026: Open Access, Reproducibilidad y Repositorios

IA y Ciencia Abierta en 2026: Open Access, Reproducibilidad y Repositorios

La convergencia entre inteligencia artificial, ciencia abierta y open access en 2026 está reconfigurando profundamente la manera en que los investigadores producen, comparten y verifican el conocimiento científico. Para los doctorandos y profesores universitarios en España y Latinoamérica, esta intersección no es una cuestión abstracta: incide directamente sobre cómo deben depositar sus tesis, cómo deben documentar el uso de IA en sus investigaciones y qué repositorios institucionales o temáticos deben utilizar para cumplir con los mandatos de acceso abierto de sus universidades y agencias financiadoras.

Este artículo examina el estado de la ciencia abierta en 2026, los mandatos institucionales vigentes, el papel de la IA en la democratización y los riesgos del acceso al conocimiento, y las implicaciones prácticas para las tesis doctorales en el espacio iberoamericano.

Respuesta rápida: La ciencia abierta combina open access (publicación libre de los resultados), datos abiertos (FAIR), código abierto (scripts reproducibles) y revisión por pares abierta. La IA potencia cada uno de estos pilares pero también introduce nuevos retos para la reproducibilidad. En España, el mandato del Plan S y la Ley de la Ciencia obligan a publicar en abierto los resultados de proyectos financiados con fondos públicos. Las tesis doctorales deben depositarse en TESEO y en el repositorio institucional.

Los pilares de la ciencia abierta en 2026

La Recomendación de la UNESCO sobre Ciencia Abierta (UNESCO, 2021) —el primer instrumento normativo internacional sobre el tema— define la ciencia abierta como un constructo que engloba cuatro pilares fundamentales, todos ellos afectados significativamente por la IA en 2026:

Pilar Definición Impacto de la IA
Open Access Publicaciones científicas libremente accesibles LLMs entrenados en publicaciones OA; IA para identificar artículos abiertos
Open Data Datos de investigación accesibles en repositorios IA para curación, anonimización y documentación de datos
Open Software/Code Código de análisis reproducible y accesible Generación de código asistida por IA; reproducibilidad computacional
Open Peer Review Revisión por pares transparente e identificada IA para apoyo en revisión; detección de revisiones generadas por IA

Mandatos de open access en España y Europa

El marco normativo del open access en España y Europa en 2026 es el más exigente de la historia. Los doctorandos y sus directores deben conocer estos mandatos, pues afectan directamente a cómo deben publicar los artículos derivados de la tesis y dónde deben depositar la tesis misma:

Plan S y cOAlition S

El Plan S, impulsado por un consorcio de agencias financiadoras europeas (incluyendo el Consejo Europeo de Investigación, ERC), exige que todas las publicaciones derivadas de proyectos financiados estén disponibles en acceso abierto inmediato desde la fecha de publicación. España, a través de la AEI (Agencia Estatal de Investigación), es signataria del Plan S. Esto afecta a todos los doctorandos con contratos FPI, FPU o proyectos I+D financiados por la AEI.

Ley de la Ciencia española (2022)

La Ley 17/2022 de la Ciencia, la Tecnología y la Innovación establece el mandato de acceso abierto para publicaciones resultantes de investigación financiada total o parcialmente con fondos públicos españoles, con un período máximo de embargo de 12 meses para artículos y 6 meses para datos de investigación.

Tesis doctorales: TESEO y repositorios institucionales

Todas las tesis doctorales defendidas en universidades españolas deben depositarse obligatoriamente en la base de datos TESEO (Ministerio de Universidades) y en el repositorio institucional de la universidad correspondiente. Este depósito contribuye al ecosistema de ciencia abierta y permite que otros investigadores (y herramientas de IA) accedan al conocimiento generado.

IA como democratizadora del acceso al conocimiento

Uno de los argumentos más potentes a favor de la IA en el ecosistema de ciencia abierta es su potencial democratizador. Los modelos de lenguaje entrenados con publicaciones en acceso abierto pueden actuar como mediadores que hacen accesible el conocimiento científico a investigadores de países con menos recursos para suscripciones académicas (Suber, 2012).

En el contexto iberoamericano, esta dimensión es especialmente relevante: universidades de México, Colombia, Argentina o Perú con presupuestos bibliotecarios limitados pueden acceder al conocimiento científico internacional a través de herramientas de IA que sintetizan y explican publicaciones difícilmente accesibles de otra manera. Esto conecta directamente con los principios de equidad y apertura de la UNESCO y con el rol de repositorios como Redalyc, Scielo y CLACSO en la democratización del conocimiento iberoamericano.

Para una perspectiva más amplia sobre el uso de IA en investigación académica en España, véase nuestro estado del arte sobre IA generativa en investigación académica española.

IA y reproducibilidad: oportunidades y riesgos

La crisis de reproducibilidad en ciencia —documentada extensamente desde 2015 (Open Science Collaboration, 2015)— ha encontrado en la IA tanto aliada como adversaria:

IA como facilitadora de la reproducibilidad

  • Generación de código reproducible: los LLMs pueden generar scripts de análisis bien documentados en R, Python o Julia, reduciendo la brecha entre «los resultados que se reportan» y «el código que los produce».
  • Comprobación de consistencia estadística: herramientas como statcheck o GRIM test verifican automáticamente la coherencia interna de los resultados reportados.
  • Documentación automatizada: los cuadernos computacionales (R Markdown, Jupyter) con apoyo de IA permiten crear documentos completamente reproducibles donde el texto, el código y los resultados coexisten.
  • Detección de errores de trascripción: IA para identificar discrepancias entre tablas, figuras y texto.

IA como amenaza para la reproducibilidad

  • Alucinaciones estadísticas: los LLMs pueden generar valores estadísticos plausibles pero incorrectos si se les pide directamente que «inventen» resultados.
  • No determinismo: los outputs de la IA generativa no son reproducibles en sentido estricto —el mismo prompt puede generar respuestas diferentes en momentos distintos.
  • Caja negra metodológica: si el investigador no documenta detalladamente cómo usó la IA, otros investigadores no pueden replicar el proceso.

Nuestra guía completa sobre reproducibilidad científica e IA generativa en metodología profundiza en estas dimensiones con protocolos específicos de documentación.

Datos FAIR y IA: gestión de datos en tesis doctorales

Los principios FAIR (Findable, Accessible, Interoperable, Reusable) —formulados por Wilkinson et al. (2016) y adoptados por la Comisión Europea como estándar para la gestión de datos de investigación— representan el marco de referencia para la apertura de datos en 2026. La IA puede asistir en la implementación de estos principios:

  • Findable (Localizable): la IA puede generar metadatos estructurados y descriptivos para conjuntos de datos, mejorando su indexación en repositorios como Zenodo o DIGITAL.CSIC.
  • Accessible (Accesible): los sistemas de IA pueden gestionar solicitudes de acceso condicionado a datos sensibles, implementando flujos de aprobación automatizados.
  • Interoperable: la IA facilita la conversión entre formatos de datos y la creación de ontologías de metadatos estandarizados.
  • Reusable (Reutilizable): los modelos de lenguaje pueden generar planes de gestión de datos (DMP, Data Management Plan) exigidos por Horizon Europe y la AEI para todos los proyectos financiados.
Obligación para doctorandos: Desde 2023, muchos programas de doctorado europeos exigen un Plan de Gestión de Datos (DMP) como parte de la documentación de la tesis. La IA puede asistir en su redacción, pero el investigador es responsable de su contenido y del cumplimiento real de los compromisos de apertura.

Repositorios en España: TESEO, e-Ciencia, Zenodo, OSF

El ecosistema de repositorios disponibles para doctorandos españoles en 2026 incluye opciones institucionales, nacionales e internacionales:

Repositorios institucionales y nacionales

  • TESEO: base de datos nacional del Ministerio de Universidades para depósito obligatorio de tesis doctorales en España. Desde 2022 incluye depósito de datos adjuntos.
  • e-Ciencia (MADROÑO): repositorio colaborativo de las universidades madrileñas; ejemplar del modelo de repositorios regionales.
  • REBIUN: red de bibliotecas universitarias españolas con acceso a repositorios institucionales de todas las universidades.
  • DIGITAL.CSIC: repositorio del Consejo Superior de Investigaciones Científicas, con más de 100.000 documentos en acceso abierto.

Repositorios internacionales

  • Zenodo: repositorio generalista del CERN con integración nativa con GitHub; acepta código, datos, publicaciones y cualquier tipo de resultado de investigación.
  • OSF (Open Science Framework): plataforma de la Center for Open Science, especialmente utilizada en psicología y ciencias sociales para prerregistro y depósito de datos y materiales.
  • figshare: repositorio multidisciplinar con integración con muchas revistas académicas.
  • Dryad: especializado en datos de ciencias de la vida y medioambientales.

Herramientas como Tesify pueden asistir al investigador en la preparación de los metadatos y la documentación necesaria para el depósito en estos repositorios, alineando el proceso con los requisitos de ANECA y los mandatos de acceso abierto. Consulte también los usos permitidos de IA en el contexto universitario 2026 para una comprensión completa del marco institucional.

Cómo orientar tu tesis doctoral hacia la ciencia abierta

Una tesis doctoral orientada a la ciencia abierta en 2026 debe contemplar los siguientes elementos desde el diseño inicial:

  1. Prerregistro del protocolo: para investigaciones experimentales o revisiones sistemáticas, el prerregistro en OSF o PROSPERO antes de la recogida de datos aumenta la credibilidad y es valorado positivamente por ANECA.
  2. Plan de Gestión de Datos (DMP): elaborado al inicio del proyecto con apoyo de la biblioteca universitaria y, en su caso, herramientas de IA.
  3. Análisis reproducible: utilizar R Markdown, Jupyter Notebooks o Quarto para integrar código y texto en documentos completamente reproducibles.
  4. Depósito de datos y materiales: depositar datasets, materiales de investigación (cuestionarios, guías de entrevista, protocolos) en Zenodo u OSF con licencias abiertas apropiadas.
  5. Publicación en abierto: planificar la publicación de artículos derivados de la tesis en revistas OA o mediante depósito en repositorios (ruta verde).
  6. Declaración de IA: incluir en la sección metodológica una declaración completa del uso de IA en el proceso de investigación, conforme a los estándares del marco ético para el uso de IA en tesis doctorales.

Posición de UNESCO, CRUE y OECD

Las tres organizaciones de referencia en el ámbito de la ciencia abierta mantienen posiciones coherentes y complementarias sobre la intersección entre IA y apertura del conocimiento:

UNESCO afirma que la ciencia abierta «aumenta la transparencia, fomenta la cooperación, la participación, la responsabilidad, la reutilización y la reproducibilidad de los resultados, al tiempo que garantiza que la producción de dicho conocimiento sea inclusiva, equitativa y sostenible» (UNESCO, 2021). En cuanto a la IA, UNESCO adoptó en 2021 su Recomendación sobre Ética de la IA, que incluye explícitamente la apertura de datos y algoritmos como principio ético.

CRUE —a través de su comisión de TIC y su grupo de trabajo sobre ciencia abierta— ha publicado directrices para la implementación de mandatos de acceso abierto en las universidades españolas y ha adoptado una posición favorable al uso de IA siempre que respete los principios de transparencia y apertura (CRUE, 2023).

OECD incluye en sus principios de IA (OECD.AI) el principio de transparencia y explicabilidad, que conecta directamente con los valores de la ciencia abierta: los sistemas de IA utilizados en investigación deben ser suficientemente transparentes para permitir la reproducción y verificación de los resultados (OECD, 2023).

Para profundizar en las implicaciones éticas de estas posiciones institucionales en el contexto de las tesis doctorales, véase nuestro análisis del marco ético para el uso de IA en tesis doctorales. La transparencia metodológica exigida por la ciencia abierta conecta asimismo con las cuestiones de reproducibilidad abordadas en reproducibilidad científica e IA generativa.

Preguntas frecuentes sobre IA, ciencia abierta y tesis doctorales

¿Tengo obligación de publicar mi tesis en open access?

Sí, si estudias en una universidad española. El artículo 14 del RD 99/2011 establece la obligación de publicar la tesis en el repositorio de la universidad y en TESEO. La Ley de la Ciencia de 2022 refuerza este mandato. Existen excepciones para tesis con datos confidenciales o patentes pendientes, pero deben solicitarse formalmente a la comisión académica del programa de doctorado.

¿Qué es el Plan de Gestión de Datos y debo elaborarlo para mi tesis?

El Plan de Gestión de Datos (DMP) es un documento que describe qué datos generará la investigación, cómo serán recogidos y procesados, dónde serán almacenados, con qué licencias serán compartidos y durante cuánto tiempo serán conservados. Es obligatorio para proyectos financiados por Horizon Europe y por la AEI desde 2023. Muchos programas de doctorado lo exigen como parte de la documentación de seguimiento. La IA puede asistir en su redacción usando plantillas estándar como DMP Online o DMPTool.

¿Los modelos de IA entrenados con publicaciones científicas respetan el copyright?

Esta es una cuestión legal activamente disputada en 2026. Varias editoriales académicas (Elsevier, Springer, Wiley) han interpuesto demandas contra empresas de IA por el entrenamiento con corpus de publicaciones con copyright. La Directiva Europea de Derechos de Autor (2019/790) incluye una excepción de minería de textos y datos para investigación académica en instituciones no comerciales, pero la aplicación al entrenamiento de LLMs sigue siendo objeto de controversia jurídica. Este aspecto está relacionado con las cuestiones legales analizadas en detalle en el marco jurídico del uso de IA en TFGs en España.

¿Zenodo y OSF son adecuados para depositar datos de tesis con información personal?

No directamente. Los datos que contienen información personal identificable deben ser anonimizados o pseudoanonimizados antes de su depósito en repositorios abiertos, conforme al RGPD. Zenodo y OSF permiten establecer restricciones de acceso (acceso bajo demanda con aprobación del autor) para datos sensibles no completamente anonimizados. En investigación con datos de salud, datos de menores o grupos vulnerables, consulte al delegado de protección de datos de su universidad antes de cualquier depósito.

¿Cómo afecta la IA a la revisión por pares en las revistas científicas?

La IA está transformando la revisión por pares de múltiples maneras: asistencia a revisores en la detección de errores estadísticos, identificación de inconsistencias internas, verificación de reproduciblidad y generación de informes de revisión preliminares. Sin embargo, la mayoría de revistas científicas prohíben explícitamente el uso de IA como revisor principal, dado que los modelos carecen de responsabilidad científica y confidencialidad real. El sistema de revisión por pares abierto (open peer review), donde los informes son públicos, facilita la detección de revisiones generadas por IA.

¿Qué diferencia hay entre la ruta verde y la ruta dorada de acceso abierto?

La ruta dorada (gold OA) implica publicar directamente en una revista de acceso abierto, frecuentemente con el pago de APCs (Article Processing Charges). La ruta verde (green OA) implica publicar en cualquier revista y depositar simultáneamente una versión del manuscrito (preprint o postprint del autor) en un repositorio institucional o temático. Para doctorandos sin financiación para APCs, la ruta verde es la vía habitual de cumplimiento del mandato de acceso abierto. En España, las universidades y la FECYT negocian acuerdos transformativos con las principales editoriales que incluyen APCs gratuitos para autores de afiliación española.

Referencias bibliográficas

  • CRUE. (2023). Ciencia abierta en las universidades españolas: guía para la implementación. Conferencia de Rectores de las Universidades Españolas.
  • Comisión Europea. (2024). Reglamento de Inteligencia Artificial (AI Act) 2024/1689. Diario Oficial de la Unión Europea.
  • OECD. (2023). OECD principles on AI. OECD Publishing. https://oecd.ai/en/ai-principles
  • Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), aac4716. https://doi.org/10.1126/science.aac4716
  • Suber, P. (2012). Open access. MIT Press. https://doi.org/10.7551/mitpress/9286.001.0001
  • UNESCO. (2021). Recomendación de la UNESCO sobre la ciencia abierta. UNESCO. https://unesdoc.unesco.org/ark:/48223/pf0000379949_spa
  • Wilkinson, M. D., Dumontier, M., Aalbersberg, I. J., y otros. (2016). The FAIR guiding principles for scientific data management and stewardship. Scientific Data, 3, 160018. https://doi.org/10.1038/sdata.2016.18
  • Wilsdon, J., y otros. (2015). The metric tide: Report of the Independent Review of the Role of Metrics in Research Assessment and Management. Higher Education Funding Council for England.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *