,

Bibliometría con IA en Tesis: Mapeo de Citas Académicas 2026

Bibliometría con IA en Tesis: Mapeo de Citas Académicas 2026

La bibliometría asistida por IA para el mapeo de citas en tesis ha pasado de ser una técnica reservada a investigadores cuantitativos especializados a convertirse en una herramienta metodológica accesible para cualquier doctorando en 2026. La combinación de software de visualización bibliométrica (VOSviewer, CiteSpace, Bibliometrix/Biblioshiny) con modelos de lenguaje para interpretación y síntesis permite construir revisiones de literatura estructuradas, identificar autores y revistas de referencia, y delimitar la frontera del conocimiento en cualquier campo disciplinar con un nivel de rigor antes impensable para trabajos individuales.

Este artículo proporciona una guía metodológica completa sobre el uso de IA en análisis bibliométrico para tesis doctorales: desde la recolección de datos en bases bibliográficas hasta la interpretación de redes de cocitación y coocurrencia de palabras clave, con indicaciones sobre declaración de uso y citación en formato APA 7.

Respuesta rápida: La bibliometría con IA combina bases de datos como Web of Science, Scopus o Dimensions con software de visualización (VOSviewer, CiteSpace) y LLMs para interpretar redes de citas. Permite identificar las líneas de investigación dominantes, los autores más influyentes y las brechas del conocimiento en un campo. Es metodológicamente válida como complemento de la revisión narrativa, siempre que se declare explícitamente en la sección de método.

Qué es la bibliometría y por qué es relevante para tu tesis

La bibliometría es el conjunto de métodos cuantitativos para analizar la literatura científica mediante el estudio de publicaciones, citas, autores, instituciones y revistas (Pritchard, 1969). En el contexto de una tesis doctoral, su utilidad es múltiple:

  • Delimitación del campo: identificar el corpus central de publicaciones en un área de conocimiento.
  • Mapeo evolutivo: rastrear cómo han evolucionado los temas de investigación a lo largo del tiempo.
  • Identificación de brechas: detectar áreas temáticas con escasa cobertura investigadora.
  • Selección de revistas diana: identificar las publicaciones más relevantes para la futura publicación de la tesis.
  • Legitimación metodológica: las revisiones bibliométricas son reconocidas por ANECA como metodología válida y publicable.

Según datos de la OECD (2023), el volumen de producción científica mundial supera los 3 millones de artículos anuales. Ningún investigador puede gestionar manualmente un corpus de esa magnitud; la IA y el software bibliométrico se han convertido en mediadores necesarios para cualquier revisión de literatura rigurosa.

Tipos de análisis bibliométrico: rendimiento, redes y mapas

Los métodos bibliométricos se dividen en tres grandes categorías, cada una con aplicaciones específicas en el contexto de una tesis doctoral:

1. Análisis de rendimiento (Performance Analysis)

Evalúa la contribución de actores (autores, instituciones, países, revistas) a la producción científica mediante indicadores como el h-index, número de publicaciones, Factor de Impacto (JIF) y Cite Score. Para una tesis, permite identificar los autores más citados del campo, las instituciones líderes en la temática y las revistas con mayor influencia.

2. Mapeo científico (Science Mapping)

Construye representaciones visuales de las relaciones estructurales entre elementos de la literatura científica. Las principales técnicas son:

  • Análisis de cocitación: agrupa autores o documentos que son citados conjuntamente con frecuencia, revelando escuelas de pensamiento.
  • Acoplamiento bibliográfico: identifica documentos que comparten referencias, señalando trabajos con enfoques similares.
  • Coocurrencia de palabras clave: mapea las relaciones temáticas entre conceptos, mostrando clústeres de investigación.
  • Coautoría: visualiza redes de colaboración científica.

3. Análisis evolutivo (Longitudinal Analysis)

Examina cómo han evolucionado temas, metodologías y enfoques a lo largo del tiempo mediante mapas de períodos sucesivos o análisis de tendencias temporales.

Fuentes de datos bibliográficos: WoS, Scopus, Dimensions, OpenAlex

La calidad del análisis bibliométrico depende fundamentalmente de la fuente de datos utilizada. Las principales opciones disponibles para doctorandos españoles en 2026 son:

Base de datos Cobertura Acceso Exportación
Web of Science (WoS) Alta, sesgada a inglés y STEM Pago (FECYT para universidades ES) BibTeX, RIS, texto plano
Scopus Más amplia que WoS, incluye más CS y SS Pago (universidades) CSV, BibTeX, RIS
Dimensions 180M+ publicaciones, datos abiertos Gratuito (básico) CSV, API
OpenAlex 250M+ obras, completamente abierto Gratuito, API abierta JSON, CSV
Dialnet / Redalyc / Scielo Literatura iberoamericana Gratuito RIS, BibTeX
Recomendación para tesis en español: Combine WoS o Scopus (para literatura internacional) con Dialnet, Redalyc o Scielo (para literatura iberoamericana) a fin de contrarrestar el sesgo de representación lingüística. Un análisis bibliométrico basado exclusivamente en WoS en un campo como educación, trabajo social o derecho producirá una imagen distorsionada del conocimiento disponible en español.

VOSviewer y CiteSpace: guía de uso para doctorandos

VOSviewer (vosviewer.com) es la herramienta de mapeo científico más utilizada en 2026, seguida de CiteSpace y Bibliometrix/Biblioshiny (van Eck y Waltman, 2010). Su uso en tesis doctorales sigue estos pasos:

Proceso paso a paso con VOSviewer

  1. Exportar el corpus: desde WoS o Scopus, exporte los registros seleccionados en formato de texto plano o RIS (máximo 10.000 registros para VOSviewer).
  2. Importar en VOSviewer: seleccione «Create a map based on bibliographic data» y elija el archivo exportado.
  3. Seleccionar tipo de análisis: coocurrencia de palabras clave, cocitación de autores, acoplamiento de documentos.
  4. Configurar umbrales: establezca el número mínimo de ocurrencias para filtrar ruido (típicamente 5-10 para campos con 500+ documentos).
  5. Generar y explorar el mapa: identifique clústeres, nodos centrales y conexiones periféricas.
  6. Interpretar con IA: describa el mapa a un LLM y solicite interpretación de los clústeres temáticos identificados.

Interpretación asistida por IA

Una vez generado el mapa bibliométrico, los modelos de lenguaje pueden asistir significativamente en la interpretación. Un prompt efectivo para esta tarea sería:

«He realizado un análisis bibliométrico de coocurrencia de palabras clave sobre [tema]. Los principales clústeres identificados son: Clúster 1 (color rojo): [palabras clave]. Clúster 2 (color verde): [palabras clave]. Clúster 3 (color azul): [palabras clave]. ¿Puedes ayudarme a interpretar qué líneas de investigación representan estos clústeres y cuáles son las brechas temáticas más evidentes?»

Esta combinación de análisis cuantitativo (VOSviewer) e interpretación cualitativa asistida (IA) constituye una metodología mixta bibliométrica que ANECA y los comités doctorales europeos reconocen como metodológicamente rigurosa cuando se declara adecuadamente.

IA para interpretación y síntesis de redes bibliométricas

Más allá de la interpretación de mapas, los LLMs ofrecen capacidades adicionales para el análisis bibliométrico en tesis:

  • Síntesis de abstracts a gran escala: herramientas como Elicit, Consensus o Research Rabbit pueden sintetizar cientos de abstracts para identificar consensos, debates y gaps.
  • Clasificación temática automatizada: clasificar artículos en categorías predefinidas o emergentes usando embeddings semánticos.
  • Detección de tendencias emergentes: identificar términos y conceptos con crecimiento acelerado en publicaciones recientes.
  • Generación del texto de la revisión bibliométrica: redactar el apartado metodológico y los resultados del análisis bibliométrico con apoyo de LLMs, bajo supervisión del investigador.

Para una perspectiva más amplia sobre el estado del arte de la IA en investigación académica española, véase nuestro artículo sobre IA generativa en investigación académica en España: estado del arte 2026. El correcto aprovechamiento de estas herramientas también requiere gestionar los sesgos de representación discutidos en detalle en nuestro análisis de sesgos en IA generativa e implicaciones para tesis.

Workflow completo: de la base de datos al mapa de conocimiento

El flujo de trabajo completo para una revisión bibliométrica asistida por IA en una tesis doctoral puede estructurarse en cinco fases:

  1. Diseño de la búsqueda: definir ecuaciones de búsqueda con operadores booleanos en WoS/Scopus; usar la IA para sugerir sinónimos y términos relacionados en inglés y español.
  2. Recolección y limpieza de datos: exportar, eliminar duplicados y filtrar por criterios de inclusión/exclusión con apoyo de R (paquete bibliometrix) o Zotero con plugins de IA.
  3. Análisis de rendimiento: calcular indicadores de producción con Biblioshiny (interfaz gráfica de Bibliometrix) o VOSviewer.
  4. Mapeo científico: generar mapas de coocurrencia, cocitación o acoplamiento con VOSviewer o CiteSpace.
  5. Interpretación y síntesis: interpretar clústeres con apoyo de LLMs y redactar la revisión de literatura estructurada por líneas temáticas.

Herramientas como Tesify pueden asistir en las fases de síntesis e interpretación, ayudando al investigador a estructurar el texto de la revisión bibliométrica con el rigor metodológico requerido por ANECA.

Limitaciones y sesgos del análisis bibliométrico

El análisis bibliométrico tiene limitaciones metodológicas que deben declararse explícitamente en la tesis:

  • Sesgo de bases de datos: WoS y Scopus sobrerepresentan revistas anglófonas y de alto impacto; subestiman literatura gris, libros, informes técnicos y producción iberoamericana.
  • Sesgo de autocita: algunos autores e instituciones inflan artificialmente sus indicadores bibliométricos.
  • Limitaciones del mapeo temático: los algoritmos de clustering bibliométrico producen categorías basadas en co-ocurrencia estadística, no en coherencia conceptual; la interpretación requiere siempre criterio experto.
  • Sesgos de la IA en la interpretación: los LLMs pueden imponer marcos teóricos convencionales al interpretar los clústeres; véase nuestro análisis sobre los sesgos metodológicos de la IA generativa.
  • Obsolescencia de datos: el análisis bibliométrico refleja el estado de la literatura hasta la fecha de exportación de los datos; no captura publicaciones muy recientes.

Para estudiar la intersección entre reproducibilidad y métodos bibliométricos, véase también reproducibilidad científica e IA generativa.

Declaración metodológica y APA 7

La sección de método de una tesis que incorpora análisis bibliométrico debe incluir los siguientes elementos:

  1. Fuentes de datos: nombre de las bases de datos, fecha de consulta, ecuación de búsqueda completa.
  2. Criterios de selección: filtros aplicados (idioma, periodo, tipo de documento, área temática).
  3. Software utilizado: VOSviewer (con versión), CiteSpace, Bibliometrix (con versión de R), y cualquier LLM utilizado para interpretación.
  4. Limitaciones reconocidas: sesgos de las bases de datos consultadas y de los algoritmos de mapeo.

Ejemplo de cita APA 7 para VOSviewer:

van Eck, N. J., y Waltman, L. (2010). Software survey: VOSviewer, a computer program for bibliometric mapping. Scientometrics, 84(2), 523–538. https://doi.org/10.1007/s11192-009-0146-3

Para el formato de citación de herramientas de IA utilizadas en la interpretación, consulte la guía completa sobre cómo citar IA en APA 7.

Preguntas frecuentes sobre bibliometría e IA en tesis

¿Es la revisión bibliométrica equivalente a una revisión sistemática?

No son equivalentes, pero son complementarias. La revisión sistemática sigue protocolos PRISMA y evalúa la calidad de cada estudio incluido; la revisión bibliométrica analiza cuantitativamente el campo mediante indicadores de producción y redes de citas sin necesariamente evaluar la calidad individual de los estudios. Muchas tesis doctorales combinan ambas metodologías: bibliometría para cartografiar el campo y revisión sistemática para responder preguntas específicas de investigación.

¿Cuántos artículos necesito para un análisis bibliométrico válido?

No existe un número mínimo establecido universalmente, pero la práctica habitual en publicaciones Q1 oscila entre 200 y 5.000 documentos dependiendo de la madurez del campo. Para campos emergentes o interdisciplinares, corpus de 100-500 documentos son metodológicamente aceptables si se documenta exhaustivamente el proceso de búsqueda. Corpus muy pequeños (menos de 100 documentos) limitan la potencia de los análisis de red.

¿Puedo hacer bibliometría si mi institución no tiene acceso a WoS o Scopus?

Sí. OpenAlex (completamente gratuito y abierto) tiene cobertura comparable a Scopus y permite exportar grandes volúmenes de datos vía API. Dimensions ofrece funcionalidades básicas gratuitas. Además, en España la FECYT proporciona acceso a WoS a través de las universidades. Para campos con producción significativa en español, Redalyc y Scielo son alternativas valiosas aunque con herramientas bibliométricas más limitadas.

¿Cómo interpreto los clústeres de VOSviewer para mi tesis?

Los clústeres en VOSviewer representan grupos de términos, autores o documentos que co-ocurren con frecuencia. Para interpretarlos: (1) examine las palabras clave dominantes en cada clúster para identificar el tema central; (2) lea los artículos más citados de cada clúster; (3) asigne un nombre descriptivo a cada clúster basado en su contenido temático; (4) puede usar un LLM como asistente de interpretación si le describe los clústeres con detalle. Los clústeres periféricos o con pocas conexiones suelen señalar brechas o áreas emergentes.

¿El análisis bibliométrico puede reemplazar la lectura de los artículos?

No. El análisis bibliométrico cartografía el campo pero no reemplaza la lectura crítica de la literatura relevante. Su función es ayudar al investigador a priorizar qué artículos leer, identificar los trabajos más influyentes y estructurar la revisión; pero la comprensión profunda del contenido, los argumentos y las metodologías requiere lectura directa. ANECA espera que el doctorando demuestre conocimiento sustantivo de la literatura, no solo datos bibliométricos.

¿Qué herramienta de IA es mejor para asistir en bibliometría?

Depende de la tarea específica. Para síntesis de abstracts: Elicit o Consensus. Para interpretación de mapas y redacción de la revisión: ChatGPT-4o o Claude 3.5 Sonnet. Para análisis de datos bibliográficos programáticamente: Python con la librería OpenAlex junto a ChatGPT con intérprete de código. Para la integración completa del proceso de revisión de literatura en tesis, plataformas académicas especializadas como Tesify ofrecen workflows adaptados al contexto de investigación en español.

Referencias bibliográficas

  • Aria, M., y Cuccurullo, C. (2017). bibliometrix: An R-tool for comprehensive science mapping analysis. Journal of Informetrics, 11(4), 959–975. https://doi.org/10.1016/j.joi.2017.08.007
  • Chen, C. (2006). CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of the American Society for Information Science and Technology, 57(3), 359–377.
  • Donthu, N., Kumar, S., Mukherjee, D., Pandey, N., y Lim, W. M. (2021). How to conduct a bibliometric analysis: An overview and guidelines. Journal of Business Research, 133, 285–296.
  • OECD. (2023). OECD science, technology and innovation outlook 2023. OECD Publishing.
  • Priem, J., Piwowar, H., y Orr, R. (2022). OpenAlex: A fully-open index of the world’s research works. arXiv, 2205.01833.
  • Pritchard, A. (1969). Statistical bibliography or bibliometrics? Journal of Documentation, 25(4), 348–349.
  • van Eck, N. J., y Waltman, L. (2010). Software survey: VOSviewer, a computer program for bibliometric mapping. Scientometrics, 84(2), 523–538. https://doi.org/10.1007/s11192-009-0146-3
  • Zupic, I., y Cater, T. (2015). Bibliometric methods in management and organization. Organizational Research Methods, 18(3), 429–472.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *