Análisis Bibliométrico para TFG con Bibliometrix y R: Tutorial Completo 2026
El análisis bibliométrico para TFG ha pasado de ser una metodología reservada a investigadores senior a convertirse en una opción viable —y cada vez más valorada— para estudiantes de grado y máster. Con el paquete Bibliometrix en R, desarrollado por Massimo Aria y Corrado Cuccurullo (Universidad Federico II de Nápoles), es posible construir mapas de co-citación, analizar redes de coautoría y trazar la evolución temática de un campo de investigación a partir de bases de datos como Scopus o Web of Science. El resultado: una revisión bibliográfica que va mucho más allá de un listado comentado de artículos.
Este tutorial recorre el flujo completo de trabajo: desde la descarga de datos en Scopus hasta la generación de visualizaciones publicables en tu TFG. Incluye código R listo para copiar y ejecutar, con un dataset de ejemplo de 250 artículos sobre inteligencia artificial en educación superior (2015-2024).
convert2df() → análisis descriptivo con biblioAnalysis() → mapa de co-citación con biblioNetwork() → visualización con networkPlot(). Tiempo estimado para un corpus de 200-300 artículos: 2-4 horas.
Qué es Bibliometrix y por qué usarlo en tu TFG
Bibliometrix es un paquete de R de código abierto publicado originalmente en el Journal of Informetrics (Aria & Cuccurullo, 2017) y mantenido activamente en CRAN y GitHub. A diferencia de herramientas de mapeo como VOSviewer (que solo visualiza redes ya construidas), Bibliometrix realiza todo el ciclo analítico desde la importación de datos bibliográficos hasta la generación de redes y análisis de tendencias temporales.
Su aplicación en TFG es especialmente relevante en disciplinas donde existe un volumen considerable de literatura científica indexada: Psicología, Educación, Administración de Empresas, Ciencias de la Salud, Comunicación y Economía. La bibliometría no reemplaza la lectura crítica de los artículos, pero permite identificar de forma sistemática qué autores, revistas y palabras clave estructuran el campo que estudias, algo que es difícil de detectar leyendo artículos uno a uno.
En TFG de revisión bibliográfica, la combinación de análisis bibliométrico + análisis crítico cualitativo de los artículos más citados es un diseño metodológico reconocido en la literatura especializada y valorado por tribunales universitarios. Puedes relacionar este enfoque con la metodología de revisión bibliográfica sistemática para un diseño más robusto.
Instalación de R, RStudio y Bibliometrix
Necesitas tener instalados R (versión 4.3 o superior) y RStudio. Ambos son gratuitos:
- R: https://cran.r-project.org/
- RStudio Desktop: disponible en posit.co
Una vez en RStudio, instala y carga Bibliometrix:
# Instalar Bibliometrix (solo la primera vez)
install.packages("bibliometrix")
# Cargar el paquete
library(bibliometrix)
# Verificar versión instalada
packageVersion("bibliometrix")
En mayo de 2026, la versión estable de Bibliometrix en CRAN es la 4.x. Puedes instalar la versión de desarrollo desde GitHub para acceder a funciones experimentales, aunque para un TFG la versión de CRAN es suficiente y más estable.
Cómo obtener y exportar datos de Scopus y Web of Science
La calidad del análisis bibliométrico depende directamente de la estrategia de búsqueda. Antes de exportar datos, define con precisión:
- Términos de búsqueda: usa operadores booleanos (AND, OR, NOT) y truncamiento (*).
- Campos de búsqueda: título, abstract y palabras clave (TITLE-ABS-KEY en Scopus).
- Ventana temporal: delimita el período de análisis (por ejemplo, 2015-2025).
- Tipos de documento: artículos de revista, revisiones; excluye editoriales y notas.
Exportar desde Scopus
- Realiza tu búsqueda y aplica los filtros necesarios.
- Selecciona todos los resultados (botón “Select all”).
- Haz clic en “Export” → elige “BibTeX” como formato.
- En “Information to export” selecciona: Citation information, Bibliographical information, Abstract & keywords, Funding details, Other information.
- Guarda el archivo .bib en tu carpeta de proyecto.
Exportar desde Web of Science
- Realiza la búsqueda y aplica filtros.
- Selecciona todos los registros (máx. 1.000 por exportación; exporta en bloques si son más).
- Haz clic en “Export” → “Plain Text File”.
- Selecciona “Full Record and Cited References” para incluir las referencias de cada artículo (necesario para el análisis de co-citación).
- Guarda el archivo .txt en tu carpeta de proyecto.
Nota importante: para el análisis de co-citación necesitas las referencias de cada artículo, lo que solo incluye Web of Science en la exportación completa (“Full Record and Cited References”). Scopus también permite exportarlo pero en algunos planes institucionales está restringido. Consulta con la biblioteca de tu universidad si tienes acceso completo.
Importar los datos a R con convert2df()
# Importar desde Scopus (BibTeX) M_scopus <- convert2df( file = "scopus_export.bib", dbsource = "scopus", format = "bibtex" ) # Importar desde Web of Science (Plain Text) M_wos <- convert2df( file = "wos_export.txt", dbsource = "wos", format = "plaintext" ) # Ver dimensiones del dataframe dim(M_scopus) head(M_scopus[, 1:5])
La función convert2df() transforma el archivo exportado en un dataframe de R con columnas estandarizadas: AU (autores), TI (título), SO (revista), AB (abstract), TC (total de citas), DE (palabras clave del autor), ID (palabras clave de la base de datos), CR (referencias citadas), entre otras. Este dataframe es el objeto de trabajo para todos los análisis posteriores.
Análisis descriptivo: producción, autores e impacto
# Análisis bibliométrico completo resultados <- biblioAnalysis(M_scopus, sep = ";") # Resumen con las métricas principales summary(resultados, k = 10, pause = FALSE) # Visualizar los resultados principales plot(x = resultados, k = 10, pause = FALSE)
La función summary() genera automáticamente:
- Producción anual: número de artículos por año y tasa de crecimiento.
- Top 10 autores más productivos: con número de artículos y citas.
- Top 10 revistas: por número de artículos publicados sobre el tema.
- Top 10 países: por afiliación de los autores.
- Top 10 artículos más citados: con DOI y número de citas.
- Índice H del corpus: medida de impacto del conjunto de artículos analizados.
Para el TFG, la tabla de “Top 10 artículos más citados” es especialmente útil: te indica qué trabajos son los más influyentes en el campo y deben ser parte de tu revisión cualitativa. Si un artículo tiene más de 500 citas dentro de un corpus de 250 papers, es un trabajo fundacional que tu TFG debe citar y discutir.
Mapa de co-citación: las referencias más influyentes del campo
El análisis de co-citación identifica qué referencias aparecen citadas juntas con mayor frecuencia. Cuando dos trabajos son citados sistemáticamente en los mismos artículos, indica que la comunidad académica los considera intelectualmente relacionados. El mapa de co-citación visualiza la estructura intelectual del campo.
# Construir la red de co-citación de referencias NetMatrix_cocit <- biblioNetwork( M_scopus, analysis = "co-citation", network = "references", sep = ";" ) # Visualizar la red set.seed(123) # Para reproducibilidad net_cocit <- networkPlot( NetMatrix_cocit, normalize = "salton", weighted = TRUE, n = 30, # Mostrar las 30 referencias más citadas Title = "Red de Co-citación", type = "fruchterman", size = 5, alpha = 0.7, labelsize = 0.7, edgesize = 3, edges.min = 5 )
El parámetro n = 30 muestra las 30 referencias más co-citadas. En el mapa resultante, los nodos son artículos o libros y las conexiones representan co-citaciones frecuentes. Los nodos más grandes son los más influyentes; los colores indican comunidades o clústeres temáticos dentro del campo.
En la memoria del TFG, el mapa de co-citación va en la sección de resultados o como anexo, con una leyenda que explique qué representa cada nodo. Lo relevante es la interpretación: ¿qué autores forman el núcleo intelectual del campo? ¿Hay subcomunidades diferenciadas? ¿Hay autores puente entre subcampos?
Red de coautoría y colaboración institucional
# Red de coautoría (nivel de autores) NetMatrix_coaut <- biblioNetwork( M_scopus, analysis = "collaboration", network = "authors", sep = ";" ) # Red de colaboración entre países NetMatrix_paises <- biblioNetwork( M_scopus, analysis = "collaboration", network = "countries", sep = ";" ) # Visualizar red de países net_paises <- networkPlot( NetMatrix_paises, n = 25, Title = "Colaboración Internacional", type = "sphere", size = TRUE, alpha = 0.7, labelsize = 0.8 )
La red de colaboración internacional es uno de los visuales más impactantes para incluir en un TFG: muestra qué países publican más sobre el tema y con quién colaboran. En campos como la educación o la salud pública, estos mapas revelan si la investigación está liderada por países anglosajones o si existe una presencia relevante de grupos latinoamericanos o europeos.
Análisis temático y evolución temporal
El análisis temático identifica los temas principales que estructuran el campo en función de la densidad de las palabras clave y su centralidad en el discurso académico. Se representa en un diagrama de cuatro cuadrantes (mapa temático):
# Análisis de acoplamiento bibliográfico por palabras clave res_tema <- thematicMap( M_scopus, field = "DE", # DE = palabras clave del autor n = 250, minfreq = 5, stemming = FALSE, size = 0.7, n.labels = 1, repel = TRUE ) plot(res_tema$map) # Evolución temática por períodos res_evol <- thematicEvolution( M_scopus, field = "DE", years = c(2018, 2021, 2024), n = 100, minFreq = 3 ) plot(res_evol, measure = "inc")
El mapa temático tiene cuatro cuadrantes con interpretación específica:
- Motor themes (arriba derecha): temas con alta centralidad y densidad; son el núcleo consolidado del campo.
- Niche themes (arriba izquierda): temas especializados con alta densidad pero baja centralidad; comunidades específicas pero poco conectadas al debate general.
- Emerging/declining themes (abajo izquierda): temas periféricos, posiblemente emergentes o en declive.
- Basic/transversal themes (abajo derecha): temas con alta centralidad pero baja densidad; conectan el campo pero están menos desarrollados.
Esta taxonomía permite a tu TFG argumentar dónde se sitúa tu pregunta de investigación en el panorama del campo: si es un tema motor consolidado o un tema emergente con poco recorrido previo. Puedes conectar este análisis con la construcción del marco teórico de tu TFG.
Biblioshiny: la alternativa sin código
Si la programación en R no es tu fuerte, Bibliometrix incluye Biblioshiny, una interfaz web interactiva que permite realizar los análisis principales con clics y sin escribir código:
# Lanzar Biblioshiny desde RStudio library(bibliometrix) biblioshiny() # Se abre automáticamente en el navegador (localhost:3838)
Biblioshiny sigue el modelo SAAS (Systematic Analysis of Academic Sources) y organiza los análisis en módulos: Overview, Sources, Authors, Documents, Clustering, y Conceptual Structure. El libro “Science Mapping Analysis: A Primer with Biblioshiny” (Aria & Cuccurullo, McGraw-Hill, 2024) es la referencia metodológica que debes citar si usas esta herramienta en tu TFG.
La limitación de Biblioshiny respecto al código directo es que los análisis son menos reproducibles (no dejas un script que otros puedan ejecutar). Para un TFG, el script de R es preferible porque demuestra rigor metodológico y transparencia.
Cómo reportar el análisis bibliométrico en tu TFG
El análisis bibliométrico debe integrarse en el TFG con la misma estructura metodológica que cualquier otro análisis:
Sección de Metodología
Incluye: (1) bases de datos consultadas (Scopus, WoS), (2) cadena de búsqueda completa con operadores booleanos, (3) criterios de inclusión y exclusión, (4) fecha de realización de la búsqueda, (5) número final de artículos en el corpus, (6) software utilizado con versión (R 4.x.x, Bibliometrix 4.x.x). Cita el artículo fundacional del paquete: Aria & Cuccurullo (2017) en Journal of Informetrics.
Sección de Resultados
Presenta los análisis en el siguiente orden: (1) estadísticas descriptivas del corpus (producción anual, autores, revistas, países), (2) artículos más citados con breve descripción, (3) mapa de co-citación con interpretación de los clústeres, (4) red de colaboración si aporta valor, (5) mapa temático con interpretación de los cuadrantes. Cada figura debe ir numerada con leyenda y referencia en el texto.
Sección de Discusión
Conecta los hallazgos bibliométricos con tu pregunta de investigación: ¿qué vacíos temáticos identificas? ¿Tu trabajo se sitúa en un área emergente o consolidada? ¿Hay sesgos geográficos en la literatura que condicionan las conclusiones existentes?
Recuerda citar correctamente el paquete Bibliometrix en tu bibliografía:
Aria, M., & Cuccurullo, C. (2017). bibliometrix: An R-tool for comprehensive science mapping analysis. Journal of Informetrics, 11(4), 959–975. https://doi.org/10.1016/j.joi.2017.08.007
Para el análisis de datos cuantitativos asociados a tu revisión bibliométrica, puedes apoyarte en nuestro artículo sobre técnicas de análisis de datos en el TFG, y consultar análisis factorial exploratorio (AFE) con SPSS si tu TFG también incluye datos propios.
Preguntas frecuentes sobre análisis bibliométrico con Bibliometrix
¿Qué es Bibliometrix y para qué sirve en un TFG?
Bibliometrix es un paquete de R desarrollado por Massimo Aria y Corrado Cuccurullo que permite realizar análisis bibliométricos completos: estadísticas descriptivas, análisis de citas, mapas de co-citación, redes de coautoría y evolución temática. Es especialmente útil en TFG con revisión bibliográfica en ciencias sociales, educación, salud y economía.
¿Necesito saber programar para usar Bibliometrix?
No es necesario tener conocimientos avanzados de R. Bibliometrix incluye Biblioshiny, una interfaz web interactiva que permite realizar los análisis principales sin escribir código. Para análisis más reproducibles sí conviene conocer los comandos básicos de R, que este tutorial explica paso a paso.
¿Cómo descargo los datos de Scopus o Web of Science para Bibliometrix?
En Scopus: realiza tu búsqueda, selecciona todos los resultados, haz clic en ‘Exportar’ y elige el formato BibTeX. En Web of Science: exporta en formato ‘Plain text’ seleccionando todos los campos (Full Record and Cited References). Ambos formatos son compatibles con la función convert2df() de Bibliometrix.
¿Es válido un análisis bibliométrico como metodología de TFG?
Sí, el análisis bibliométrico es una metodología reconocida en ciencias sociales, educación, salud y administración de empresas. Requiere justificación metodológica explícita, criterios de búsqueda documentados y una interpretación crítica de los mapas y redes generados.
¿Cuántos artículos necesito para un análisis bibliométrico en TFG?
Un corpus de entre 100 y 500 artículos permite obtener mapas de co-citación interpretables. Con menos de 50 artículos los análisis de red son poco informativos. El tamaño adecuado depende del volumen de publicaciones sobre el tema y de los criterios de búsqueda aplicados.
Fuentes externas: Bibliometrix.org · Bibliometrix en CRAN · Aria & Cuccurullo (2017) – Journal of Informetrics · Documentación oficial Bibliometrix

Leave a Reply