, ,

Análisis de Contenido según Bardin: las Tres Fases que Todo Investigador Debe Conocer (2026)

Análisis de Contenido según Bardin: las Tres Fases que Todo Investigador Debe Conocer (2026)

Cuando un investigador se enfrenta a un corpus de documentos, entrevistas transcritas o registros mediáticos, la pregunta inmediata es: ¿cómo extraer significado de manera sistemática y replicable? El análisis de contenido según Bardin responde a esa pregunta con una propuesta metodológica estructurada en tres fases consecutivas que transforman el material bruto en inferencias válidas. Desde la primera edición francesa de L’Analyse de contenu (Bardin, 1977), pasando por las revisiones de 1996 y la traducción al español de 2002 (Ediciones Akal), este marco ha traspasado las fronteras francófonas y se ha convertido en referencia obligada en las ciencias sociales, la comunicación y la educación en España y América Latina.

Lo que distingue el modelo de Bardin de una lectura interpretativa ordinaria es su apuesta por la sistematicidad y la objetividad relativa: la técnica no elimina la subjetividad del analista —algo que Bardin reconoce explícitamente—, pero la somete a procedimientos explícitos que permiten la auditabilidad del proceso y la intersubjetividad de los resultados. Comprender las tres fases —preanálisis, explotación del material e inferencia e interpretación— es, por tanto, condición necesaria para aplicar correctamente esta técnica en cualquier TFG, TFM o tesis doctoral.

Respuesta rápida: El análisis de contenido de Bardin se articula en tres fases: (1) preanálisis (lectura flotante, selección del corpus, formulación de hipótesis y objetivos); (2) explotación del material (codificación, categorización y cuantificación/cualificación); y (3) tratamiento de resultados, inferencia e interpretación (síntesis, validación y extracción de conclusiones). Las fases son secuenciales pero admiten iteraciones entre la segunda y la tercera.

Origen y alcance del análisis de contenido de Bardin

Laurence Bardin publicó L’Analyse de contenu por primera vez en 1977, sintetizando y superando las formulaciones anteriores de Berelson (1952) y Holsti (1969), que habían privilegiado un análisis cuantitativo —frecuencia de palabras, recuento de categorías— frente al análisis semántico e inferencial. Bardin amplía el objeto del método: no solo interesa qué se dice, sino también cómo se dice, qué se omite y qué inferencias puede extraer el analista sobre las condiciones de producción y recepción del mensaje.

En su definición clásica, Bardin (2002, p. 23) describe el análisis de contenido como «un conjunto de técnicas de análisis de las comunicaciones tendente a obtener indicadores (cuantitativos o no) por procedimientos sistemáticos y objetivos de descripción del contenido de los mensajes, permitiendo la inferencia de conocimientos relativos a las condiciones de producción/recepción de estos mensajes». Tres elementos clave emergen de esta definición: la sistematicidad del procedimiento, la posibilidad de indicadores tanto cuantitativos como cualitativos, y la centralidad de la inferencia como producto final.

El modelo es aplicable a materiales heterogéneos: textos periodísticos, transcripciones de entrevistas en profundidad, documentos institucionales, comunicaciones en redes sociales, notas de campo etnográficas o respuestas abiertas a cuestionarios. Esta versatilidad explica su adopción transversal en disciplinas que van desde la comunicación política hasta la enfermería, pasando por la educación y el trabajo social. Si tu TFG o tesis trabaja con cualquier tipo de material textual o discursivo, el análisis de contenido de Bardin ofrece un andamiaje metodológico reconocible por los tribunales académicos.

Crecimiento de las citas a Bardin en la producción científica (2002–2019)

Período Artículos AC en SciELO (acum.) Citas a Bardin (acum.)
2002–2005 ~50 ~25
2006–2010 ~180 ~100
2011–2015 ~620 ~160
2016–2019 ~1.150 ~229

Datos aproximados extraídos del análisis bibliométrico de Sampaio & Lycarião sobre el uso del análisis de contenido en SciELO Brasil (2002–2019). Fuente: SciELO en Perspectiva: Humanidades.

Crecimiento sostenido de las citas a Bardin en la literatura científica indexada en SciELO, 2002–2019. Fuente: SciELO en Perspectiva: Humanidades (Sampaio & Lycarião, UFPR/UFC).

Fase 1 — Preanálisis: organizar para analizar

El preanálisis es la fase preparatoria que persigue tres objetivos simultáneos: (a) seleccionar y delimitar el corpus documental, (b) formular hipótesis o preguntas de análisis, y (c) elaborar los indicadores que guiarán la interpretación posterior. Bardin denomina a la actividad central de esta fase lectura flotante (lecture flottante): un primer contacto con los documentos sin imposición de categorías previas, análogo a la escucha libre del psicoanalista, que permite familiarizarse con el material y dejar emerger las primeras intuiciones.

Reglas para la constitución del corpus

Bardin establece cuatro reglas que el corpus debe satisfacer:

  • Exhaustividad: todos los materiales relevantes para el objetivo de análisis deben incluirse; no se descarta ningún documento por ser incómodo o difícil de codificar.
  • Representatividad: el corpus debe representar al universo de referencia; cuando este es demasiado grande, se recurre a una muestra que respete las proporciones del universo.
  • Homogeneidad: los documentos han de ser producidos en condiciones análogas (mismo género discursivo, mismo período temporal) y generados por técnicas equivalentes.
  • Pertinencia: los documentos deben guardar correspondencia con el objetivo del análisis; incluir material irrelevante contamina el sistema de categorías.

Al concluir el preanálisis, el investigador cuenta con: (1) un corpus delimitado y justificado, (2) una formulación provisional de hipótesis o preguntas de análisis, y (3) un índice preliminar de las dimensiones que se explorarán en la fase siguiente. Este momento es análogo al protocolo de búsqueda en una revisión sistemática con PRISMA 2020, en tanto que documenta las decisiones metodológicas antes de que el análisis influya en ellas.

Fase 2 — Explotación del material: codificar y categorizar

La explotación del material es la fase más laboriosa y la que consume más tiempo. Consiste en transformar el material bruto en unidades codificadas y en agrupar estas unidades en categorías. Bardin distingue dos operaciones nucleares: la codificación y la categorización.

Codificación: de la unidad de registro a la unidad de contexto

La codificación implica seleccionar unidades de registro —el fragmento mínimo de contenido al que se asigna una categoría— y situarlas dentro de su unidad de contexto —el segmento más amplio que permite comprender el significado de la unidad de registro—. Las unidades de registro pueden ser de naturaleza semántica (el tema, el objeto, el personaje, el acontecimiento), formal (la palabra, la frase, el párrafo) o referencial (el ítem, la unidad temática).

En investigación cualitativa en ciencias sociales, la unidad de registro temática es la más frecuente: se identifica el «núcleo de significación» de un fragmento y se le asigna un código. Esta elección conecta el análisis de contenido de Bardin con la tradición de la investigación cualitativa basada en análisis de contenido, donde la interpretación del contexto es tan relevante como la frecuencia de aparición.

Cuando el corpus procede de entrevistas transcritas, la calidad de la codificación depende en gran medida de cómo se haya preparado el material. La guía sobre cómo codificar entrevistas a mano sin software ofrece una perspectiva complementaria sobre el proceso manual que ayuda a comprender la lógica subyacente antes de automatizarlo con herramientas digitales.

Categorización: construir el sistema clasificatorio

Las unidades de registro codificadas se agrupan en categorías según criterios de analogía semántica, temática, sintáctica o léxica. Bardin establece que las categorías deben cumplir cinco propiedades fundamentales:

  • Exclusión mutua: un elemento solo puede pertenecer a una categoría.
  • Homogeneidad: el principio de organización de una categoría debe ser único.
  • Pertinencia: las categorías deben ser coherentes con el marco teórico y los objetivos del análisis.
  • Objetividad y fidelidad: dos codificadores independientes deben asignar los mismos materiales a las mismas categorías (fiabilidad interjueces).
  • Productividad: las categorías deben generar resultados fértiles, es decir, inferencias e hipótesis nuevas.

El sistema de categorías puede construirse de forma a priori (deductiva: a partir del marco teórico), a posteriori (inductiva: emergente del material) o mixta. La modalidad mixta —habitual en tesis doctorales— parte de un conjunto provisional de categorías deductivas que se ajustan y complementan durante el análisis.

Fase 3 — Inferencia e interpretación: producir conocimiento

El tratamiento de los resultados, la inferencia y la interpretación constituyen el momento epistemológico central del método: es aquí donde el analista trasciende la descripción del corpus para formular conclusiones sobre las condiciones de producción, las representaciones sociales o los procesos cognitivos que subyacen al material analizado. Bardin señala que la inferencia se apoya en dos tipos de polos: el polo de emisión (¿qué condiciones produjeron este discurso?) y el polo de recepción (¿qué efectos sociales o cognitivos puede tener?).

En términos prácticos, esta fase implica: (a) condensar y sintetizar los resultados de la codificación —tablas de frecuencias, mapas de categorías, matrices temáticas—; (b) someter los resultados a pruebas estadísticas simples si el análisis es cuantitativo (chi-cuadrado para la significatividad de diferencias entre categorías) o a procedimientos de validación intersubjetiva si es cualitativo (triangulación de codificadores, member checking con participantes); y (c) interpretar los hallazgos en relación con el marco teórico y las preguntas de investigación formuladas en el preanálisis.

La iteración entre la segunda y la tercera fase es frecuente: al interpretar los primeros resultados, el analista puede detectar que el sistema de categorías es insuficiente o que ciertas unidades de registro habían sido mal clasificadas, lo que obliga a retornar a la explotación del material con categorías revisadas. Esta circularidad no es una debilidad del método, sino una expresión de su naturaleza hermenéutica.

Construcción del sistema de categorías

El diseño del sistema de categorías es, para muchos investigadores, el paso más crítico de todo el proceso. Un sistema mal construido —con categorías solapadas, excesivamente abstractas o sin anclaje en el marco teórico— invalida los resultados con independencia del rigor aplicado en las demás fases.

Tipo de construcción Lógica Ventajas Limitaciones
A priori (deductiva) Las categorías se derivan del marco teórico antes de analizar el corpus Alta coherencia teórica; facilita la comparación entre estudios Riesgo de forzar el material a categorías inadecuadas
A posteriori (inductiva) Las categorías emergen del propio corpus tras lecturas sucesivas Fiel a la particularidad del material; adecuada para temas poco explorados Mayor tiempo; riesgo de proliferación de categorías sin jerarquía
Mixta Categorías provisionales a priori, ajustadas inductivamente durante el análisis Equilibrio entre anclaje teórico y sensibilidad al material Requiere documentar los cambios en el libro de códigos

Independientemente del tipo elegido, el investigador debe elaborar un libro de códigos (codebook) que defina operacionalmente cada categoría, incluya ejemplos de unidades de registro que sí pertenecen a ella y ejemplos que no. Este instrumento es imprescindible para el cálculo de la fiabilidad interjueces mediante el índice kappa de Cohen o el porcentaje de acuerdo. La elección del criterio de muestreo que determina qué entrevistados o documentos forman el corpus también condiciona la validez del análisis; una lectura complementaria útil es el artículo sobre muestreo teórico vs. muestreo intencional en investigación cualitativa, que clarifica cuándo usar cada estrategia antes de cerrar el corpus de Bardin.

Tipos de análisis: categorial, de evaluación, de enunciación y de relaciones

Bardin no propone un único procedimiento analítico, sino una familia de técnicas que comparten las tres fases pero difieren en sus unidades de registro y en sus reglas de cuantificación:

  • Análisis categorial: el más difundido; trabaja con la frecuencia de aparición de temas o categorías en el corpus. Es el punto de entrada natural para la mayoría de TFG y TFM.
  • Análisis de evaluación o de las valoraciones: registra no solo la presencia de categorías sino su polaridad (positiva/negativa/neutra) y su intensidad. Útil para estudios de framing mediático o análisis de opinión.
  • Análisis de enunciación: trata cada entrevista o discurso como un todo dinámico y analiza su organización interna, las repeticiones, los silencios y las contradicciones. Apropiado para análisis de discurso político o estudios de comunicación interpersonal.
  • Análisis de relaciones o co-ocurrencias: examina la asociación entre categorías dentro de la misma unidad de contexto. Se presta a representaciones en redes semánticas o matrices de co-ocurrencia.

La elección del tipo de análisis debe decidirse durante el preanálisis, pues condiciona la selección de las unidades de registro y las reglas de enumeración. Para la mayoría de trabajos finales de grado en ciencias sociales, el análisis categorial temático es suficiente y el que mejor encaja con la estructura del capítulo de resultados esperado por los tribunales. Puedes ver cómo se articula este tipo de análisis dentro de un marco metodológico más amplio en la guía sobre metodología del TFG: enfoques, instrumentos y justificación.

Ejemplo aplicado: análisis de noticias sobre salud mental

Para ilustrar las tres fases de forma concreta, tomemos un TFM en Comunicación Social cuyo objetivo es analizar cómo representan la depresión tres diarios nacionales españoles durante el período 2022-2026.

Fase 1 — Preanálisis: El investigador realiza una primera lectura flotante de una muestra aleatoria de 30 noticias (10 por periódico) y detecta que el material aborda la depresión desde marcos distintos: médico-biologicista, psicosocial y estigmatizador. Estas observaciones se convierten en hipótesis de trabajo: «Los tres periódicos emplean marcos representacionales distintos de la depresión, y el marco estigmatizador se asocia significativamente con las noticias de sucesos». El corpus definitivo, siguiendo las reglas de exhaustividad y homogeneidad, queda fijado en 180 noticias (60 por periódico) publicadas entre enero de 2022 y diciembre de 2026.

Fase 2 — Explotación del material: La unidad de registro es el tema dominante de cada noticia, la unidad de contexto es la noticia completa. Se construye un sistema de seis categorías mutuamente excluyentes: (C1) Marco médico-biologicista, (C2) Marco psicosocial, (C3) Marco estigmatizador, (C4) Marco de superación personal, (C5) Marco de demanda de recursos sanitarios, (C6) Marco neutro-informativo. Dos codificadores independientes aplican el sistema al corpus y obtienen un kappa de Cohen de 0,81, valor considerado «casi perfecto» según la escala de Landis y Koch (1977).

Fase 3 — Inferencia e interpretación: Los resultados muestran que el diario A emplea el marco médico-biologicista con mayor frecuencia proporcional, mientras que el diario C concentra el marco estigmatizador en las noticias de sucesos. Una prueba chi-cuadrado confirma que la distribución de marcos entre los tres periódicos no es homogénea. El investigador interpreta este hallazgo en relación con las líneas editoriales documentadas en estudios previos sobre framing mediático, estableciendo inferencias sobre las condiciones de producción periodística.

Errores frecuentes al aplicar el modelo de Bardin

La revisión de TFG y TFM en ciencias sociales permite identificar un patrón recurrente de errores metodológicos que comprometen la validez del análisis:

  1. Saltar la lectura flotante: iniciar directamente con categorías a priori sin un preanálisis exploratorio impide detectar dimensiones emergentes que el marco teórico no anticipaba.
  2. Confundir unidad de registro y unidad de contexto: codificar palabras aisladas en lugar de temas produce categorías superficiales e insensibles al significado contextual.
  3. No calcular la fiabilidad interjueces: presentar un análisis realizado por un solo codificador sin ninguna prueba de consistencia interna es una debilidad metodológica fácilmente señalable por el tribunal.
  4. Categorías con solapamiento: si una unidad de registro puede pertenecer a dos categorías, el sistema no cumple el principio de exclusión mutua y los recuentos de frecuencia son inválidos.
  5. Detener el análisis en la descripción: presentar solo tablas de frecuencias sin llegar a la fase de inferencia equivale a hacer análisis descriptivo, no análisis de contenido en sentido pleno.

Para profundizar en el proceso de categorización aplicado a entrevistas transcritas —uno de los materiales más habituales en análisis de contenido cualitativo—, la guía sobre tipos de entrevista para TFG: estructurada, semiestructurada y abierta ofrece una perspectiva complementaria sobre el diseño de los instrumentos que generarán el corpus. Asimismo, si tu análisis implica un volumen documental elevado, el artículo sobre análisis de contenido con Atlas.ti detalla cómo el software CAQDAS puede agilizar las operaciones de codificación sin alterar la lógica metodológica de Bardin.

Para acceder a la obra original en español, la edición de Bardin disponible en bibliotecas universitarias es: Bardin, L. (2002). Análisis de contenido. Ediciones Akal. Para la contextualización metodológica en el ámbito hispanohablante, el recurso de Introducción general a la metodología de la investigación ofrece un marco epistemológico complementario.

Preguntas frecuentes

¿Cuál es la diferencia entre el análisis de contenido de Bardin y el análisis de discurso?

El análisis de contenido de Bardin opera fundamentalmente sobre el contenido manifiesto y latente de los mensajes, buscando inferencias sobre las condiciones de producción a partir de indicadores sistemáticos. El análisis del discurso, en sus variantes crítica (Fairclough) o conversacional (Sacks), centra la atención en los mecanismos lingüísticos, retóricos y pragmáticos de construcción del texto. El primero es más adecuado cuando el investigador trabaja con corpus extensos y necesita comparar entre textos; el segundo, cuando el interés está en la microestructura de un discurso particular. Ambos métodos son compatibles y a menudo se combinan en tesis doctorales.

¿Cuántos documentos debe incluir el corpus en un análisis de contenido para un TFG?

Bardin no establece umbrales numéricos rígidos: el tamaño del corpus depende del objetivo de análisis, del tipo de material y del tipo de análisis (cuantitativo o cualitativo). En TFG y TFM de ciencias sociales, corpus de entre 30 y 100 documentos homogéneos son habituales para análisis categorial cuantitativo. Para análisis de enunciación centrado en entrevistas cualitativas, entre 8 y 20 entrevistas suelen ser suficientes si se alcanza la saturación temática. La regla es que el corpus sea representativo del universo de referencia y que el investigador justifique el criterio de delimitación.

¿Es necesario calcular la fiabilidad interjueces en un TFG individual?

No siempre es obligatorio —depende de la normativa de cada universidad y de las instrucciones del tutor—, pero es metodológicamente recomendable y tiende a valorarse positivamente por los tribunales. En trabajos individuales, una solución frecuente es realizar una doble codificación en dos momentos temporales separados (fiabilidad intracodificador) y reportar el índice de consistencia. Otra opción es solicitar a un compañero o al propio tutor que codifique una submuestra del 20% del corpus y calcular el acuerdo con el kappa de Cohen.

¿Cómo se cita a Bardin correctamente en APA 7?

Para la edición española de Akal: Bardin, L. (2002). Análisis de contenido (3.ª ed.). Ediciones Akal. (Obra original publicada en 1977). Si se cita la edición francesa actualizada: Bardin, L. (2013). L’analyse de contenu. Presses Universitaires de France. En la cita en texto se escribe (Bardin, 2002) o (Bardin, 1977/2002) si se quiere destacar la fecha original. Nunca se escribe solo el año 1977 si el ejemplar consultado es una edición posterior.

¿Puede aplicarse el análisis de contenido de Bardin a datos de redes sociales?

Sí, con adaptaciones. Los tuits, publicaciones de Instagram o comentarios de YouTube son materiales textuales que pueden constituir un corpus si se respetan las reglas de homogeneidad y exhaustividad. La principal adaptación es la definición de la unidad de registro: en materiales de microblogging, la unidad habitualmente es la publicación completa (no la frase), dado el carácter fragmentario del género. Autores como Herring (2007) han propuesto extensiones del análisis de contenido al entorno digital bajo el nombre de Análisis de Contenido Asistido por Ordenador (Computer-Assisted Content Analysis, CACA).

¿Qué diferencia hay entre análisis de contenido y análisis temático de Braun y Clarke?

El análisis temático de Braun y Clarke (2006, revisado 2022) es un método independiente del análisis de contenido de Bardin, aunque comparten el interés por los temas. La diferencia principal es epistemológica: el análisis temático asume una posición constructivista y no pretende objetividad intersubjetiva, mientras que Bardin reivindica —con matices— una objetividad relativa verificable mediante indicadores de fiabilidad. Metodológicamente, Braun y Clarke presuponen que los temas son construidos activamente por el investigador y no «encontrados» en los datos; Bardin, en cambio, mantiene que las categorías deben anclarse en propiedades observables del texto. Ambos métodos son legítimos; la elección debe justificarse en función del posicionamiento epistemológico del investigador.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *