Likert vs Diferencial Semántico vs Escala Stapel en TFG: Comparativa con 3 Cuestionarios Validados 2026

Likert vs Diferencial Semántico vs Escala Stapel en TFG: Comparativa con 3 Cuestionarios Validados 2026

Elegir entre la escala Likert, el diferencial semántico y la escala Stapel es una de las decisiones metodológicas que más confusión genera al diseñar el instrumento de medición de un TFG. Las tres escalas miden actitudes y percepciones, pero difieren radicalmente en formato, propiedades psicométricas y adecuación según el fenómeno que quieres capturar. Un error en esta elección compromete la validez de constructo de toda tu investigación. Esta guía desglosa cada escala, presenta una matriz de decisión de 8 criterios × 3 escalas y ancla el análisis en tres cuestionarios validados ampliamente citados en la literatura española e iberoamericana.

En 2026, las tres escalas siguen siendo las más usadas en investigación universitaria cuantitativa, pero las diferencias importan: la Likert mide grado de acuerdo, el diferencial semántico mide connotación bipolar de un concepto y la Stapel mide intensidad unipolar sin punto neutro. Saber cuándo usar cada una puede marcar la diferencia entre un α de Cronbach de 0,60 y uno de 0,88. Para enmarcar esta elección en el diseño global de tu trabajo, consulta primero nuestra guía completa de metodología TFG 2026.

Respuesta rápida: Si mides acuerdo o frecuencia con afirmaciones → usa Likert (5 o 7 puntos). Si necesitas capturar el significado connotativo de un concepto mediante pares de adjetivos opuestos → usa el diferencial semántico de Osgood (7 puntos). Si quieres medir intensidad sin punto neutro con valores negativos y positivos → usa la Stapel (–5 a +5). Para la mayoría de los TFG en ciencias sociales, la Likert es la elección más segura por su amplio respaldo en SPSS, Jamovi y PSPP.

Qué son las tres escalas y en qué se diferencian

Escala Likert

Propuesta por Rensis Likert en 1932, presenta al encuestado una afirmación y le pide que indique su grado de acuerdo en un continuo de puntos impares (habitualmente 5 o 7). Los extremos son «Totalmente en desacuerdo» y «Totalmente de acuerdo». Produce datos ordinales que, por convención extendida en la literatura española, muchos investigadores tratan como de intervalo para aplicar estadística paramétrica, siempre que la distribución sea aproximadamente simétrica y los ítems sean ≥ 5. Su fortaleza reside en la intuitividad para los participantes y en el respaldo psicométrico acumulado durante décadas.

Diferencial Semántico (Osgood)

Desarrollado por Charles Osgood en 1957, mide el significado connotativo de conceptos, objetos o personas. El participante valora un estímulo (p. ej., «Mi tutor de TFG») en una escala de 7 puntos entre pares de adjetivos bipolares (competente–incompetente; cercano–distante). A diferencia de la Likert, no mide acuerdo con afirmaciones, sino posicionamiento en un continuo semántico bipolar. Las tres dimensiones subyacentes universales son evaluación, potencia y actividad (EPA). Se aplica especialmente en estudios de imagen de marca, percepción de docentes, clima de aula y actitudes hacia grupos sociales.

Escala Stapel

Desarrollada por Jan Stapel en los años 1950, presenta un único adjetivo central en una escala simétrica de –5 a +5, excluyendo el 0. Al no tener punto neutral, reduce el sesgo de aquiescencia y facilita la detección de valoraciones negativas claras sin necesidad de formular ítems en sentido negativo. Es menos frecuente en TFG de ciencias sociales pero resulta idónea en estudios de marketing, calidad de servicio universitario y evaluación de atributos de un producto.

Comparativa entre la escala de diferencial semántico de Osgood y la escala Likert: diferencias de formato, puntos y ejemplos de ítems
Fuente: QuestionPro — Escala Diferencial Semántica

Matriz de decisión: 8 criterios × 3 escalas

La siguiente tabla sintetiza los criterios técnicos más relevantes para la elección de escala en un TFG. La columna «Recomendación» indica qué escala aventaja a las demás en ese criterio concreto.

Criterio Likert Diferencial Semántico Stapel Recomendación
Formato del ítem Afirmación + escala de acuerdo (1–5 o 1–7) Par bipolar de adjetivos, continuo de 7 puntos Adjetivo único central, escala –5 a +5 sin 0 Likert (más intuitivo para participantes no expertos)
Nº de puntos típico 5 (grado) o 7 (máster/doctorado) 7 (recomendado por Osgood) 10 (–5 a +5, excluyendo 0) Diferencial semántico / Stapel (mayor granularidad)
Sesgo de respuesta Aquiescencia moderada; tendencia al centro Sesgo de halo si los pares están mal equilibrados Menor aquiescencia (ausencia de punto neutro) Stapel (menor sesgo de aquiescencia)
Varianza esperada Moderada; puede comprimirse en 5 puntos Alta; 7 puntos distribuyen mejor las respuestas Alta; 10 valores maximizan la discriminación Stapel (mayor varianza y discriminación)
Fiabilidad α esperada α ≥ 0,70 con ≥3 ítems/dimensión (habitual 0,78–0,90) α ≥ 0,65–0,80 según número de pares por dimensión α ≥ 0,60–0,75 (menos investigada en español) Likert (mayor respaldo empírico en α en castellano)
Validez de constructo Muy documentada; AFC en cientos de adaptaciones Documentada en estudios EPA; AFC menos frecuente en TFG Limitada en literatura española; escasa validación TFG Likert (mayor respaldo en literatura española)
Software-friendly (SPSS/Jamovi/PSPP) Excelente; alfa, factorial, descriptivos integrados Bueno; requiere codificación manual de pares bipolares Moderado; escala numérica sencilla pero pocos tutoriales Likert (mejor soporte en manuales SPSS en español)
Casos típicos TFG Burnout, satisfacción laboral, actitudes educativas, bienestar Imagen de marca, percepción de docentes, clima escolar Calidad de servicio, evaluación de productos, marketing Elegir según objeto de estudio (ver sección 5)

3 cuestionarios validados: uno por escala

1. Maslach Burnout Inventory (MBI) — Escala Likert

El Maslach Burnout Inventory (Maslach y Jackson, 1981; adaptación española Seisdedos, 1997) es el instrumento más utilizado a nivel mundial para medir el síndrome de burnout. Consta de 22 ítems en tres subescalas: Agotamiento Emocional (9 ítems), Despersonalización (5 ítems) y Realización Personal (8 ítems). Cada ítem se responde en Likert de 7 puntos: de 0 («Nunca») a 6 («Todos los días»). Los estudios de validación en muestras españolas reportan α = 0,90 para Agotamiento Emocional, α = 0,79 para Despersonalización y α = 0,71 para Realización Personal. El modelo trifactorial ha sido replicado en docentes, enfermeras y estudiantes universitarios españoles con CFI > 0,90 y RMSEA < 0,08. Si tu TFG trata de estrés laboral o bienestar estudiantil, el MBI es el instrumento de referencia validado en castellano. Puedes consultar las validaciones iberoamericanas en SciELO México.

2. Test Diferencial de Osgood (EPA) — Diferencial Semántico

El Diferencial Semántico de Osgood, Suci y Tannenbaum (1957) mide el significado connotativo de conceptos mediante pares bipolares de adjetivos en escala de 7 puntos. Las tres dimensiones universales son Evaluación (bueno–malo, agradable–desagradable), Potencia (fuerte–débil, grande–pequeño) y Actividad (activo–pasivo, rápido–lento). En TFG españoles se ha adaptado para medir percepción de marcas educativas, imagen de la universidad, actitud hacia la investigación y clima del aula. La fiabilidad inter-ítem dentro de cada dimensión oscila entre α = 0,65 y α = 0,82. Para construir tu diferencial semántico debes: (a) seleccionar 6–12 pares bipolares relevantes, (b) equilibrar qué adjetivos van a izquierda y derecha para evitar sesgo de posición, y (c) codificar numéricamente del 1 al 7 antes de introducir los datos en SPSS o Jamovi.

3. Escala Stapel para calidad de servicio universitario

En TFG sobre calidad de servicio universitario, la Stapel se aplica para evaluar la plataforma virtual (atributos: «intuitiva», «rápida», «actualizada») o la atención administrativa. Su principal ventaja frente a la Likert es que los valores negativos permiten capturar valoraciones claramente desfavorables sin reformular el ítem en sentido negativo (lo que en Likert introduce sesgo de negación). La mayor limitación es la escasez de literatura de validación en español, por lo que el capítulo de metodología debe justificar la elección con referencias anglofonías (Churchill y Peter, 1984; Coelho y Esteves, 2007) y explicar la equivalencia estadística con la Likert.

Compatibilidad con SPSS, Jamovi y PSPP

  • Likert en SPSS/Jamovi/PSPP: flujo de trabajo más documentado. Alfa de Cronbach, AFE y AFC disponibles sin preparación especial. Amplia bibliografía y tutoriales en castellano.
  • Diferencial Semántico: se codifica cada par como variable numérica de 1 a 7. Los pares con adjetivo negativo a la izquierda se recodifican (Transformar → Recodificar) antes del análisis. Los centroides EPA se obtienen mediante análisis de componentes principales.
  • Stapel en SPSS/Jamovi/PSPP: introducción de datos sencilla (enteros de –5 a +5). Escasez de bibliografía metodológica en español obliga a justificar detalladamente el análisis ante el tribunal.

Para un contexto más amplio de qué tipos de instrumentos existen más allá de las escalas, consulta nuestra guía de instrumentos de recolección de datos con tipos y ejemplos. Si además necesitas información sobre cómo formular el problema de investigación que justifica tu elección instrumental, lee el artículo sobre planteamiento del problema con ejemplos reales de tesis. La elección de escala también condiciona qué tipo de entrevista puedes combinar en un diseño mixto: comparamos las opciones en el artículo sobre entrevista estructurada vs semiestructurada vs abierta. Para diseñar cuestionarios con escalas mixtas en tu TFG, consulta también cuestionarios mixtos en TFG de ciencias sociales y escalas de medición en investigación cuantitativa. Si tu trabajo usa triangulación para combinar datos cuantitativos y cualitativos, te será de utilidad el artículo sobre diseño de instrumentos en investigación mixta. Ver también comparativa de enfoques metodológicos TFG.

Cómo elegir la escala correcta para tu TFG

  1. ¿Qué mides? Actitud o grado de acuerdo con proposiciones → Likert. Significado connotativo de un concepto (imagen, percepción) → Diferencial semántico. Intensidad de atributos individuales → Stapel.
  2. ¿Quiénes son tus participantes? Poblaciones no especializadas → Likert (más intuitiva). El diferencial semántico puede resultar confuso si los adjetivos no son familiares para los encuestados.
  3. ¿Qué análisis planeas? Alfa de Cronbach, AFC y correlaciones → cualquiera. Comparación de medias entre grupos (t, ANOVA) → Likert o Stapel. Análisis de perfiles EPA → Diferencial semántico.

La delimitación del objeto de estudio es previa a la elección de escala. Para acotar correctamente el problema, revisa la guía de delimitación del tema de investigación en TFG antes de diseñar el cuestionario.

Errores frecuentes al usar estas escalas en un TFG

  • Mezclar escalas sin justificación: combinar Likert y diferencial semántico en el mismo cuestionario sin explicar la razón metodológica genera inconsistencia en el marco de medición.
  • No reportar el alfa de Cronbach: cualquier escala multidimensional exige calcular la fiabilidad interna. Los tribunales lo comprueban sistemáticamente.
  • Escala Likert de 3 puntos: comprime la varianza y dificulta el análisis factorial. Mínimo 5 puntos.
  • No recodificar ítems inversos: tanto en Likert como en diferencial semántico, los ítems redactados en sentido negativo deben recodificarse antes de calcular la media de escala.
  • Citar la escala sin citar la adaptación española: si usas el MBI, cita la versión original (Maslach y Jackson, 1981) Y la adaptación española (Seisdedos, 1997). Omitir la segunda es un error bibliográfico habitual. Consulta las normas de citación en nuestra guía de normas APA para TFG 2026.

Para profundizar en el marco teórico que sostiene la elección del instrumento, te recomendamos el artículo sobre cómo hacer el marco teórico del TFG con ejemplos 2026. También puedes explorar las guías de citación de instrumentos en Normas APA y los recursos metodológicos de Universo Abierto sobre herramientas de investigación.

Preguntas frecuentes

¿Puedo usar la escala Likert en un TFG de ciencias de la salud?

Sí. La escala Likert es el formato dominante en ciencias de la salud para medir actitudes, conocimientos y prácticas (estudios CAP). Instrumentos como el MBI (burnout), el WHOQOL-BREF (calidad de vida) o el GAD-7 (ansiedad) usan formato Likert y están validados en muestras españolas. Cita tanto la versión original como la adaptación española y calcula el alfa de Cronbach por subescalas, no para el instrumento completo.

¿El diferencial semántico se puede analizar con SPSS?

Sí. En SPSS se codifica cada par bipolar como variable numérica de 1 a 7. Los pares con adjetivo negativo a la izquierda se recodifican con Transformar → Recodificar antes del análisis. Para las dimensiones EPA, se aplica análisis de componentes principales. El proceso es idéntico en Jamovi con el módulo de análisis factorial.

¿Cuántos ítems necesito para que el alfa de Cronbach sea aceptable?

Con 3 ítems por dimensión y correlaciones inter-ítem de al menos 0,30 se suele alcanzar α ≥ 0,70 (umbral mínimo aceptable). Para un TFG, subescalas de 4 a 6 ítems con correlaciones moderadas son las más habituales. Un α < 0,60 suele indicar que los ítems no miden el mismo constructo o que la redacción es deficiente.

¿La escala Stapel es válida para un TFG de administración de empresas?

Sí, especialmente para estudios de calidad de servicio, evaluación de atributos de marca o satisfacción del cliente. Su mayor ventaja es capturar valoraciones negativas sin reformular los ítems. La limitación principal es la escasez de literatura de validación en español, por lo que el capítulo de metodología debe justificar la elección con referencias anglofonías y explicar la equivalencia estadística con la Likert.

¿Necesito validar la escala yo mismo en un TFG de grado?

No. En un TFG de grado lo recomendable es usar un instrumento ya validado (p. ej., el MBI o el WHOQOL-BREF) y reportar el alfa de Cronbach en tu muestra. No necesitas realizar AFC, validez convergente ni discriminante, salvo que estés en un TFM o tesis doctoral. Lo que sí debes hacer es citar el instrumento original y su adaptación española, y verificar que los valores de fiabilidad en tu muestra son aceptables.

¿La escala Likert produce datos ordinales o de intervalo?

En sentido estricto, produce datos ordinales. Sin embargo, en la práctica investigadora es habitual tratarlos como datos de intervalo (calculando medias y aplicando estadística paramétrica) cuando la distribución es aproximadamente simétrica y el número de puntos es ≥ 5. Para un TFG, lo más prudente es mencionar este debate en el capítulo de metodología y justificar la decisión con una referencia estándar (Norman, 2010, British Journal of Clinical Pharmacology).

¿Necesitas ayuda para diseñar el cuestionario de tu TFG?

Tesify acompaña a los estudiantes en el diseño del instrumento, la validación estadística y la redacción del capítulo de metodología. Desde la elección de la escala hasta el análisis en SPSS o Jamovi.

Empezar con Tesify

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *