Vous êtes sur la page 1sur 94

Técnicas de

recogida de datos
cuantitativos: la
encuesta
Montserrat Martínez Melo
PID_00227026
© FUOC • PID_00227026 Técnicas de recogida de datos cuantitativos: la encuesta

Ninguna parte de esta publicación, incluido el diseño general y la cubierta, puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio, sea éste eléctrico,
químico, mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la previa autorización escrita
de los titulares del copyright.
© FUOC • PID_00227026 Técnicas de recogida de datos cuantitativos: la encuesta

Índice

Introducción............................................................................................... 5

Objetivos....................................................................................................... 7

1. Introducción........................................................................................ 9
1.1. La técnica de encuesta en el contexto de la metodología
cuantitativa .................................................................................. 9
1.1.1. Una mirada rápida a la metodología cuantitativa y la
perspectiva multiestratégica .......................................... 9
1.1.2. Diferentes técnicas asociadas a la metodología
cuantitativa: características esenciales de la encuesta ... 10
1.1.3. Limitaciones de la investigación por encuesta .............. 13
1.2. Pasos clave para la realización de una encuesta ......................... 14
1.3. Casos de ayuda al estudio ........................................................... 16

2. Revisión literatura y conceptualización...................................... 18


2.1. Temas y conceptos ...................................................................... 18
2.2. Poblaciones e informantes .......................................................... 21

3. Diseño del cuestionario.................................................................... 23


3.1. Tipos de encuestas ...................................................................... 23
3.2. Definición, funciones y grandes tipos ........................................ 26
3.2.1. Definición y funciones .................................................. 26
3.2.2. Tipos ............................................................................... 28
3.3. El orden de las preguntas ........................................................... 29
3.4. Formulaciones ............................................................................. 31
3.4.1. Grado de libertad ........................................................... 32
3.4.2. Premeditación de las respuestas .................................... 35
3.4.3. Número de respuestas admitidas ................................... 36
3.5. Pretest o prueba piloto ................................................................ 39
3.6. Resumen y recomendaciones generales ...................................... 41

4. Diseño muestral.................................................................................. 43
4.1. Conceptos clave .......................................................................... 43
4.2. Muestreo probabilístico: confianza, error y tamaño de la
muestra ........................................................................................ 46
4.3. Estructurar y estratificar una muestra ......................................... 49
4.4. Recomendaciones y ayudas ........................................................ 49

5. Trabajo de campo y pretratamiento de los datos...................... 51


5.1. El trabajo de campo .................................................................... 51
© FUOC • PID_00227026 Técnicas de recogida de datos cuantitativos: la encuesta

5.2. Depuración .................................................................................. 51


5.3. Codificación ................................................................................ 52
5.4. Plan de tabulación o análisis ...................................................... 53
5.5. La ficha técnica ........................................................................... 54

6. Análisis de datos cuantitativos...................................................... 56


6.1. Contexto e informaciones adicionales ....................................... 56
6.1.1. La estadística resumida y simplificada .......................... 56
6.1.2. El software estadístico ................................................... 56
6.1.3. Las diferenciaciones clave ............................................. 57
6.2. Características de las variables estadísticas: clasificación
según criterio y escala de medida ............................................... 58
6.3. Niveles de análisis: univariante, bivariable y multivariable ........ 62
6.4. Estadística descriptiva y estadística inferencial .......................... 63
6.5. Estadística descriptiva: resúmenes y gráficos esenciales ............. 64
6.5.1. Frecuencias: gráficos de barras, sectores e
histogramas .................................................................... 64
6.5.2. Media y desviación ........................................................ 67
6.5.3. Resumen de los 5 números: gráfico de cajas ................. 69
6.6. Estadística inferencial: modelos esenciales y prueba de
significación en análisis bivariable ............................................. 71
6.6.1. La prueba de significación ............................................. 71
6.6.2. Relación entre dos variables cualitativas: tablas de
contingencia y test de Chi2............................................ 73
6.6.3. Relación entre una variable cualitativa y una
cuantitativa: ANOVA y test T-student ........................... 78
6.7. Más allá ....................................................................................... 80

7. Resumen y consideraciones finales............................................... 83

Actividades.................................................................................................. 85

Bibliografía................................................................................................. 92
© FUOC • PID_00227026 5 Técnicas de recogida de datos cuantitativos: la encuesta

Introducción

El módulo que os presentamos a continuación tiene la difícil función de re-


sumir de manera sintética los principales�conocimientos que hay que tener
para trabajar desde un enfoque�cuantitativo y dar las pautas�esenciales pa-
ra tomar las decisiones�metodológicas�clave. Estos conocimientos y pautas
os deben permitir, además, entender�cómo�otros�autores�y�equipos�funda-
mentan�sus�decisiones y cómo utilizar�e�interpretar�los�resultados que se
derivan de estas fuentes.

Por lo tanto, el estudio del módulo ha de resultaros útil, ayudaros�a�tomar


decisiones y entender las de otros.

Presentamos el módulo desde la dificultad de hacer esta síntesis, dado que si


algo se puede afirmar es que actualmente resulta casi imposible pasar un día
sin leer información basada en datos cuantitativos del ámbito laboral. En la era
de los datos, el big data, la transparencia institucional y empresarial, encon-
traremos información de base cuantitativa en varios soportes y por muchos
canales. A su vez, sobre metodología cuantitativa existe un amplio abanico de
materiales, tanto dentro como fuera del mundo académico: manuales, artícu-
los, webs, etc. Las administraciones ponen a nuestro alcance gran cantidad de
datos, los institutos y centros de investigación también, las empresas y funda-
ciones de empresas elaboran sus estudios, y muchos de vosotros trabajáis en
empleos que requieren utilizar información cuantitativa y posiblemente tam-
bién la producís.

De este modo, existen muchos y variados procedimientos para producir este


tipo de información que parte de la mirada�cuantitativa. La idea de mirada
nos remite a la palabra clave metodología, es decir, los principios�y�supuestos
epistemológicos que rigen la manera de hacer investigación. Siguiendo estos
supuestos y principios, se desarrollan métodos que hay que entender como las
diferentes�etapas para conseguir nuestros objetivos, y finalmente las técni-
cas, que también podemos denominar estrategias�o�instrumentos, para ma-
terializar nuestros objetivos.

La finalidad de este módulo es ayudar a construir estos instrumentos y a utili- Ved también
zarlos, por lo que centraremos la atención en las técnicas: experimentos o casi
Sobre la distinción entre me-
experimentos, test y encuesta son los principales instrumentos, asociados a todología y método es intere-
la sociometría, psicometría o econometría. Específicamente, dedicaremos los sante la aportación de Kothari
(2004), que encontraréis cita-
esfuerzos a la técnica de encuesta. do en la bibliografía.

Esta manera de clasificar las diferencias entre las palabras metodología, método y
técnica –palabras muy utilizadas– puede ser muy sencilla de entender a primera
vista. Aun así, a menudo encontraremos que se utilizan como sinónimos, de
© FUOC • PID_00227026 6 Técnicas de recogida de datos cuantitativos: la encuesta

modo que muchos afirman realizar metodología de investigación por encuesta


y método de encuesta. Sin embargo, como hemos afirmado, no dedicaremos
demasiado tiempo a discusiones generales o transversales y nos centraremos
en aprender cómo se hace.

Con esta finalidad, el módulo empieza introduciendo, contextualizando y jus-


tificando la técnica de encuesta, presentando los pasos clave que hay que se-
guir para llevarla a cabo, y los ejemplos o casos aplicados que nos ayudarán
en el estudio. Muy rápidamente se darán algunas pautas sobre cómo realizar
la propuesta teórica y la necesaria revisión metodológica, para dedicar más
esfuerzos al diseño de cuestionario. En el cuarto apartado, se estudiarán los
principios y procedimientos esenciales del muestreo, seguido de las tareas de
trabajo de campo y pretratamiento de datos. Finalizaremos el módulo con el
estudio de las principales pautas para el análisis estadístico de datos y unas
breves consideraciones finales.

En este módulo os queremos ofrecer también recursos para ampliar vuestros


conocimientos, que, además de la bibliografía y los materiales complementa-
rios de la UOC, incluyen software.

En el módulo siguiente, centrado en la construcción y el análisis de indicado-


res, se abordarán muchas de las cuestiones y debates que se derivan del estudio
de este, como son las dificultades para definir y medir conceptos, las fuentes
principales de las que se obtienen indicadores generales y específicos o la lo-
calización y el uso de fuentes clave.
© FUOC • PID_00227026 7 Técnicas de recogida de datos cuantitativos: la encuesta

Objetivos

Al finalizar el estudio de este módulo, el estudiante habrá logrado los siguien-


tes objetivos específicos:

1. Entender el significado y la naturaleza de llevar a cabo investigación desde


la perspectiva cuantitativa en el ámbito laboral.

2. Conocer los diferentes pasos para llevar a cabo investigación por encuesta,
específicamente: elaboración del cuestionario, procedimientos de mues-
treo y análisis estadístico de datos.
© FUOC • PID_00227026 9 Técnicas de recogida de datos cuantitativos: la encuesta

1. Introducción

1.1. La técnica de encuesta en el contexto de la metodología


cuantitativa

1.1.1. Una mirada rápida a la metodología cuantitativa y la


perspectiva multiestratégica

Una aproximación muy ligera a la metodología�cuantitativa requiere asumir Ved también


la creencia de que los fenómenos sociales, como los naturales, tienen forma,
Una tipificación de las princi-
estructura, geografía y siguen modelos o pautas, y que estas se pueden medir. pales diferencias entre meto-
Así, la realidad social es objetivable y tangible, de manera que si la fragmenta- dología cuantitativa y cualitati-
va se puede consultar en el ca-
mos, la descomponemos en variables, podemos conocer las partes e, incluso, pítulo de Corbetta (2003).

el todo. Lo que queremos estudiar es externo a nosotros, y nos acercaremos a


partir de hipótesis y deducciones empíricas que permitirán la demostración y
discusión crítica racional. Al conocer la realidad en su forma se pueden reali-
zar predicciones probabilísticas en otros momentos o contextos, y hasta cierto
punto controlar futuros escenarios. Para asegurar esta capacidad empírica y
demostrativa, el método debe ser transparente y replicable, prefijado antes de
su ejecución. Estos procedimientos prefijados medirán los fenómenos, habi-
tualmente por medio del uso de tests o formularios, y buscarán, cuando acce-
der al total de las poblaciones o casos no sea posible, la inferencia, es decir, la
posibilidad de generalizar con validez y fiabilidad estadística los resultados que
se obtienen en cada investigación. La finalidad última es explicar los fenóme-
nos, en este caso del ámbito laboral, para formular leyes y teorías universales.

Como en el módulo inicial, centrado en las técnicas cualitativas, hay que re-
cordar que la asignatura no tiene por finalidad ahondar en el debate en torno
a la diferenciación entre metodologías, pero sí queremos apostar firmemente
por la perspectiva multiestratégica, que se posiciona ante la complejidad de la
realidad con complejidad de miradas y estrategias para conocerla y compren-
derla, de manera que ya sea a la vez o en secuencia la combinación de métodos
es la gran oportunidad de la ciencia social para resultar ciencia.

“We should also try to use different kinds of evidence together and in sequence and
Ved también
look for ways of triangulating different measures on the same research problem” (Tarrow,
1995).
Una revisión interesante y rápi-
da de estos procedimientos la
encontraréis en el artículo de
Tarrow (1995).
© FUOC • PID_00227026 10 Técnicas de recogida de datos cuantitativos: la encuesta

1.1.2. Diferentes técnicas asociadas a la metodología


cuantitativa: características esenciales de la encuesta

Siguiendo este paradigma y metodología, se desarrollan varios procedimien-


tos y técnicas entre los que destacan los experimentos, los tests y muy espe-
cialmente la encuesta. Pasemos a hacer una muy breve descripción de estos
procedimientos.

1)�Experimentos

Uno de los objetivos clásicos desde la metodología cuantitativa es conocer y


demostrar los efectos de una variable. Así, se diseñan experimentos o casi ex-
perimentos en los que se somete a un grupo experimental a este estímulo,
mientras que un grupo lo más parecido posible, o grupo de control, no se ve
afectado por este. Se obtiene una medida antes del estímulo (ex ante) y una
después (ex post) para poder inferir hasta qué punto la presencia del estímulo
afecta a los cambios que se observan entre los dos momentos. Para realizar
experimentos sociales se requiere una sólida teoría y un diseño de investiga-
ción muy formalizado, así como tener mucho cuidado de las condiciones de
las aplicaciones y medidas y de las características de los grupos. En economía y
econometría existen muchos ejemplos relacionados con la experimentación.
Un ejemplo clásico entre los clásicos son los conocidos como experimentos
Hawthorne sobre la productividad que han dado lugar a la tipificación del
efecto Hawthorne.

2)�Tests

La palabra test se refiere específicamente al conjunto de preguntas de respuesta


cerrada que permiten medir las características de los casos para clasificarlos en
situaciones. Las medidas de los diferentes ítems se realiza muy frecuentemente
en escalas y para hacer las clasificaciones a menudo se construyen índices.
Se trata por lo tanto de formularios muy estandarizados y estructurados que
requieren varios procesos de validación para ser aceptados por la comunidad
académica y profesional. Como en el caso de los experimentos, se requiere un
cuerpo teórico y metodológico muy sólido para su diseño y también para su
aplicación a contextos diferentes. Los tests psicométricos, como por ejemplo
la escala de personalidad de Eysenck, son muy conocidos

Ahora mismo es posible que determinados términos utilizados para describir tan breve-
mente estas grandes familias de técnicas os generen cierta confusión: variable, respuesta
cerrada, escala, formulario y estandarización, entre otros. Aun así, a lo largo de los próximos
apartados estos quedarán claramente definidos.

3)�Encuesta

La encuesta es sin duda una�de�las�técnicas�más�populares del pasado siglo y


parece ser que del actual. Es utilizada en muchos ámbitos académicos y profe-
sionales, y el mundo de la comunicación parece sentir especial afición a difun-
dir los resultados y también a producirlos. No os resultará difícil por lo tanto
© FUOC • PID_00227026 11 Técnicas de recogida de datos cuantitativos: la encuesta

encontrar ejemplos de estos procedimientos, dado que la gran mayoría de los


datos y estudios sobre los que nos llega información han sido producidos a
partir de encuestas.

Su fama ha sido argumentada alegando varios factores: la creciente demanda


de información empírica, la imposibilidad de llegar a conocer tantas cuestio-
nes sobre toda la población o casos, el desarrollo de herramientas, como la
encuesta telefónica y el procesamiento tecnológico de datos (y más reciente-
mente la encuesta en línea), que abaratan gastos y agilizan la obtención de
resultados, la posibilidad de elaborar encuestas en las que el propio encuestado
se autoadministra el cuestionario, entre otros.

De este modo, se ha construido una gran�cantidad�de�diseños, es decir, mu-


chas maneras de proceder en las diferentes decisiones que hay que tomar para
realizar una encuesta. Analicemos detenidamente la siguiente definición so-
bre qué es una encuesta y qué nos facilitan los componentes clave sobre los
que debemos trabajar:

“Consulta tipificada a personas (o casos) elegidas según principios estadísticos” (Alvira,


2011).

1)�Consulta: por lo tanto, en general lo que haremos será consultar, preguntar


(por escrito u oralmente) sobre algo. Este hecho nos remite a la idea de que
hace falta en primer lugar elegir tema y conceptualizarlo. Este ejercicio lo tra-
bajaremos en el apartado 2.

2)�Tipificada: de manera que a todo el mundo se le consulte del mismo modo


y bajo el mismo procedimiento de selección. Ello implica el diseño de una
serie de preguntas que responden a nuestros interrogantes y conceptos y que
requieren operativizar los conceptos, es decir, hacerlos medibles. En el aparta-
do 3 estudiaremos cómo construir este formulario, o cuestionario, y qué tipos
de formulaciones básicas existen.

3)�Personas�o�casos�elegidos�bajo�principios�estadísticos: la gran mayoría de


las encuestas pretenden poder afirmar que los resultados que se han obteni-
do de ella son inferibles al conjunto de la población sobre la que se consulta,
y que no son hechos u opiniones parciales que el resto de los casos no com-
parten. En el apartado 4, sobre diseño muestral, explicaremos las principales
decisiones y fundamentos que hay que tomar, así como las posibilidades de
realizar también muestreo que no se rige bajo principios estadísticos.

Estas son las decisiones�fundamentales que hay que tomar para diseñar una
encuesta: qué,�cómo y a�quién. Ahora bien, será necesario abordar muchas
otras, como por ejemplo cómo actuar para conseguir la muestra o qué hacemos
después con los datos que obtendremos. Los apartados 4 y 5 del módulo nos
orientarán sobre estos pasos.
© FUOC • PID_00227026 12 Técnicas de recogida de datos cuantitativos: la encuesta

A partir de ahora empezaremos a hablar de la encuesta también como un método (y como


sinónimo de método), dado que si bien es una técnica o un instrumento que se produce
bajo los principios cuantitativos ya revisados, estaremos de acuerdo en que son necesa-
rios una serie de pasos, y que cada uno de ellos implica procedimientos. Así, a menudo
nos referiremos a ella como metodología de investigación por encuesta, o similar. En in-
vestigación, por lo tanto, hay que aprender a usar la misma palabra de manera diferente
en diferentes contextos y momentos. Igualmente sucederá con las palabras cualitativo y
cuantitativo o la palabra variable. Hay que añadir el efecto de otras lenguas en nuestro
vocabulario: survey research, survey method, etc.

Siguiendo las tres características esenciales destacadas, además de las diferen-


cias evidentes con el paradigma y metodología cualitativa, podemos distinguir
las encuestas de otros diseños. Por un lado, de los datos�de�registro�y�de�los
censos: los registros de datos en principio registran todos los casos u opera-
ciones. Un ejercicio clásico son los censos de población. Como estudiaremos
en los módulos siguientes, mucha de la información utilizada en el ámbito
laboral, especialmente en la construcción de indicadores, proviene de regis-
tros, por ejemplo de la Seguridad Social. A su vez, también son ejercicios di-
ferentes de las entrevistas: aunque se cumplan el resto de las características,
una encuesta tiende a tipificar al máximo las consultas (las mismas preguntas,
con las mismas posibilidades de respuesta, en el mismo orden), mientras que
las entrevistas suelen formular los interrogantes de manera más abierta y en
general también con posibilidad de cambios de orden.

Por lo tanto, podemos caracterizar la encuesta como:

1) Técnica estructurada que utiliza un conjunto de�procedimientos�estan-


darizados�de�interrogación,

2) Para obtener�sistemáticamente�medidas de las variables que se derivan de


una problemática�de�investigación�previamente�construida.

3) En general, proporcionan una gran�cantidad�de�información.

4) Se basa habitualmente en teoría matemática y en la�estadística,

5) Con el objetivo de conseguir muestras�representativas y analizar los datos.

Además, existen muchos y variados diseños que violentan o son creativos en Contenido
alguno de los puntos mencionados, como por ejemplo los paneles, que reali- complementario

zan la misma o diferentes encuestas a la misma muestra reiteradamente. Co- Hay que excluir de esta noción
mo veremos, es el caso de la Encuesta de población activa, que será uno de clásica de censo el censo 2011
español, que adoptó la forma
nuestros casos de ayuda en el estudio. de encuesta, como en otros
países europeos. Podéis con-
sultar la información metodo-
lógica en la web del Instituto
Nacional de Estadística.
© FUOC • PID_00227026 13 Técnicas de recogida de datos cuantitativos: la encuesta

1.1.3. Limitaciones de la investigación por encuesta

La encuesta es un procedimiento bastante popular como para que sea revisa-


da, discutida y criticada desde varios ángulos. De estas diferentes revisiones
hay que destacar algunas limitaciones importantes que debemos considerar
cuando decidimos usar la encuesta como procedimiento de investigación:

1) La información producida proviene de un proceso de operativización, de


construcción de las medidas que el equipo investigador considera adecuadas
para dar cuenta de la realidad que quiere estudiar. Así, este proceso�de�deci-
sión, en el que siempre existirán alternativas, es ampliamente discutido, espe-
cialmente en caso de discrepancia con los resultados o las intervenciones que
se puedan derivar de él.

2) No permite, por lo tanto, la espontaneidad de los participantes. Se busca la


estandarización, todo el mundo igual, de manera que es un procedimiento
rígido que no admite cambios (o los mínimos) mientras dura. Imaginad que
un encuestado no se siente cómodo con las opciones de respuesta que damos
a una pregunta y quiere dar otras. Es posible que no hayamos previsto este ex-
tremo y que ya llevemos 1.000 encuestas realizadas. ¿Qué hacemos entonces?
¿Puede ser que las 1.000 anteriores tuvieran una manera diferente de entender
las posibilidades de respuesta? En todo caso, no hay mucho margen para dar
marcha atrás.

3) Esta necesidad de operativizar para poder medir requiere un conocimiento


sólido de lo que se quiere estudiar. Solo preguntaremos sobre lo que habremos
pensado antes y formulado en el cuestionario. De modo que no es la mejor
opción si estamos en una fase exploratoria o de descubrimiento.

4) En la encuesta existe poco�diálogo, aunque lo parezca. La comunicación


es unidireccional. En general, el encuestador no puede incluir aportaciones
no previstas del encuestado. Podemos tener un apartado de observaciones o
espacios para otras respuestas, pero en ningún caso es una entrevista. A esta
condición se le atribuye la menor riqueza en la información producida, dado
que se opta por mayor cantidad y precisión.

5) Presenta importantes�dificultades a la hora de ser implementada en pobla-


ciones o�universos�pequeños,�desconocidos�u�ocultos. Como veremos, si hay
que diseñar una muestra sobre una población pequeña a menudo la muestra
y la población serán muy parecidas en número de casos. Por otro lado, para
hacer muestras representativas hay que tener una mínima información sobre
la población que hay que estudiar. Si no sabemos nada o muy poco de ella,
estas decisiones se complican. Cabe añadir que para seleccionar los casos hay
que usar cierta aleatoriedad, lo que es muy difícil si la población sobre la que
hacemos la muestra está oculta. Un ejemplo de universo o población oculta es
© FUOC • PID_00227026 14 Técnicas de recogida de datos cuantitativos: la encuesta

por ejemplo el de trabajadores sin permiso de residencia o trabajo, actividad


económica no declarada, etc. Retomaremos este punto cuando hablemos de
diseño muestral.

Estas son las principales limitaciones que se pueden atribuir a la metodolo-


gía de investigación por encuesta. No obstante, hay muchas otras críticas que
provienen del uso indiscriminado con decisiones metodológicas muy débiles,
vinculadas en muchos casos al auge de la encuesta telefónica y la encuesta
en línea. Otras hay que atribuirlas al uso intencionado y poco riguroso de los
resultados que se derivan de estas. Sin embargo, en este caso no se trata tanto
de una limitación metodológica como de un problema ético o político.

1.2. Pasos clave para la realización de una encuesta

Toca empezar a trabajar y para hacerlo seguiremos cinco pasos clave:

1) Revisión de la literatura y conceptualización

2) Diseño del cuestionario

3) Diseño muestral

4) Trabajo de campo y pretratamiento de los datos

5) Análisis e interpretación de los datos cuantitativos


© FUOC • PID_00227026 15 Técnicas de recogida de datos cuantitativos: la encuesta

Figura 1. Etapas clave en el proceso de encuesta

Fuente: Elaboración propia.

Cada uno de los siguientes apartados os guiará en estas decisiones, si bien hay
que tener presente que las diferentes decisiones están muy interrelacionadas:
por ejemplo, si decidimos hacer una encuesta a trabajadores de los servicios
de limpieza (universo y muestra), habría que valorar si la encuesta en línea es
la más adecuada. O bien, si la encuesta está orientada a profesionales especia-
lizados en ocupaciones de alto nivel, deberemos tener muy en cuenta la for-
mulación de las preguntas para ser precisos en lo que medimos. Igualmente,
si en nuestro diseño optamos por realizar encuestas a altos cargos de empre-
sas y administraciones, hay que pensar que el trabajo de campo, es decir, el
tiempo para producir la información, no será breve en cuanto que se trata de
personas a las que tendremos difícil acceso y con limitaciones de tiempos y
disponibilidad para atendernos.

A su vez, en ocasiones, habrá que volver atrás para poder continuar. Si bien
como procedimiento estandarizado y rígido que hemos caracterizado no siem-
pre será posible o será imposible, se puede dar el caso de que al diseñar el cues-
tionario y hacer una muy recomendable prueba piloto, descubrimos que nos
faltan opciones de respuesta o conceptos no cubiertos, de manera que hay que
retomar la revisión de los conceptos y el diseño del formulario.
© FUOC • PID_00227026 16 Técnicas de recogida de datos cuantitativos: la encuesta

1.3. Casos de ayuda al estudio

Para seguir el contenido de este módulo, os proponemos usar dos ejemplos de


encuesta. Su consulta nos ayudará a tener ejemplos y también a ver decisiones
completas, dado que son investigaciones acabadas.

Ved también
Caso 1. Estadística oficial. Encuesta de población activa
Sobre matrices de datos, análi-
La EPA es sin duda una de las operaciones de estadística oficial que más utilizaréis sis de datos y software para el
como profesionales del ámbito laboral. Para empezar, os ayudará a introduciros en análisis de datos, podéis dirigi-
el estudio si descargáis la información metodológica que nos ofrece el Instituto Na- ros al apartado 6 de este mó-
cional de Estadística. dulo.

Entrad a la web del Instituto Nacional de Estadística y buscad los documentos:

• Descripción de la encuesta, definiciones e instrucciones para la cumplimentación


del cuestionario

• Cuestionario EPA 2005

Actualmente, estos documentos se localizan siguiendo la ruta:

www.ine.esinebasemercado laboralactividad, ocupación y paroencuesta de población


activa

En el apartado “información detallada metodología”.

Lógicamente esta ruta de acceso puede variar, y los documentos pueden ser revisados
o actualizados.

Sobre la EPA existen otros muchos documentos de interés: las clasificaciones que
utiliza y los módulos especiales que ha usado para indagar sobre cuestiones concre-
tas: mercado de trabajo e inmigración, accidentalidad y salud, transiciones laborales,
conciliación, etc.

Os recomiendo que reviséis todas las que queráis, y que las uséis a lo largo de vues-
tra vida académica y profesional, dado que si bien es una operación con decisiones
cuestionables es una fuente sólida y estable muy importante, que nos permite reali-
zar comparativas europeas e internacionales. Aun así, los documentos que os hemos
indicado son suficientes para ilustrar el módulo.

Al mismo tiempo, podéis disponer de los datos en varios formatos: por un lado, podéis
generar vosotros mismos resultados mediante la página del INE, pedir a este que os
los genere, lo que supone un coste económico, o disponer de las matrices de datos
para haceros vosotros mismos los resultados. Aprenderemos más sobre lo que es una
matriz de datos en el apartado 6 de este módulo, aunque hay que advertir que usar
estas matrices requiere cierto conocimiento tanto informático como estadístico.

Caso�2.�Estudio�“Les�condicions�laborals�dels�professionals�de�la�dansa�a�Cata-
lunya”�(2009)

Este estudio no es de estadística oficial ni de carácter académico. Se trata de una in-


vestigación a demanda del sector de la danza por medio de una asociación no lucra-
tiva de profesionales. La investigación se llevó a cabo en 2009, y la dirigió la autora
de este módulo, de modo que es un caso que nos puede ayudar a ejemplificar las
decisiones que un equipo de investigación aplicada toma para caracterizar cómo son
las condiciones laborales de un colectivo, pequeño y oculto, en un contexto de difícil
delimitación como es la danza y como es Cataluña.

Podéis descargar el informe de la investigación, tanto en formato abstract como en


formato íntegro en la web de la Associació de Professionals de la Dança de Catalunya.

Actualmente, siguiendo la ruta: Recursos y documentación estudios y diagnósticos

Además de este informe os entregamos como material adjunto el cuestionario y una


matriz de datos de la encuesta. No se trata de la matriz de datos completa, sino de una
© FUOC • PID_00227026 17 Técnicas de recogida de datos cuantitativos: la encuesta

selección de variables, suficiente para ejemplificar los ejercicios estadísticos básicos


del apartado 6. La matriz se entrega en formato Excel y SPSS.

Actividad

Ahora que tenéis una visión de los principios y usos de las principales técnicas cualita-
tivas y cuantitativas, os recomendamos hacer el ejercicio de diseñar un procedimiento
metodológico multiestratégico, combinando metodología cualitativa y cuantitativa, pa-
ra dar respuesta a vuestros interrogantes de estudio.
© FUOC • PID_00227026 18 Técnicas de recogida de datos cuantitativos: la encuesta

2. Revisión literatura y conceptualización

2.1. Temas y conceptos

En cuanto que la asignatura centra su interés en las técnicas, no dedicaremos


demasiado tiempo a este apartado, si bien es uno de los ejercicios que más
determina el resto de las decisiones, más valor tiene a la hora de valorar la
calidad de la investigación académica y más se puede cuestionar en la revisión
crítica de esta. Es también una de las competencias que hay que interiorizar
en formación superior. Hay que dominar: la busca de literatura, la elección, su
análisis y el trabajo sistemático con ella, incluida la citación correcta.

Partiendo de que ya hemos realizado la ardua tarea de elegir un tema y aco- Ved también
tarlo mínimamente, es el turno de documentarnos sobre él para definir qué
Para ahondar en esta fase os
estudiaremos. Este paso para determinar el estado del arte o de la cuestión recomendamos los materiales
cumple muchas funciones de las que hay que destacar la función de precisar elaborados por Santana Leit-
ner (2012). Concretamente los
el�problema�de�investigación�construyendo�así�algo�abarcable�y�cognosci- módulos “El disseny de la re-
cerca” y “Marc teòric i disseny
ble. Buscaremos por lo tanto artículos académicos, libros y otras publicaciones empíric”.
que se relacionen con nuestro tema y ámbito.

Esta presentación no varía de manera relevante de cualquier otra pauta de in-


vestigación que se os pueda indicar tanto en asignaturas sustantivas como en
metodologías no cuantitativas. Ahora bien, en�metodología�cuantitativa,�y
lógicamente�en�investigación�por�encuesta,�existen�algunas�particularida-
des que hay que destacar:

Por un lado, en esta revisión pondremos especial�atención�a�cómo�se�ha�pro-


ducido� la� información,� especialmente� la� información� cuantitativa: qué
diseños (experimento, encuesta, etc.), qué muestras, qué cuestionarios, qué
tipo de análisis estadístico, qué accesibilidad a los datos existen (solo en la
publicación, la matriz de datos está disponible). Con el�doble�objetivo de de-
terminar si nos interesa el procedimiento y lo queremos replicar totalmente
o en parte, y así poder establecer comparabilidad con aquella operación; y
determinar hasta qué punto es conveniente usar los datos producidos en estas
investigaciones u operaciones en nuestra investigación:

Es exactamente la función que tiene la revisión de la EPA (caso 1 propuesto).


Si revisamos análisis elaborados a partir de esta fuente, podemos determinar
si queremos establecer comparativas con ella. Este es el ejercicio hecho en el
caso 2, no solo con la EPA sino también con otras fuentes, como la Encuesta
de condiciones de vida, para buscar formular preguntas iguales o similares
© FUOC • PID_00227026 19 Técnicas de recogida de datos cuantitativos: la encuesta

y poder compararlas con estas. A su vez, como hemos comentado, muchos


investigadores utilizan esta operación para contextualizar sus estudios o para
producir resultados y contrastar sus hipótesis.

Una segunda particularidad consiste en que el proceso de operativización u


operacionalización debe ser lo más completo posible. Hacer operativo un con-
cepto consiste en traducirlo al lenguaje empírico, asignar variables que podre-
mos medir para poder observar empíricamente, y medir con especificidad lo
que es un constructo teórico.

Hay que diferenciar básicamente 3 etapas: conceptualización, dimensionali-


zación y operacionalización. Seguimos un ejemplo de cada etapa:

Tabla 1. Ejemplo de operativización

Tarea Ejemplo/comentarios

1. Conceptualización (variable)

¿Qué entendemos por condiciones laborales? Revisión de distintos textos. Copia de una defi-
nición o integración de varias definiciones en
una nueva.
Quedan excluidas otras maneras de entender
el concepto.

2. Dimensionalización

¿Qué subcomponentes tiene el concepto? Si revisamos rápidamente el índice del docu-


mento, podríamos establecer las siguientes di-
mensiones de las condiciones laborales:
1.1. Situación laboral
1.2. Condiciones laborales
1.3. Paro
1.4. Lesiones
1.5. Jubilación
El resto de la información es para caracteriza-
ción, análisis y opinión, no forma parte direc-
tamente del concepto de condiciones labora-
les.

3. Operacionalización: indicadores (variable)

¿Cómo medimos cada componente? Ponemos un ejemplo en las condiciones labo-


rales
1.1. Situación laboral
Indicador 1.1.1. Relación con la actividad
Indicador 1.1.2. Situación laboral
1.2. Condiciones laborales 2008-2009
Subdimensión 1. Situación laboral y número
de proyectos
Indicador 1.2.1. Relación con la actividad
Indicador 1.2.2. Número de proyectos
Indicador 1.2.3. Media de proyectos
Indicador 1.2.4. Tipo de proyectos según rela-
ción con la danza o no.
Así podríamos seguir reconstruyendo la opera-
tivización de cada concepto del estudio.

Fuente: Elaboración propia a partir de la publicación de Martínez Melo (2011): Estudi Condicions Laborals dels professionals de
la dansa de Catalunya. Associació de professionals de la dansa de Catalunya.
© FUOC • PID_00227026 20 Técnicas de recogida de datos cuantitativos: la encuesta

Este procedimiento es esencial para poder construir el cuestionario, dado que


para cada indicador o variable habrá que formular al menos una o tantas pre-
guntas como consideremos.

Tanto la EPA como el caso 2 no están acompañados de marco teórico que po-
sicione la investigación en una determinada mirada al mercado laboral, ni que
defina los conceptos y los referencien. Ahora bien, la EPA tiene otros muchos
documentos que la acompañan y el trabajo de muchos investigadores para
armonizar conceptos y medidas a nivel europeo. Será uno de los aspectos que
se trabajarán en el módulo siguiente.

Actividad

A partir del cuestionario de la EPA y del cuestionario sobre las condiciones laborales de
los profesionales de la danza, podríais reconstruir la operativización de los conceptos.
Además, esta construcción os permitirá determinar: ¿qué se han incluido y qué no?, ¿a
qué definición corresponden? En el apartado de definiciones de la EPA también encon-
traréis pistas sobre cómo se concibe cada aspecto que hay que medir.

La propuesta de actividad que os proponemos es un ejercicio inductivo (de có-


mo se mide a qué se ha querido medir), pero antes, el equipo de investigación
ha hecho el camino contrario, de la teoría a la medida. Como investigadores
e investigadoras este será el proceso para llegar a poder hacer una encuesta.

Pero ahora mismo, podríais valorar por ejemplo la propuesta del caso 2: en
vuestra opinión, ¿qué queda fuera?, ¿en la medida de la relación con la activi-
dad hay algo que os extrañe? En el caso 1, ¿dónde queda el trabajo doméstico?,
¿y la formación no formal?

Bien, en este momento podemos tener una visión más afinada de por qué es
una técnica estandarizada. Unos conceptos claros y excluyentes, con fragmen-
tación de diferentes aspectos y con medidas específicas que habrá que formu-
lar.

Como podéis observar en la tabla, aparece la�palabra�variable�en�más�de�un


momento�o�etapa. Al final del módulo, en el bloque 6 se resumen estas acep-
ciones de la misma palabra. En el momento que estamos trabajando a menudo
haremos uso de la palabra variable como fenómeno que se ha de estudiar que
toma diferentes formas: existen diferentes condiciones laborales, incluso las
dimensiones pueden usar este nombre. La segunda acepción en cuanto que
indicador o medida de este que son las posibilidades de cada subdimensión
o del concepto.

Son muchos los artículos y documentos que os facilitan operativizaciones de fenómenos


y conceptos como por ejemplo pobreza, desigualdad, capital social, vulnerabilidad, ex-
clusión. No tendréis ningún problema para localizarlos. El trabajo es elegir y construir el
propio esquema, sin el que no podemos avanzar en el diseño de encuesta.
© FUOC • PID_00227026 21 Técnicas de recogida de datos cuantitativos: la encuesta

Recopilando, las dimensiones son los factores o componentes del concepto


que responde a cómo hemos realizado el marco teórico y busca bibliográfica.
Deben responder a los objetivos de la investigación y ser independientes entre
sí, forzar la separación de aspectos y elementos, buscando poder alcanzar en
todo lo posible los conceptos que se han de medir.

Los indicadores que deben dar cuenta de cada dimensión y por lo tanto de los
conceptos se constituyen en las referencias observables que también preten-
den dar cuenta de la máxima riqueza del concepto con el mínimo de informa-
ción, haciendo valer el principio de parsimonia. Aun así, hay que tener pre-
sente que por mucho que intentemos alcanzar el máximo de los conceptos, la
investigación en sí y la operativización son un proceso de elección y renuncia.

“Por muchas dimensiones que se consideren, nunca puede abarcarse la totalidad de un


concepto” (Cea de Ancona, 1996).

2.2. Poblaciones e informantes

Un segundo ejercicio en la conceptualización que no podemos obviar es que


hay que determinar qué�poblaciones�formarán�parte�del�estudio�y�cómo�se
definen. Para entender a qué nos referimos podemos echar un vistazo al ma-
nual del INE en el que nos facilitan estas definiciones. Una primera limitación
de la población queda clara cuando indica que la EPA estudia la población que
reside en viviendas familiares principales.

A partir de aquí se desgranan las diferentes limitaciones e implicaciones de las


decisiones sobre a quiénes se estudia y a quiénes no.

En el caso 2, observaremos que una de las primeras declaraciones iniciales es la


dificultad de definir qué significa ser profesional de la danza, la multiplicidad
y simultaneidad de las profesiones en el mundo de la danza y las imprecisiones
que hay que admitir a la hora de determinar qué quiere decir “en Cataluña
–ser nacido o no, estar trabajando en el momento del estudio o no–, en un
mercado caracterizado por la diversidad y temporalidad de situaciones perso-
nales y laborales”.

Una última cuestión que hay que tener presente es la divergencia�entre�las


poblaciones�que�hay�que�estudiar�y�las�poblaciones�informantes. Un ejem-
plo de estas situaciones es cuando pretendemos estudiar los hábitos de los ni-
ños y la interrogación la realizaremos a sus padres. O cuando para conocer las
condiciones de trabajo de los trabajadores interrogamos a los representantes
de organizaciones.
© FUOC • PID_00227026 22 Técnicas de recogida de datos cuantitativos: la encuesta

En estos casos, hay que definir y delimitar ambas poblaciones y definir sobre
cuál realizaremos el procedimiento de muestreo, es decir, cuál responderá la
encuesta. Esta situación no es la más frecuente pero hay que tenerla en cuenta
por las repercusiones que tendrá en el diseño muestral y también del cuestio-
nario.

En resumen, esta etapa clave que condiciona el resto de las decisiones consiste
en hacer un esfuerzo de reducción de la complejidad y de fragmentación, en
definitiva, de adelgazamiento (Anduiza y otros, 2009), asumido que los volú-
menes y las magnitudes son relevantes a pesar de la consecuente pérdida de
textura.

Figura 2. Figuración del proceso de operativización

Fuente: Elaboración propia.


© FUOC • PID_00227026 23 Técnicas de recogida de datos cuantitativos: la encuesta

3. Diseño del cuestionario

Una vez disponemos de una operativización procedemos a pensar cómo con-


seguiremos la información y cómo formularemos las preguntas. Sin embargo,
es habitual que muchos equipos noveles empiecen precisamente por las pre-
guntas, lo que es un gran error dado que sin una definición que determine qué
queremos medir las preguntas son ideas arbitrarias, más o menos acertadas,
pero con poca coherencia. Igualmente, no es infrecuente que los encargos em-
piecen con la indicación de cómo se debe realizar el trabajo de campo: “que-
remos hacer una encuesta en línea” es la frase de moda en los últimos años.

Pasemos, pues, a mostrar los pasos que aseguran que avanzaremos con correc- Ved también
ción.
Para ampliar el estudio sobre
diseño de cuestionario, os re-
3.1. Tipos de encuestas comendamos el módulo ela-
borado por Meneses (2012),
concretamente el módulo “El
cuestionario”.
Una de las decisiones consiste en cómo�abordar�a�los�encuestados. Aunque
no hemos estudiado el tipo de muestreo que realizaremos –lo haremos en el si-
guiente punto–, sabemos que tarde o temprano tocará determinar cómo�con-
tactamos con ellos. Empecemos sintetizando las tres�grandes�familias de en-
cuestas según cómo�organizamos�el�trabajo�de�campo.

Tabla 2. Principales tipos de encuesta

Tipo Principales subtipos

Personal • Face to face


• Hall-test
• En el hogar
• En el punto en el que se produce el fenó-
meno (en el punto de venta, en la puerta
de la escuela, en la oficina. etc.)

Si usamos soporte informático (tableta, PDA,


etc.), se utiliza el término CAPI (computer assis-
ted personal interview)

Telefónica CATI (computer assisted telephone interview)

Autoadministrada • Correo
• En línea

Fuente: Elaboración propia.


© FUOC • PID_00227026 24 Técnicas de recogida de datos cuantitativos: la encuesta

Sobra que decir que existen muchos y variados diseños y soluciones en cada Contenido
subtipo, combinación de tipo y subtipo, y que el desarrollo de la encuesta complementario

en línea ha generado una amplia literatura sobre este procedimiento y básica- Como veis, volvemos a usar la
mente sobre los inconvenientes de varias soluciones poco rigurosas. palabra procedimiento, de ma-
nera que encontraréis que a
menudo también se denomi-
na esta decisión como método
No obstante, antes pasaremos a detallar las ventajas e inconvenientes princi- de�encuestación.
pales de cada gran familia.

1)�Encuesta�personal

Se caracteriza generalmente por conseguir un mayor�nivel�de�respuesta, es


decir, de cada contacto que hacemos conseguimos que nos respondan más ca-
sos. La presencia del encuestador ayuda a adaptar�la�interrogación�a�la�per-
sona�entrevistada; se accede a mayor�diversidad�de�encuestados, dado que
no solo se limita a aquellos con teléfono o internet o que se sienten cómodos
con estos canales de diálogo. Así se recomienda en caso de tener�que�acceder
a�colectivos�minoritarios�o�de�difícil�acceso. Permite en mayor grado que
otros procedimientos el uso�de�material�de�ayuda (observación, apoyo a la
persona entrevistada, como por ejemplo fichas de escalas, fotografías, etc.) y
también es más flexible�para�combinar�con�otras�técnicas (entrevistas au-
toadministradas, fichas de observación, etc.). La presencia de un encuestador
permite también tener mayor�control�sobre�el�contexto de la entrevista (in-
fluencia de terceras personas, valoración del comportamiento del entrevista-
do, etc.) y recabar información�aneja. Hay que valorar hasta qué punto es el
único procedimiento posible, por ejemplo en el caso de que las personas en-
cuestadas presenten dificultades de habla, escucha o atención, o para hacerse
con información no verbal.

Huelga decir que también tiene inconvenientes, seguramente el más evidente


es el mayor�coste�económico�del�trabajo�de�campo y el mayor coste tempo-
ral. En general, distribuir a personas encuestadoras en el territorio implica más
tiempo y dinero. A su vez, el equipo�de�entrevistadores�es�menos�supervisa-
ble que si están todos en una sala de teléfonos, por ejemplo. Por lo tanto, hay
que poner mayor énfasis a la hora de asegurar que el equipo de encuesta realiza
las encuestas y el contacto con los entrevistados tal y como hemos diseñado
y que reporta los errores que se puedan dar.

2)�Encuesta�telefónica

La encuesta telefónica supuso una revolución en España a partir de los años


setenta con la consolidación y generalización del teléfono en el hogar. Se vio
así una vía clara de economizar el gasto de desplazamiento, localización y
tiempo que suponía la encuesta personal. A este tipo de procedimiento se le
atribuye por lo tanto mayor�rapidez, mayor�facilidad�de�gestión del proceso
y menor�coste. Otras ventajas son menos generalizables en comparación es-
pecialmente a la encuesta personal. Así, se destaca que hacer las encuestas por
teléfono facilita acceder�a�muestras con elevado nivel de ocupación o menor
© FUOC • PID_00227026 25 Técnicas de recogida de datos cuantitativos: la encuesta

disponibilidad de tiempo. El hecho que de no tener una entrevista cara a cara


fomenta hasta cierto punto mayores�niveles de sinceridad, y el hecho de te-
ner el equipo de encuestación generalmente en un espacio controlado implica
una mayor�supervisión�del�trabajo�de�campo y menor error en esta etapa.
En relación con la encuesta postal tradicional, también se obtenía mayor�tasa
de�respuesta.

Como inconvenientes generales, se considera que la encuesta telefónica supo-


ne mayor limitación�de�la�duración�de�los�cuestionarios, y se recomienda
un máximo de 15 minutos de conversación, si bien el inconveniente más evi-
dente es que solo se puede aplicar a personas�que�dispongan�de�teléfono.
Dificulta también el uso de material�auxiliar y la recogida�de�información
adicional en el cuestionario.

3)�Encuesta�autoadministrada

Una encuesta autoadministrada es aquella en la que el encuestado responde


por sí mismo el cuestionario, sin la interrogación del encuestador. La opción
por la encuesta autoadministrada está vinculada en general a dos factores: dar
flexibilidad�a�la�persona�encuestada�para�participar en la investigación y
poder acceder a poblaciones� con� mayores� limitaciones� de� participación.
Así, con relación al primer aspecto, permite participar sin limitación de hora-
rio y se puede responder el formulario en varios momentos, lo que facilita el
pedir información compleja que requiere elaboración. En la misma línea, la
segunda cuestión nos indica que es un buen procedimiento si queremos ac-
ceder por ejemplo a cargos que tienen poco tiempo o tiempos fragmentados,
o que deben facilitarnos información que no se puede responder espontánea-
mente. En general, suele ser el procedimiento con menor�coste: no hay equi-
po de encuestación, no hay que desplazarse, etc., y específicamente al formato
en�línea también se le atribuye mayor�rapidez de respuesta.

Son muchas y variadas las limitaciones de este procedimiento en el que no hay


encuestación activa (quién formula y se asegura de que se dan respuestas cohe-
rentes). En primer lugar, como se ha comentado antes, tradicionalmente se le
atribuye una baja�tasa�de�participación�o�respuesta (Díaz de Rada, 2010), y
las dificultades que implica el control�de�la�muestra (que responda quien debe
responder y ningún otro, que no haya repeticiones, etc.) y es complicado con-
trolar la influencia�de�segundas�personas. Resulta complicado�usar�mate-
rial�de�apoyo�y�refuerzo, y hay que pensar hasta qué punto se dispone de una
base�de�datos�o�listado de potenciales participantes (lo que denominaremos
más adelante marco de muestreo) que nos asegure una correcta cobertura de
la población que vamos a encuestar. Sea como fuere, en línea o postal, existen
importantes limitaciones� en� el� perfil� del� entrevistado: niveles formativos
bajos, personas con limitaciones de tiempos o capacidades, etc. Especialmente
en la encuesta en línea existen claras limitaciones�en�la�duración�del�cues-
tionario cuando se trata de población general, de modo que encuestas largas
de cinco o más minutos o demasiado planas provocan cansancio y abandono.
© FUOC • PID_00227026 26 Técnicas de recogida de datos cuantitativos: la encuesta

Con relación al cuestionario, este necesitará un mayor�esfuerzo�de�elabora-


ción dado que no se dispondrá de un encuestador que pueda ayudar a hacer
comprender las preguntas y las formas de responder, y específicamente en la
encuesta postal, donde no�se�puede�controlar�el�orden�de�respuesta y por lo
tanto tampoco de la provocación del discurso, lo que impide garantizar que
todos los entrevistados hayan recibido el mismo estímulo.

Actividad

Revisad la documentación facilitada sobre los caso 1 y 2. ¿Qué procedimiento de encues-


tación se ha llevado a cabo en cada caso? ¿Consideráis que es el más adecuado? ¿Qué
efectos positivos o negativos puede haber tenido en el logro de una muestra de calidad?

De nuevo, hay que remarcar que muchas investigaciones optan por lo que
denominamos encuestación�multimétodo, es decir, combinar varios proce-
dimientos para acceder a perfiles diferentes. Así, ante la constatación de que
cada vez son más las personas y los hogares que disponen como única fuente
de contacto de teléfono móvil, se combinan encuestas personales y telefónicas
(generalmente mediante teléfono fijo). O bien, encuesta en línea y telefónica.

Hay que valorar cuándo la decisión que tomamos puede intervenir de mane-
ra determinante en la composición de la muestra que queremos conseguir.
Por ejemplo, ¿si optamos por una encuesta telefónica llegaremos a una buena
muestra de jóvenes o de personas inmigradas? ¿Si decidimos hacer encuesta
autoadministrada en línea, qué perfil no podrá participar? ¿Qué relevancia
tiene este sesgo?

Actividad

Si estáis diseñando una investigación por encuesta, ¿cuál sería vuestra opción? Hay que
argumentar las ventajas e inconvenientes esperados. Y, al finalizar, valorar el efecto que
nuestra elección haya podido tener en la calidad de la muestra conseguida.

Ved también

El interés por la encuesta en línea que seduce por su bajo coste requiere repensar sus
ventajas e inconvenientes. Os pueden ayudar en esta tarea las lecturas de Couper (2000
y 2005) y de Díaz de Rada (2012) que encontraréis citadas en la bibliografía.

3.2. Definición, funciones y grandes tipos

3.2.1. Definición y funciones

Un cuestionario es el soporte para recoger/provocar la información. También


se conoce como formulario, pero hay que evitar denominarlo encuesta (aun-
que en inglés se refieran también como survey optaremos por el término más
preciso questionnaire). No solo se utiliza en investigación por encuesta, sino
que como hemos dicho se utiliza en otros procedimientos: los tests, la obser-
vación, y como no son esenciales para todos los registros.
© FUOC • PID_00227026 27 Técnicas de recogida de datos cuantitativos: la encuesta

La particularidad en investigación por encuesta es que este formulario no es


solo un apoyo de registro, sino que hay que entenderlo como herramienta
de� interrogación� y� diálogo con un informante. Por ello en ocasiones nos
referimos a un número de entrevistas válidas o hablamos del encuestado como
el entrevistado.

Su diseño se ve influenciado por todas las decisiones previas del modelo de


investigación, pero principalmente por el tipo de encuesta que se ha de rea-
lizar: personal, autoadministrada y telefónica, y por las características del in-
formante: nivel formativo, origen, disponibilidad de tiempo, etc.

De manera esquemática, las funciones atribuibles al cuestionario son las si-


guientes:

1) Registrar la información.

2) Estructurar la entrevista determinando un orden.

3) Homogeneizar el impacto: todas las unidades son interrogadas del mismo


modo y sobre los mismos temas, con la misma formulación (este punto puede
ser relativamente flexible).

Elaboramos el cuestionario con el objetivo de:

1) Traducir dimensiones e indicadores en preguntas.

2) Producir la información con calidad: diseño, estructura, ordenación y as-


pecto formal contribuyen eficazmente a que las personas proporcionen buena
información.

3) Homogeneizar la obtención de información y minimizar el error de respues-


ta, que las preguntas se respondan en:

a) el mismo orden;

b) el mismo nivel (lenguaje, complejidad, opciones, etc.);

c) la misma forma, y

d) las mismas condiciones.

Como podemos ver, damos un paso todavía más firme en la estandarización


del proceso y en la rigidez que caracteriza la metodología cuantitativa. Hay que
pensar también que la forma que adquiere el cuestionario, específicamente la
formulación de preguntas, es determinante en el tratamiento posterior de los
datos, tal y como estudiaremos en el apartado 6 de este módulo.
© FUOC • PID_00227026 28 Técnicas de recogida de datos cuantitativos: la encuesta

A pesar de las recomendaciones que haremos a partir de ahora sobre tipos, Nota
formulación y orden, lo cierto es que la mejor manera de aprender y tener
Los enlaces que facilitamos
opciones y alternativas para el investigador novel es revisando cuestionarios. son válidos a fecha de junio de
Actualmente, este procedimiento es muy sencillo, dado que la mayor parte 2015.

de las fuentes ofrecen los formularios utilizados. Ya habéis visitado la web del
INE y habéis revisado los formularios de los casos 1 y 2. En el INE podéis
consultar otros muchos cuestionarios, como también os ofrecen el Centro de
Investigaciones Sociológicas, el Instituto de Estadística de Cataluña o el Centro
de Estudios de Opinión.

3.2.2. Tipos

Los cuestionarios se suelen clasificar básicamente en tres tipos según la inten-


sidad en su estructuración:

1)�Estructurado

Todas las preguntas y posibles respuestas están formalizadas y estandarizadas


en su totalidad, siguiendo siempre un orden idéntico. Es el caso claramente
de los tests.

2)�Semiestructurado

Existe un guion y un orden, pero contiene diferentes tipos de preguntas más


o menos estandarizadas y cerradas. También es el caso de cuestionarios en los
que se puede permitir variaciones del orden y enunciado de las preguntas.

3)�No�estructurados

En los que se presentan preguntas abiertas sobre temas y en los que puede
variar tanto el orden como la formulación. Estos tipos de cuestionarios son
infrecuentes en investigación cuantitativa, dado que son formas muy similares
a las entrevistas y violentan las finalidades de estandarización.

De este modo, la gran mayoría de los cuestionarios que encontraréis serán


semiestructurados. Las siguientes indicaciones sobre orden y formulación de
preguntas os ayudarán a entender en mayor medida cómo se introducen estos
elementos de flexibilidad.

Otra consideración en este punto es el tipo de apoyo que utilizaremos para


llevar a cabo el formulario.

1)�Soporte�informatizado

Existen muchas herramientas tecnológicas para informatizar un cuestionario,


desde Googleforms a Acrobat, pasando por las aplicaciones de empresas espe-
cializadas. Optar por un formulario informatizado nos ayudará a tener una
© FUOC • PID_00227026 29 Técnicas de recogida de datos cuantitativos: la encuesta

mayor rapidez�de�tratamiento�de�datos, nos facilitará el control�de�los�per-


files�participantes en el cuestionario (lo que denominaremos control de cuo-
tas a partir de los puntos 4 y 5), y nos dará mayores�posibilidades�de�perso-
nalización (filtros, registros lingüísticos, idiomas, etc.). Ahora bien, hay que
aprender�a�usar�los�softwares�y�las�aplicaciones y en caso de proyectos para
empresas o instituciones hay que disponer de las infraestructuras necesarias
para poderlos usar: ordenadores, tabletas, etc. Este hecho hace que a menudo
se externalice este proceso para reducir el coste que supone disponer del per-
sonal necesario para el diseño y uso de los softwares.

2)�Soporte�papel

La segunda opción más intuitiva es usar un formulario en papel. También exis-


ten softwares especializados para esta función, si bien es muy habitual dise-
ñarlos en cualquier procesador de textos. Lógicamente, diseñar un cuestiona-
rio en papel es más económico, aunque hay que tener siempre presentes los
gastos de impresión y grabación de datos. En encuestas personales, un papel
suele intervenir�menos�en�la�interacción con la persona encuestada que un
ordenador, pero usar papel implica siempre o casi siempre el trabajo posterior
de informatización: grabar�los�datos. Esta tarea tiene un coste económico y
de tiempo que debemos considerar, pero también es una de las grandes fuen-
tes�de�error. Nos obliga, por lo tanto, a esforzarnos mucho en el diseño del
cuestionario para facilitar las tareas posteriores.

3.3. El orden de las preguntas

Es difícil disponer de una directriz clara sobre el orden en el que deben ser
formuladas las preguntas en un cuestionario, dado que se trata de una conver-
sación sobre varios temas en el contexto de una investigación y por lo tanto
la pertinencia del orden puede tener soluciones diferentes. De este modo, el
orden de las preguntas está al servicio de los objetivos y la metodología del
estudio.

Hay que tener presente que el objetivo del orden es, generalmente, conseguir
que las preguntas�fluyan�en�un�orden�natural�y�se�produzca�una�conver-
sación. Aun así, el diseño puede romper este objetivo buscando� un� deter-
minado�efecto o función. Es el caso por ejemplo de las encuestas electorales
(preguntar o no al principio por simpatía por los partidos o por intención de
voto) o de las encuestas sobre conocimientos y usos (por ejemplo en el uso
de lenguas), y específicamente de los tests, en los que el orden cumple una
estratégica metodológica.

Os podemos hacer las siguientes recomendaciones generales, y podéis revisar


el formulario del caso 2:
© FUOC • PID_00227026 30 Técnicas de recogida de datos cuantitativos: la encuesta

1) Introducción (objetivos, motivos de colaboración, anonimato de respues-


tas).

2) Preguntas filtro: que clasifican al entrevistado en candidato o no a la en-


cuesta o que dirigen al entrevistado a una parte concreta de cuestionario o a
un idioma, formulación, etc.

3) Preguntas iniciales: empezar la encuesta con preguntas sencillas es intere-


sante y ayudará a involucrar al encuestado en el tema.

4) Preguntas complejas o delicadas: es recomendable ubicarlas en mitad del


cuestionario.

5) Preguntas de descompresión al final poco antes de llegar al final del cues-


tionario.

6) Finalizar con las preguntas clasificatorias (nivel de estudios, actividad prin-


cipal, ingresos) al final del cuestionario. Esta estrategia se puede realizar siem-
pre que estos aspectos no sean un filtro u objeto directo de la operativización
conceptual.

7) Por último, agradecer la colaboración y ofrecer la posibilidad de añadir ob-


servaciones o comentarios. Pasar al resto de los trámites si procede.

Figura3. Propuesta de esquema de orden en el diseño de un cuestionario

Fuente: Elaboración propia.

Otras recomendaciones con relación al orden de las preguntas que pueden ser
útiles para iniciarse en esta tarea son las siguientes: agrupar las preguntas o
cuestiones afines, es decir, tratar un tema una sola vez; empezar por las pre-
guntas generales y seguir con las específicas, contextualizar los cambios de te-
mas con textos que incentiven al encuestado a no desconectar de la conver-
sación; agrupar las preguntas de formato similar: escalas similares juntas por
ejemplo, de modo que si tenemos varias preguntas con escala de respuesta
(ejemplo de 0 a 10, o de 1 a 5) las agrupamos dentro de lo posible por bloques;
en el caso de tener muchas formulaciones similares, seccionar el cuestionario
en partes rompiendo con preguntas sencillas para variar el ritmo de la entre-
vista. Finalmente, fuera de la conversación, el cuestionario puede incluir pre-
© FUOC • PID_00227026 31 Técnicas de recogida de datos cuantitativos: la encuesta

guntas de observación al entrevistador, en el caso de la encuesta presencial,


pero también en la encuesta telefónica, por ejemplo para evaluar la sinceridad
del entrevistado, describir y valorar el contexto de la entrevista, etc.

3.4. Formulaciones

Finalmente, llegamos a ofreceros un abanico de posibilidades de formulación


de peso, preguntas de un cuestionario con ejemplos que os ayudarán a visua-
lizarlas. Os recomendamos tener a mano los cuestionarios de los casos 1 y 2.

La clasificación tradicional de las formulaciones de preguntas en cuestionarios


se realiza a partir de tres criterios: el grado de libertad, el nivel de premedita-
ción de las respuestas y el número de respuestas admitidas. Podéis observar las
diferentes formas que adquieren en la siguiente tabla:

Tabla 3. Tipos de formulaciones de preguntas

Nivel de clasificación Tipo y subtipos

1. Grado de libertad 1.1. Preguntas abiertas


1.2. Preguntas cerradas
1.2.1. Dicotómicas
1.2.2. Politómicas
1.2.2.1. Escalares u ordinales
1.2.2.2. No escalares
1.3. Preguntas semiabiertas

2. Premeditación de las respuestas 2.1. Espontánea


2.2. Sugerida

3. Número de respuestas admitidas 3.1. Simple


3.2. Múltiple

Fuente: Elaboración propia.

Adicionalmente encontraremos clasificaciones que identifican las formulacio-


nes según si se trata de preguntas introductorias, filtro, de control, de com-
portamientos, de opiniones, valorativas, descriptivas, etc. Aun así, en general
se trata de clasificaciones que se centran más en la función u objetivos del in-
vestigador con cada pregunta que en su redacción. Por lo tanto, una pregunta
será valorativa o de actitud, de filtro o descriptiva, en función del uso que la
investigación le haya otorgado.

Por otro lado, hay que tener presente que todas estas preguntas, ya sean las
que queramos usar de filtro, para clasificar los encuestados, para controlar la
entrevista o la muestra, etc., es posible que no estén incluidas en la operativi-
zación de conceptos que se ha realizado al principio de la investigación. Por lo
tanto, ahora toca incluirlas en nuestro esquema para poder realizar un buen
cuestionario.

Actividad

Si estáis avanzando en el diseño del cuestionario, es el momento de completar la operati-


vización con el resto de los indicadores que darán pie a los filtros, controles y descripcio-
© FUOC • PID_00227026 32 Técnicas de recogida de datos cuantitativos: la encuesta

nes. En el apartado dedicado a muestreo y trabajo de campo (puntos 4 y 5) obtendremos


también necesidades de información que habrá que incluir en el formulario.

3.4.1. Grado de libertad

Se clasifican las preguntas según si el encuestado dispondrá o no de las opcio-


nes de respuesta y si estas serán únicas o podrá añadir alguna.

1)�Preguntas�abiertas

Ejemplo caso 2

P90. Según su opinión, ¿cómo describiría las condiciones laborales de los/las profesiona-
les de la danza? [LITERAL, MÚLTIPLE]

______________________

______________________

______________________

En el caso de la encuesta telefónica o presencial, también sería una pregunta


abierta si en vez de tener las opciones de respuesta para el registro literal, dis-
pusiéramos de un listado de posibles respuestas pero el encuestado no lo pu-
diera ver. En este caso, a pesar de las opciones preestablecidas, la formulación
es abierta y el registro no.

Esta formulación tiene la ventaja de dar total libertad�al�encuestado para ex-


presarse con sus palabras, que serán registradas literalmente o no en función
de si tenemos o queremos utilizar un listado de posibles respuestas o no. Por
lo tanto, en la clasificación según la premeditación de las respuestas las pre-
guntas abiertas son exclusivamente�espontáneas. Son fáciles�de�formular, y
con ellas podemos conseguir cierta�riqueza�de�discurso�y�vocabulario, pero
en ningún caso pueden ser sustitutivas de la investigación cualitativa, dado
que el contexto estandarizado de una encuesta no promueve otros factores
de flexibilidad y espontaneidad. Se recomiendan especialmente en el caso de
investigaciones exploratorias, cuando el equipo de investigación no siente la
confianza de cerrar las posibilidades de respuesta. Sin embargo, implican algu-
nas complicaciones importantes. De�registro�de�respuestas: dado que escri-
bir literalmente respuestas es complicado y sintetizarlas en la rapidez de una
conversación o asignarlas a respuestas preestablecidas también. De� análisis
estadístico: no son números, habrá que clasificar y codificar las respuestas tal
y como estudiaremos en el apartado 5. Estas formulaciones suelen dar pie a
preguntas excesivamente difusas y amplias que implican un porcentaje alto de
no respuesta o de respuesta imprecisa. Preguntas del tipo: ¿qué es para usted
la cultura? o ¿qué políticas educativas pondría en marcha? suelen sufrir estos
problemas.

2)�Preguntas�cerradas
© FUOC • PID_00227026 33 Técnicas de recogida de datos cuantitativos: la encuesta

Son aquellas en las que el encuestado tiene un abanico de posibilidades para


elegir. Generalmente se le sugieren y ha de elegir.

a)�Dicotómicas

Ejemplo caso 2

P75. ¿Da por finalizada su formación de base?

Sí, me considero un/a profesional 1

No, me considero estudiante 2

Solo dos opciones de respuesta.

Cuando formulamos preguntas cerradas, las opciones�de�respuesta�suelen�ser


claras�y�definidas, y esta es�la�principal�dificultad en su diseño, obtener pre-
codificaciones, opciones de respuesta claras�y�excluyentes. Como veremos en
el apartado 6, se trata de un tipo de formulación que limita el�análisis�estadís-
tico. Específicamente en el caso de las preguntas dicotómicas es complicado
proponer solo dos opciones. Por ejemplo: ¿qué pasa en esta pregunta con las
opciones no lo sabe o no contesta?

b)�Politómicas

Más de dos opciones de respuesta.

Escalares�u�ordinales

Ejemplo caso 2

P7. [P6 = 1]: ¿Me podría indicar cuánto dinero cobra cada mes de su pensión de jubilación
(descontando impuestos y otras deducciones)?

Menos de 150 eu- 0 De 1.501 a 1.800 9


ros/mes euros/mes

De 151 a 300 eu- 1 De 1.801 a 2.400 10


ros/mes euros/mes

De 301 a 450 eu- 2 De 2.401 a 3.000 11


ros/mes euros/mes

De 451 a 600 eu- 3 De 3.001 a 3.600 12


ros/mes euros/mes

De 601 a 750 eu- 4 De 3.601 a 4.200 13


ros/mes euros/mes

De 751 a 900 eu- 5 De 4.201 a 4.800 14


ros/mes euros/mes

De 901 a 1.050 eu- 6 Más de 4.800 eu- 15


ros/mes ros/mes
© FUOC • PID_00227026 34 Técnicas de recogida de datos cuantitativos: la encuesta

De 1.051 a 1.200 7 (no leer) Nc 99


euros/mes

De 1.201 a 1.500 8
euros/mes

Ejemplo�caso�2

P93. Y personalmente, ¿considera que su situación y condiciones laborales son? [LEER,


SOLO UNA RESPUESTA]

Bastante mejores que la mayoría de los profesionales 1


de la danza

Mejores que la mayoría de los profesionales de la dan- 2


za

Iguales que la mayoría de los profesionales de la danza 3

Peores que la mayoría de los profesionales de la danza 4

Bastante peores que la mayoría de los profesionales de 5


la danza

(no leer) Nc 99

Las opciones de respuesta tienen un orden�o�gradación. Sobre la clasificación


de las variables y sus implicaciones en el análisis ahondaremos bastante en el
apartado 6 del módulo. Aun así, hay que tener presente que la formulación�de
escalas es una de las obsesiones de quienes construimos cuestionarios, y por
lo tanto dedicaremos un breve espacio al final del presente apartado a algunas
informaciones relevantes.

No�escalares

Ejemplo caso 2

P71. De las posibilidades siguientes, ¿cuál refleja mejor su situación actual? [LEER, SIM-
PLE]

Me dedico exclusivamente a la actividad artística (dan- 1


za u otras)

Compagino la actividad artística (danza u otras) y do- 2


cencia

Compagino la actividad artística (danza u otras) con 3


otras actividades diferentes a la docencia

No me dedico a la actividad artística (danza u otras), 4


me dedico a otros actividades profesionales

No me dedico a ninguna actividad puesto que estoy 5


inactivo (jubilado, etc.)

(no leer) Nc 99
© FUOC • PID_00227026 35 Técnicas de recogida de datos cuantitativos: la encuesta

Las opciones no�tienen�un�orden,�solo�son�opciones�diferentes.

3)�Preguntas�semiabiertas

Ejemplo caso 2

P6. [P5 = 2, 3 o 4]: Actualmente, ¿qué pensiones o ayudas del estado u otras administra-
ciones percibe? Puede marcar más de una. [NO LEER, MÚLTIPLE]

Pensión de jubilación (contributiva) 1

Ayudas complementarias a la viudedad 2

Ayuda a la alimentación 3

Pensión de viudedad 4

Otras prestaciones o ayudas (anotar)


__________________________
__________________________

No recibe ninguna pensión o ayuda 97

(no leer) NC 99

[LAS OPCIONES DE 2 A 99 PASAR A P14]

Son iguales que en el caso anterior pero además existe�una�opción�abierta


de�respuesta.

Tanto las preguntas cerradas como las semiabiertas permiten una mayor rapi-
dez�de�registro de las respuestas que las abiertas y, en general, son rápidas�de
analizar. Además de la ya mencionada limitación de análisis y la dificultad
para construir opciones de respuesta precisas y excluyentes, hay que tener pre-
sente que no�se�recomiendan�las�precodificaciones�largas, como máximo
de 5 a 7 opciones, dado que más opciones generan desatención de la encuesta
en las últimas opciones. Las dificultades para reducir el rango de respuestas
obliga a menudo a convertirlas en preguntas semiabiertas, dando la opción
al entrevistado de añadir respuestas, o bien a rotar las opciones de respuesta
de manera que a cada encuestado se le ofrezcan en un orden diferente para
intentar evitar así el efecto orden.

Específicamente para las preguntas semiabiertas hay que valorar si el hecho


de dar la opción a otras permite recoger con mayor exactitud la opinión del
entrevistado o, por el contrario, distorsiona las opciones de respuesta. En cual-
quier caso, si se decide ofrecer la opción a otras hay que hacerlo a todos los
entrevistados para que todo el mundo reciba el mismo impacto.

3.4.2. Premeditación de las respuestas

Se refiere a si ofrecemos las opciones de respuesta o no.


© FUOC • PID_00227026 36 Técnicas de recogida de datos cuantitativos: la encuesta

1)�Espontánea

En este caso no�ofrecemos�las�opciones: formulamos la pregunta y esperamos


la respuesta de la persona encuestada. Podemos usar el mismo ejemplo que en
el caso de las preguntas abiertas.

No ofrecer respuestas implica limitar la influencia del encuestador y mejora


la obtención de los conjuntos de referencia de los encuestados. Imaginemos
que en vez de preguntar abiertamente “¿Cómo describiría las condiciones la-
borales de los/las profesionales de la danza?” y dejar a la persona encuestada
expresarse, le damos un listado limitado de opciones, limitando también las
opciones de pensamiento del encuestado. Como inconvenientes principales
hay que tener presente que pueden generar gran cantidad y diversidad de res-
puestas que a continuación habrá que tratar, codificar, y que en algunos casos
es un ejercicio similar al análisis de datos cualitativos.

2)�Sugerida

El ejemplo ya dado como pregunta de escala (P93) es un caso de pregunta


sugerida. En las indicaciones al encuestado se le pide leer� las� opciones, de
manera que este tendrá estas�para�elegir.

Dar las opciones de respuesta ayuda� a� la� memoria� de� los� entrevistados� y
facilita�y�agiliza�la�conversación. Hay que prever si con este objeto, en el
caso de la encuesta presencial, la persona participante requiere material de
apoyo como el que presentamos en la imagen siguiente. Lógicamente limitar
las opciones de respuesta implica rigidez en la conversación, y como se ha
comentado en el apartado anterior existe un límite en el número de opciones
de respuesta.

Figura 4. Ejemplo de material de apoyo para responder a una escala de satisfacción

Fuente: Elaboración propia.

3.4.3. Número de respuestas admitidas

Una última caracterización de las formulaciones es en función de si permiti-


mos o pedimos a la persona encuestada que dé una o más respuestas.

1)�Simple
© FUOC • PID_00227026 37 Técnicas de recogida de datos cuantitativos: la encuesta

Solo permitiremos una respuesta. Son la formulación más frecuente. Podemos


poner atención a las preguntas dadas en los apartados anteriores: P7 y P93.
Observamos que en la segunda opción indica “Solo una respuesta” a los en-
cuestados.

Hay que prever la�dificultad�de�simplificar�a�una�sola�respuesta, y la�ne-


cesidad�de�control�de�la�lectura�de�las�opciones de respuesta. Como se ha
indicado, dentro de lo posible hay que considerar rotar lectura de las opciones
para evitar el efecto orden de la exposición.

2)�Múltiple

En este caso pediremos o permitiremos que la persona encuestada dé más de


una opción. La pregunta dada como ejemplo P90, como veréis, indica “múl-
tiple”. Ofrecer la posibilidad de dar más de una respuesta fomentará obtener
una imagen más completa de sus características y opiniones, teniendo mayor
precisión. Sin embargo, estas formulaciones implican mayores dificultades de
codificación, de tabulación y de análisis de datos.

Como se ha comentado, supera los objetivos de este módulo ahondar en las


formulaciones de escala, pero nos detendremos en dar algunas indicaciones
generales. Las escalas son instrumentos de medida que quieren dar respues-
ta�a�fenómenos�complejos�con�precisión, como por ejemplo sentimientos,
actitudes, creencias, opiniones, etc. Son así las formulaciones más habituales
para�crear�indicadores�e�índices.

Las escalas tienen el objetivo de identificar la intensidad�y�dirección de la


medida. Permiten medir fenómenos�inconscientes o que no se verbalizan y
en general son instrumentos validados�por�diferentes�disciplinas (principal-
mente econometría y psicometría). Ahora bien, hay que tener presente que
construir escalas, lejos de ser un proceso intuitivo, implica importantes difi-
cultades y requiere un proceso de validación complejo y largo. Hay que ase-
gurarse de las condiciones de su uso: qué información obtendremos y cómo
la trataremos, hasta qué punto existe adecuación entre la escala y el objeto
de medida con validez y fiabilidad. A continuación se presenta un listado de
posibles encuestas sin abordar ninguna de ellas con detalle.

Básicas�(de�Stevens)

1) Nominal

2) Ordinal

3) De intervalo

4) De razón (ratio)
© FUOC • PID_00227026 38 Técnicas de recogida de datos cuantitativos: la encuesta

Comparativas

5) Comparaciones emparejadas

6) De clasificación

7) De suma constante

8) De Guttman

9) De clases o similitudes

10) De protocolos verbales

No�comparativas

11) De clasificación continúa

12) Likert

13) Diferencial semántico

14) Stapel

15) Thurstone

Llega el momento, pues, de ponerse manos a la obra para elegir qué formula-
ción tendrá cada uno de los indicadores de nuestro modelo de operativización.
Algunas recomendaciones�generales al encarar esta tarea pasan por procurar
una redacción en lenguaje claro y un vocabulario adecuado a la población en-
trevistada. Entre la población general hay que evitar los tecnicismos; entre la
población específica se aconseja explicarlos para asegurar el mutuo entendi-
miento. Hay que evitar enunciados o frases con formulación negativa, enun-
ciados largos, un exceso de preguntas tipo examen y que estas no resulten ex-
cesivamente abstractas o filosóficas. Las preguntas pueden ser contextualiza-
das para mejorar la comprensión de la persona entrevistada y hay que evitar
siempre que se pueda redactar en una sola pregunta dos cuestiones o indica-
dores.

Dentro de lo posible, no formularemos preguntas que obligan a respuestas po-


co aceptadas socialmente, o que implican responder según comportamientos
íntimos, procurando que el enunciado de la pregunta no influya en la respues-
ta y controlando la deseabilidad social: diseños y formulaciones que incluyen
preguntas de control, contraste o provocación que eviten la respuesta políti-
camente correcta. También limitaremos la aquiescencia: cuestionarios que por
orden o formulación de preguntas invitan a dar determinadas respuestas.
© FUOC • PID_00227026 39 Técnicas de recogida de datos cuantitativos: la encuesta

Este es uno de los elementos de discusión tradicional con relación a muchas


encuestas. Hay que tener presente que en ningún caso es posible evitar la ma-
nipulación de la interrogación, dado que como hemos explicado los concep-
tos, su medida y su formulación son decisión del equipo de investigación,
que mantendrá una relación asimétrica con el encuestado y generalmente una
conversación unidireccional. Lógicamente, a pesar de estos condicionantes
propios de la metodología y de la técnica existen niveles sostenibles y con
mayor corrección en su argumentación y otros más débiles o claramente in-
correctos.

Validación

La validación de escalas y de cuestionarios es un aspecto clave para su utilización. Sin


embargo, a menudo hacen referencia a sistemas o modelos, y no a preguntas aisladas. El
proceso es largo y puede resultar metodológicamente complicado y costoso, además de
analíticamente complejo. Los ejercicios en este sentido tienen por objetivo determinar
y ampliar los niveles de validez, es decir, el grado en que la definición se ajusta al con-
cepto: nos preguntaremos por la validez de contenido, de constructo, convergente y dis-
criminante, concurrente y predictiva. También valoraremos la fiabilidad de las medidas,
especialmente de escala, con tests estadísticos y con procedimientos de test y retest. Los
procedimientos mencionados suponen un trabajo avanzado en diseño de cuestionarios,
motivo por el que os invitamos a trabajar en otras etapas de vuestra formación o carrera.
Aun así, una de las estrategias más sencillas es el test o prueba piloto del cuestionario y/
o de los sistemas de escalas, sobre los que daremos algunas pautas a continuación.

Variable

De nuevo, aunque menos frecuentemente, encontraremos que en la redacción del cues-


tionario usamos la palabra variable. Sin embargo, en esta etapa nos referimos a las pre-
guntas que usamos para medir los indicadores de nuestro modelo teórico operativizado.

3.5. Pretest o prueba piloto

Llegados a este punto de nuestra investigación, y a pesar de la emoción que


puede suponer querer empezar cuanto antes mejor a hacer encuestas y obtener
resultados, hay que hacer una parada más. Una vez que disponemos de una
primera versión del cuestionario preparada para hacer el trabajo de campo
(podéis ver el apartado 5), hay que realizar una serie de pruebas previas para
validarlo mínimamente, es decir, para depurar errores y mejorar el diseño. Los
objetivos esenciales son estos:

1) Validar el contenido de las preguntas: adecuación, pertenencia, ¿son bas-


tante exhaustivas?

2) Validar la formulación de las preguntas: lenguaje, tipo de pregunta, catego-


rías de respuesta.

3) Validar el contenido.

4) Validar el orden de discurso provocado.

5) Validar el sistema de recogida/provocación de la información: necesidad de


material de apoyo.
© FUOC • PID_00227026 40 Técnicas de recogida de datos cuantitativos: la encuesta

6) Validar el formato del formulario: utilidad para los diferentes usuarios (en-
trevistadores o entrevistados, grabadores, depuradores, codificadores, etc.).
¿Pueden leerlo, registrar las respuestas, grabar los datos ágilmente y con pocos
errores?

Con esta finalidad podemos proceder de diferentes maneras, es decir, dispone-


mos de varios métodos. Por un lado, podemos contar con la revisión de otros
expertos en diseños de cuestionarios, así como de los propios encuestadores y
de los responsables de trabajo de campo si contamos con un equipo especiali-
zado y con experiencia. Un segundo ejercicio consiste en cuadrar las preguntas
con los objetivos del estudio, asegurándonos de que están todos cubiertos y
de que no hay redundancias innecesarias. Finalmente, es recomendable dise-
ñar un plan de análisis, tal y como os explicamos en el apartado 5, que nos
permita reflexionar sobre los diferentes usos de cada pregunta y determinar
qué nos sobra y qué nos falta, y qué formulaciones permiten o no hacer lo
que deseamos. Por ejemplo, imaginemos que pensamos analizar si el salario
de las personas con doctorado es diferente al de las personas con grado uni-
versitario pero no hemos incluido esta diferenciación en nuestra codificación.
O que no sabemos qué hacer con la pregunta sobre la situación civil, dado
que en realidad si las personas están casadas, divorciadas o solteras no forma
parte de ninguno de los objetivos de la investigación ni sirve para controlar
la calidad muestral.

Finalmente, el ejercicio clave es el pilotaje del cuestionario, que consiste en


hacer una prueba de cómo funciona este en contextos lo más reales posible.
Así, si estamos realizando una encuesta al personal de la Administración públi-
ca trataremos de probarlo antes de ponerlo en marcha, y si estamos haciendo
encuestas a personal directivo de empresas internacionales con sede en Barce-
lona... ¿qué podemos hacer? Para diseñar una prueba piloto existen recomen-
daciones más o menos estrictas en cuanto al número de encuestas que hay
que hacer, si se pueden o no incluir en la muestra final, el perfil del encuesta-
dor, etc. Encontraremos quien nos reclama hacer como mínimo 100 encuestas
en una muestra lo más parecida posible a la muestra diseñada para escala de
100 encuestas, realizar todas las tareas que os enseñaremos a continuación y
validar el conjunto de procesos antes de empezar el trabajo de campo real. Y
así, e incluso más, es como se realiza en estadística oficial y en operaciones
complejas.

Ahora bien, estos tipos de pilotajes no siempre son viables en otros contextos.
Como os proponíamos, en el segundo ejemplo acceder a personas con altos
cargos de empresas internacionales es un ejercicio bastante complicado como
para hacerlo “de prueba” en 100 ocasiones. Hay que encontrar alternativas y
no renunciar a hacer la prueba piloto o pretest del cuestionario, puesto que
una vez llegados a este punto del diseño de cuestionarios probablemente no
seréis capaces de ver errores de funcionamiento importantes que pueden afec-
tar a todo el proceso. Recordemos que se trata de una etapa sin retorno, dado
© FUOC • PID_00227026 41 Técnicas de recogida de datos cuantitativos: la encuesta

que una vez enviadas, y más hechas ya las encuestas, los errores tienen difícil
enmienda. Optaremos pues por muestras pequeñas de casos concretos que nos
ayuden a probar cada decisión.

3.6. Resumen y recomendaciones generales

Recordemos brevemente cómo hemos llegado a este punto, en el que dispo-


nemos de una de las piezas fundamentales para sacar adelante nuestra inves-
tigación. Hemos empezado haciendo una investigación de la literatura sobre
nuestros conceptos y decidiendo cómo medirlos de acuerdo también con los
objetivos que queremos lograr. A partir del proceso de operativización para
cada indicador hemos redactado una o varias preguntas que serán las que fi-
nalmente van a producir la información. Preguntas que se adecuan al proce-
dimiento de trabajo de campo y al registro de las personas que se van a en-
cuestar. Hemos realizado una prueba piloto más o menos completa que nos
permite afirmar que el formulario elaborado es útil y produce la información
de manera controlada y estandarizada. Hemos elaborado, y lo hemos consi-
derado, materiales complementarios para encuestadores y encuestados, como
por ejemplo instrucciones, fichas de respuesta, etc., y hemos concretado los
sistemas de control y supervisión que emplearemos durante la etapa de traba-
jo de campo.

Por lo tanto, podemos realizar una última revisión y asegurarnos de que todas
las preguntas están numeradas de manera excluyente, que las opciones de res-
puesta de cada pregunta también, que las preguntas que filtran otras están cla-
ramente identificadas para todas las opciones posibles, que las preguntas tie-
nen identificadas claramente las condiciones para su ejecución: espontánea,
sugerida, simple o múltiple, así como las posibilidades de respuesta, rotación,
etc., y que el personal entrevistador las puede usar sin perturbar la lectura del
cuestionario.

Actividad

Podemos revisar el formulario del caso 2. Encontramos indicados los filtros de las pre-
guntas y las condiciones para formularlas. Hagamos lo mismo en el caso del cuestionario
1. ¿Si adoptamos el rol de encuestador sabríamos cómo utilizar los cuestionarios?

Hay que tener presente que la calidad en el diseño de un cuestionario puede ser
juzgada desde varios ángulos, y con mayor o menor componente académico
y estadístico. Hagamos memoria de los conceptos de validez y fiabilidad. Aun
así, un cuestionario será de mejor calidad si hemos realizado un buen traba-
jo bibliográfico y repasado investigaciones con encuesta y/o con cuestionario
para observar cómo otros han tomado decisiones similares, si usamos formu-
laciones estandarizadas (nivel de estudios, situación laboral, formas de convi-
vencia, etc.), y si hemos realizado un trabajo suficientemente intenso sobre
cómo medir actitudes, comportamientos y opiniones, o si deseamos usar esca-
las. En este sentido, podemos usar instrumentos creados por otros equipos que
estén validados si justificamos su pertinencia (tests, sistemas de escala, etc.).
© FUOC • PID_00227026 42 Técnicas de recogida de datos cuantitativos: la encuesta

Por lo tanto, podemos proceder a la producción sistemática y estructurada de


información.

De manera simplificada, entenderemos por medida fiable la que se produce con precisión,
sin sesgos y es consistente. La variabilidad que podemos observar en la medida no es
atribuible al instrumento de medida ni a su ejecución. Una medida válida es aquella
que mide realmente lo que queremos medir, existe coherencia entre el concepto y la
medida, y complementariedad entre las diferentes medidas del concepto. En el diseño del
cuestionario estas dos dimensiones clave pueden ser argumentativas (literatura, expertos,
etc.) pero en cuanto a técnica cuantitativa también podremos tener medidas de validez
y fiabilidad estadística.
© FUOC • PID_00227026 43 Técnicas de recogida de datos cuantitativos: la encuesta

4. Diseño muestral

4.1. Conceptos clave

La decisión sobre cómo de grande será nuestra muestra, qué características


debe tener y cómo seleccionar cada unidad es una de las etapas que mayores
retos implica en la elaboración de una encuesta. Hay que recordar que en la
gran mayoría de los casos realizamos una encuesta con un objetivo estadístico
inferencial, es decir, con el fin de poder atribuir al total de nuestra población
las características de la muestra. Iniciamos así el momento en el que hay que
acercarse un poco al menos a la estadística como rama de conocimiento que
hace de puente entre las matemáticas y las ciencias sociales.

Sin embargo, antes es necesario que resumamos los grandes conceptos que
hay que tener claros en un muestreo.

1) Universo o población

2) Muestra

3) Equilibrio de la muestra

4) Error no muestral

5) Tipo de muestreo

6) Error muestral

7) Nivel de confianza

8) Grado de homogeneidad

9) Determinación del tamaño de la muestra

Podemos estudiar todos estos conceptos con mucho detalle, así como sus ínti-
mas interacciones y las razones estadísticas de estas (teoremas, modelos, etc.).
Sin embargo, en este módulo nos limitaremos a comprender la idea clave y lo
que supone en nuestra decisión.

En primer lugar, nuestro universo�de�estudio�o�población es el conjunto�de


casos�e�individuos�de�interés para la investigación. En la definición de los ob-
jetivos y proceso de operativización, así como en el diseño del cuestionario, ya
hemos pensado a quién va dirigida la encuesta. Ahora toca escribir claramente
© FUOC • PID_00227026 44 Técnicas de recogida de datos cuantitativos: la encuesta

quiénes�son�y�qué�características tienen. Además, de todas estas característi-


cas de las que tenemos�información�cuantitativa: cuántos son, cuántos son
de un tipo o de otro, etc. Delimitaremos claramente quién es población en
estudio y quién no. Tal como nos informa el documento sobre muestreo de la
EPA que os hemos facilitado. Así, por ejemplo, ¿qué quiere decir empresas ca-
talanas o empresas pequeñas y medianas?, ¿qué características deben cumplir?
Cuanto más sepamos de nuestra población y más datos cuantitativos tenga-
mos, en mejores condiciones estaremos para diseñar nuestra muestra.

La muestra es una parte de�la�población�o�universo. Una unidad�muestral


es cada caso de la muestra y una submuestra es una parte de la muestra. Así,
por ejemplo, en el caso 2 en estudio cada persona encuestada es una unidad
muestral y existe una submuestra encuestada por teléfono y una submuestra
encuestada en línea. Cuando deseamos un muestreo con criterio�estadístico
lo que pretendemos es que la muestra sea de tamaño�proporcionado�o�sufi-
ciente,�sin�distorsión�o�sesgo en la selección, que nos permita�realizar�aná-
lisis�estadístico�y�contraste�de�hipótesis y, en definitiva, que sea represen-
tativa, que permita realizar hipótesis de generalización con un nivel de error
aceptable. Esta noción de representatividad se construye a partir de todos los
componentes del diseño muestral, y no es fruto de un solo criterio o medida.

El equilibrio�de�la�muestra hace referencia a hasta�qué�punto�nuestra�mues-


tra� se� asemeja� al� universo� de� estudio. En el momento del diseño debere-
mos determinar�con�qué�características�o�variables�lo�valoraremos. Así, por
ejemplo, podemos querer hacer una encuesta en España, como la EPA, y de-
beremos asegurarnos de que cada comunidad autónoma está bien representa-
da por ejemplo según su peso demográfico. No puede ser que Cataluña tenga
más muestra que Andalucía o que no haya ninguna muestra de Asturias, ¿ver-
dad? En estos casos pensaríamos que es una muestra desequilibrada y que no
representa bien la realidad española. Cuando seleccionemos y dispongamos
de la muestra final tendremos que hacer lo mismo, comprobar que hemos
conseguido este equilibrio. En este sentido, uno de los debates más intensos
en metodología de encuestas se centra en las diferencias que puede haber en
función de si hacemos la encuesta personal, telefónica u en línea.

Existe además el error�no�muestral, también denominado error�sistemático,


es decir, cualquier error que se produce en�el�proceso�de�diseño y ejecución�de
la�encuesta, hasta el análisis y redacción de los resultados. Podemos destacar
las principales fuentes de error sistemático: de�respuesta�y�administrativo. El
error de�respuesta es cualquier error en el proceso�de�diseño�e�implementa-
ción�del�cuestionario: no conseguir acceder a la muestra inicial, dejar casos
fuera por dificultades por ejemplo de comprensión, recursos para acceder a
ella, etc. También la falta de adecuación entre pregunta e indicador, errores
de orden y filtro en el cuestionario y errores que se producen en la adminis-
tración del cuestionario: inadecuación entre entrevistado-entrevistador, ocul-
tación, evitación de respuestas extremas, etc. Así, por ejemplo, imaginemos
que queremos hacer una encuesta sobre la actividad económica sumergida en
© FUOC • PID_00227026 45 Técnicas de recogida de datos cuantitativos: la encuesta

nuestro municipio y nos presentamos como encuestadores de Hacienda. El


error administrativo es todo aquel que se produce en la tramitación�de�los
datos: grabación, depuración, codificación, etc., tareas que abordaremos en
el apartado 5.

Seguramente, una de las decisiones más importantes es el tipo�de�muestreo


que usaremos, y la principal distinción consiste en si realizaremos un mues-
treo probabilístico�o�no�probabilístico. Esencialmente, el muestreo�proba-
bilístico es aquel en el que deseamos�aplicar�las�leyes�y�conocimientos�de
estadística�inferencial, y por lo tanto hay que asegurar el cumplimiento de
unas mínimas�condiciones. Muy específicamente: todos los elementos de la
población deben tener alguna posibilidad de ser seleccionados (probabilidad
diferente de 0); la selección de los casos se hará mediante sistemas aleatorios o
de azar; el sistema de selección debe permitir controlar los errores o desviacio-
nes entre las características poblacionales y las muestrales, y disponemos de
un marco de muestreo, es decir, algún censo o listado bastante completo del
universo de estudio (censo, listado telefónico, base de datos de empresas, etc.).

Son muchos los procedimientos para realizar un muestreo probabilístico: Ved también
muestreo aleatorio simple, aleatorio sistemático, estratificado, por conglome-
Sobre muestreo y sobre esta-
rados, por ruta aleatoria, etc. Y en general los diseños son una combinación dística, os recomendamos los
de varios procedimientos en varias etapas, de manera que es común que los materiales de la UOC elabora-
dos por Greenacre (2012). Es-
denominemos muestreo polietápico. Para ahondar en los diferentes procedi- tadística I.

mientos, os derivamos a la bibliografía, ya que su estudio excede nuestros ob-


jetivos. Ahora bien, podemos indicar que un muestreo aleatorio simple impli-
ca un sorteo de casos, que un procedimiento sistemático implica el estableci-
miento de un sistema, por ejemplo en las encuestas a pie de calle seleccionar
uno de cada tres peatones, o que el muestreo estratificado implica estratificar
la muestra primero (hacer subapartados a partir de variables, separar hombres
y mujeres, diferenciar por territorios, o combinaciones de variables) que se
muestrearán de manera separada. Así, este es el caso de la EPA, que indica que
se trata de un muestreo bietápico estratificado. Los criterios de estratificación
se explican en el documento sobre muestreo. A su vez, en el caso 2 el muestreo
es aleatorio simple, dado que al disponer de un listado de socios se seleccio-
naron al azar.

También existe el muestreo�no�probabilístico, es decir, aquel que no�preten-


de�respetar�las�leyes�y�modelos�de�la�probabilidad y que por lo tanto basa-
rá los procedimientos�de�selección�y�los�argumentos�sobre�la�calidad�de
la�muestra�en�criterios�sustantivos�no�matemáticos. Estos tipos de proce-
dimientos también se utilizan en investigación cuantitativa y nos permiten
conseguir muestras sobre la información cuantitativa. Ahora bien, no�pode-
mos�calcular�los�errores que comentamos y que a menudo dificultan�las�po-
sibilidades de comparar nuestros resultados con modelos de distribución que
permitan contrastar�hipótesis. Muchos de estos procedimientos son similares
o idénticos a los procedimientos en investigación cualitativa. Es el caso del
muestreo por conveniencia, de juicio o por criterio, cuotas o por bola de nieve.
© FUOC • PID_00227026 46 Técnicas de recogida de datos cuantitativos: la encuesta

Todos ellos comparten el hecho de que los elementos del universo no tienen
una probabilidad conocida de pertenecer a la muestra, y no existe aleatorie-
dad, o esta es muy débil en su selección. Al no poder establecer los criterios
probabilísticos de error y confianza, ni cumplir supuestos mínimos, no pode-
mos valorar las desviaciones de los resultados y, por lo tanto, las estimaciones
no pueden generalizarse estadísticamente a la totalidad de la población. Puede
haber una generalización argumentada pero no estadística.

4.2. Muestreo probabilístico: confianza, error y tamaño de la


muestra

Llegados a este punto, si hemos elegido realizar una encuesta con un mues-
treo probabilístico, necesitamos algunos conceptos relevantes de la estadísti-
ca. Todos son probabilidades y cantidades y están interrelacionados, y por lo
tanto pueden ser escritos en una fórmula. En ningún caso nos dedicaremos al
aspecto formal de la estadística ni al estudio de los modelos y teoremas que
nos permiten hacer estos supuestos y cálculos, pero sí necesitamos entender
la idea que hay detrás de cada componente y cómo se relaciona con el resto.

Por error�muestral o margen�de�error entendemos el grado�de�exactitud�o


precisión que estamos dispuestos a aceptar en la lectura de los resultados fina-
les. Como hemos dicho, se determina a partir del tamaño del universo (cuán-
tas unidades hay en la población), el tamaño de la muestra (cuántas unidades
hay en la muestra), el nivel de confianza (o intervalo de confianza) y el nivel
de dispersión de las respuestas. Así, por ejemplo, cuando en una muestra, por
ejemplo en el caso 2, afirmamos que nuestros datos, en general, son ±5,87%
para los datos globales, querrá decir que si en nuestra muestra el 83,1% decla-
ra ser nacido en España, en la realidad este porcentaje podría variar entre el
77,23 y el 88,97%, este es nuestro intervalo de confianza del dato de la mues-
tra: 83,1% ± 5,87%. Así, nuestro error será más pequeño cuanta más muestra
tengamos. De hecho, los errores se calculan para cada uno de los datos obser-
vados en la muestra. Así es como los equipos estadísticos trabajan. Este valor
es un indicador global de error que nos ayuda a calcular una muestra inicial,
y valorarla, pero una vez dispusiéramos de la muestra final, podríamos calcu-
lar todos los errores. Observemos en el documento de la EPA el detalle de los
errores de muestreo. En general, el margen de error máximo que querremos
aceptar será del ±5%.

Pero para calcularlo necesitamos saber el resto de los componentes.

El nivel de confianza se refiere a la probabilidad�de�obtener�el�valor�pobla-


cional�a�partir�de�la�muestra, su grado de certeza o validez. Así, cuando afir-
mamos en el caso 2 que nuestra muestra nos permite tener un grado de error
global ±5,87% para los datos globales, para un nivel de confianza de 95,5%,
estamos afirmando que este error será así en el 95,5% de los casos, pero que
existe un 4,5% de los casos de nuestra población que probablemente no cum-
plan las características que observamos en la muestra. Así, en la muestra del
© FUOC • PID_00227026 47 Técnicas de recogida de datos cuantitativos: la encuesta

caso 2 este 4,5% de los casos podría hacer variar la estimación según la cual
entre el 77,23 y el 88,97% de los profesionales de la danza en Cataluña ha na-
cido en España. Cuanta mayor confianza queramos tener sobre nuestros datos,
y conseguir representar el máximo de población posible, incluidos los valores
más extremos, más muestra necesitaremos. El nivel de confianza mínimo que
querremos aceptar es del 95%.

Otro componente del muestreo probabilístico es el grado�de�homogeneidad


de los fenómenos que queremos estudiar, también denominado nivel�de�dis-
persión de la distribución de una variable en el universo. Así, si sabemos que
un fenómeno es muy homogéneo, necesitaremos menos muestra que si sabe-
mos que un fenómeno es muy heterogéneo. Pongamos un ejemplo didáctico.
Si en un aula todo el mundo ha sacado un 5, con poca muestra que hagamos
seguro que encontramos casos que representen el parámetro. Ahora bien, si en
una aula las notas tienen mucha dispersión, son muy heterogéneas, van de 2 a
9 por ejemplo, hará falta más muestra para asegurarnos de que en mi muestra
está representado el máximo de situaciones posible. Si conocemos este dato
podemos usarlo, pero generalmente cuando hagamos encuestas no sabemos
cuál es la distribución de nuestras medidas. No sabemos cuánto tiempo están
los profesionales de la danza en paro, o cuántos de ellos tienen cobertura de
paro, por lo tanto trabajamos con la máxima incertidumbre posible, es decir,
bajo el criterio de máxima indeterminación, que se expresa: p = 1-p (o q) =
50%, o bien p = q = 50. Es decir, desconozco qué distribución tienen los pará-
metros que quiero valorar.

Dado que ya conocemos qué significa cada uno de los componentes del mues-
treo probabilístico, podemos proceder a calcular o bien el tamaño de la mues-
tra o bien el error muestral.

Observaremos que las muestras que ofrecemos a continuación son diferentes


en función de si son para poblaciones�finitas�o�infinitas. Una población fi-
nita significa una población pequeña. Cuanto más pequeña sea la población,
más muestra necesitaremos. Al contrario, cuanto mayor sea la población. Pon-
gamos otro ejemplo extremo y típico para ilustrar esta idea. Si tenemos un
aula formada por diez personas, prácticamente deberemos hablar con todo el
mundo para asegurarnos de que en mi muestra hay una buena representación
de la población; incluir o no cada caso puede hacer variar mucho el resultado
de la muestra. Ahora bien, mi muestra son todos los estudiantes de Cataluña, y
a partir de determinado número de encuestas, por mucho que incluyamos una
nueva, no variará el resultado de manera relevante. La aportación marginal de
cada caso al resultado total es poco relevante. Una simplificación estadística
consiste en asumir que los universos son infinitos a partir de 100.000 casos,
y que son finitos si están por debajo de esa cantidad. Así, disponemos de dos
fórmulas diferenciadas según este criterio, dado que las relaciones entre los
© FUOC • PID_00227026 48 Técnicas de recogida de datos cuantitativos: la encuesta

diferentes componentes del muestreo son diferentes estadísticamente y, como


vemos en el caso de las muestras para universos infinitos, el valor de la pobla-
ción desaparece, deja de ser relevante.

Cálculo�del�tamaño�muestral

Universos infinitos:

Universos finitos:

Donde:

n = muestra

z = confianza con la que queremos trabajar

e = error que queremos cometer

p = nivel de indeterminación de los parámetros que debemos valorar

Lógicamente, para entender el porqué de estas fórmulas y las relaciones que se establecen
hay que ahondar en las propiedades de la distribución normal, el teorema del límite
central y otros argumentos matemáticos que no son objeto de este módulo. Además, es
necesario que tengamos presente que estas formulaciones son una simplificación y que,
como podemos ver en el documento de la EPA, las fórmulas se deben desarrollar a medida
de cada dato u operación, incluyendo los modelos ajustados. Esto es trabajo generalmente
de la estadística. Aun así, con la información facilitada hasta ahora es suficiente.

En estos momentos estamos decidiendo qué tamaño muestral necesitamos, Contenido


pero podríamos transformar estas fórmulas para dar respuesta a otras pregun- complementario

tas del tipo: ya tengo una muestra, ¿cuál es el error que comentamos?, ¿cuál es Uno de los supuestos acepta-
el intervalo de confianza de nuestros datos?, ¿con qué confianza trabajamos?, dos, más un consenso que no
algo validable estadísticamen-
¿cómo de probables son nuestros resultados? Dependiendo del momento de te, es que cuando no tenemos
información sobre cuántas uni-
la investigación en el que estemos o el rol que tengamos en ella, será una u dades forman nuestra pobla-
ción en estudio, utilizamos las
otra nuestra pregunta. Sea como fuere, es importante destacar que necesita- formulaciones para universos
mos información sobre los componentes de la fórmula, o bien hacer supues- infinitos.

tos. Así, supongamos que queremos reducir el error, ¿cuánta más muestra ne-
cesitaremos?, y si queremos ampliar la confianza, ¿cuánta más muestra nece-
sitaremos?
© FUOC • PID_00227026 49 Técnicas de recogida de datos cuantitativos: la encuesta

4.3. Estructurar y estratificar una muestra

Una última cuestión esencial, por la importancia que tiene el muestreo en


ciencias sociales, es la estructuración y estratificación del muestreo. Como he-
mos estudiado al principio del apartado, debemos definir y delimitar el uni-
verso de estudio y decidir qué características o variables son importantes pa-
ra caracterizarlo. En la EPA se nos indica por ejemplo que el territorio es una
característica relevante que hay que tener en cuenta a la hora de obtener una
fotografía precisa y válida de lo que sucede en términos de mercado de trabajo.
Estas variables que son relevantes�para�conocer�cómo�es�una�población se
denominamos variables�estructurales. Algunas variables clásicas son el terri-
torio (identificado con la comunidad autónoma, con el tamaño del munici-
pio, la edad, la nacionalidad, etc.).

Además, una vez decididas cuáles son relevantes, estructurales, deberemos ele- Contenido
gir cuáles usaremos para distribuir nuestra muestra y cómo lo haremos. Estas complementario

variables�que�utilizaremos�para�distribuir�nuestra�muestra son las variables Este punto es seguramente


de�estratificación. Así, cuando la EPA indica que ha estratificado la muestra uno de los más cuestionables
en el diseño muestral de la
según el tamaño del municipio, quiere decir que el tamaño del municipio es EPA. Observad que indica que
se utiliza la caracterización del
una variable bastante importante como para asegurarnos de que en nuestra censo 2001 y que se utilizan
variables.
muestra hay una distribución adecuada de cada tipo de municipio.

Aunque en el caso de la EPA el procedimiento es bastante más complicado,


el método más sencillo para hacer esta distribución es el proporcional, es de-
cir, asegurarnos de que si en nuestro universo el porcentaje de empresas de
servicios es del 70%, en nuestra muestra también. En buena parte de las en-
cuestas que diseñaremos o que revisaremos este será el procedimiento, que es
bastante intuitivo y fácil de calcular. En el caso 2 en estudio, no existe ninguna
distribución inicial de la muestra por estratos, dado que tal y como se indica
en la ficha técnica no hay afijación y toda la muestra se ha conseguido por
muestreo aleatorio simple.

Podemos finalmente retomar la idea según la cual la representatividad de una muestra se


construye a partir de la calidad de los diferentes aspectos estudiados. Así que ¿calidad y
representatividad tendrían una muestra muy elevada pero sesgada, o en ella las preguntas
no hubieran sido entendidas por los encuestados?

4.4. Recomendaciones y ayudas

En resumen, el ejercicio de diseñar una muestra implica varias decisiones: de-


finir el universo de análisis con la máxima precisión, determinar la informa-
ción disponible sobre la población objeto de estudio y las características/va-
riables que se quieren controlar en la muestra, elegir el tipo de muestreo y
determinar el tamaño de la muestra. En el caso de optar por muestreo proba-
bilístico, hay que calcular este tamaño según la confianza y error que estamos
dispuestos a cometer. Si disponemos de un listado o marco de muestreo, habrá
que extraer la muestra y proceder finalmente con el trabajo de campo sobre
el que daremos algunas pautas en el apartado siguiente. El muestreo es uno
© FUOC • PID_00227026 50 Técnicas de recogida de datos cuantitativos: la encuesta

de los retos de una buena investigación cuantitativa, tanto probabilístico co-


mo no probabilístico. Es necesario no olvidar que las primeras condiciones se
defienden con argumentos sustantivos e información de calidad, motivo por
el cual nuestra revisión bibliográfica pondrá atención en las decisiones meto-
dológicas de otras investigaciones y en las definiciones de las poblaciones en
estudio. Es específico de los muestreos probabilísticos las medidas de error y
confianza, para cuya comprensión hay que ahondar en los modelos y teore-
mas de la probabilidad.
© FUOC • PID_00227026 51 Técnicas de recogida de datos cuantitativos: la encuesta

5. Trabajo de campo y pretratamiento de los datos

5.1. El trabajo de campo

Llega el momento de conseguir la muestra. Así, denominamos trabajo� de


campo todas las�acciones que realizamos para localizar a las personas que de-
bemos entrevistar, administrar el cuestionario, comprobar el funcionamien-
to de todo el proceso, elaborar los soportes�para�el�análisis de la información.

Se trata de la etapa de investigación que seguramente más equipos deciden en-


cargar a empresas o equipos especializados. Sin embargo, esta externalización
implica mayor atención si cabe a la calidad del proceso, ya que ¿de qué nos
serviría un excelente cuestionario y una sofisticada muestra, si la producción
de encuestas se hace de manera sesgada? Por lo tanto, es necesario planificar
con mucho detalle el proceso que se quiere seguir y establecer los mecanismos
de control y supervisión necesarios para evitar que la pérdida de control afecte
a la calidad de la información.

Así, son momentos clave en el trabajo de campo la selección de la muestra


determinando el procedimiento de concertación y contacto y los métodos de
sustitución; la selección y formación del equipo de entrevistadores; la super-
visión y validación inicial de la información de los cuestionarios, y el control
del trabajo de campo y la grabación. Estas etapas se pueden considerar trabajo
de campo en sentido estricto.

No obstante, existen otras tareas que están vinculadas a la producción de re-


sultados, como son la depuración y el control de la depuración, el análisis de la
no respuesta, la codificación y su control y el plan de tabulación o análisis, así
como la creación de nuevas variables. Dedicaremos atención exclusivamente
a aclarar las tareas relacionadas con la codificación, depuración y plan de ta-
bulación.

5.2. Depuración

Durante el trabajo de campo, lo más inmediatamente posible a la realización y


recepción del cuestionario, habrá que evaluar la completitud de los cuestio-
narios, es decir, si la información es completa, si se rechaza o no un cuestio-
nario en función de la información que falta. Si se puede deducir o completar
volviendo a contactar con el entrevistado. También, la consistencia de estos,
es decir, la coherencia de las respuestas, resolviendo las incidencias con el en-
trevistado y/o el entrevistador. Lo más frecuente es que existan inconsistencias
lógicas –incongruencia entre respuestas a varias preguntas, conceptuar la res-
puesta que no se adecua al concepto que se interroga– o de administración del
© FUOC • PID_00227026 52 Técnicas de recogida de datos cuantitativos: la encuesta

cuestionario –la formulación de la pregunta no ha sido adecuada o no se ha


seleccionado la muestra adecuadamente. Todas estas tareas se enmarcan en el
proceso de depuración. Como se ha indicado, algunas tienen vías de solución,
pero otras pueden ser difícilmente redirigibles, como por ejemplo detectar en
este punto de la investigación que hay errores en la formulación de preguntas
o categorización de respuestas. Nos damos cuenta por lo tanto de que una en-
cuesta es un proceso rígido, dado que en este momento, excepto que sean las
primeras encuestas y podamos rehacer las nuevas, ya no se puede solventar
un error de operativización.

5.3. Codificación

Durante el trabajo de campo, o al final de este, desarrollaremos si procede las


tareas de codificación. Esta tarea es necesaria cuando nuestro formulario in-
cluye preguntas abiertas o semiabiertas. Así, estos textos�literales que recogen
las respuestas de los encuestados deben que ser clasificados�de�manera�siste-
mática�en�categorías�excluyentes�y�exhaustivas. Será con estos códigos nu-
méricos como se realizará el análisis posterior. Para proceder a la codificación
hay que hacer la grabación de las respuestas literales en soporte digital, si dis-
ponemos de cuestionarios en papel, leer todos los literales, establecer un sis-
tema de categorización o utilizar uno existente, y asignar códigos numéricos a
cada categoría de respuesta, elaborar un listado de códigos, que denominamos
manual de códigos, y controlar y supervisar todo el proceso asegurándonos,
por ejemplo a partir de la revisión de otros, que las respuestas literales han
sido bien asignadas a los códigos numéricos.

Un ejemplo de esta tarea lo podemos observar en la siguiente pregunta del


caso 2:

P35. ¿Cuál era su ocupación en cada actividad? Puede poner más de una ocupación. [NO
LEER, MÚLTIPLE]

Disponemos de una batería de códigos posibles para estas actividades que in-
cluye la posibilidad de “otras”, de modo que la persona encuestada puede des-
cribir su actividad. En todos estos casos deberemos decidir si las actividades se
ajustan a alguno de los códigos ya disponibles, o si necesitamos otras catego-
rías nuevas para aglutinar situaciones no previstas.

En el caso de la pregunta:

P125. ¿Qué actuaciones cree que debería llevar a cabo la Associació de Professionals de
la Dansa de Catalunya para apoyar la profesión de la danza? Por favor, descríbalas. [LI-
TERAL, MÚLTIPLE]

no existe un sistema de códigos previos, de modo que se ha generado a medida


de las respuestas de las personas encuestadas. En la tabla 97 del informe com-
pleto se analizan los resultados y podéis observar el sistema de códigos creado.
© FUOC • PID_00227026 53 Técnicas de recogida de datos cuantitativos: la encuesta

Las decisiones que hay que tomar durante la codificación son relevantes para
el análisis e interpretación de los resultados y requieren conocimientos de la
problemática en estudio. Como se ha comentado en apartados anteriores, el
procedimiento se asimila a los métodos de análisis de la información cualita-
tiva, de modo que los conocimientos que hay que tener de la teoría y objetivos
de la investigación, así como las decisiones que hay que tomar, son bastante
relevantes como para formar parte de las tareas del equipo de investigación.

5.4. Plan de tabulación o análisis

Hace referencia a las tareas de reflexión y documentación sobre qué tipo de


análisis se hará de los datos. Concretamente, es recomendable elaborar un do-
cumento en el que especificaremos el listado de variables que se derivan del
cuestionario y el tratamiento que le queremos dar. De este modo, plantear las
tareas y los objetivos de análisis antes de dar por finalizado el cuestionario nos
ayudará a supervisarlo, es decir, a controlar la falta de preguntas y la elimina-
ción de aquellas superfluas. Si el tipo de análisis buscado es complejo (indica-
dores, clasificación, dimensionalización u otros), hay que tenerlo en cuenta
como parte de la fase de diseño, dado que son objetivos que requieren formu-
laciones específicas para poder realizar los cálculos necesarios. La sistematiza-
ción de este documento también facilita encargar tabulación a una empresa,
entidad o a un equipo con conocimientos de estadística.

A continuación, os ofrecemos un ejemplo de plan de análisis para el caso 2.


Buena parte de la información que se pide en este modelo de documento lo
estudiaremos en el próximo apartado; aun así, se trata de un ejemplo en el que
se plantea la necesidad de calcular la tasa de paro de los profesionales de la
danza en Cataluña y analizar las diferencias que pudieran existir según sexo,
edad y nivel de estudios.

Tabla 4. Ejemplo de plan de tabulación o análisis

Nombre variable Descripción Base Tipo Composición/cálculos

P4 Relación actividad_actual Total Simple Trabajo o busco trabajo o


estudio (activo) - 1
No trabajo, ni estudio, ni
busco trabajo (inactivo) -
2
Cálculos:
Número de casos
% de casos

P8 Relación actividad_actual Total Simple Todos


Cálculos:
Número de casos
% de casos

P8 Relación actividad_actual Activos: p4 = 1 Simple Todos


Cálculos:
Número de casos
% de casos

Fuente: Elaboración propia.


© FUOC • PID_00227026 54 Técnicas de recogida de datos cuantitativos: la encuesta

Nombre variable Descripción Base Tipo Composición/cálculos

Tasa_paro_actual Tasa_paro_actual Activos: p4 = 1 Simple Estoy en el paro: busco


trabajo - 2
Resto
Cálculos:
Número de casos
% de casos

Análisis bivariable:
A. Cruce según
P1_sexo
P2_edad (intervalos)
P3_Nivel de estudios
Cálculos:
Número de casos
% de casos total, fila y columna
2
Test Chi
B. Tasa_paro_actual: Cálculo media de edad (desviación, resumen de los 5 números).
Test T-Student

Fuente: Elaboración propia.

5.5. La ficha técnica

Una vez finalizado el trabajo de campo y de cara a la elaboración de los docu- Ved también
mentos metodológicos y de difusión, elaboraremos una síntesis de las carac-
Para ver otras fichas técnicas
terísticas esenciales de nuestra investigación. Esta síntesis se suele expresar en os recomendamos acceder a la
formato de ficha técnica, tal y como se puede observar en el ejemplo facilitado. web del CIS, donde están dis-
ponibles las fichas técnicas de
todas las investigaciones.
© FUOC • PID_00227026 55 Técnicas de recogida de datos cuantitativos: la encuesta

Figura 5. Ejemplo de ficha técnica

Fuente: Elaboración propia.


© FUOC • PID_00227026 56 Técnicas de recogida de datos cuantitativos: la encuesta

6. Análisis de datos cuantitativos

6.1. Contexto e informaciones adicionales

6.1.1. La estadística resumida y simplificada

Finalmente, llega el momento de analizar los datos. Como hemos advertido


desde el principio, el análisis de datos cuantitativos implica necesariamente
un análisis�estadístico.

No nos detendremos demasiado tiempo en hacer un repaso de qué es la esta- Ved también
dística ni su derivación de la matemática. No obstante, os dediquéis a la rama
Para seguir este y otros argu-
que os dediquéis, seguramente la habréis usado. Y es que se trata probable- mentos, os recomendamos
mente del ámbito�de�conocimiento�del�que�más�se�han�apropiado�otras leer el interesante artículo de
Hand (2009) que encontraréis
disciplinas. De este modo, a menudo no somos nada estadísticos los que usa- citado en la bibliografía.

mos la estadística. Más aún, apenas hemos tenido relación con los números a
lo largo de la vida académica pero aun así usamos la estadística. Este hecho,
entre otros impactos, ha implicado que se�simplifiquen�conceptos�y�proce-
dimientos (con la lógica discusión académica sobre las carencias y los errores
que ello supone).

Y esto�es�exactamente�lo�que�haremos en este apartado. Explicar e ilustrar


de manera simplificada conceptos y procedimientos que tienen una base de
conocimiento complejo. Por lo tanto, como en el apartado dedicado al mues-
treo, alguna imprecisión y vaguedad deberemos asumir, necesidad que hay
que excusar sin conocimientos más avanzados.

6.1.2. El software estadístico

Otra cuestión a la que hay que referirse antes de entrar en materia es el soft- Ved también
ware�informático�que�se�usa�en�estadística. Todo lo que se explica a conti-
Al final del documento se faci-
nuación se puede realizar con papel y lápiz (y si nos queremos estirar algo más lita una breve lista de progra-
con lápices de colores). Ahora bien, supone un trabajo considerable. De este mas informáticos especializa-
dos, que en ningún caso quie-
modo, desde software general de Office y de tratamiento de textos y de datos, re ser exhaustiva, pero que os
invitamos a consultar tanto co-
hasta programas específicos para técnicas concretas, se han desarrollado apli- mo podáis.
caciones informáticas específicas que nos ayudan a hacer el trabajo más fácil y
con mayor precisión (a veces, no siempre, más bonito también). Por lo tanto,
podemos hacer tratamiento de datos con Excel, por ejemplo, o usar SPSS o R,
u otros muchos programas.
© FUOC • PID_00227026 57 Técnicas de recogida de datos cuantitativos: la encuesta

En análisis estadístico básico qué software se usa es una decisión particular1,


que a menudo depende de la tradición de cada disciplina o incluso de cada
grupo de investigación, empresa o universidad. Así, algunos de vosotros ha-
bréis usado SPSS, otros STATA o SPAD, que son seguramente los programas más
generalizados en el entorno cercano. En la última década se han desarrollado
además varios programas de software libre, entre los que destaca R.

(1)
En un análisis más avanzado al que explicaremos aquí, el software estadístico más ade-
cuado puede ser uno u otro, o uno más específico todavía, incluso uno hecho a medida.
Sin embargo, todos los análisis que se proponen en este módulo se pueden realizar con
casi cualquiera de los programas existentes.

Ved también

Los análisis que se presentan en este módulo se han producido con SPSS. La UOC ha
desarrollado diferentes módulos específicos sobre tratamiento de datos con R que os re-
comendamos como parte de la bibliografía. Específicamente los módulos: “El entorno
estadístico R” y “Análisis de datos y estadística descriptiva con R y R-Commander”, den-
tro del manual Matemáticas y estadística con R. No obstante, cabe señalar que en la red
existen muchos manuales y ejercicios sobre la mayoría de los programas estadísticos.

La elección de qué herramienta usamos es, hoy por hoy, poco relevante, dado
que independientemente del software por el que optemos lo�más�importante
es�saber�qué�estamos�haciendo. Más aún, si sabemos qué queremos hacer, en
cualquier software encontraremos la manera de hacerlo.

6.1.3. Las diferenciaciones clave

Finalmente, en el proceso de simplificación enunciado es necesario que ten-


gáis presentes las siguientes cuestiones clave a la hora de hacer frente al aná-
lisis estadístico básico.

1) Las variables estadísticas según su clasificación determinan los tipos de aná-


lisis que se han de realizar.

2) Se pueden sintetizar tres grandes niveles de análisis de datos.

3) Hay que distinguir entre estadística descriptiva y estadística inferencial, que


será diferente en función de tipo de variable que se trate.

4) Se pueden distinguir tres grandes familias de resúmenes de datos.

5) La estadística: todo un mundo por descubrir y para hacer descubrimientos.

A continuación pasamos a desglosar mínimamente cada cuestión, siguiendo


los ejemplos que estamos trabajando.
© FUOC • PID_00227026 58 Técnicas de recogida de datos cuantitativos: la encuesta

6.2. Características de las variables estadísticas: clasificación


según criterio y escala de medida

Del mismo modo que un concepto se ha transformado en un indicador, y este


se ha querido medir mediante una formulación específica en un cuestionario,
el último paso consiste en reconocer cómo es esta información en términos
estadísticos: se ha transformado pues en lo que denominamos variable�esta-
dística.

Repasemos las diferentes acepciones que hemos utilizado de la palabra varia-


ble:

1) En la etapa conceptual definíamos variable como el fenómeno que estudiar


(y es necesario la justificación teórica y académica pertinente).

2) En el momento de la operativización el nombre de variable lo usamos para


hacer referencia a las posibilidades que toma el fenómeno y medidas posibles.
¿Qué incluiremos y qué no? ¿Cómo se medirá?

3) Si estamos realizando un formulario o cuestionario, deberemos formular


una o varias preguntas (podéis ver el ejemplo tomado del caso 1, en el cuadro
siguiente).

4) Finalmente, y este era el objetivo metodológico específicamente cuantitati-


vo, dispondremos de una medida, es decir, la característica�o�atributo�regis-
trado�con�un�número, y en ocasiones específicas en texto. Generalmente en
la matriz de datos o base de datos.

Tabla 5. Significado de la palabra variable en los principales momentos metodológicos

Momento Acepción del término variable Ejemplo

1 Conceptual Definíamos variable como el fenó- Actividad económica: definición y jus-


meno que debemos estudiar que tificación teórica del término
puede adquirir diferentes formas ¿Qué significa actividad económica?
¿Qué tipos existen?

2 Operativización Posibilidades que adquiere el fenó- ¿Cómo medimos estar activo/activa?


meno conceptual ¿Qué posibilidades puede tomar?
¿Una o más de una?

3 Formulación Una o varias preguntas para medir ¿Concretamente�es...?


este/os indicador/es Trabajo actualmente - 1
Estoy en el paro: busco trabajo - 2
Solo estudio:
no busco trabajo ni quiero trabajar - 3
Estoy de baja (anotad razón) - 4
Otras situaciones (anotar)
(no leer) NS - 98
(no leer) NC - 99

4 Medida estadística Registro específico numérico o tex- En la matriz de datos dispondremos


tual de cada caso con su característica
identificada con un número.

Fuente: Elaboración propia.


© FUOC • PID_00227026 59 Técnicas de recogida de datos cuantitativos: la encuesta

Cuando usamos el término matriz�de�datos o base�de�datos, sin demasiado rigor, dicho


sea de paso, nos referimos al documento en el que se guardan los datos específicos de
cada cuestionario o registro. Generalmente, en las filas tendremos los casos y en las co-
lumnas las variables estadísticas. Ejemplo: en la fila dispondremos de los datos de la per-
sona 1 (o del municipio, empresa, etc., que es unidad muestral o poblacional de nuestra
investigación) y en las columnas si son hombres o mujeres, la edad, la formación, etc.
Podéis revisar un ejemplo en la matriz de datos facilitada en los formatos Excel y SPSS.

En estadística, cuando leemos “en un conjunto de variables” o “la variable


aleatoria toma valores de...” no nos estamos refiriendo al fenómeno género,
formación o a actividad económica, sino a la medida específica de este fenó-
meno: si hemos puesto un 1 para los hombres y un 2 para las mujeres, o si
hemos medido la edad en años cumplidos de la persona, en meses, o en gru-
pos de meses, o en grandes grupos de edad, o bien la actividad económica en
ingresos brutos, grupos de salario, tipo de relación con el mercado de trabajo
y el Estado (1. Trabaja; 2. Está en el paro; 3. Estudia; 4. Está de baja, etc.). El
cómo�se�mide�estadísticamente�cada�variable�determina�sus�posibilidades
de�análisis.

La clasificación de las variables estadística es variada. Es decir, como en el ca-


so de las formulaciones en los cuestionarios, no existe solo una manera de
clasificar variables, y por lo tanto cada variable podría tener varios nombres
y apellidos, dependiendo de la o las clasificaciones que usemos. De todas las
clasificaciones destacaremos dos.

La primera y fundamental, lo que se denomina criterio�estadístico, diferencia


si una variable estadística es cualitativa o cuantitativa (de nuevo estas pala-
bras toman acepciones diferentes a las utilizadas hasta ahora). Esta clasifica-
ción lo determina casi todo.

En segundo lugar, la escala�de�medida (o clasificación de Stevens, 1951), que


distingue básicamente entre variable� nominal,� ordinal,� de� intervalo� y� de
razón.

Pasemos a describir las características de cada clasificación y ver un ejemplo


aplicado.

1)�Criterio�estadístico

Una variable cualitativa es aquella en la que cada categoría de respuesta/re-


gistro equivale a un atributo. También se pueden denominar nominales o ca-
tegóricas, si bien son términos que llevan a mayor confusión. Sus valores pue-
den o no variar en grado o cantidad, pero lo más importante es que son cua-
litativamente diferentes. Pueden ser de registro simple o múltiple. Lo más im-
portante para distinguirlas de las variables cuantitativas es que numeramos
las categorías de respuesta, pero la variable no se expresa con un número, el
número solo identifica la categoría. Así, en el ejemplo siguiente a jornada par-
© FUOC • PID_00227026 60 Técnicas de recogida de datos cuantitativos: la encuesta

tida le podríamos haber puesto los valores 30 o 50, o al NC el valor 33 o 78,


dado que el número elegido solo es un instrumento para hacer otras cosas que
aprenderemos más adelante.

Ejemplo caso 2

Pregunta de cuestionario. Tipo de jornada.

P41. ¿Qué tipo de jornada?

Continua 1

Partida 2

NC 99

Una variable cuantitativa está expresada con un número y este tiene sentido
y valor, y representa la medida de lo que estamos registrando. En el ejemplo
que hay a continuación, si tu edad es 18 años no se expresa de ninguna otra
manera que con el número 18 y con este podemos realizar cálculos.

Ejemplo caso 2

Pregunta de cuestionario. Edad de la persona entrevistada

P2. ¿Cuál es su edad?

_ _ años

Las variables cuantitativas tienen una subdivisión que no afecta demasiado al


análisis estadístico esencial pero que hay que conocer dado que sí lo hace en
otros casos. Distinguimos entre variables cuantitativas continuas�y�discretas.

Una variable cuantitativa es continua si entre dos valores de la variable, por


próximos que estén, puede haber infinitos valores. Se pueden registrar deci-
males de manera que se midan con un alto grado de precisión y las diferencias
mínimas quedan registradas. No disponemos de ningún ejemplo en el cues-
tionario del ejemplo 2, pero podemos proponer el siguiente:

Ejemplo

Ingresos anuales brutos declarados en el ejercicio de la renta 2011

Indique sus ingresos anuales brutos declarados en el ejercicio de la renta 2011

_.._ _ _ . _ _ _, _ _ €/brutos anuales 2011

Otro ejemplo clásico de estas variables son el registro de temperatura, peso, etc.

En cambio, las variables cuantitativas son discretas si entre dos valores suce-
sivos de la variable no hay ningún valor. No se pueden registrar decimales.
Cuando calculan datos sí aparecen decimales, pero en el registro no. El ejemplo
ya dado de variable cuantitativa es del subtipo discreto, dado que no permite
indicar los decimales (la edad se expresa en números enteros). Otro ejemplo
© FUOC • PID_00227026 61 Técnicas de recogida de datos cuantitativos: la encuesta

clásico es el número de hijos, en el que no podemos registrar los decimales si


se trata de personas o parejas. O las escalas de valoración de 0 a 10 en las que
la persona encuestada solo puede decir 0 pero no 0,2.

2)�Clasificación�escala�de�Stevens

En la clasificación clásica más utilizada las variables cualitativas se dividen en


función de si son de escala nominales�u�ordinales. Las nominales tienen las
mismas características ya descritas para las variables cualitativas en general.
El ejemplo ya facilitado es igualmente válido. En cambio, en las variables or-
dinales, además de clasificar los sujetos según las opciones de respuesta, en-
tre las categorías existe algún tipo de orden. La distancia entre cada categoría
puede ser un constructo, es decir, no tiene por qué ser de la misma magnitud
entre cada categoría. Un ejemplo muy usado y del que tenemos ejemplo en
nuestro caso 2 es el nivel de estudios.

Ejemplo caso 2

P43. ¿Cuál es el nivel máximo de estudios que habéis logrado?

Sin estudios 1

Elementales (sabe leer y escribir) 2

Primarios (incompletos: fue a la escuela 5 años o más pe- 3


ro sin completar la EGB, primaria de ESO...)

Bachiller elemental, EGB, FP1 o equivalente 4

Bachiller superior, BUP, FP2 o equivalente 5

Universitario grado medio (diplomatura, arquitectura o 6


ingeniería técnica)

Universitario grado superior (licenciatura, ingeniería o ar- 7


quitectura o equivalente)

Formación de tercer ciclo (máster, posgrado, doctorado) 8

¿Otros?________________________________

Nc 99

A su vez, las variables cuantitativas se dividen en variables intervalo y va-


riables razón. Hay que destacar que las variables cuantitativas son por lógica
ordinales, ahora bien, en las que son cuantitativas de escala intervalo los dife-
rentes puntos o valores tienen una distancia entre ellos igual y se puede inter-
pretar. El 0 no existe o no significa ausencia del fenómeno medido. El ejemplo
ya facilitado de la edad cumple este criterio. La distancia entre los distintos
años es idéntica en términos de tiempo.
© FUOC • PID_00227026 62 Técnicas de recogida de datos cuantitativos: la encuesta

La principal diferencia con la escala de razón es que estas medidas tienen un


valor 0 que indica ausencia del fenómeno, de modo que el 0 no es un punto
arbitrario de inicio. Por ejemplo, como hemos comentado antes, el valor 0 en
la pregunta número de hijos, el 0 sería un 0 real, que mediría la ausencia del
fenómeno medido.

Dedicamos tanto de tiempo a estas dos clasificaciones puesto que del tipo de
variable depende el tipo de análisis que se podrá realizar. Especialmente del
criterio. Aun así, como hemos aprendido, en ciencias sociales, y en otras cien-
cias, las variables estadísticas son resultado de un proceso de operativización y
por lo tanto no siempre es fácil identificar propiedades matemáticas más com-
plejas, como si las medidas son discretas o continuas o las escalas de medida
de intervalo y de razón. Para distinguir una variable de intervalo o de razón
podemos preguntarnos si permite valores negativos, entonces se sabe que el
0 no es ausencia del atributo y no un punto más en la escala. Por lo tanto, es
una variable de intervalo (por ejemplo, la temperatura). No obstante, resulta
siempre complejo determinar si el 0 es natural o arbitrario cuando las escalas
que construimos son por ejemplo de opinión. Pensad en una escala de 0 a
10, en la que el 0 es nada de acuerdo y el 10 totalmente de acuerdo; tener 0
acuerdo no quiere decir no tener “algún grado de acuerdo”, sino un valor de
acuerdo mínimo. Otra cuestión importante es que, en ocasiones, las preguntas
formuladas en escala (de 1-4 o de 1-5, o de 1-7) parecen cuantitativas. Lo son
si la escala pide cantidad (por ejemplo, cuando hacemos una valoración de 0
a 10 o, por ejemplo, pedimos una frecuencia de 0 a 100). Pero no lo son si
hemos dado a todas las categorías un atributo. Como en el ejemplo siguiente:

Ejemplo caso 2

P120. En su opinión, ¿estar dispuesto a marcharse fuera es una actitud necesaria para
desarrollar la carrera profesional de la danza? Dígame si está...

Totalmente de acuerdo 1

Bastante de acuerdo 2

Poco de acuerdo 3

Nada de acuerdo 4

(no leer) Nc 99

Ahora es el momento de elaborar un esquema de estos tipos de medidas, dado que lo


iremos completando con lo que podemos hacer en cada caso y lo que no o no se reco-
mienda. Os recomendamos también identificar las propiedades de algunas preguntas del
cuestionario de ejemplo facilitado.

6.3. Niveles de análisis: univariante, bivariable y multivariable

Antes de hacer cosas con los datos, lo que denominamos vulgarmente tabular
o explotar datos, podemos distinguir tres niveles de análisis.
© FUOC • PID_00227026 63 Técnicas de recogida de datos cuantitativos: la encuesta

1)�Univariante: cuando analizamos cada variable una a una. Por ejemplo, si


queremos analizar cuántas personas están en paro, cuántas tienen diferentes
niveles de estudio, cuál es la media de edad de las personas en paro, etc.

2)�Bivariable: vamos un paso más allá y queremos conocer la existencia, el


sentido y la magnitud de la relación entre las dos variables. Así, querremos
saber si las mujeres y los hombres tienen el mismo nivel educativo o si las
personas que están en paro tienen una media de edad diferente de las que
están trabajando.

3)�Multivariable: estudiaremos las posibles relaciones que se pueden estable-


cer entre tres o más variables. Al final de este apartado se presentan algunas
características esenciales a estos procedimientos a modo de invitación.

En este módulo nos centraremos en los dos primeros niveles de análisis. Como
podéis deducir, al usar la palabra nivel, suponemos que hay pasos básicos y
superiores. Así, primero realizaríamos análisis univariante, después bivariable
y por último multivariable. Este es un hábito muy recomendado y enseñado.
No obstante, os recomendamos reflexionar sobre si estos pasos nos permiten
descubrir las relaciones clave entre las variables o solo dan una visión frag-
mentada de la realidad que medimos, de manera que hacer realizar un análi-
sis multivariable nos permitiría por ejemplo descubrir estructuras latentes y
relaciones inesperadas.

6.4. Estadística descriptiva y estadística inferencial

Finalmente, antes de entrar a manipular datos, hay que distinguir entre estos
tipos de objetivos. Cuando se realiza estadística descriptiva producimos me-
didas�y�gráficos�que�resumen�la�información y permiten tener una imagen
del comportamiento de las variables. Lo podemos hacer con cualquier con-
junto de datos, ya sean muestrales o de registro. Sobre todas las empresas de
nuestra ciudad o sobre una muestra, sobre todos los casos atendidos por nues-
tro servicio o sobre una muestra de posibles casos.

En cambio, cuando realizamos estadística inferencial tenemos el objetivo de


determinar y medir hasta� qué� punto� los� datos� que� observamos, que des-
cribimos, son inferibles, atribuibles�al�total�de�la�población. Hemos realiza-
do estadística inferencial cuando hemos calculado una muestra. Al preguntar-
nos cuántas encuestas hacen falta para realizar una muestra suficientemente
precisa y fiable, hemos determinado el número necesario y calculado el error
y confianza que globalmente obtendremos. Específicamente en el momento
del análisis lo que pretendemos es determinar�que�lo�que�observamos�en�la
muestra�es�atribuible�al�conjunto�de�la�población. Por lo tanto, realizaremos
estadística descriptiva y además estadística inferencial. Por ejemplo, primero
determinaremos la edad de las personas en paro y después calcularemos el in-
tervalo de edades más probable en nuestra población total.
© FUOC • PID_00227026 64 Técnicas de recogida de datos cuantitativos: la encuesta

(2)
Para hacerlo, tenemos dos opciones: 1) disponer de los datos del total o casi Este procedimiento es el que
realizan por ejemplo los pediatras
total de la población, lo que nos permitiría saber hasta qué punto mi mues-
cuando nos dicen si nuestro hijo o
tra se asemeja al total de la población. Esta situación no se da prácticamente hija tiene un peso o una altura sig-
nificativamente diferente de la dis-
nunca en ciencias sociales. Imaginemos que sabemos el patrón de edad de las tribución normal de la población.
personas en paro de toda la población europea. Podríamos determinar si los
resultados de nuestra muestra son muy diferentes o no2. 2) Sin embargo, la
situación más habitual es que no dispongamos de estos datos y por lo tanto
debemos fijarnos en patrones o modelos que se repiten en determinadas cir-
cunstancias y que usamos de espejos. Algunos ejemplos son los modelos de
distribución normal, Chi Cuadrado, T-Student, etc., que los aplicaremos en
determinados supuestos. En el punto 6.6 aplicaremos estos modelos.

6.5. Estadística descriptiva: resúmenes y gráficos esenciales

Como hemos indicado, la función de la estadística descriptiva es resumir el Ved también


comportamiento de nuestras variables estadísticas a partir de estadísticos resu-
Como se ha indicado en el
men (media, desviación, etc.) y su representación gráfica. Existen varios pro- apartado de muestreo, os re-
cedimientos para realizar este ejercicio y en este módulo daremos las pautas comendamos ampliar el es-
tudio a partir de los materia-
clave de los que son esenciales para iniciarse en el análisis de datos cuantita- les de la UOC elaborados por
Greenacre (2012), Estadística I.
tivo poniendo ejemplos sencillos basados en el caso 2.

6.5.1. Frecuencias: gráficos de barras, sectores e histogramas

En primer lugar, de cualquier variable que tengamos podemos calcular la fre-


cuencia de casos de cada respuesta, es decir, el número de casos que han res-
pondido cada una de las categorías de una pregunta: cuántos son hombres o
mujeres, cuántos tienen 23 años o cuántos tienen estudios superiores. A par-
tir de esta frecuencia podemos establecer cálculos básicos como por ejemplo
la frecuencia�relativa, siendo la más habitual el porcentaje, aunque existen
otros, como el tanto por 1, el tanto por 1.000 o 10.000 (muy habitual en el
cálculo de indicadores) o cualquier otra razón.

Cómo podemos observar en las tablas siguientes, la pregunta p2 edad ha da-


do lugar a una variable cuantitativa en la que tenemos registrada la edad de
todos los participantes. Así, en nuestra muestra tenemos a diez personas de 25
años que representan el 3,4% de las 290 encuestas. También se ha transforma-
do la variable en una cualitativa ordinal, clasificando las diferentes edades en
intervalos. El análisis de sus frecuencias nos permite afirmar que en nuestra
muestra el grupo más numeroso es el de personas de 30 a 34 años, 65 casos
que representan el 22,4%.
© FUOC • PID_00227026 65 Técnicas de recogida de datos cuantitativos: la encuesta

Tabla 6. Tabla de frecuencias absolutas y relativas de una variable cuantitativa

p2 P2. ¿Cuál es su edad?

Frecuencia Porcentaje Porcenta- Porcentaje


je�válido acumulado

Válidos 20 1 ,3 ,3 ,3
21 1 ,3 ,3 ,7
22 4 1,4 1,4 2,1
23 5 1,7 1,7 3,8
24 10 3,4 3,4 7,2
25 10 3,4 3,4 10,7
26 5 1,7 1,7 12,4
27 8 2,8 2,8 15,2
28 12 4,1 4,1 19,3
29 13 4,5 4,5 23,8
30 13 4,5 4,5 28,3
31 11 3,8 3,8 32,1
32 17 5,9 5,9 37,9
33 14 4,8 4,8 42,8
34 10 3,4 3,4 46,2
35 11 3,8 3,8 50,0
36 14 4,8 4,8 54,8
37 8 2,8 2,8 57,6
38 6 2,1 2,1 59,7

Fuente: Elaboración propia a partir de los resultados de la Enquesta de condicions laborals del professionals de la dansa a Cata-
lunya 2010 (en adelante, ECLPDC2010).

Tabla 7. Tabla de frecuencias absolutas y relativas de una variable cualitativa

p2_rec1 P2_rec1. ¿Cuál es su edad?

Frecuencia Porcentaje Porcenta- Porcentaje


je�válido acumulado

Válidos 1 20-24 21 7,2 7,2 7,2


2 25-29 48 16,6 16,6 23,8
3 30-34 65 22,4 22,4 46,2
4 35-39 46 15,9 15,9 62,1
5 40-44 40 13,8 13,8 75,9
6 45-49 30 10,3 10,3 86,2
7 50-54 17 5,9 5,9 92,1
8 55-59 12 4,1 4,1 96,2
9 60-64 7 2,4 2,4 98,6
10 65 o más 4 1,4 1,4 100,0
Total 290 100,0 100,0

Fuente: Elaboración propia a partir de los resultados de la Enquesta de condicions laborals del professionals de la dansa a Cata-
lunya 2010 (en adelante, ECLPDC2010).

Bien, este ejercicio se puede realizar para cualquier variable, tanto cualitativa
como cuantitativa, y a partir de ellas realizar varias representaciones gráficas:

1)�Histogramas

Se trata del resumen y representación gráfica indicado para variables cuanti-


tativas, especialmente continuas. Sitúa en el eje horizontal el número de casos
agrupados por intervalos y la altura de cada área corresponde al número de
casos, es decir, profesionales de la danza. Así, en la siguiente figura observamos
que la primera barra indica que existen aproximadamente 93 casos entre los
20 y los 32 años. A la hora de leer un histograma os recomendamos indicar qué
representa cada eje, qué contiene cada barra y cómo se interpreta, cuáles son
© FUOC • PID_00227026 66 Técnicas de recogida de datos cuantitativos: la encuesta

los valores mínimo y máximo del eje x y del y, así como la forma que adquiere
la distribución, cómo es: simétrica, con puntas, centrada, con extremos, etc.,
y cuánto hay en cada tramo que describimos (inicio, medio y final).

Figura 6. Ejemplo de histograma de la variable p2_edad

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

2)�Gráfico�de�barras�y�sectores

Se trata de gráficos que representan variables cualitativas. El gráfico de barras


representa en el eje vertical la frecuencia (número de repeticiones) y en el eje
horizontal las opciones de la variable, en este caso cualitativa ordinal edad.
Podemos elaborar también un gráfico de sectores que representa lo mismo que
en el caso anterior, pero en términos de proporción o porcentaje, dado que
sitúa todos los datos en una sola área. Los gráficos de barras suelen represen-
tar frecuencias absolutas de las variables, mientras que los gráficos de secto-
res muestran generalmente los porcentajes o frecuencias relativas. También se
pueden usar para mostrar frecuencias absolutas, pero no es lo más habitual.
El gráfico de barras indica por lo tanto cuántos casos hay en cada situación,
mientras que el gráfico de sectores permite visualizar la magnitud o propor-
ción de cada tipo de situación, de cada categoría de la variable cualitativa, po-
niéndolas en valor 100.

En el ejemplo facilitado observamos que lo más frecuente es tener de 30 a


39 años, y en el gráfico de sectores se observa claramente que este colectivo
representa la mayor proporción.
© FUOC • PID_00227026 67 Técnicas de recogida de datos cuantitativos: la encuesta

Figura 7. Ejemplo gráfico de barras de la variable p2_rec2_edad

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Figura 8. Ejemplo gráfico de sectores de la variable


p2_rec2_edad

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

6.5.2. Media y desviación

Estos ejercicios que hemos hecho hasta el momento son prácticamente todo
o casi todo lo que podemos hacer para describir variables cualitativas. Por es-
ta razón, en apartados anteriores, como la formulación de preguntas, se han
indicado que estadísticamente presentan bastantes limitaciones. Lógicamen-
te, se pueden realizar transformaciones de otras representaciones gráficas pe-
ro se requieren otros conocimientos que exceden el objetivo de este módulo.
© FUOC • PID_00227026 68 Técnicas de recogida de datos cuantitativos: la encuesta

En cambio, para las variables cuantitativas existen otros resúmenes esenciales


que hay que conocer. Como en apartados anteriores, nos centraremos en el
significado y no en el cálculo. En primer lugar, la media y desviación.

La media aritmética o valor medio es la suma de todas las puntuaciones divi-


dido por el total de casos. En nuestro caso, la suma de todas las edades de los
290 participantes y dividido por 290. Así, las edades de nuestros encuestados
van de 20 a 72 años, y la media de edad de los profesionales de la danza es
de 37,57 años.

Fórmula de la media aritmética:

Asociado a este primer valor podemos calcular la desviación estándar, que con-
siste esencialmente en calcular cómo se desvía cada caso de la media. Si suma-
mos todas estas desviaciones obtendríamos la varianza total, y si la dividimos
entre todos los casos la media de la desviación. Por lo tanto, la desviación es-
tándar debemos interpretarla como la media de las desviaciones. Así, si esta es
muy elevada, tendremos que asumir que la media no refleja con precisión có-
mo se distribuyen nuestros datos, mientras que si esta es pequeña, podremos
decir que la media es un buen resumen de lo que sucede con nuestra medida.
Es por lo tanto una medida que nos indica la dispersión de nuestros datos y
la validez de la media para representarlas.

Fórmula de la desviación estándar

Contenido
complementario

La definición más precisa y que


En nuestro caso, de media los casos se desvían 10,34 años de esta media, de se ajusta más a las fórmulas fa-
cilitadas sería la siguiente: des-
modo que podemos afirma que existe cierta dispersión en las edades de los viación: raíz cuadrada positiva
de la varianza; varianza: media
profesionales de la danza de Cataluña. del cuadrado de la diferencia
entre cada valor y la media.
Tabla 8. Ejemplo media y desviación de la variable p2_edad

N Mínimo Máximo Media Desv. típ. Contenido


complementario
p2 P2. 290 20 72 37,57 10,349
¿Cuál es Para saber cuándo una desvia-
su edad? ción es grande o pequeña po-
demos usar coeficientes senci-
N Válido 290 llos, como el coeficiente de va-
(según riación de Pearson.
lista)

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.


© FUOC • PID_00227026 69 Técnicas de recogida de datos cuantitativos: la encuesta

6.5.3. Resumen de los 5 números: gráfico de cajas

Otra manera de resumir los valores de nuestra variable es el conocido como el


resumen de los 5 números. Este está formado por el valor mínimo, el primer
cuartil, la mediana (el segundo cuartil), el tercer cuartil y el máximo, y se suele
completar con el cálculo del rango (máximo – mínimo) total y el rango inter-
cuartil (cuartil 3 – cuartil 1).

El mínimo y el máximo son valores muy intuitivos; la distancia entre estos


se denomina rango total, y nos ofrece el abanico de posibilidades que se han
dado. En nuestro caso, las edades de los profesionales de la danza van de 20 a
72 años, o sea una distancia de 52 años entre el mínimo y máximo. Estaremos
de acuerdo con que se trata de una gran dispersión de situaciones.

El siguiente paso será calcular los puntos o posiciones que dividen los casos
en grupos. Una posición posible es la mediana: el valor que divide nuestra
muestra en 2. Consiste en ordenar todos los casos de menos a más y observar
qué valor divide los casos por la mitad dejando el 50% por debajo y el 50%
por encima.

Fórmula de la mediana:

Según nuestros resultados, la mitad de los profesionales de la danza tiene me-


nos de 35,5 años y la otra mitad los supera. Dado que del mínimo, de 20 a
35,5 años, hay 15 años, y de la media al máximo, 72 años, hay 35, podemos
afirmar que los menores de 35 tienen menos dispersión, tienen edades más
cercanas que los mayores de 35.

Los cuartiles son igual que la media de un valor de posición, pero si la mediana
es el punto que divide por la mitad, el primer cuartil es el punto que marca el
primer 25% de los casos y el tercer cuartil el que marca el 75% de los casos.
Así, en nuestros datos, uno de cada 4 profesionales (25%) está por debajo de
los 30 años. Y uno de cada 4 supera los 44 años (del tercer cuartil en adelante).
La distancia entre el primer y tercer cuartil es de 14 años e indica cómo de
variables son las situaciones en torno a la mediana y cómo de simétricas.

Tabla 9. Ejemplo de resumen de los 5 números para la variable p2_edad

p2 P. ¿Cuál es su edad?

N Válidos 290

Perdidos 0

Mediana 35,50

Mínimo 20

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.


© FUOC • PID_00227026 70 Técnicas de recogida de datos cuantitativos: la encuesta

p2 P. ¿Cuál es su edad?

Máximo 72

Percentiles 25 30,00

50 35,50

75 44,00

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Una de las representaciones gráficas más asociada a estos resúmenes numéri-


cos es el gráfico o diagrama de cajas. Como se observa en la figura siguiente,
se pueden establecer las puntuaciones analizadas anteriormente y visualizar
las distancias que existen entre los diferentes puntos, de modo que podemos
observar si se trata de una distribución muy dispersa o no y si existe o no asi-
metría. La altura de la caja no tiene significado.

Figura 9. Ejemplo de gráfico de cajas de la variable p2_edad

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Como en el caso del histograma, las recomendaciones para leer un diagrama Contenido
de caja pasarían por identificar bien qué ha representado: cuál es el sujeto, complementario

qué hay en el eje y, valores máximos y mínimos, dónde está la mediana y qué La mediana y la media tam-
significa, el rango total, rango intercuartílico, la simetría del gráfico y los casos bién se suelen denominar me-
didas de centralidad, mientras
extremos. que la desviación y los rangos
se denominan de dispersión.
Igualmente, al resumen de los
cinco números también se le
Si bien debemos recomendaros no elegir qué resumen es más adecuado para suele denominar análisis de
las muestras, si la media y la desviación o el resumen de los 5 números, a me- posición.

nudo hay que economizar esfuerzos dado que tendremos un gran volumen
de datos. Existen algunas recomendaciones en este sentido que nos os pueden
ayudar a elegir. Por un lado, la desviación estándar es un número que es sufi-
© FUOC • PID_00227026 71 Técnicas de recogida de datos cuantitativos: la encuesta

ciente si la distribución es simétrica. En caso contrario necesitaremos el resu-


men de los 5 números para analizar qué pasar por encima y por debajo. Por
otro lado, la media aritmética no es un buen indicador de resumen si existe
mucha dispersión, y optaremos en este caso por el resumen de los 5 números.

Actividad

Disponéis de los datos sobre los meses en el paro al final del módulo. ¿Podríais identificar
la información y escribir una narración sobre cómo es la situación de paro de los profe-
sionales de la danza en Cataluña?

Estos son los ejercicios esenciales para describir la información de una pobla-
ción o muestra. Aun así, especialmente en el caso de una muestra, nos formu-
laremos preguntas más complejas sobre la similitud de nuestros datos y las
poblacionales. Habrá que aplicar por lo tanto los principios de la estadística
inferencial. Centraremos el estudio únicamente en el caso de la estadística bi-
variable, y concretamente en la relación entre dos variables cualitativas y una
variable cualitativa independiente y una variable cuantitativa dependiente,
dado que los objetivos de la asignatura limitan otras posibilidades.

6.6. Estadística inferencial: modelos esenciales y prueba de


significación en análisis bivariable

Las bases estadísticas de la inferencia se fundamentan en la teoría de la pro-


babilidad y los modelos de distribución. Para aquellos que os iniciáis en esta
práctica puede resultar laborioso su estudio en detalle; no obstante, este apar-
tado, como el resto del módulo, centrará su interés en explicar los conceptos
básicos y mostrar la aplicación práctica. A pesar de que la inferencia es una
herramienta utilizada en muchos contextos, en esta ocasión solo abordaremos
el análisis bivariable y específicamente la relación entre dos variables cualita-
tivas y una cualitativa independiente con una cualitativa independiente.

La definición más esencial de variable dependiente es aquella que consideramos que se


ve afectada por otra, es decir, que varía al variar la variable independiente. Así, la varia-
ble independiente es aquella que consideramos que afecta, hace variar la variable depen-
diente. Se trata de un criterio de clasificación teórico y metodológico y que no está vin-
culado directamente al concepto de causalidad, dado que muchas relaciones observadas
no son atribuibles a causa.

6.6.1. La prueba de significación

Como se ha introducido en apartados anteriores, una parte importante de la


aportación de la estadística al resto de las ciencias ha sido el desarrollo de mo-
delos teóricos de distribución. Estos modelos, desde los más básicos, como el
binomial o el de Poisson, hasta otros más complejos, como Chi2, F o T-Student
y los no paramétricos, nos permiten comparar –contrastar– un resultado ob-
servado con otro esperado, si se cumplieran los supuestos de la distribución
que queremos utilizar. Así, actúan como espejo.
© FUOC • PID_00227026 72 Técnicas de recogida de datos cuantitativos: la encuesta

El procedimiento de comparación y contraste entre los datos observados (las


nuestras, de nuestra muestra) y el modelo teórico de distribución requiere pues
los siguientes pasos esenciales:

1) Determinar qué variable o conjunto de variables estamos analizando y sus


propiedades (cualitativas, cuantitativas y cómo se relacionan, provenientes de
muestras aleatorias grandes o pequeñas, para analizar la relación entre resul-
tados de muestras dependientes o independientes, etc.).

2) Elegir el modelo de distribución que más se ajusta a esta situación.

3) Formular hipótesis (nula y alternativa o alternativas).

4) Decidir el nivel de confianza con el que queremos tomar la decisión.

2
5) Calcular los estimadores observados (por ejemplo, valor de Chi en la mues-
tra observada).

6) Compararlos con los teóricos (por ejemplo, buscándolos en tablas de distri-


bución o en softwares).

7) Decidir si nuestros datos son muy o poco probables según cómo serían en
la realidad si siguieran el modelo elegido.

Como veis, se trata de muchas decisiones, y complejas si no se tienen los co-


nocimientos estadísticos suficientes. Una de las herramientas más potentes de
la estadística ha sido el desarrollo de lo que denominamos prueba�de�signi-
ficación, consistente en un�procedimiento�abreviado�de�decisión, que nos
permite afirmar� o� rechazar� si� lo� que� observamos� en� una� muestra� puede
ser�generalizado�en�la�población (o infinitas muestras) con�un�nivel�de�con-
fianza�o�probabilidad determinada.

Este procedimiento simplificado ha sido ampliamente desarrollado por los


softwares estadísticos y ha hecho muy accesible su uso y la toma de decisio-
nes a partir de datos estadísticos Así, desde un punto de vista aplicado y para
aquellos que no estén en condiciones de fundamentar las decisiones en cono-
cimientos estadísticos más complejos, consiste básicamente en la observación
del valor�p.

(3)
Hay que interpretar este valor como la probabilidad de que nuestro resultado Más correctamente: probabili-
3 dad de que sea cierto en caso de
(media, diferencia de medias, etc.), o uno más extremo, sea falso . Esta proba- hipótesis nula.
bilidad, basada en el nivel de confianza, se suele expresar en tanto por 1. Si
© FUOC • PID_00227026 73 Técnicas de recogida de datos cuantitativos: la encuesta

deseamos�que�esta�probabilidad�esté�por�debajo�del�0,05, lo que queremos Contenido


es afirmar que los resultados que nosotros observamos son muy probables, es complementario

decir, que hay 0,05�o�menos�de�probabilidades�de�que�nos�equivoquemos. Para una comprensión más in-


tuitiva, os proponemos tradu-
cir este valor en tanto por cien-
Cuanto más cerca de 0 esté nuestra probabilidad de equivocarnos, mejor. Con- to. De 0 a 100, 0 significaría
que nuestra probabilidad de
vencionalmente, en ciencias sociales se establece un�umbral�máximo�del�0,5 equivocarnos es 0, por lo tan-
to es muy probable que acer-
(un 5%, en tanto por ciento). Así, si nos marcamos este umbral de 0,05 cual- temos.
quier� valor� p� por� debajo� de� 0,05� lo� consideraremos� significativo. De es-
te modo, cuando usemos la palabra significativo (“estadísticamente significati-
vo”) queremos afirmar que lo que hemos observado, en nuestra muestra, es
muy probable que sea cierto (o es improbable que sea falso).

Si asumimos esta simplificación como una herramienta útil para tomar deci-
siones rápidamente, solo necesitaremos�decidir�qué�modelo�de�probabili-
dad�hay�que�aplicar�en�cada�caso. Cada modelo de probabilidad corresponde
a una situación de observación específica. Lo elegimos en función del tipo de
variables que se relacionan, cualitativa y cualitativa, cualitativa y cuantitativa,
etc.; el parámetro que hay que contrastar (proporción, diferencia de propor-
ciones, medias, medianas, etc.); si existe o no dirección o dependencia en esta
relación (si establecemos cuál es la variable dependiente y cuál es la indepen-
diente); el tipo de relaciones que establecíamos (lineales, etc.); si nos interesan
las relaciones globales (entre variables) o locales (entre pares de categorías);
si analizamos dos o más muestras, si estas son independientes o están relacio-
nadas, si se cumplen los supuestos de los modelos (normalidad, igualdad de
varianza, etc.), y otros criterios de elección.

Sin embargo, de nuevo simplificaremos esta decisión centrándonos en dos


situaciones muy frecuentes y remitiéndoos a materiales más específicos para
ahondar en otras situaciones.

6.6.2. Relación entre dos variables cualitativas: tablas de


contingencia y test de Chi2

Ya hemos aprendido algunos procedimientos esenciales de análisis descriptivo


de datos. Aun así, con toda seguridad una de las intenciones habituales de rea-
lizar análisis cuantitativo es relacionar variables, observando cómo se incuban
o se correlacionan. Dado que en ciencias sociales muchas de las variables esta-
dísticas que construimos son cualitativas, nos encontraremos habitualmente
analizando la relación entre�dos�variables�cualitativas mediante tablas�de
contingencia.

Como ejemplo usaremos la tabla de contingencia que relaciona la edad de


los profesionales de la danza de Cataluña (simplificada en tres categorías) y la
respuesta a la pregunta de hasta qué punto cree que en el futuro deberá mar-
charse para desarrollar su carrera profesional (resumida en si cree que ello es
© FUOC • PID_00227026 74 Técnicas de recogida de datos cuantitativos: la encuesta

totalmente o bastante seguro, o si cree que es poco o nada seguro). Pregunta-


mos si existe alguna relación entre la edad y si cree que es necesario marcharse
para desarrollarse profesionalmente en el mundo de la danza.

Lo primero que podemos hacer es observar las frecuencias o casos en los que
coinciden cada par de categorías. Observamos que 55 declaran tener entre 20
y 29 años y creen que deberán marcharse; 51 de 30 a 39 años, y 28 de 40 a
64 años. Si avanzamos en el análisis podemos calcular el porcentaje� total:
observamos que el 23,4% de los profesionales tienen entre 20 y 29 años y
creen que deberán marcharse; el 21,7% del total de profesionales tienen entre
30 y 39 años y deberán marcharse, etc. Podemos hacer la lectura de todas las
combinaciones.

Otra lectura de la tabla consiste en analizar los porcentajes�por�fila: entre to-


dos los que creen que tendrán que marcharse, el 41% tiene entre 20 y 29 años;
en cambio, entre los que opinan que no deberán marcharse solo el 4,3% tiene
esta edad. Empezamos a ver más claro que en nuestra muestra la edad parece
estar relacionada con pensar que hay que marcharse fuera para desarrollar la
carrera. Finalmente, si analizamos el porcentaje�por�columna, observaremos
que el 84,6% de los procesionales menores de 30 años cree que se marchará
fuera para desarrollar la carrera profesional, porcentaje que se reduce a medida
que decrece la edad del encuestado.

(4)
Así, el análisis de tablas�de�contingencia se posiciona como una herramienta Y lógicamente para el análisis de
tablas de tres o más variables.
clave y muy potente de análisis de la relación�entre�dos�variables�cualitati-
vas4. Si situamos este análisis en el plano descriptivo, podemos afirmar que
entre los más jóvenes la creencia de tener que marchar fuera es más frecuente
(el 84,6% lo cree) que entre los que tienen entre 30 y 39 años, aunque es un
amplio 58,6%, y se reduce a 1 de cada 3, un 33,7%, a partir de los 40 años.

(5)
Pero esta diferencia entre los grupos (las combinaciones de categorías), obser- 2
Chi tiene otras muchas propie-
dades y usos, así como supuestos
vada en una muestra representativa, ¿hasta qué punto es probable que se dé
que os invitamos a estudiar.
en el total de la población? Para dar respuesta a esta pregunta podemos con-
trastar nuestros resultados con el modelo de Chi2, que compara las frecuencias
observadas y esperadas5.
© FUOC • PID_00227026 75 Técnicas de recogida de datos cuantitativos: la encuesta

Tabla 10. Pasos en el análisis de la tabla de contingencia que relaciona la variable edad y la va-
riable creencia de que en el futuro se marchará para desarrollar su carrera profesional

Frecuencias

CAP2�CAP2_¿Cuál�es�su�edad? Total

1�20-29 2�30-39 3�40-64

p122_rec 1 Totalmente o muy 55 51 28 134


P122_rec_¿Cree que seguro
en el futuro se mar-
chará fuera para 3 Poco o nada segu- 10 36 55 101
desarrollar su carrera ro
profesional?

Total 65 87 83 235

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Tabla 11. Pasos en el análisis de la tabla de contingencia que relaciona la variable edad y la va-
riable creencia de que en el futuro se marchará para desarrollar su carrera profesional

% total

CAP2�CAP2_¿Cuál�es�su�edad? Total

1�20-29 2�30-39 3�40-64

p122_rec 1 Totalmente o Recuento 55 51 28 134


P122_rec_¿Cree muy seguro
que en el futuro % del total 23,4% 21,7% 11,9% 57,0%
se marchará fuera
para desarrollar
3 Poco o nada se- Recuento 10 36 55 101
su carrera profe-
guro
sional?
% del total 4,3% 15,3% 23,4% 43,0%

Total Recuento 65 87 83 235

% del total 27,7% 37,0% 35,3% 100,0%

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Tabla 12. Pasos en el análisis de la tabla de contingencia que relaciona la variable edad y la va-
riable creencia de que en el futuro se marchará para desarrollar su carrera profesional

% fila

CAP2�CAP2_¿Cuál�es�su�edad? Total

1�20-29 2�30-39 3�40-64

p122_rec 1 Totalmente o Recuento 55 51 28 134


P122_rec_¿Cree muy seguro
que en el futuro % dentro de 41,0% 38,1% 20,9% 100,0%
se marchará fuera p122_red
para desarrollar P122_rec_¿Cree
su carrera profe- que en el futuro
sional? se marchará fuera
para desarrollar
su carrera profe-
sional?

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.


© FUOC • PID_00227026 76 Técnicas de recogida de datos cuantitativos: la encuesta

% fila

CAP2�CAP2_¿Cuál�es�su�edad? Total

1�20-29 2�30-39 3�40-64

3 Poco o nada se- Recuento 10 36 55 101


guro
% dentro de 9,9% 35,6% 54,5% 100,0%
p122_red
P122_ rec_¿Cree
que en el futuro
marchará fuera
para desarrollar
su carrera profe-
sional?

Total Recuento 65 87 83 235

% dentro de 27,7% 37,0% 35,3% 100,0%


p122_red
P122_ rec_¿Cree
que en el futuro
se marchará fuera
para desarrollar
su carrera profe-
sional?

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Tabla 13. Pasos en el análisis de la tabla de contingencia que relaciona la variable edad y la va-
riable creencia de que en el futuro marchará para desarrollar la carrera profesional

% columna

CAP2�CAP2_¿Cuál�es�su�edad? Total

1�20-29 2�30-39 3�40-64

p122_rec 1 Totalmente o Recuento 55 51 28 134


P122_rec_¿Cree muy seguro
que en el futuro % dentro de 84,6% 58,6% 33,7% 57,0%
se marchará fuera CAP2
para desarrollar CAP2_¿Cuál es su
su carrera profe- edad?
sional?
3 Poco o nada se- Recuento 10 36 55 101
guro
% dentro de 15,4% 41,4% 66,3% 43,0%
CAP2
CAP2_¿Cuál es su
edad?

Total Recuento 65 87 83 235

% dentro de 100,0% 100,0% 100,0% 100,0%


CAP2
CAP2_¿Cuál es su
edad?

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.


© FUOC • PID_00227026 77 Técnicas de recogida de datos cuantitativos: la encuesta

Podemos realizar el test de significación y observar exclusivamente probabi-


lidad asociada a equivocarnos. La tabla siguiente nos indica el valor de Chi2
observado en nuestros datos (y que en estos momentos no significa nada para
nosotros) y el nivel de significación de la prueba. Es decir, que la probabilidad
de equivocarnos es 0,000.

Si aplicamos el criterio 0,05,�y�dado�que�0,000�está�por�debajo,�afirmaremos


que�es�muy�probable�que�exista�relación�entre�la�edad�y�la�creencia�de�que
se�marchará�para�desarrollar�la�carrera�profesional. O, lo que es lo mismo,
que es poco probable que nos equivoquemos al realizar esta afirmación.

No obstante, es muy probable que construyamos una frase algo más interesan-
te, del tipo: “Existe una relación estadísticamente significativa entre la edad
de los profesionales de la danza y la creencia de que hay que marcharse para
desarrollar la carrera profesional”.

2
Tabla 14. Test de Chi para la relación entre la variable edad y la variable creencia de que en el
futuro se marchará para desarrollar su carrera profesional

Pruebas de chi-cuadrado

Valor gl Sig.�asintóti-
ca�(bilateral)

Chi-cuadrado de Pear- 38,651(a) 2 ,000


son

Razón de verosimilitu- 41,192 2 ,000


des

Asociación lineal por 38,480 1 ,000


lineal

Núm. de casos válidos 235

(a) 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima espera-
da es 27,94.

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

En resumen, en el análisis de la relación entre dos variables cualitativas pode-


mos emplear el estudio de las tablas de contingencia y el contraste de Chi2.
En procedimiento abreviado de la prueba de significación, no se interpreta el
valor de este estadístico, sino su significación, que estableciendo un nivel de
confianza del 95% es necesario que sea inferior a 0,05.

2
Hay que tener presente que Chi indica si existe asociación o no a nivel global,
es decir, en el conjunto de datos de la tabla. Pero no indica cuál es el sentido
de la asociación, es decir, qué variable influye en cuál, cuál es la intensidad de
la asociación, ni entre qué par de categorías existe la relación. Además, es una
estadística sensible al número de filas y columnas, y al número de casos en
© FUOC • PID_00227026 78 Técnicas de recogida de datos cuantitativos: la encuesta

cada casilla, de manera que existen otras estadísticas y correcciones que nos
pueden ayudar a ser más precisos en nuestras afirmaciones: Phi, V, solución
de Yates, etc.

6.6.3. Relación entre una variable cualitativa y una


cuantitativa: ANOVA y test T-student

Una segunda situación habitual en investigación social es analizar la relación


entre una variable cualitativa y una variable cuantitativa. En este caso, para
cada categoría de la variable cualitativa podemos calcular los estadísticos de
resumen ya aprendidos (media, desviación, mediana, etc.). Observamos la re-
lación entre la variable edad (resumida en tres categorías, por lo tanto cualita-
tiva) y la variable número de veces que se ha marchado fuera para ejercer su
profesión. Según la tabla siguiente los menores de 30 años se han marchado
una media de 3,83 veces para ejercer su profesión. Entre los 30 y 39 años la
media es de 14,69 veces. A partir de los 30 años observamos también que exis-
te mucha variabilidad de situaciones (desviación típica de los 30 a 39 años,
un 31,71%).

Así, nos preguntamos si esta diferencia en las medias de los diferentes grupos
se puede inferir al conjunto de la población. Este procedimiento se denomina
ANOVA (del inglés analysis of variance, análisis de la varianza). El modelo de
distribución asociado a este procedimiento y condiciones es el modelo F.

De nuevo, usando el procedimiento abreviado del contraste mediante la prue-


ba�de�significación, y marcando un umbral de 0,05, observamos que el nues-
tro es de 0,014; por debajo de 0,05, afirmaremos�que�es�muy�probable�que
exista�relación�entre�la�edad�y�el�número�de�veces�que�se�ha�marchado�a
ejercer�la�profesión�fuera. O, lo que es lo mismo, que es poco probable que
nos equivoquemos al hacer esta afirmación.

Nuevamente, podemos construir una frase más interesante: “Existe una rela-
ción estadísticamente significativa entre la edad de los profesionales de la dan-
za y las veces que se ha marchado fuera a ejercer la profesión”.

Tabla 15. Test ANOVA para la relación entre la variable de edad y la variable número de veces
que se ha marchado fuera para ejercer su profesión

p118_1_other P118s. Número de veces que ha mar-


chado fuera de Cataluña para ejercer su profesión

Intervalo�de�con-
fianza�para�la
media�al�95%

N Media Desvia- Error Límite Límite Mínimo Máximo


ción típico inferior superior
típica

1 20-29 46 3,83 3,743 ,552 2,71 4,94 1 20

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.


© FUOC • PID_00227026 79 Técnicas de recogida de datos cuantitativos: la encuesta

p118_1_other P118s. Número de veces que ha mar-


chado fuera de Cataluña para ejercer su profesión

Intervalo�de�con-
fianza�para�la
media�al�95%

N Media Desvia- Error Límite Límite Mínimo Máximo


ción típico inferior superior
típica

2 30-39 59 14,69 31,715 4,129 6,43 22,96 1 200

3 40-64 57 50,39 139,209 18,439 13,45 87,32 1 900

Total 162 24,17 86,610 6,805 10,73 37,60 1 900

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Tabla 16. Test ANOVA para la relación entre la variable de edad y la variable número de veces
que se ha marchado fuera para ejercer su profesión – ANOVA de un factor

p118_1_other P118s. Número de veces que se ha mar-


chado fuera de Cataluña para ejercer su profesión

Suma�de gl Media�cua- F Sig.


cuadrados drática

Inter-grupos 63509,874 2 31754,937 4,413 ,014

Intra-grupos 1144208,626 159 7196,281

Total 1207718,500 161

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Recordemos que estamos ante la relación de una variable cualitativa y una


cuantitativa y que queremos estudiar la varianza, desviación en torno a la
2
media. Como Chi , nos indica si existe una relación global, pero no entre qué
par o pares de categorías se da esta diferencia, y no indica cuál es el sentido
de la asociación, qué variable influye en cuál ni cuál es la intensidad de la
asociación. ANOVA se utiliza cuando la variable cualitativa tiene tres o más
categorías.

En caso de que la variable cualitativa tenga dos categorías, utilizaríamos el


modelo T-Student, siguiendo los mismos criterios. Observemos el ejemplo si-
guiente: los profesionales de la danza de Cataluña de 30 a 39 años durante la
temporada 2008-2009 han pasado de media 2,17 meses en el paro, y los que
tienen de 40 a 64 años, 0,96.

Nos preguntamos si esta diferencia es probable que se dé en el conjunto de la


población. La prueba�de�significación sitúa esta probabilidad en 0,002, por
debajo de 0,05, y afirmaremos�que�es�muy�probable�que�esta�diferencia�se
dé�también�en�el�conjunto�de�la�población. Es improbable que nos equivo-
quemos al hacer esta afirmación.
© FUOC • PID_00227026 80 Técnicas de recogida de datos cuantitativos: la encuesta

La traducción menos técnica es “los menores de 40 años han pasado signifi-


cativamente más tiempo en el paro que los mayores de 40”.

Tabla 17. Test T-Student para la diferencia entre la media de meses en el paro entre los profe-
sionales de 30 a 39 años y de 40 a 64 años

Estadísticos de grupo

CAP2 N Media Desvia- Error�típ.


CAP2_¿Cuál ción�típ. de�la�media
es�su�edad?

p57 P57. 2 30-39 103 2,17 3,249 ,320


Durante la
temporada 3 40-64 97 ,96 2,263 ,230
2008-2009,
¿cuántos me-
ses en total es-
tuvo en el pa-
ro? Meses

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Tabla 18. Test T-Student para la diferencia entre la media de meses en el paro entre los profe-
sionales de 30 a 39 años y de 40 a 64 años

Prueba de muestras independientes

Prueba�de�Leve- Prueba�T�para�la�igualdad�de�varianzas
ne�para�la�igual-
dad�de�varianzas

F Sig t gl Sig.�(bi- Diferen- Error 95%�Intervalo�de�con-


lateral) cia�de típ.�de�la fianza�para�la�diferencia
medias diferencia
Inferior Superior

p57 P57. Se han 16,179 ,000 3,053 198 ,003 1,216 ,398 ,431 2,001
Durante asumido
la tem- varianzas
porada iguales
2008-2009,
¿cuántos No se han 3,085 182,669 ,002 1,216 ,394 ,438 1,994
meses en asumido
total estu- varianzas
vo en el iguales
paro? Me-
ses

Fuente: Elaboración propia a partir de los resultados ECLPDC2010.

Nota

Para practicar estos análisis esenciales disponéis al final del módulo de datos.

6.7. Más allá

No podemos pasar por alto la importancia de conocer los procedimientos de


análisis multivariable y haceros una invitación a aplicarlos. Se trata de todos
aquellos procedimientos para el�análisis�simultáneo�de�un�conjunto�de�da-
tos�con�tres�variables�o�más. Como podemos imaginar, los fundamentos ma-
temáticos de estos procedimientos son complejos, y a pesar de que se quieran
simplificar requieren cierto nivel de base matemática para poder ser compren-
© FUOC • PID_00227026 81 Técnicas de recogida de datos cuantitativos: la encuesta

didos en detalle. Pero se pueden simplificar si ponemos atención principal-


mente a sus usos, es decir, para qué sirven, a los requerimientos que tienen
(para qué variables).

En la mayoría de los casos, si se quieren aplicar estas técnicas es recomenda- Ved también
ble diseñar el cuestionario de manera apropiada, dado que son muy exigentes
Un esquema de la posible cla-
en cuanto a tipos de variables y categorías que se pueden incluir. El objetivo sificación de procedimientos
de estas técnicas es detectar las formas del comportamiento de los datos, no multivariable lo encontraréis
en el libro de López Roldán y
tabla a tabla, a partir de cruces bivariables, sino reduciendo y simplificando Lozares Colina (2000), citado
en la bibliografía.
el conjunto de interrelaciones. Una posible manera de clasificar las técnicas
es en función de las preguntas que se hacen. Se pueden clasificar además en
función de las variables involucradas, si queremos determinar una relación de
dependencia entre las variables o no, etc. En ningún caso se pueden considerar
clasificaciones excluyentes dado que la evolución acelerada de la estadística y
la computación hacen aparecer cada vez más procedimientos, impulso al que
se añaden las exigencias del mercado y la disponibilidad de big data, desarro-
llando así la ingeniería de negocio, el análisis del riesgo, la modelización, etc.

Según el objetivo del análisis se pueden destacar algunas técnicas� clásicas,


que pueden dar respuesta a más de un interés:

1)�Reducir�la�dimensionaliad: Es la función esencial del análisis�factorial,


ya sea confirmatorio o exploratorio, que incluye varios procedimientos, en-
tre los que hay que destacar: el análisis�de�correspondencias, para variables
cuantitativas, y el de componentes principales, para las variables cualitativas.
El objetivo, por lo tanto, es pasar de 20, 30, 40... variables posibles de análisis
a localizar�factores latentes, es decir, las combinaciones de variables que más
discriminan a los individuos o sujetos (personas, municipios, clientes, etc.). Se
quiere dar respuesta por lo tanto a la pregunta general: “Aparte del género, la
edad, la clase, los ingresos, etc., ¿existe alguna combinación de variables que
explique mejor que cada variable por separado las probabilidades de estar en
el paro?”.

2)�Clasificar�y�agrupar: en este caso no trabajamos con las variables sino con


los casos. Un ejemplo es el análisis de clasificación (clúster), que pretende
agrupar los casos (personas, empresas, etc.) en grupos que son internamente
homogéneos, es decir, los miembros de un grupo son personas muy similares
entre sí, y heterogéneos entre ellos, es decir, los miembros de un grupo son
muy diferentes de los miembros de otro grupo. Existen varios procedimientos:
jerárquicos o ascendientes, descendente, etc., que generan tipologías y que
quieren responder a la pregunta general: “¿Qué grupos de personas o casos
hay? Que sean grupos de casos muy similares entre ellos y muy diferentes
de los otros. Creamos tipologías. En nuestro segundo caso de estudio: dadas
estas condiciones laborales, ¿qué grupos de profesionales existen?”. Es una
investigación no realizada, así que podéis incluirla en vuestra lista de deseos.
© FUOC • PID_00227026 82 Técnicas de recogida de datos cuantitativos: la encuesta

Cabe mencionar, dado que se utiliza muy frecuentemente, el análisis�de�re-


gresión�múltiple. Se utiliza para estudiar la relación entre más de dos variables
cuantitativas (existe también la versión simple cuando se analiza la relación de
dos variables), con el objetivo de determinar qué covariaciones de x explican
y, y más precisamente encontrar la función (lineal o no) que permita calcular
esta relación. Un ejemplo que podemos usar es cuando queremos dar respues-
ta a la pregunta general: “¿Qué variables hacen variar (aumentar o reducir) el
salario?”. Nos preguntaremos varias cuestiones si queremos realizar un análisis
de regresión lineal: “¿Existe una función lineal entre estas variables, además
de una variable (edad, años estudiados, ingresos otros miembros del hogar,
etc.)? ¿Esta relación qué parte de los ingresos explica? ¿Qué variables afectan
y cuáles no? ¿Y con qué intensidad lo hace cada una de ellas?”.
© FUOC • PID_00227026 83 Técnicas de recogida de datos cuantitativos: la encuesta

7. Resumen y consideraciones finales

El estudio de este módulo debe tener la utilidad de introduciros en la investi-


gación cuantitativa y daros las herramientas esenciales para la producción de
información a través de investigación por encuesta, uno de los procedimien-
tos más populares y de los que se deriva buena parte de los datos sobre el mer-
cado de trabajo y sus indicadores esenciales. Como parte de este procedimien-
to, queremos destacar la importancia de la operativización de los conceptos
en medidas, el diseño del cuestionario y el análisis de datos. Los aprendizajes
sobre operativización os serán útiles en cualquier proceso de investigación,
mientras que el diseño de cuestionarios, en la valoración de cualquier formu-
lario. A su vez, el análisis de datos es aplicable a la mayor parte de los conjuntos
de datos de los que disponéis, aunque no procedan de muestras o encuestas,
en una etapa que los datos y el big data adquieren un gran protagonismo. Os
animamos a continuar con el estudio aplicado de las técnicas cuantitativas, así
como en los fundamentos de los conocimientos que muy simplificadamente
hemos abordado en este módulo.
© FUOC • PID_00227026 85 Técnicas de recogida de datos cuantitativos: la encuesta

Actividades
Actividad�1.�Análisis�de�datos�descriptivo�de�la�pregunta�p57_meses�que�estuvo�en�el
paro�durante�la�temporada�2008-2009

p57 P57. Durante la temporada 2008-2009, ¿cuán-


tos meses en total estuvo en el paro? Meses

Frecuencia Porcentaje Porcenta- Porcentaje


je�válido acumulado

Válidos 1 6 2,1 6,7 6,7


2 22 7,6 24,7 31,5
3 8 2,8 9,0 40,4
4 10 3,4 11,2 51,7
5 6 2,1 6,7 58,4
6 12 4,1 13,5 71,9
7 5 1,7 5,6 77,5
8 8 2,8 9,0 86,5
9 2 ,7 2,2 88,8
10 3 1,0 3,4 92,1
11 1 ,3 1,1 93,3
12 6 2,1 6,7 100,0
Total 89 30,7 100,0

Perdi- 0 169 58,3


dos 99 N.C. 21 7,2
888 No 11 3,8
estaba 201 69,3
activo
Total

Total 290 100,00

p57 P57. Durante la temporada 2008-2009, ¿cuán-


tos meses en total estuvo en el paro? Meses

Frecuencia Porcentaje Porcenta- Porcentaje


je�válido acumulado

Válidos 0 No 169 58,3 60,6 60,6


estuvo 52 17,9 18,6 79,2
en el 37 12,8 13,3 92,5
paro 21 7,2 7,5 100,0
11a5 279 96,2 100,0
2 6 a 12
99 N.C.
Total

Perdi- 888 No 11 3,8


dos estaba
activo

Total 290 100,0


© FUOC • PID_00227026 86 Técnicas de recogida de datos cuantitativos: la encuesta
© FUOC • PID_00227026 87 Técnicas de recogida de datos cuantitativos: la encuesta

N Mínimo Máximo Media Desv. típ.

p57 P57. 89 1 12 5,01 3,157


Durante la
temporada
2008-2009,
¿cuántos me-
ses en total es-
tuvo en el pa-
ro? Meses

N válido (se- 89
gún lista)

p57 P57. Durante la temporada 2008-2009, ¿cuán-


tos meses en total estuvo en el paro? Meses

N Válidos 89

Perdidos 201

Mediana 4,00

Mínimo 1

Máximo 12

Percentiles 25 2,00

50 4,00

75 7,00
© FUOC • PID_00227026 88 Técnicas de recogida de datos cuantitativos: la encuesta

Actividad�2.�Relación�entre�dos�variables�cualitativas

CAP1 CAP1_Sexo del entrevistado

1 Hombre 2 Mujer Total

p121_rec 1 Totalmente o bas- Recuento 40 130 170


P121_rec_Usted, tante dispuesto
personalmente, % dentro de 23,5% 76,5% 100,0%
¿hasta qué punto es- p121_rec
tá dispuesto a mar- P121_rec_Usted,
charse fuera para personalmente,
desarrollar su carrera ¿hasta qué punto es-
profesional? tá dispuesto a mar-
charse fuera para
desarrollar su carrera
profesional?

% dentro de CAP1 85,1% 58,0% 62,7%


CAP1_Sexo del en-
trevistado

% del total 14,8% 48,0% 62,7%

3 Poco o nada dis- Recuento 7 94 101


puesto
% dentro de 6,9% 93,1% 100,0%
p121_rec
P121_rec_Usted,
personalmente,
¿hasta qué punto es-
tá dispuesto a mar-
charse fuera para
desarrollar su carrera
profesional?

% dentro de CAP1 14,9% 42,0% 37,3%


CAP1_Sexo del en-
trevistado

% del total 2,6% 34,7% 37,3%


© FUOC • PID_00227026 89 Técnicas de recogida de datos cuantitativos: la encuesta

CAP1 CAP1_Sexo del entrevistado

1 Hombre 2 Mujer Total

Total Recuento 47 224 271

% dentro de 17,3% 82,7% 100,0%


p121_rec
P121_rec_Usted,
personalmente,
¿hasta qué punto es-
tá dispuesto a mar-
charse fuera para
desarrollar su carrera
profesional?

% dentro de CAP1 100,0% 100,0% 100,0%


CAP1_Sexo del en-
trevistado

% del total 17,3% 82,7% 100,0%

Pruebas de Chi-cuadrado

Valor gl Sig.�asintóti- Sig.�exacta Sig.�exacta


ca�(bilateral) (bilateral) (unilateral)

Chi-cuadrado 12,177 (a) 1 0,000


de Pearson

Corrección 11,047 1 0,001


por continui-
dad (b)

Razón de ve- 13,643 1 0,000


rosimilitudes

Estadístico 0,000 0,000


exacto de Fis-
her

Asociación li- 12,132 1 0,000


neal por lineal

N de casos vá- 271


lidos

(a) 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima espera-
da es 17,52.
(b) Calculado solo para una tabla de 2x2.

Actividad�3.�Relación�entre�una�variable�cualitativa�y�otra�cuantitativa
© FUOC • PID_00227026 90 Técnicas de recogida de datos cuantitativos: la encuesta

p57 P57. Durante la temporada 2008-2009, ¿cuán-


tos meses en total estuvo en el paro? Meses

Intervalo�de�con-
fianza�para�la
media�al�95%

N Media Desvia- Error Límite Límite Mínimo Máximo


ción típico inferior superior
típica

1 For- 116 1,52 2,906 ,270 ,98 2,05 0 12


mación
mixta FR
y FNR

2 Cen- 88 1,94 3,045 ,325 1,30 2,59 0 12


trado en
FR

5 Cen- 40 1,75 3,136 ,496 ,75 2,75 0 12


trado en
FNR

Total 244 1,71 2,989 ,191 1,33 2,09 0 12

ANOVA de un factor

p57�P57.�Durante�la�temporada�2008-2009,�¿cuán-
tos�meses�en�total�estuvo�en�el�paro?�Meses

Suma�de gl Media�cua- F Sig.


cuadrados drática

Inter-grupos 9,159 2 4,579 ,511 ,601

Intra-grupos 2161,181 241 8,968

Total 2170,340 243

Estadísticos de grupo

CAP5 N Media Desviación�típ. Error�típ.�de�la�media


CAP5_CLASS3_BASE
CLASS5_NOU

p57 P57. Duran- 2 Centrado en FR 88 1,94 3,045 ,325


te la temporada
2008-2009, ¿cuán- 5 Centrado en FNR 40 1,75 3,136 ,496
tos meses en total
estuvo en el paro?
Meses
© FUOC • PID_00227026 91 Técnicas de recogida de datos cuantitativos: la encuesta

Prueba de muestras independientes

Prueba�de�Leve- Prueba�T�para�la�igualdad�de�varianzas
ne�para�la�igual-
dad�de�varianzas

F Sig t gl Sig.�(bi- Diferen- Error 95%�Intervalo�de�con-


lateral) cia�de típ.�de�la fianza�para�la�diferencia
medias diferencia
Inferior Superior

p57 P57. Se han 0,60 ,807 ,330 126 ,742 ,193 ,586 -,967 1,353
Durante asumido
la tem- varianzas
porada iguales
2008-2009,
¿cuántos No se han ,326 73,541 ,745 ,193 ,593 -,988 1,374
meses en asumido
total estu- varianzas
vo en el iguales
paro? Me-
ses

Observaciones variable cualitativa: Tipo de formación realizada: 1. Formación mixta forma-


ción reglada y formación no reglada. 2. Centrada en formación reglada. 5. Centrada en for-
mación no reglada.
© FUOC • PID_00227026 92 Técnicas de recogida de datos cuantitativos: la encuesta

Bibliografía
Bibliografía citada

Alvira Martín, F. (2004). La encuesta: una perspectiva general metodológica. Madrid: CIS
(“Cuadernos Metodológicos”).

Anduiza, E., Crespo,I., Crespo-Martínez, I., y Méndez-Lago, M. (2009). Metodología


de la ciencia política. Madrid: CIS. Cuadernos Metodológicos.

Cea D’Ancona, M. (1996). Metodología cuantitativa: estrategias y técnicas de investigación so-


cial. Madrid: Ed. Síntesis.

Corbetta, P. (2003). Metodologías y técnicas de investigación social. Madrid: McGraw-Hill.

Couper, M. (2000). Web Surveys: A Review of Issues and Approaches [artículo en línea]. The
Public Opinion Quarterly, 4 (64).

http://www.goethe-university-frankfurt.de/47929851/couper_2000.pdf

Couper, M. (2005). Technology Trends in Survey Data Collection. Social Science Computer,
invierno, 23, 486-501.

doi: 10.1177/0894439305278972

Díaz de Rada, V. (2012). Ventajas e inconvenientes de la encuesta por Internet [artículo


en línea]. Papeles (97/1).

http://www.raco.cat/index.php/Papers/article/download/248512/332636

Hand, D. J. (2009). Modern statistics: the myth and the magic. Journal of the Royal Statistical
Society: Series A (Statistics in Society), 172, 287-306. doi: 10.1111/j.1467-985X.2009.00583.x

Kothari, C. R. (2004). Research Methodology: Methods and Techniques. New Delhi: New Age
International.

López Roldán, P. y Lozares Colina, C. (1999). Análisis bivariable de datos estadísticos.


Bellaterra: Universitat Autònoma de Barcelona.

López Roldán, P. y Lozares Colina, C. (2000). Análisis multivariable de datos estadísticos.


Bellaterra: Universitat Autònoma de Barcelona.

Tarrow, S. (1995). Review: Bridging the quantitative-qualitative divide in political science.


Reviewed work: Designing Social Inquiry: Scientific Inference in Qualitative Research by Gary
King, Robert O. Keohane, Sidney Verba [artículo en línea]. American Political Science Review,
2 (89).

http://www.jstor.org/stable/2082444?origin=crossref&seq=1#page_scan_tab_contents

Bibliografía general

Aguilera del Pino, A. M. (2001). Tablas de contingencia bidimensionales. Madrid: La Muralla


(“Cuadernos de Estadística”).

Aguilera del Pino, A. M. (2006). Modelización de tablas de contingencia multidimensionales.


Madrid: La Muralla (“Cuadernos de Estadística”).

APA (2009). Publication Manual of American Psychological Association (6.ª edición). Washing-
ton, DC: APA.

Azofra Márquez, M. J. (1999). Cuestionarios. Madrid: CIS (“Cuadernos Metodológicos”).

Creswell, J. (2003). Research Design: Qualitative & Quantitative and Mixed Methods Approaches
(2.ª edición). Thousand Oaks (CA), London, New Delhi: Sage.

Díaz de Rada, V. (2010). Comparación entre los resultados proporcionados por encuestas telefó-
nicas y personales: el caso de un estudio electoral. Madrid: CIS (“Opiniones y Actitudes”, 66).

Friedman, D. y Sunder, S. (1994). Experimental Methods. A Primer for Economists. Cambrid-


ge: Cambridge University Press.
© FUOC • PID_00227026 93 Técnicas de recogida de datos cuantitativos: la encuesta

García Ferrando, M. (1994). Socioestadística. Introducción a la estadística en sociología. Ma-


drid: Alianza (“Alianza Universidad Textos”, 96).

Hair, J. F., Anderson, R. E., Tatham, R. L., y Black, W. C. (1999). Análisis multivariante.
Madrid: Prentice-Hall.

Lago Peñas, I. (2008). La lógica de la explicación en las ciencias sociales: una introducción
metodológica. Madrid: Alianza Editorial.

Levy, J. P. y Valera, J. (2003). Análisis multivariado para ciencias sociales. Madrid: Prenti-
ce-Hall.

López Roldán, P. y Fachelli, S. (2015). Metodología de la investigación social cuantitativa


(1.ª edición). Bellaterra (Cerdanyola del Vallès): Dipòsit Digital de Documents, Universitat
Autònoma de Barcelona. Edición digital.

http://pagines.uab.cat/plopez/content/manual-misc

Newbold, P. (2008). Estadística para administración y economía. Madrid: Pearson, Prentice


Hall.

Quivy, R. y Van-Campenhoudt, L. (1999). Manual de investigación en ciencias sociales.


México: Limusa.

Ritchey, F. J. (2006). Estadística para las ciencias sociales. México: McGraw Hill.

Sánchez Carrión, J. J. (1995). Manual de análisis de datos. Madrid: Alianza.

Stevens, S. S. (ed.) (1951). Handbook of Experimental Psychology. New York: Wiley.

Materiales complementarios de la UOC

Marco teórico y diseño:

Santana Leitner, A. (2012). El disseny de la recerca. Barcelona: Fundació UOC.

Santana Leitner, A. (2012). Marc teòric i disseny empíric. Barcelona: Fundació UOC.

Diseño de cuestionario:

Meneses, J. (2012). El qüestionari. Barcelona: Fundació UOC.

Estadística y análisis de datos:

Grenacre, M. (2012). Estadística I. Barcelona: Fundació UOC.

Fornieles, A., Domènech, J. M., y Bonillo, A. (2010). Tutorial de l’Excel XP. Barcelona:
Fundació UOC.

Liviano Solís, D. y Pujol Jover, M. (2010). Matemáticas y estadística con R. Barcelona:


Fundació UOC.

Observaciones: La UOC dispone de muchos otros documentos que os pueden ser de ayuda
en la ampliación de conocimientos y práctica en esta materia. Esta solo pretende ser una
breve selección.

Listado de software específico para análisis de datos

Software de pago

SAS

Statistical Analysis System

http://www.sas.com/

SPAD

Système Pour l’Analyse des Données

http://www.coheris.com/produits/analytics/logiciel-data-mining/
© FUOC • PID_00227026 94 Técnicas de recogida de datos cuantitativos: la encuesta

SPSS

Statistic Package for Social Science

http://www-01.ibm.com/software/analytics/spss/

STATA

Data Analysis and Statistical Software

http://www.stata.com/

Software libre

https://cran.r-project.org/

PSPP

http://www.gnu.org/software/pspp/

Nota:

Es importante que os animéis a descargar y trabajar con software especializado. Aun así, os
facilitamos un manual de Excel XP que también permite realizar análisis de datos, si bien con
más limitaciones o complicaciones que los softwares específicos. Encontraréis la referencia
en el apartado dedicado a materiales de la UOC.

Vous aimerez peut-être aussi