Académique Documents
Professionnel Documents
Culture Documents
recogida de datos
cuantitativos: la
encuesta
Montserrat Martínez Melo
PID_00227026
© FUOC • PID_00227026 Técnicas de recogida de datos cuantitativos: la encuesta
Ninguna parte de esta publicación, incluido el diseño general y la cubierta, puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio, sea éste eléctrico,
químico, mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la previa autorización escrita
de los titulares del copyright.
© FUOC • PID_00227026 Técnicas de recogida de datos cuantitativos: la encuesta
Índice
Introducción............................................................................................... 5
Objetivos....................................................................................................... 7
1. Introducción........................................................................................ 9
1.1. La técnica de encuesta en el contexto de la metodología
cuantitativa .................................................................................. 9
1.1.1. Una mirada rápida a la metodología cuantitativa y la
perspectiva multiestratégica .......................................... 9
1.1.2. Diferentes técnicas asociadas a la metodología
cuantitativa: características esenciales de la encuesta ... 10
1.1.3. Limitaciones de la investigación por encuesta .............. 13
1.2. Pasos clave para la realización de una encuesta ......................... 14
1.3. Casos de ayuda al estudio ........................................................... 16
4. Diseño muestral.................................................................................. 43
4.1. Conceptos clave .......................................................................... 43
4.2. Muestreo probabilístico: confianza, error y tamaño de la
muestra ........................................................................................ 46
4.3. Estructurar y estratificar una muestra ......................................... 49
4.4. Recomendaciones y ayudas ........................................................ 49
Actividades.................................................................................................. 85
Bibliografía................................................................................................. 92
© FUOC • PID_00227026 5 Técnicas de recogida de datos cuantitativos: la encuesta
Introducción
La finalidad de este módulo es ayudar a construir estos instrumentos y a utili- Ved también
zarlos, por lo que centraremos la atención en las técnicas: experimentos o casi
Sobre la distinción entre me-
experimentos, test y encuesta son los principales instrumentos, asociados a todología y método es intere-
la sociometría, psicometría o econometría. Específicamente, dedicaremos los sante la aportación de Kothari
(2004), que encontraréis cita-
esfuerzos a la técnica de encuesta. do en la bibliografía.
Esta manera de clasificar las diferencias entre las palabras metodología, método y
técnica –palabras muy utilizadas– puede ser muy sencilla de entender a primera
vista. Aun así, a menudo encontraremos que se utilizan como sinónimos, de
© FUOC • PID_00227026 6 Técnicas de recogida de datos cuantitativos: la encuesta
Objetivos
2. Conocer los diferentes pasos para llevar a cabo investigación por encuesta,
específicamente: elaboración del cuestionario, procedimientos de mues-
treo y análisis estadístico de datos.
© FUOC • PID_00227026 9 Técnicas de recogida de datos cuantitativos: la encuesta
1. Introducción
Como en el módulo inicial, centrado en las técnicas cualitativas, hay que re-
cordar que la asignatura no tiene por finalidad ahondar en el debate en torno
a la diferenciación entre metodologías, pero sí queremos apostar firmemente
por la perspectiva multiestratégica, que se posiciona ante la complejidad de la
realidad con complejidad de miradas y estrategias para conocerla y compren-
derla, de manera que ya sea a la vez o en secuencia la combinación de métodos
es la gran oportunidad de la ciencia social para resultar ciencia.
“We should also try to use different kinds of evidence together and in sequence and
Ved también
look for ways of triangulating different measures on the same research problem” (Tarrow,
1995).
Una revisión interesante y rápi-
da de estos procedimientos la
encontraréis en el artículo de
Tarrow (1995).
© FUOC • PID_00227026 10 Técnicas de recogida de datos cuantitativos: la encuesta
1)�Experimentos
2)�Tests
Ahora mismo es posible que determinados términos utilizados para describir tan breve-
mente estas grandes familias de técnicas os generen cierta confusión: variable, respuesta
cerrada, escala, formulario y estandarización, entre otros. Aun así, a lo largo de los próximos
apartados estos quedarán claramente definidos.
3)�Encuesta
Estas son las decisiones�fundamentales que hay que tomar para diseñar una
encuesta: qué,�cómo y a�quién. Ahora bien, será necesario abordar muchas
otras, como por ejemplo cómo actuar para conseguir la muestra o qué hacemos
después con los datos que obtendremos. Los apartados 4 y 5 del módulo nos
orientarán sobre estos pasos.
© FUOC • PID_00227026 12 Técnicas de recogida de datos cuantitativos: la encuesta
Además, existen muchos y variados diseños que violentan o son creativos en Contenido
alguno de los puntos mencionados, como por ejemplo los paneles, que reali- complementario
zan la misma o diferentes encuestas a la misma muestra reiteradamente. Co- Hay que excluir de esta noción
mo veremos, es el caso de la Encuesta de población activa, que será uno de clásica de censo el censo 2011
español, que adoptó la forma
nuestros casos de ayuda en el estudio. de encuesta, como en otros
países europeos. Podéis con-
sultar la información metodo-
lógica en la web del Instituto
Nacional de Estadística.
© FUOC • PID_00227026 13 Técnicas de recogida de datos cuantitativos: la encuesta
3) Diseño muestral
Cada uno de los siguientes apartados os guiará en estas decisiones, si bien hay
que tener presente que las diferentes decisiones están muy interrelacionadas:
por ejemplo, si decidimos hacer una encuesta a trabajadores de los servicios
de limpieza (universo y muestra), habría que valorar si la encuesta en línea es
la más adecuada. O bien, si la encuesta está orientada a profesionales especia-
lizados en ocupaciones de alto nivel, deberemos tener muy en cuenta la for-
mulación de las preguntas para ser precisos en lo que medimos. Igualmente,
si en nuestro diseño optamos por realizar encuestas a altos cargos de empre-
sas y administraciones, hay que pensar que el trabajo de campo, es decir, el
tiempo para producir la información, no será breve en cuanto que se trata de
personas a las que tendremos difícil acceso y con limitaciones de tiempos y
disponibilidad para atendernos.
A su vez, en ocasiones, habrá que volver atrás para poder continuar. Si bien
como procedimiento estandarizado y rígido que hemos caracterizado no siem-
pre será posible o será imposible, se puede dar el caso de que al diseñar el cues-
tionario y hacer una muy recomendable prueba piloto, descubrimos que nos
faltan opciones de respuesta o conceptos no cubiertos, de manera que hay que
retomar la revisión de los conceptos y el diseño del formulario.
© FUOC • PID_00227026 16 Técnicas de recogida de datos cuantitativos: la encuesta
Ved también
Caso 1. Estadística oficial. Encuesta de población activa
Sobre matrices de datos, análi-
La EPA es sin duda una de las operaciones de estadística oficial que más utilizaréis sis de datos y software para el
como profesionales del ámbito laboral. Para empezar, os ayudará a introduciros en análisis de datos, podéis dirigi-
el estudio si descargáis la información metodológica que nos ofrece el Instituto Na- ros al apartado 6 de este mó-
cional de Estadística. dulo.
Lógicamente esta ruta de acceso puede variar, y los documentos pueden ser revisados
o actualizados.
Sobre la EPA existen otros muchos documentos de interés: las clasificaciones que
utiliza y los módulos especiales que ha usado para indagar sobre cuestiones concre-
tas: mercado de trabajo e inmigración, accidentalidad y salud, transiciones laborales,
conciliación, etc.
Os recomiendo que reviséis todas las que queráis, y que las uséis a lo largo de vues-
tra vida académica y profesional, dado que si bien es una operación con decisiones
cuestionables es una fuente sólida y estable muy importante, que nos permite reali-
zar comparativas europeas e internacionales. Aun así, los documentos que os hemos
indicado son suficientes para ilustrar el módulo.
Al mismo tiempo, podéis disponer de los datos en varios formatos: por un lado, podéis
generar vosotros mismos resultados mediante la página del INE, pedir a este que os
los genere, lo que supone un coste económico, o disponer de las matrices de datos
para haceros vosotros mismos los resultados. Aprenderemos más sobre lo que es una
matriz de datos en el apartado 6 de este módulo, aunque hay que advertir que usar
estas matrices requiere cierto conocimiento tanto informático como estadístico.
Caso�2.�Estudio�“Les�condicions�laborals�dels�professionals�de�la�dansa�a�Cata-
lunya”�(2009)
Actividad
Ahora que tenéis una visión de los principios y usos de las principales técnicas cualita-
tivas y cuantitativas, os recomendamos hacer el ejercicio de diseñar un procedimiento
metodológico multiestratégico, combinando metodología cualitativa y cuantitativa, pa-
ra dar respuesta a vuestros interrogantes de estudio.
© FUOC • PID_00227026 18 Técnicas de recogida de datos cuantitativos: la encuesta
Partiendo de que ya hemos realizado la ardua tarea de elegir un tema y aco- Ved también
tarlo mínimamente, es el turno de documentarnos sobre él para definir qué
Para ahondar en esta fase os
estudiaremos. Este paso para determinar el estado del arte o de la cuestión recomendamos los materiales
cumple muchas funciones de las que hay que destacar la función de precisar elaborados por Santana Leit-
ner (2012). Concretamente los
el�problema�de�investigación�construyendo�así�algo�abarcable�y�cognosci- módulos “El disseny de la re-
cerca” y “Marc teòric i disseny
ble. Buscaremos por lo tanto artículos académicos, libros y otras publicaciones empíric”.
que se relacionen con nuestro tema y ámbito.
Tarea Ejemplo/comentarios
1. Conceptualización (variable)
¿Qué entendemos por condiciones laborales? Revisión de distintos textos. Copia de una defi-
nición o integración de varias definiciones en
una nueva.
Quedan excluidas otras maneras de entender
el concepto.
2. Dimensionalización
Fuente: Elaboración propia a partir de la publicación de Martínez Melo (2011): Estudi Condicions Laborals dels professionals de
la dansa de Catalunya. Associació de professionals de la dansa de Catalunya.
© FUOC • PID_00227026 20 Técnicas de recogida de datos cuantitativos: la encuesta
Tanto la EPA como el caso 2 no están acompañados de marco teórico que po-
sicione la investigación en una determinada mirada al mercado laboral, ni que
defina los conceptos y los referencien. Ahora bien, la EPA tiene otros muchos
documentos que la acompañan y el trabajo de muchos investigadores para
armonizar conceptos y medidas a nivel europeo. Será uno de los aspectos que
se trabajarán en el módulo siguiente.
Actividad
A partir del cuestionario de la EPA y del cuestionario sobre las condiciones laborales de
los profesionales de la danza, podríais reconstruir la operativización de los conceptos.
Además, esta construcción os permitirá determinar: ¿qué se han incluido y qué no?, ¿a
qué definición corresponden? En el apartado de definiciones de la EPA también encon-
traréis pistas sobre cómo se concibe cada aspecto que hay que medir.
Pero ahora mismo, podríais valorar por ejemplo la propuesta del caso 2: en
vuestra opinión, ¿qué queda fuera?, ¿en la medida de la relación con la activi-
dad hay algo que os extrañe? En el caso 1, ¿dónde queda el trabajo doméstico?,
¿y la formación no formal?
Bien, en este momento podemos tener una visión más afinada de por qué es
una técnica estandarizada. Unos conceptos claros y excluyentes, con fragmen-
tación de diferentes aspectos y con medidas específicas que habrá que formu-
lar.
Los indicadores que deben dar cuenta de cada dimensión y por lo tanto de los
conceptos se constituyen en las referencias observables que también preten-
den dar cuenta de la máxima riqueza del concepto con el mínimo de informa-
ción, haciendo valer el principio de parsimonia. Aun así, hay que tener pre-
sente que por mucho que intentemos alcanzar el máximo de los conceptos, la
investigación en sí y la operativización son un proceso de elección y renuncia.
En estos casos, hay que definir y delimitar ambas poblaciones y definir sobre
cuál realizaremos el procedimiento de muestreo, es decir, cuál responderá la
encuesta. Esta situación no es la más frecuente pero hay que tenerla en cuenta
por las repercusiones que tendrá en el diseño muestral y también del cuestio-
nario.
En resumen, esta etapa clave que condiciona el resto de las decisiones consiste
en hacer un esfuerzo de reducción de la complejidad y de fragmentación, en
definitiva, de adelgazamiento (Anduiza y otros, 2009), asumido que los volú-
menes y las magnitudes son relevantes a pesar de la consecuente pérdida de
textura.
Pasemos, pues, a mostrar los pasos que aseguran que avanzaremos con correc- Ved también
ción.
Para ampliar el estudio sobre
diseño de cuestionario, os re-
3.1. Tipos de encuestas comendamos el módulo ela-
borado por Meneses (2012),
concretamente el módulo “El
cuestionario”.
Una de las decisiones consiste en cómo�abordar�a�los�encuestados. Aunque
no hemos estudiado el tipo de muestreo que realizaremos –lo haremos en el si-
guiente punto–, sabemos que tarde o temprano tocará determinar cómo�con-
tactamos con ellos. Empecemos sintetizando las tres�grandes�familias de en-
cuestas según cómo�organizamos�el�trabajo�de�campo.
Autoadministrada • Correo
• En línea
Sobra que decir que existen muchos y variados diseños y soluciones en cada Contenido
subtipo, combinación de tipo y subtipo, y que el desarrollo de la encuesta complementario
en línea ha generado una amplia literatura sobre este procedimiento y básica- Como veis, volvemos a usar la
mente sobre los inconvenientes de varias soluciones poco rigurosas. palabra procedimiento, de ma-
nera que encontraréis que a
menudo también se denomi-
na esta decisión como método
No obstante, antes pasaremos a detallar las ventajas e inconvenientes princi- de�encuestación.
pales de cada gran familia.
1)�Encuesta�personal
2)�Encuesta�telefónica
3)�Encuesta�autoadministrada
Actividad
De nuevo, hay que remarcar que muchas investigaciones optan por lo que
denominamos encuestación�multimétodo, es decir, combinar varios proce-
dimientos para acceder a perfiles diferentes. Así, ante la constatación de que
cada vez son más las personas y los hogares que disponen como única fuente
de contacto de teléfono móvil, se combinan encuestas personales y telefónicas
(generalmente mediante teléfono fijo). O bien, encuesta en línea y telefónica.
Hay que valorar cuándo la decisión que tomamos puede intervenir de mane-
ra determinante en la composición de la muestra que queremos conseguir.
Por ejemplo, ¿si optamos por una encuesta telefónica llegaremos a una buena
muestra de jóvenes o de personas inmigradas? ¿Si decidimos hacer encuesta
autoadministrada en línea, qué perfil no podrá participar? ¿Qué relevancia
tiene este sesgo?
Actividad
Si estáis diseñando una investigación por encuesta, ¿cuál sería vuestra opción? Hay que
argumentar las ventajas e inconvenientes esperados. Y, al finalizar, valorar el efecto que
nuestra elección haya podido tener en la calidad de la muestra conseguida.
Ved también
El interés por la encuesta en línea que seduce por su bajo coste requiere repensar sus
ventajas e inconvenientes. Os pueden ayudar en esta tarea las lecturas de Couper (2000
y 2005) y de Díaz de Rada (2012) que encontraréis citadas en la bibliografía.
1) Registrar la información.
a) el mismo orden;
c) la misma forma, y
A pesar de las recomendaciones que haremos a partir de ahora sobre tipos, Nota
formulación y orden, lo cierto es que la mejor manera de aprender y tener
Los enlaces que facilitamos
opciones y alternativas para el investigador novel es revisando cuestionarios. son válidos a fecha de junio de
Actualmente, este procedimiento es muy sencillo, dado que la mayor parte 2015.
de las fuentes ofrecen los formularios utilizados. Ya habéis visitado la web del
INE y habéis revisado los formularios de los casos 1 y 2. En el INE podéis
consultar otros muchos cuestionarios, como también os ofrecen el Centro de
Investigaciones Sociológicas, el Instituto de Estadística de Cataluña o el Centro
de Estudios de Opinión.
3.2.2. Tipos
1)�Estructurado
2)�Semiestructurado
3)�No�estructurados
En los que se presentan preguntas abiertas sobre temas y en los que puede
variar tanto el orden como la formulación. Estos tipos de cuestionarios son
infrecuentes en investigación cuantitativa, dado que son formas muy similares
a las entrevistas y violentan las finalidades de estandarización.
1)�Soporte�informatizado
2)�Soporte�papel
Es difícil disponer de una directriz clara sobre el orden en el que deben ser
formuladas las preguntas en un cuestionario, dado que se trata de una conver-
sación sobre varios temas en el contexto de una investigación y por lo tanto
la pertinencia del orden puede tener soluciones diferentes. De este modo, el
orden de las preguntas está al servicio de los objetivos y la metodología del
estudio.
Hay que tener presente que el objetivo del orden es, generalmente, conseguir
que las preguntas�fluyan�en�un�orden�natural�y�se�produzca�una�conver-
sación. Aun así, el diseño puede romper este objetivo buscando� un� deter-
minado�efecto o función. Es el caso por ejemplo de las encuestas electorales
(preguntar o no al principio por simpatía por los partidos o por intención de
voto) o de las encuestas sobre conocimientos y usos (por ejemplo en el uso
de lenguas), y específicamente de los tests, en los que el orden cumple una
estratégica metodológica.
Otras recomendaciones con relación al orden de las preguntas que pueden ser
útiles para iniciarse en esta tarea son las siguientes: agrupar las preguntas o
cuestiones afines, es decir, tratar un tema una sola vez; empezar por las pre-
guntas generales y seguir con las específicas, contextualizar los cambios de te-
mas con textos que incentiven al encuestado a no desconectar de la conver-
sación; agrupar las preguntas de formato similar: escalas similares juntas por
ejemplo, de modo que si tenemos varias preguntas con escala de respuesta
(ejemplo de 0 a 10, o de 1 a 5) las agrupamos dentro de lo posible por bloques;
en el caso de tener muchas formulaciones similares, seccionar el cuestionario
en partes rompiendo con preguntas sencillas para variar el ritmo de la entre-
vista. Finalmente, fuera de la conversación, el cuestionario puede incluir pre-
© FUOC • PID_00227026 31 Técnicas de recogida de datos cuantitativos: la encuesta
3.4. Formulaciones
Por otro lado, hay que tener presente que todas estas preguntas, ya sean las
que queramos usar de filtro, para clasificar los encuestados, para controlar la
entrevista o la muestra, etc., es posible que no estén incluidas en la operativi-
zación de conceptos que se ha realizado al principio de la investigación. Por lo
tanto, ahora toca incluirlas en nuestro esquema para poder realizar un buen
cuestionario.
Actividad
1)�Preguntas�abiertas
Ejemplo caso 2
P90. Según su opinión, ¿cómo describiría las condiciones laborales de los/las profesiona-
les de la danza? [LITERAL, MÚLTIPLE]
______________________
______________________
______________________
2)�Preguntas�cerradas
© FUOC • PID_00227026 33 Técnicas de recogida de datos cuantitativos: la encuesta
a)�Dicotómicas
Ejemplo caso 2
b)�Politómicas
Escalares�u�ordinales
Ejemplo caso 2
P7. [P6 = 1]: ¿Me podría indicar cuánto dinero cobra cada mes de su pensión de jubilación
(descontando impuestos y otras deducciones)?
De 1.201 a 1.500 8
euros/mes
Ejemplo�caso�2
(no leer) Nc 99
No�escalares
Ejemplo caso 2
P71. De las posibilidades siguientes, ¿cuál refleja mejor su situación actual? [LEER, SIM-
PLE]
(no leer) Nc 99
© FUOC • PID_00227026 35 Técnicas de recogida de datos cuantitativos: la encuesta
3)�Preguntas�semiabiertas
Ejemplo caso 2
P6. [P5 = 2, 3 o 4]: Actualmente, ¿qué pensiones o ayudas del estado u otras administra-
ciones percibe? Puede marcar más de una. [NO LEER, MÚLTIPLE]
Ayuda a la alimentación 3
Pensión de viudedad 4
(no leer) NC 99
Tanto las preguntas cerradas como las semiabiertas permiten una mayor rapi-
dez�de�registro de las respuestas que las abiertas y, en general, son rápidas�de
analizar. Además de la ya mencionada limitación de análisis y la dificultad
para construir opciones de respuesta precisas y excluyentes, hay que tener pre-
sente que no�se�recomiendan�las�precodificaciones�largas, como máximo
de 5 a 7 opciones, dado que más opciones generan desatención de la encuesta
en las últimas opciones. Las dificultades para reducir el rango de respuestas
obliga a menudo a convertirlas en preguntas semiabiertas, dando la opción
al entrevistado de añadir respuestas, o bien a rotar las opciones de respuesta
de manera que a cada encuestado se le ofrezcan en un orden diferente para
intentar evitar así el efecto orden.
1)�Espontánea
2)�Sugerida
Dar las opciones de respuesta ayuda� a� la� memoria� de� los� entrevistados� y
facilita�y�agiliza�la�conversación. Hay que prever si con este objeto, en el
caso de la encuesta presencial, la persona participante requiere material de
apoyo como el que presentamos en la imagen siguiente. Lógicamente limitar
las opciones de respuesta implica rigidez en la conversación, y como se ha
comentado en el apartado anterior existe un límite en el número de opciones
de respuesta.
1)�Simple
© FUOC • PID_00227026 37 Técnicas de recogida de datos cuantitativos: la encuesta
2)�Múltiple
Básicas�(de�Stevens)
1) Nominal
2) Ordinal
3) De intervalo
4) De razón (ratio)
© FUOC • PID_00227026 38 Técnicas de recogida de datos cuantitativos: la encuesta
Comparativas
5) Comparaciones emparejadas
6) De clasificación
7) De suma constante
8) De Guttman
9) De clases o similitudes
No�comparativas
12) Likert
14) Stapel
15) Thurstone
Llega el momento, pues, de ponerse manos a la obra para elegir qué formula-
ción tendrá cada uno de los indicadores de nuestro modelo de operativización.
Algunas recomendaciones�generales al encarar esta tarea pasan por procurar
una redacción en lenguaje claro y un vocabulario adecuado a la población en-
trevistada. Entre la población general hay que evitar los tecnicismos; entre la
población específica se aconseja explicarlos para asegurar el mutuo entendi-
miento. Hay que evitar enunciados o frases con formulación negativa, enun-
ciados largos, un exceso de preguntas tipo examen y que estas no resulten ex-
cesivamente abstractas o filosóficas. Las preguntas pueden ser contextualiza-
das para mejorar la comprensión de la persona entrevistada y hay que evitar
siempre que se pueda redactar en una sola pregunta dos cuestiones o indica-
dores.
Validación
Variable
3) Validar el contenido.
6) Validar el formato del formulario: utilidad para los diferentes usuarios (en-
trevistadores o entrevistados, grabadores, depuradores, codificadores, etc.).
¿Pueden leerlo, registrar las respuestas, grabar los datos ágilmente y con pocos
errores?
Ahora bien, estos tipos de pilotajes no siempre son viables en otros contextos.
Como os proponíamos, en el segundo ejemplo acceder a personas con altos
cargos de empresas internacionales es un ejercicio bastante complicado como
para hacerlo “de prueba” en 100 ocasiones. Hay que encontrar alternativas y
no renunciar a hacer la prueba piloto o pretest del cuestionario, puesto que
una vez llegados a este punto del diseño de cuestionarios probablemente no
seréis capaces de ver errores de funcionamiento importantes que pueden afec-
tar a todo el proceso. Recordemos que se trata de una etapa sin retorno, dado
© FUOC • PID_00227026 41 Técnicas de recogida de datos cuantitativos: la encuesta
que una vez enviadas, y más hechas ya las encuestas, los errores tienen difícil
enmienda. Optaremos pues por muestras pequeñas de casos concretos que nos
ayuden a probar cada decisión.
Por lo tanto, podemos realizar una última revisión y asegurarnos de que todas
las preguntas están numeradas de manera excluyente, que las opciones de res-
puesta de cada pregunta también, que las preguntas que filtran otras están cla-
ramente identificadas para todas las opciones posibles, que las preguntas tie-
nen identificadas claramente las condiciones para su ejecución: espontánea,
sugerida, simple o múltiple, así como las posibilidades de respuesta, rotación,
etc., y que el personal entrevistador las puede usar sin perturbar la lectura del
cuestionario.
Actividad
Podemos revisar el formulario del caso 2. Encontramos indicados los filtros de las pre-
guntas y las condiciones para formularlas. Hagamos lo mismo en el caso del cuestionario
1. ¿Si adoptamos el rol de encuestador sabríamos cómo utilizar los cuestionarios?
Hay que tener presente que la calidad en el diseño de un cuestionario puede ser
juzgada desde varios ángulos, y con mayor o menor componente académico
y estadístico. Hagamos memoria de los conceptos de validez y fiabilidad. Aun
así, un cuestionario será de mejor calidad si hemos realizado un buen traba-
jo bibliográfico y repasado investigaciones con encuesta y/o con cuestionario
para observar cómo otros han tomado decisiones similares, si usamos formu-
laciones estandarizadas (nivel de estudios, situación laboral, formas de convi-
vencia, etc.), y si hemos realizado un trabajo suficientemente intenso sobre
cómo medir actitudes, comportamientos y opiniones, o si deseamos usar esca-
las. En este sentido, podemos usar instrumentos creados por otros equipos que
estén validados si justificamos su pertinencia (tests, sistemas de escala, etc.).
© FUOC • PID_00227026 42 Técnicas de recogida de datos cuantitativos: la encuesta
De manera simplificada, entenderemos por medida fiable la que se produce con precisión,
sin sesgos y es consistente. La variabilidad que podemos observar en la medida no es
atribuible al instrumento de medida ni a su ejecución. Una medida válida es aquella
que mide realmente lo que queremos medir, existe coherencia entre el concepto y la
medida, y complementariedad entre las diferentes medidas del concepto. En el diseño del
cuestionario estas dos dimensiones clave pueden ser argumentativas (literatura, expertos,
etc.) pero en cuanto a técnica cuantitativa también podremos tener medidas de validez
y fiabilidad estadística.
© FUOC • PID_00227026 43 Técnicas de recogida de datos cuantitativos: la encuesta
4. Diseño muestral
Sin embargo, antes es necesario que resumamos los grandes conceptos que
hay que tener claros en un muestreo.
1) Universo o población
2) Muestra
3) Equilibrio de la muestra
4) Error no muestral
5) Tipo de muestreo
6) Error muestral
7) Nivel de confianza
8) Grado de homogeneidad
Podemos estudiar todos estos conceptos con mucho detalle, así como sus ínti-
mas interacciones y las razones estadísticas de estas (teoremas, modelos, etc.).
Sin embargo, en este módulo nos limitaremos a comprender la idea clave y lo
que supone en nuestra decisión.
Son muchos los procedimientos para realizar un muestreo probabilístico: Ved también
muestreo aleatorio simple, aleatorio sistemático, estratificado, por conglome-
Sobre muestreo y sobre esta-
rados, por ruta aleatoria, etc. Y en general los diseños son una combinación dística, os recomendamos los
de varios procedimientos en varias etapas, de manera que es común que los materiales de la UOC elabora-
dos por Greenacre (2012). Es-
denominemos muestreo polietápico. Para ahondar en los diferentes procedi- tadística I.
Todos ellos comparten el hecho de que los elementos del universo no tienen
una probabilidad conocida de pertenecer a la muestra, y no existe aleatorie-
dad, o esta es muy débil en su selección. Al no poder establecer los criterios
probabilísticos de error y confianza, ni cumplir supuestos mínimos, no pode-
mos valorar las desviaciones de los resultados y, por lo tanto, las estimaciones
no pueden generalizarse estadísticamente a la totalidad de la población. Puede
haber una generalización argumentada pero no estadística.
Llegados a este punto, si hemos elegido realizar una encuesta con un mues-
treo probabilístico, necesitamos algunos conceptos relevantes de la estadísti-
ca. Todos son probabilidades y cantidades y están interrelacionados, y por lo
tanto pueden ser escritos en una fórmula. En ningún caso nos dedicaremos al
aspecto formal de la estadística ni al estudio de los modelos y teoremas que
nos permiten hacer estos supuestos y cálculos, pero sí necesitamos entender
la idea que hay detrás de cada componente y cómo se relaciona con el resto.
caso 2 este 4,5% de los casos podría hacer variar la estimación según la cual
entre el 77,23 y el 88,97% de los profesionales de la danza en Cataluña ha na-
cido en España. Cuanta mayor confianza queramos tener sobre nuestros datos,
y conseguir representar el máximo de población posible, incluidos los valores
más extremos, más muestra necesitaremos. El nivel de confianza mínimo que
querremos aceptar es del 95%.
Dado que ya conocemos qué significa cada uno de los componentes del mues-
treo probabilístico, podemos proceder a calcular o bien el tamaño de la mues-
tra o bien el error muestral.
Cálculo�del�tamaño�muestral
Universos infinitos:
Universos finitos:
Donde:
n = muestra
Lógicamente, para entender el porqué de estas fórmulas y las relaciones que se establecen
hay que ahondar en las propiedades de la distribución normal, el teorema del límite
central y otros argumentos matemáticos que no son objeto de este módulo. Además, es
necesario que tengamos presente que estas formulaciones son una simplificación y que,
como podemos ver en el documento de la EPA, las fórmulas se deben desarrollar a medida
de cada dato u operación, incluyendo los modelos ajustados. Esto es trabajo generalmente
de la estadística. Aun así, con la información facilitada hasta ahora es suficiente.
tas del tipo: ya tengo una muestra, ¿cuál es el error que comentamos?, ¿cuál es Uno de los supuestos acepta-
el intervalo de confianza de nuestros datos?, ¿con qué confianza trabajamos?, dos, más un consenso que no
algo validable estadísticamen-
¿cómo de probables son nuestros resultados? Dependiendo del momento de te, es que cuando no tenemos
información sobre cuántas uni-
la investigación en el que estemos o el rol que tengamos en ella, será una u dades forman nuestra pobla-
ción en estudio, utilizamos las
otra nuestra pregunta. Sea como fuere, es importante destacar que necesita- formulaciones para universos
mos información sobre los componentes de la fórmula, o bien hacer supues- infinitos.
tos. Así, supongamos que queremos reducir el error, ¿cuánta más muestra ne-
cesitaremos?, y si queremos ampliar la confianza, ¿cuánta más muestra nece-
sitaremos?
© FUOC • PID_00227026 49 Técnicas de recogida de datos cuantitativos: la encuesta
Además, una vez decididas cuáles son relevantes, estructurales, deberemos ele- Contenido
gir cuáles usaremos para distribuir nuestra muestra y cómo lo haremos. Estas complementario
5.2. Depuración
5.3. Codificación
P35. ¿Cuál era su ocupación en cada actividad? Puede poner más de una ocupación. [NO
LEER, MÚLTIPLE]
Disponemos de una batería de códigos posibles para estas actividades que in-
cluye la posibilidad de “otras”, de modo que la persona encuestada puede des-
cribir su actividad. En todos estos casos deberemos decidir si las actividades se
ajustan a alguno de los códigos ya disponibles, o si necesitamos otras catego-
rías nuevas para aglutinar situaciones no previstas.
En el caso de la pregunta:
P125. ¿Qué actuaciones cree que debería llevar a cabo la Associació de Professionals de
la Dansa de Catalunya para apoyar la profesión de la danza? Por favor, descríbalas. [LI-
TERAL, MÚLTIPLE]
Las decisiones que hay que tomar durante la codificación son relevantes para
el análisis e interpretación de los resultados y requieren conocimientos de la
problemática en estudio. Como se ha comentado en apartados anteriores, el
procedimiento se asimila a los métodos de análisis de la información cualita-
tiva, de modo que los conocimientos que hay que tener de la teoría y objetivos
de la investigación, así como las decisiones que hay que tomar, son bastante
relevantes como para formar parte de las tareas del equipo de investigación.
Análisis bivariable:
A. Cruce según
P1_sexo
P2_edad (intervalos)
P3_Nivel de estudios
Cálculos:
Número de casos
% de casos total, fila y columna
2
Test Chi
B. Tasa_paro_actual: Cálculo media de edad (desviación, resumen de los 5 números).
Test T-Student
Una vez finalizado el trabajo de campo y de cara a la elaboración de los docu- Ved también
mentos metodológicos y de difusión, elaboraremos una síntesis de las carac-
Para ver otras fichas técnicas
terísticas esenciales de nuestra investigación. Esta síntesis se suele expresar en os recomendamos acceder a la
formato de ficha técnica, tal y como se puede observar en el ejemplo facilitado. web del CIS, donde están dis-
ponibles las fichas técnicas de
todas las investigaciones.
© FUOC • PID_00227026 55 Técnicas de recogida de datos cuantitativos: la encuesta
No nos detendremos demasiado tiempo en hacer un repaso de qué es la esta- Ved también
dística ni su derivación de la matemática. No obstante, os dediquéis a la rama
Para seguir este y otros argu-
que os dediquéis, seguramente la habréis usado. Y es que se trata probable- mentos, os recomendamos
mente del ámbito�de�conocimiento�del�que�más�se�han�apropiado�otras leer el interesante artículo de
Hand (2009) que encontraréis
disciplinas. De este modo, a menudo no somos nada estadísticos los que usa- citado en la bibliografía.
mos la estadística. Más aún, apenas hemos tenido relación con los números a
lo largo de la vida académica pero aun así usamos la estadística. Este hecho,
entre otros impactos, ha implicado que se�simplifiquen�conceptos�y�proce-
dimientos (con la lógica discusión académica sobre las carencias y los errores
que ello supone).
Otra cuestión a la que hay que referirse antes de entrar en materia es el soft- Ved también
ware�informático�que�se�usa�en�estadística. Todo lo que se explica a conti-
Al final del documento se faci-
nuación se puede realizar con papel y lápiz (y si nos queremos estirar algo más lita una breve lista de progra-
con lápices de colores). Ahora bien, supone un trabajo considerable. De este mas informáticos especializa-
dos, que en ningún caso quie-
modo, desde software general de Office y de tratamiento de textos y de datos, re ser exhaustiva, pero que os
invitamos a consultar tanto co-
hasta programas específicos para técnicas concretas, se han desarrollado apli- mo podáis.
caciones informáticas específicas que nos ayudan a hacer el trabajo más fácil y
con mayor precisión (a veces, no siempre, más bonito también). Por lo tanto,
podemos hacer tratamiento de datos con Excel, por ejemplo, o usar SPSS o R,
u otros muchos programas.
© FUOC • PID_00227026 57 Técnicas de recogida de datos cuantitativos: la encuesta
(1)
En un análisis más avanzado al que explicaremos aquí, el software estadístico más ade-
cuado puede ser uno u otro, o uno más específico todavía, incluso uno hecho a medida.
Sin embargo, todos los análisis que se proponen en este módulo se pueden realizar con
casi cualquiera de los programas existentes.
Ved también
Los análisis que se presentan en este módulo se han producido con SPSS. La UOC ha
desarrollado diferentes módulos específicos sobre tratamiento de datos con R que os re-
comendamos como parte de la bibliografía. Específicamente los módulos: “El entorno
estadístico R” y “Análisis de datos y estadística descriptiva con R y R-Commander”, den-
tro del manual Matemáticas y estadística con R. No obstante, cabe señalar que en la red
existen muchos manuales y ejercicios sobre la mayoría de los programas estadísticos.
La elección de qué herramienta usamos es, hoy por hoy, poco relevante, dado
que independientemente del software por el que optemos lo�más�importante
es�saber�qué�estamos�haciendo. Más aún, si sabemos qué queremos hacer, en
cualquier software encontraremos la manera de hacerlo.
1)�Criterio�estadístico
Ejemplo caso 2
Continua 1
Partida 2
NC 99
Una variable cuantitativa está expresada con un número y este tiene sentido
y valor, y representa la medida de lo que estamos registrando. En el ejemplo
que hay a continuación, si tu edad es 18 años no se expresa de ninguna otra
manera que con el número 18 y con este podemos realizar cálculos.
Ejemplo caso 2
_ _ años
Ejemplo
Otro ejemplo clásico de estas variables son el registro de temperatura, peso, etc.
En cambio, las variables cuantitativas son discretas si entre dos valores suce-
sivos de la variable no hay ningún valor. No se pueden registrar decimales.
Cuando calculan datos sí aparecen decimales, pero en el registro no. El ejemplo
ya dado de variable cuantitativa es del subtipo discreto, dado que no permite
indicar los decimales (la edad se expresa en números enteros). Otro ejemplo
© FUOC • PID_00227026 61 Técnicas de recogida de datos cuantitativos: la encuesta
2)�Clasificación�escala�de�Stevens
Ejemplo caso 2
Sin estudios 1
¿Otros?________________________________
Nc 99
Dedicamos tanto de tiempo a estas dos clasificaciones puesto que del tipo de
variable depende el tipo de análisis que se podrá realizar. Especialmente del
criterio. Aun así, como hemos aprendido, en ciencias sociales, y en otras cien-
cias, las variables estadísticas son resultado de un proceso de operativización y
por lo tanto no siempre es fácil identificar propiedades matemáticas más com-
plejas, como si las medidas son discretas o continuas o las escalas de medida
de intervalo y de razón. Para distinguir una variable de intervalo o de razón
podemos preguntarnos si permite valores negativos, entonces se sabe que el
0 no es ausencia del atributo y no un punto más en la escala. Por lo tanto, es
una variable de intervalo (por ejemplo, la temperatura). No obstante, resulta
siempre complejo determinar si el 0 es natural o arbitrario cuando las escalas
que construimos son por ejemplo de opinión. Pensad en una escala de 0 a
10, en la que el 0 es nada de acuerdo y el 10 totalmente de acuerdo; tener 0
acuerdo no quiere decir no tener “algún grado de acuerdo”, sino un valor de
acuerdo mínimo. Otra cuestión importante es que, en ocasiones, las preguntas
formuladas en escala (de 1-4 o de 1-5, o de 1-7) parecen cuantitativas. Lo son
si la escala pide cantidad (por ejemplo, cuando hacemos una valoración de 0
a 10 o, por ejemplo, pedimos una frecuencia de 0 a 100). Pero no lo son si
hemos dado a todas las categorías un atributo. Como en el ejemplo siguiente:
Ejemplo caso 2
P120. En su opinión, ¿estar dispuesto a marcharse fuera es una actitud necesaria para
desarrollar la carrera profesional de la danza? Dígame si está...
Totalmente de acuerdo 1
Bastante de acuerdo 2
Poco de acuerdo 3
Nada de acuerdo 4
(no leer) Nc 99
Antes de hacer cosas con los datos, lo que denominamos vulgarmente tabular
o explotar datos, podemos distinguir tres niveles de análisis.
© FUOC • PID_00227026 63 Técnicas de recogida de datos cuantitativos: la encuesta
En este módulo nos centraremos en los dos primeros niveles de análisis. Como
podéis deducir, al usar la palabra nivel, suponemos que hay pasos básicos y
superiores. Así, primero realizaríamos análisis univariante, después bivariable
y por último multivariable. Este es un hábito muy recomendado y enseñado.
No obstante, os recomendamos reflexionar sobre si estos pasos nos permiten
descubrir las relaciones clave entre las variables o solo dan una visión frag-
mentada de la realidad que medimos, de manera que hacer realizar un análi-
sis multivariable nos permitiría por ejemplo descubrir estructuras latentes y
relaciones inesperadas.
Finalmente, antes de entrar a manipular datos, hay que distinguir entre estos
tipos de objetivos. Cuando se realiza estadística descriptiva producimos me-
didas�y�gráficos�que�resumen�la�información y permiten tener una imagen
del comportamiento de las variables. Lo podemos hacer con cualquier con-
junto de datos, ya sean muestrales o de registro. Sobre todas las empresas de
nuestra ciudad o sobre una muestra, sobre todos los casos atendidos por nues-
tro servicio o sobre una muestra de posibles casos.
(2)
Para hacerlo, tenemos dos opciones: 1) disponer de los datos del total o casi Este procedimiento es el que
realizan por ejemplo los pediatras
total de la población, lo que nos permitiría saber hasta qué punto mi mues-
cuando nos dicen si nuestro hijo o
tra se asemeja al total de la población. Esta situación no se da prácticamente hija tiene un peso o una altura sig-
nificativamente diferente de la dis-
nunca en ciencias sociales. Imaginemos que sabemos el patrón de edad de las tribución normal de la población.
personas en paro de toda la población europea. Podríamos determinar si los
resultados de nuestra muestra son muy diferentes o no2. 2) Sin embargo, la
situación más habitual es que no dispongamos de estos datos y por lo tanto
debemos fijarnos en patrones o modelos que se repiten en determinadas cir-
cunstancias y que usamos de espejos. Algunos ejemplos son los modelos de
distribución normal, Chi Cuadrado, T-Student, etc., que los aplicaremos en
determinados supuestos. En el punto 6.6 aplicaremos estos modelos.
Válidos 20 1 ,3 ,3 ,3
21 1 ,3 ,3 ,7
22 4 1,4 1,4 2,1
23 5 1,7 1,7 3,8
24 10 3,4 3,4 7,2
25 10 3,4 3,4 10,7
26 5 1,7 1,7 12,4
27 8 2,8 2,8 15,2
28 12 4,1 4,1 19,3
29 13 4,5 4,5 23,8
30 13 4,5 4,5 28,3
31 11 3,8 3,8 32,1
32 17 5,9 5,9 37,9
33 14 4,8 4,8 42,8
34 10 3,4 3,4 46,2
35 11 3,8 3,8 50,0
36 14 4,8 4,8 54,8
37 8 2,8 2,8 57,6
38 6 2,1 2,1 59,7
Fuente: Elaboración propia a partir de los resultados de la Enquesta de condicions laborals del professionals de la dansa a Cata-
lunya 2010 (en adelante, ECLPDC2010).
Fuente: Elaboración propia a partir de los resultados de la Enquesta de condicions laborals del professionals de la dansa a Cata-
lunya 2010 (en adelante, ECLPDC2010).
Bien, este ejercicio se puede realizar para cualquier variable, tanto cualitativa
como cuantitativa, y a partir de ellas realizar varias representaciones gráficas:
1)�Histogramas
los valores mínimo y máximo del eje x y del y, así como la forma que adquiere
la distribución, cómo es: simétrica, con puntas, centrada, con extremos, etc.,
y cuánto hay en cada tramo que describimos (inicio, medio y final).
2)�Gráfico�de�barras�y�sectores
Estos ejercicios que hemos hecho hasta el momento son prácticamente todo
o casi todo lo que podemos hacer para describir variables cualitativas. Por es-
ta razón, en apartados anteriores, como la formulación de preguntas, se han
indicado que estadísticamente presentan bastantes limitaciones. Lógicamen-
te, se pueden realizar transformaciones de otras representaciones gráficas pe-
ro se requieren otros conocimientos que exceden el objetivo de este módulo.
© FUOC • PID_00227026 68 Técnicas de recogida de datos cuantitativos: la encuesta
Asociado a este primer valor podemos calcular la desviación estándar, que con-
siste esencialmente en calcular cómo se desvía cada caso de la media. Si suma-
mos todas estas desviaciones obtendríamos la varianza total, y si la dividimos
entre todos los casos la media de la desviación. Por lo tanto, la desviación es-
tándar debemos interpretarla como la media de las desviaciones. Así, si esta es
muy elevada, tendremos que asumir que la media no refleja con precisión có-
mo se distribuyen nuestros datos, mientras que si esta es pequeña, podremos
decir que la media es un buen resumen de lo que sucede con nuestra medida.
Es por lo tanto una medida que nos indica la dispersión de nuestros datos y
la validez de la media para representarlas.
Contenido
complementario
El siguiente paso será calcular los puntos o posiciones que dividen los casos
en grupos. Una posición posible es la mediana: el valor que divide nuestra
muestra en 2. Consiste en ordenar todos los casos de menos a más y observar
qué valor divide los casos por la mitad dejando el 50% por debajo y el 50%
por encima.
Fórmula de la mediana:
Los cuartiles son igual que la media de un valor de posición, pero si la mediana
es el punto que divide por la mitad, el primer cuartil es el punto que marca el
primer 25% de los casos y el tercer cuartil el que marca el 75% de los casos.
Así, en nuestros datos, uno de cada 4 profesionales (25%) está por debajo de
los 30 años. Y uno de cada 4 supera los 44 años (del tercer cuartil en adelante).
La distancia entre el primer y tercer cuartil es de 14 años e indica cómo de
variables son las situaciones en torno a la mediana y cómo de simétricas.
p2 P. ¿Cuál es su edad?
N Válidos 290
Perdidos 0
Mediana 35,50
Mínimo 20
p2 P. ¿Cuál es su edad?
Máximo 72
Percentiles 25 30,00
50 35,50
75 44,00
Como en el caso del histograma, las recomendaciones para leer un diagrama Contenido
de caja pasarían por identificar bien qué ha representado: cuál es el sujeto, complementario
qué hay en el eje y, valores máximos y mínimos, dónde está la mediana y qué La mediana y la media tam-
significa, el rango total, rango intercuartílico, la simetría del gráfico y los casos bién se suelen denominar me-
didas de centralidad, mientras
extremos. que la desviación y los rangos
se denominan de dispersión.
Igualmente, al resumen de los
cinco números también se le
Si bien debemos recomendaros no elegir qué resumen es más adecuado para suele denominar análisis de
las muestras, si la media y la desviación o el resumen de los 5 números, a me- posición.
nudo hay que economizar esfuerzos dado que tendremos un gran volumen
de datos. Existen algunas recomendaciones en este sentido que nos os pueden
ayudar a elegir. Por un lado, la desviación estándar es un número que es sufi-
© FUOC • PID_00227026 71 Técnicas de recogida de datos cuantitativos: la encuesta
Actividad
Disponéis de los datos sobre los meses en el paro al final del módulo. ¿Podríais identificar
la información y escribir una narración sobre cómo es la situación de paro de los profe-
sionales de la danza en Cataluña?
Estos son los ejercicios esenciales para describir la información de una pobla-
ción o muestra. Aun así, especialmente en el caso de una muestra, nos formu-
laremos preguntas más complejas sobre la similitud de nuestros datos y las
poblacionales. Habrá que aplicar por lo tanto los principios de la estadística
inferencial. Centraremos el estudio únicamente en el caso de la estadística bi-
variable, y concretamente en la relación entre dos variables cualitativas y una
variable cualitativa independiente y una variable cuantitativa dependiente,
dado que los objetivos de la asignatura limitan otras posibilidades.
2
5) Calcular los estimadores observados (por ejemplo, valor de Chi en la mues-
tra observada).
7) Decidir si nuestros datos son muy o poco probables según cómo serían en
la realidad si siguieran el modelo elegido.
(3)
Hay que interpretar este valor como la probabilidad de que nuestro resultado Más correctamente: probabili-
3 dad de que sea cierto en caso de
(media, diferencia de medias, etc.), o uno más extremo, sea falso . Esta proba- hipótesis nula.
bilidad, basada en el nivel de confianza, se suele expresar en tanto por 1. Si
© FUOC • PID_00227026 73 Técnicas de recogida de datos cuantitativos: la encuesta
Si asumimos esta simplificación como una herramienta útil para tomar deci-
siones rápidamente, solo necesitaremos�decidir�qué�modelo�de�probabili-
dad�hay�que�aplicar�en�cada�caso. Cada modelo de probabilidad corresponde
a una situación de observación específica. Lo elegimos en función del tipo de
variables que se relacionan, cualitativa y cualitativa, cualitativa y cuantitativa,
etc.; el parámetro que hay que contrastar (proporción, diferencia de propor-
ciones, medias, medianas, etc.); si existe o no dirección o dependencia en esta
relación (si establecemos cuál es la variable dependiente y cuál es la indepen-
diente); el tipo de relaciones que establecíamos (lineales, etc.); si nos interesan
las relaciones globales (entre variables) o locales (entre pares de categorías);
si analizamos dos o más muestras, si estas son independientes o están relacio-
nadas, si se cumplen los supuestos de los modelos (normalidad, igualdad de
varianza, etc.), y otros criterios de elección.
Lo primero que podemos hacer es observar las frecuencias o casos en los que
coinciden cada par de categorías. Observamos que 55 declaran tener entre 20
y 29 años y creen que deberán marcharse; 51 de 30 a 39 años, y 28 de 40 a
64 años. Si avanzamos en el análisis podemos calcular el porcentaje� total:
observamos que el 23,4% de los profesionales tienen entre 20 y 29 años y
creen que deberán marcharse; el 21,7% del total de profesionales tienen entre
30 y 39 años y deberán marcharse, etc. Podemos hacer la lectura de todas las
combinaciones.
(4)
Así, el análisis de tablas�de�contingencia se posiciona como una herramienta Y lógicamente para el análisis de
tablas de tres o más variables.
clave y muy potente de análisis de la relación�entre�dos�variables�cualitati-
vas4. Si situamos este análisis en el plano descriptivo, podemos afirmar que
entre los más jóvenes la creencia de tener que marchar fuera es más frecuente
(el 84,6% lo cree) que entre los que tienen entre 30 y 39 años, aunque es un
amplio 58,6%, y se reduce a 1 de cada 3, un 33,7%, a partir de los 40 años.
(5)
Pero esta diferencia entre los grupos (las combinaciones de categorías), obser- 2
Chi tiene otras muchas propie-
dades y usos, así como supuestos
vada en una muestra representativa, ¿hasta qué punto es probable que se dé
que os invitamos a estudiar.
en el total de la población? Para dar respuesta a esta pregunta podemos con-
trastar nuestros resultados con el modelo de Chi2, que compara las frecuencias
observadas y esperadas5.
© FUOC • PID_00227026 75 Técnicas de recogida de datos cuantitativos: la encuesta
Tabla 10. Pasos en el análisis de la tabla de contingencia que relaciona la variable edad y la va-
riable creencia de que en el futuro se marchará para desarrollar su carrera profesional
Frecuencias
CAP2�CAP2_¿Cuál�es�su�edad? Total
Total 65 87 83 235
Tabla 11. Pasos en el análisis de la tabla de contingencia que relaciona la variable edad y la va-
riable creencia de que en el futuro se marchará para desarrollar su carrera profesional
% total
CAP2�CAP2_¿Cuál�es�su�edad? Total
Tabla 12. Pasos en el análisis de la tabla de contingencia que relaciona la variable edad y la va-
riable creencia de que en el futuro se marchará para desarrollar su carrera profesional
% fila
CAP2�CAP2_¿Cuál�es�su�edad? Total
% fila
CAP2�CAP2_¿Cuál�es�su�edad? Total
Tabla 13. Pasos en el análisis de la tabla de contingencia que relaciona la variable edad y la va-
riable creencia de que en el futuro marchará para desarrollar la carrera profesional
% columna
CAP2�CAP2_¿Cuál�es�su�edad? Total
No obstante, es muy probable que construyamos una frase algo más interesan-
te, del tipo: “Existe una relación estadísticamente significativa entre la edad
de los profesionales de la danza y la creencia de que hay que marcharse para
desarrollar la carrera profesional”.
2
Tabla 14. Test de Chi para la relación entre la variable edad y la variable creencia de que en el
futuro se marchará para desarrollar su carrera profesional
Pruebas de chi-cuadrado
Valor gl Sig.�asintóti-
ca�(bilateral)
(a) 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima espera-
da es 27,94.
2
Hay que tener presente que Chi indica si existe asociación o no a nivel global,
es decir, en el conjunto de datos de la tabla. Pero no indica cuál es el sentido
de la asociación, es decir, qué variable influye en cuál, cuál es la intensidad de
la asociación, ni entre qué par de categorías existe la relación. Además, es una
estadística sensible al número de filas y columnas, y al número de casos en
© FUOC • PID_00227026 78 Técnicas de recogida de datos cuantitativos: la encuesta
cada casilla, de manera que existen otras estadísticas y correcciones que nos
pueden ayudar a ser más precisos en nuestras afirmaciones: Phi, V, solución
de Yates, etc.
Así, nos preguntamos si esta diferencia en las medias de los diferentes grupos
se puede inferir al conjunto de la población. Este procedimiento se denomina
ANOVA (del inglés analysis of variance, análisis de la varianza). El modelo de
distribución asociado a este procedimiento y condiciones es el modelo F.
Nuevamente, podemos construir una frase más interesante: “Existe una rela-
ción estadísticamente significativa entre la edad de los profesionales de la dan-
za y las veces que se ha marchado fuera a ejercer la profesión”.
Tabla 15. Test ANOVA para la relación entre la variable de edad y la variable número de veces
que se ha marchado fuera para ejercer su profesión
Intervalo�de�con-
fianza�para�la
media�al�95%
Intervalo�de�con-
fianza�para�la
media�al�95%
Tabla 16. Test ANOVA para la relación entre la variable de edad y la variable número de veces
que se ha marchado fuera para ejercer su profesión – ANOVA de un factor
Tabla 17. Test T-Student para la diferencia entre la media de meses en el paro entre los profe-
sionales de 30 a 39 años y de 40 a 64 años
Estadísticos de grupo
Tabla 18. Test T-Student para la diferencia entre la media de meses en el paro entre los profe-
sionales de 30 a 39 años y de 40 a 64 años
Prueba�de�Leve- Prueba�T�para�la�igualdad�de�varianzas
ne�para�la�igual-
dad�de�varianzas
p57 P57. Se han 16,179 ,000 3,053 198 ,003 1,216 ,398 ,431 2,001
Durante asumido
la tem- varianzas
porada iguales
2008-2009,
¿cuántos No se han 3,085 182,669 ,002 1,216 ,394 ,438 1,994
meses en asumido
total estu- varianzas
vo en el iguales
paro? Me-
ses
Nota
Para practicar estos análisis esenciales disponéis al final del módulo de datos.
En la mayoría de los casos, si se quieren aplicar estas técnicas es recomenda- Ved también
ble diseñar el cuestionario de manera apropiada, dado que son muy exigentes
Un esquema de la posible cla-
en cuanto a tipos de variables y categorías que se pueden incluir. El objetivo sificación de procedimientos
de estas técnicas es detectar las formas del comportamiento de los datos, no multivariable lo encontraréis
en el libro de López Roldán y
tabla a tabla, a partir de cruces bivariables, sino reduciendo y simplificando Lozares Colina (2000), citado
en la bibliografía.
el conjunto de interrelaciones. Una posible manera de clasificar las técnicas
es en función de las preguntas que se hacen. Se pueden clasificar además en
función de las variables involucradas, si queremos determinar una relación de
dependencia entre las variables o no, etc. En ningún caso se pueden considerar
clasificaciones excluyentes dado que la evolución acelerada de la estadística y
la computación hacen aparecer cada vez más procedimientos, impulso al que
se añaden las exigencias del mercado y la disponibilidad de big data, desarro-
llando así la ingeniería de negocio, el análisis del riesgo, la modelización, etc.
Actividades
Actividad�1.�Análisis�de�datos�descriptivo�de�la�pregunta�p57_meses�que�estuvo�en�el
paro�durante�la�temporada�2008-2009
N válido (se- 89
gún lista)
N Válidos 89
Perdidos 201
Mediana 4,00
Mínimo 1
Máximo 12
Percentiles 25 2,00
50 4,00
75 7,00
© FUOC • PID_00227026 88 Técnicas de recogida de datos cuantitativos: la encuesta
Actividad�2.�Relación�entre�dos�variables�cualitativas
Pruebas de Chi-cuadrado
(a) 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima espera-
da es 17,52.
(b) Calculado solo para una tabla de 2x2.
Actividad�3.�Relación�entre�una�variable�cualitativa�y�otra�cuantitativa
© FUOC • PID_00227026 90 Técnicas de recogida de datos cuantitativos: la encuesta
Intervalo�de�con-
fianza�para�la
media�al�95%
ANOVA de un factor
p57�P57.�Durante�la�temporada�2008-2009,�¿cuán-
tos�meses�en�total�estuvo�en�el�paro?�Meses
Estadísticos de grupo
Prueba�de�Leve- Prueba�T�para�la�igualdad�de�varianzas
ne�para�la�igual-
dad�de�varianzas
p57 P57. Se han 0,60 ,807 ,330 126 ,742 ,193 ,586 -,967 1,353
Durante asumido
la tem- varianzas
porada iguales
2008-2009,
¿cuántos No se han ,326 73,541 ,745 ,193 ,593 -,988 1,374
meses en asumido
total estu- varianzas
vo en el iguales
paro? Me-
ses
Bibliografía
Bibliografía citada
Alvira Martín, F. (2004). La encuesta: una perspectiva general metodológica. Madrid: CIS
(“Cuadernos Metodológicos”).
Couper, M. (2000). Web Surveys: A Review of Issues and Approaches [artículo en línea]. The
Public Opinion Quarterly, 4 (64).
http://www.goethe-university-frankfurt.de/47929851/couper_2000.pdf
Couper, M. (2005). Technology Trends in Survey Data Collection. Social Science Computer,
invierno, 23, 486-501.
doi: 10.1177/0894439305278972
http://www.raco.cat/index.php/Papers/article/download/248512/332636
Hand, D. J. (2009). Modern statistics: the myth and the magic. Journal of the Royal Statistical
Society: Series A (Statistics in Society), 172, 287-306. doi: 10.1111/j.1467-985X.2009.00583.x
Kothari, C. R. (2004). Research Methodology: Methods and Techniques. New Delhi: New Age
International.
http://www.jstor.org/stable/2082444?origin=crossref&seq=1#page_scan_tab_contents
Bibliografía general
APA (2009). Publication Manual of American Psychological Association (6.ª edición). Washing-
ton, DC: APA.
Creswell, J. (2003). Research Design: Qualitative & Quantitative and Mixed Methods Approaches
(2.ª edición). Thousand Oaks (CA), London, New Delhi: Sage.
Díaz de Rada, V. (2010). Comparación entre los resultados proporcionados por encuestas telefó-
nicas y personales: el caso de un estudio electoral. Madrid: CIS (“Opiniones y Actitudes”, 66).
Hair, J. F., Anderson, R. E., Tatham, R. L., y Black, W. C. (1999). Análisis multivariante.
Madrid: Prentice-Hall.
Lago Peñas, I. (2008). La lógica de la explicación en las ciencias sociales: una introducción
metodológica. Madrid: Alianza Editorial.
Levy, J. P. y Valera, J. (2003). Análisis multivariado para ciencias sociales. Madrid: Prenti-
ce-Hall.
http://pagines.uab.cat/plopez/content/manual-misc
Ritchey, F. J. (2006). Estadística para las ciencias sociales. México: McGraw Hill.
Santana Leitner, A. (2012). Marc teòric i disseny empíric. Barcelona: Fundació UOC.
Diseño de cuestionario:
Fornieles, A., Domènech, J. M., y Bonillo, A. (2010). Tutorial de l’Excel XP. Barcelona:
Fundació UOC.
Observaciones: La UOC dispone de muchos otros documentos que os pueden ser de ayuda
en la ampliación de conocimientos y práctica en esta materia. Esta solo pretende ser una
breve selección.
Software de pago
SAS
http://www.sas.com/
SPAD
http://www.coheris.com/produits/analytics/logiciel-data-mining/
© FUOC • PID_00227026 94 Técnicas de recogida de datos cuantitativos: la encuesta
SPSS
http://www-01.ibm.com/software/analytics/spss/
STATA
http://www.stata.com/
Software libre
https://cran.r-project.org/
PSPP
http://www.gnu.org/software/pspp/
Nota:
Es importante que os animéis a descargar y trabajar con software especializado. Aun así, os
facilitamos un manual de Excel XP que también permite realizar análisis de datos, si bien con
más limitaciones o complicaciones que los softwares específicos. Encontraréis la referencia
en el apartado dedicado a materiales de la UOC.