Vous êtes sur la page 1sur 10

TCNICAS DE ANLISIS MULTIVARIANTE PARA INVESTIGACIN SOCIAL Y COMERCIAL (Ejemplos prcticos utilizando SPSS versin 11) INTRODUCCIN

En el verano de 1998 terminamos Tcnicas de anlisis de datos para investigadores sociales, dando cuenta de la existencia de un gran nmero de procedimientos de anlisis de datos que no fueron explicados en ese trabajo. Nos referamos, concretamente, a las tcnicas multivariantes que no distinguen entre variables dependientes e independientes, conocidas popularmente como tcnicas de interdependencia entre variables. Al final de la obra animamos a los lectores a profundizar en su aplicacin, aunque consideramos tambin la explicacin de stas para algn trabajo posterior. Despus de cuatro aos, y tras mltiples interrupciones y cambios en su concepcin, el lector tiene en sus manos un trabajo dedicado a las tcnicas multivariables de interdependencia. Las referencias bibliogrficas sobre el anlisis multivariante estn experimentando un rpido aumento en los ltimos aos, apareciendo trabajos que se ocupan tanto del desarrollo matemtico como de las distintas aplicaciones de cada tcnica a la investigacin social y comercial. Este trabajo se acerca ms a este segundo planteamiento, y tiene como objetivo explicar determinadas tcnicas multivariantes centrados fundamentalmente en las condiciones de utilizacin de cada una, y en la interpretacin de sus resultados. Con el fin de explicar las tcnicas multivariantes de forma sencilla se han utilizado ejemplos de investigaciones reales, buscando problemas similares a los que el profesional se enfrenta en su trayectoria investigadora. Se trata, en definitiva, de presentar una serie de pautas sobre cundo utilizar una determinada tcnica multivariante y de cmo interpretar sus resultados. Obviaremos los complicados planteamientos matemticos para centrar nuestra atencin en las condiciones de aplicacin de la tcnica y en la interpretacin de los resultados obtenidos. El objetivo se centra en proporcionar una referencia sinttica de las similitudes y diferencias entre las distintas tcnicas multivariantes, considerando tres aspectos: 1. Presentar las diferencias entre las distintas tcnicas multivariantes, dando respuesta a preguntas como: es lo mismo un anlisis factorial y un anlisis de correspondencias?

XII

TCNICAS DE ANLISIS MULTIVARIANTE

RA-MA

2.

Explicar qu tcnica utilizar en funcin del objetivo de la investigacin, respondiendo a la pregunta: para qu sirve cada una de las tcnicas? Por ltimo, prestaremos atencin a cmo aplicar de forma correcta cada tcnica, analizando las condiciones que deben cumplir los datos (tamao muestral, comprobacin de determinados supuestos, etc.).

3.

En realidad el objetivo principal de esta obra es proporcionar una serie de pautas para comprender la realidad social de la mejor forma posible. Con este fin utilizaremos la tcnica de anlisis de datos que mejor se adapte a los objetivos de la investigacin, considerando siempre que cuando dos tcnicas explican lo mismo utilizaremos la ms sencilla, la que sea ms fcil de aplicar. Buscaremos tambin facilitar la comprensin de las personas que encargan la investigacin, pensando siempre que stas pueden desconocer determinados procedimientos de anlisis de datos, y que generalmente demandan explicaciones muy sencillas enfocadas a la rpida toma de decisiones. La obra que el lector tiene en sus manos, Tcnicas de anlisis multivariante para investigacin social y comercial, comenz a gestarse en los primeros meses de 1999 y sigue fiel al planteamiento de la obra anterior, que recordemos tena como objetivo solucionar problemas de una investigacin utilizando determinadas tcnicas de anlisis de datos. En aquel momento se presentaba una investigacin completa, desde la formulacin de hiptesis hasta la exposicin de resultados y generalizacin de los mismos, "aprovechando" las preguntas de la investigacin para explicar el uso e interpretacin de diversas tcnicas de anlisis de datos. Los comentarios de muchos lectores nos han demostrado lo acertado de aquel planteamiento y, por ello, optamos por repetirlo en este trabajo. Sin embargo, la diversidad de tcnicas que se explican en esta obra impiden utilizar la misma estrategia, puesto que es muy difcil aplicar todos estos procedimientos en una misma investigacin y, ms importante, es una concepcin que nada tiene que ver con la situacin real de la investigacin. Aunque es posible utilizar en una misma investigacin el anlisis factorial, el anlisis de correspondencias y el anlisis cluster, por hablar de algunas de las tcnicas que aqu se explican, lo normal es utilizar slo alguna de stas, en funcin del objetivo de la investigacin y el tipo de variables disponibles en la investigacin. Este hecho, unido a los buenos resultados del planteamiento utilizado en el libro anterior, nos animaron a buscar una solucin intermedia, un desarrollo expositivo donde los problemas de investigacin sean los que determinen la utilizacin de una tcnica de anlisis. No se trata de explicar el anlisis exploratorio en el segundo captulo, el anlisis factorial en el tercero,... sino de proponer situaciones de investigacin que

RA-MA

INTRODUCCIN XIII

precisen el empleo de una herramienta para lograr los objetivos fijados; es decir, que sean las necesidades de la investigacin las que indican las tcnicas a utilizar. Esto se consigue eligiendo situaciones reales de investigacin, de modo que hemos optado por una exposicin similar al libro anterior planteando varias investigaciones que requieran la utilizacin de tcnicas determinadas. As en vez de utilizar una misma investigacin desde el principio hasta el final, como hicimos en aquel trabajo, aqu se utilizan investigaciones concretas que precisan de la aplicacin de una o varias tcnicas de anlisis de datos. Conviene dejar claro que se han utilizado datos de investigaciones reales, con las consecuencias que ello conlleva. Trabajar con datos reales plantea una situacin de simulacin real muy similar a lo que es la prctica investigadora diaria, pero requiere tambin enfrentarse a decisiones complejas sobre cmo tratar los casos perdidos, la solucin a tomar cuando una variable no cumple los supuestos paramtricos, qu hacer con los casos extremos, etc. La solucin a estos problemas no suele aparecer en los libros al uso, puesto que al utilizar datos preparados no surgen estas situaciones "anormales". Consideramos que sta es una de las novedades del presente libro, trabajar con los datos brutos tal y como son recogidos por el investigador, presentando todas las manipulaciones y transformaciones que faciliten el tratamiento ms adecuado. Se trata, en definitiva de reproducir la prctica cotidiana de cualquier instituto de investigacin. En lnea con las ideas presentadas en el prrafo anterior, la novedad de este texto est en la ausencia de obras publicadas que expliquen con profundidad el proceso de una investigacin mediante encuesta. Pese a que en los ltimos aos se ha producido una proliferacin de publicaciones sobre el funcionamiento de programas estadsticos, as como otros textos donde se exponen ejemplos de investigaciones reales (entre otros Soler y Perdiguer 1992, Gonzlez Lobo 2000, Alonso Rivas y Ruiz de Maya 2001, etc.), el texto que aqu presentamos unifica ambos planteamientos al exponer problemas concretos del diseo de la investigacin, junto a las dificultades del anlisis de datos. Creemos que hay una importante carencia en el mercado espaol de un texto que considere conjuntamente estos planteamientos: por un lado los criterios metodolgicos de la investigacin mediante encuesta, por otro el anlisis de datos reales de una investigacin y, por ltimo, la capacidad de generalizar conclusiones utilizando las propiedades de los paquetes estadsticos. Las obras que explican la dinmica de la investigacin basadas en ejemplos de investigaciones reales nos parecen excelentes, pero plantean algn problema puesto que en ocasiones se producen grandes "saltos" entre el planteamiento de la investigacin y los resultados proporcionados; no quedando muy claro -por ejemplo- las transformaciones realizadas antes de aplicar el anlisis factorial, los diversos anlisis exploratorios realizados antes de presentar el modelo definitivo, etc. Este trabajo sigue una filosofa muy similar a estos textos, aunque aqu se solventan estos problemas

XIV

TCNICAS DE ANLISIS MULTIVARIANTE

RA-MA

presentando todos los clculos, hiptesis alternativas, dudas del investigador, etc. ocurridas en cada uno de los ejemplos. Se trata, en definitiva, de presentar menos ejemplos de investigaciones pero ser sumamente exhaustivos en el desarrollo de los ejemplos elegidos. La complejidad en el clculo de algunas tcnicas de anlisis multivariante, unida a la amplia difusin de ordenadores personales y paquetes estadsticos, nos ha llevado a realizar todos los clculos con un programa estadstico, reproduciendo al mximo la investigacin realizada en cualquier instituto de investigacin. En este trabajo se ha elegido uno de los programas estadsticos ms utilizados en la investigacin social y comercial, el SPSS para Windows. Las razones que han motivado esta eleccin son, entre otras, la facilidad de su uso, la explicacin de determinados procesos estadsticos en sus mens de ayuda, y la existencia de una versin para estudiantes que posibilita a un precio muy asequible- que stos puedan adquirirlo y familiarizarse con l. Conviene dejar claro que no es la explicacin del programa estadstico la que guiar la exposicin, sino que son las necesidades de la investigacin las que aconsejan la utilizacin -y explicacin- de determinados procesos de anlisis de datos. Todos los cuadros de dilogo del programa SPSS se presentarn en figuras, mientras que las ilustraciones sern utilizadas para realizar sntesis de explicaciones, presentar esquemas, explicar grficos, etc. Los resultados obtenidos por cada procedimiento sern presentados en tablas y grficos cuando se trate de los resultados directos proporcionados por el programa, utilizando tambin cuadros para exponer sinttica y ordenadamente los datos de una tabla. En el texto, todas las menciones a cuadros de dilogo del SPSS, recuadros, etc. aparecern en letra cursiva. En cuanto a su estructura, el libro comienza con un captulo dedicado a la definicin del anlisis multivariante, realizando una clasificacin de las tcnicas multivariantes y una presentacin breve de las tcnicas ms utilizadas en la actualidad. La utilizacin del anlisis multivariable en una investigacin debe comenzar con un estudio detallado de la informacin recogida, aspecto que es analizado en el segundo captulo. El objetivo de este captulo es proporcionar una visin general de las tcnicas de exploracin de datos, desde el simple proceso de inspeccin visual de las representaciones grficas hasta el proceso de comprobacin de la evaluacin de los supuestos del anlisis multivariante, pasando por el tratamiento de los casos atpicos y ausentes. Los captulos siguientes estn dedicados a la explicacin de diversas tcnicas de anlisis multivariante, concretamente las tcnicas de interdependencia: el anlisis factorial en el captulo tres, el anlisis de correspondencias en el cuatro, y el anlisis cluster en el quinto. Todos estos captulos siguen una estructura muy similar, que comienza con una presentacin donde se exponen los objetivos de la tcnica, y

RA-MA

INTRODUCCIN XV

contina con la eleccin del ejemplo utilizado para explicar cada tcnica. El trabajo termina con un anexo donde se presenta el lenguaje de sintaxis de SPSS. Respecto a los destinatarios de este libro, y aunque en un primer momento fue realizado pensado para utilizarlo como manual en un curso avanzado de anlisis de datos, las sucesivas modificaciones realizadas en los ltimos aos -tratando de hacer ms fcil la comprensin del mismo- lo hacen muy apropiado para todo tipo de personas interesadas en el anlisis de encuestas: socilogos, trabajadores sociales, investigadores de mercado, psiclogos, economistas, departamentos de marketing, etc.; aunque los ejemplos utilizados son ms propios de la sociologa y la investigacin comercial. El libro est escrito en un lenguaje claro y sencillo, y considera que el lector tiene conocimientos sobre investigacin social. Pese a que nuestro inters es realizar una explicacin "intuitiva" de cada una de las tcnicas multivariantes, la comprensin de stas precisa del lector unos conocimientos previos de estadstica, digamos a un nivel intermedio. Se supone tambin que el lector ha trabajado con tcnicas uni y bivariantes, y que conoce la lgica y la interpretacin de las pruebas de significacin. De la misma forma, solucionar los ejemplos con el programa estadstico SPSS requiere que el lector haya trabajado con l, o que conozca -al menos- la lgica de funcionamiento y est familiarizado con los resultados proporcionados por ste o por cualquier otro paquete estadstico. Este libro se plantea como una segunda parte de tcnicas de anlisis de datos para investigadores sociales, de modo que aconsejamos su lectura a los lectores que no todava no tienen este conocimiento previo. Es preciso volver a insistir que el objetivo de este trabajo no se centra tanto en una exposicin de distintas tcnicas de anlisis de datos, sino que se explica cmo solucionar problemas de una investigacin utilizando determinadas tcnicas de anlisis de datos. Este planteamiento lleva a centrar nuestro inters en razonar por qu se utiliza una determinada tcnica, y cmo interpretar los resultados que proporciona. No nos preocupa la comprensin de frmulas complejas, que adems trataremos de evitar en la medida de lo posible, sino que deseamos profundizar en la utilizacin de determinadas tcnicas y en la interpretacin de los resultados que proporcionan. Estos aspectos diferencian este trabajo de otras obras destinadas a la descripcin de un programa de ordenador, o a la exposicin de diversas tcnicas de anlisis estadstico. En estas ltimas cuando se analizan datos suelen ser pocos y muy simples, puesto que lo prioritario es la tcnica de anlisis. Cuando se analiza el funcionamiento de un programa de ordenador los ejemplos se utilizan como "un medio" para explicar el programa, y nunca como un fin.

XVI

TCNICAS DE ANLISIS MULTIVARIANTE

RA-MA

Un breve apunte para recordar algunas de las personas que me han ayudado en la elaboracin de esta obra. La mayor parte de las ideas de este trabajo se originaron durante una estancia de investigacin del autor en la universidad de Essex, que fue posible gracias a una ayuda concedida por el vicerrectorado de profesorado de la Universidad Pblica de Navarra. Me gustara agradecer la ayuda proporcionada por Tony Coxon, Nick Buck y el resto del personal del ESRC Research Centre on MicroSocial Change de la citada universidad. Prcticamente todos los contenidos aqu presentados fueron expuestos en un curso sobre anlisis multivariante en ciencias de la salud, impartido dentro del programa de formacin continua del personal del Departamento de Salud del Gobierno de Navarra. Deseo agradecer a M Jess Guembe Suescun e Isabel Ezpeleta la oportunidad de impartir el citado curso. Gracias tambin a Mara Pellejero, Leyre Iribarren y Maite Ruffo por la cuidada revisin de las primeras versiones del trabajo. Recordar, y agradecer tambin, a Encarna y Leo que han estado conmigo en los momentos ms importantes de mi vida acadmica. Para terminar, me gustara dedicar este libro a Demetrio, un amigo por encima de todo.

Vidal Daz de Rada Pamplona, 2002

RA-MA

INTRODUCCIN XVII

NDICE

INTRODUCCIN

CAPTULO 1: ANLISIS MULTIVARIANTE: DEFINICIN Y CLASIFICACIN 1. Definicin de Anlisis Multivariante 2. Clasificacin de las tcnicas multivariantes 3. Presentacin y descripcin breve de las tcnicas multivariantes ms utilizadas 3.1. Tcnicas de dependencia 3.2. Tcnicas de interdependencia 4. Una precisin sobre el contenido de la obra CAPTULO 2: PRIMER ACERCAMIENTO A LOS DATOS: ANLISIS EXPLORATORIO 1. Introduccin: objetivos de la tcnica 2. Explicacin mediante un ejemplo: exploracin univariante 2.1. Definicin del problema a investigar 2.2. Proceso de realizacin del anlisis exploratorio utilizando el programa estadstico SPSS 2.3. Visualizacin de la distribucin: examen grfico de los datos 2.4. Comprensin de la distribucin utilizando estadsticos univariantes 2.5. Transformaciones de la distribucin 2.6. Tratamiento de casos atpicos y ausentes 3. Explicacin utilizando un ejemplo con dos variables 3.1. Seleccin de los procedimientos: proceso de realizacin del anlisis exploratorio utilizando el programa estadstico SPSS 3.2. Interpretacin de resultados 4. Evaluacin de los supuestos del anlisis multivariante

XVIII

TCNICAS DE ANLISIS MULTIVARIANTE

RA-MA

5. Otras tcnicas de anlisis para conocer la distribucin de los datos CAPTULO 3: ANLISIS FACTORIAL 1. Introduccin: objetivos de la tcnica 2. Tipos de Anlisis Factorial 2.1. Anlisis de Componentes Principales 2.2. Anlisis de Factores Principales 2.3. Otros tipos 3. Anlisis Factorial de Componentes Principales: explicacin mediante un ejemplo 3.1. Definicin del problema a investigar 3.2. Primer anlisis de la informacin 3.3. Proceso de realizacin del anlisis factorial con el programa estadstico SPSS 3.4. Primeros resultados: comprobacin del ajuste del modelo 3.5. Interpretacin de resultados 3.6. Puntuaciones factoriales 3.7. Ayudas a la interpretacin: representaciones grficas CAPTULO 4: ANLISIS DE CORRESPONDENCIAS 1. Introduccin: objetivos de la tcnica 2. La lgica del Anlisis de Correspondencias 3. Anlisis de Correspondencias Simples: explicacin mediante un ejemplo 3.1. Definicin del problema a investigar 3.2. Primer anlisis de la informacin 3.3. Proceso de realizacin del anlisis de correspondencias simples con el SPSS 3.4. Explicacin de los resultados obtenidos 3.5. Anlisis de los componentes grficos 3.6. Interpretacin de resultados 3.7. Anlisis de correspondencias con modalidades suplementarias

RA-MA

INTRODUCCIN XIX

4. Anlisis Factorial de Correspondencias Mltiples: explicacin mediante un ejemplo 4.1. Definicin del problema a investigar 4.2. Primer anlisis de la informacin 4.3. Proceso de realizacin del Anlisis de Correspondencias Mltiples con el programa estadstico SPSS 4.4. Interpretacin de resultados 5. Anexo: proceso de elaboracin de una tabla de datos para el Anlisis de Correspondencias Simples CAPTULO 5: ANLISIS DE CONGLOMERADOS (CLUSTER) 1. Introduccin: objetivos de la tcnica 2. Tipos de Anlisis de Conglomerados 3. Anlisis de Conglomerados Jerrquico: explicacin mediante un ejemplo 3.1. Definicin del problema a investigar 3.2. Primer anlisis de la informacin 3.3. Proceso de realizacin del Anlisis de Conglomerados Jerrquico con el programa estadstico SPSS 3.4. Explicacin de los resultados obtenidos 3.5. Interpretacin de la clasificacin resultante: caractersticas de los conglomerados 4. Anlisis de Conglomerados no Jerrquico aplicado a los resultados del Anlisis de Componentes Principales 4.1. Definicin del problema a investigar 4.2. Primer anlisis de la informacin 4.3. Proceso de realizacin del Anlisis de Conglomerados no Jerrquico con el programa estadstico SPSS 4.4. Anlisis de resultados 4.5. Validacin de la clasificacin efectuada 4.6. Una tipologa del consumidor navarro 5. Anexo: medidas de distancia y proximidad

XX

TCNICAS DE ANLISIS MULTIVARIANTE

RA-MA

ANEXO: LENGUAJE DE SINTAXIS DE SPSS 1. Introduccin: organizacin de las instrucciones de sintaxis 2. Exploracin de los datos 2.1. Anlisis exploratorio de datos 2.2. Comandos de sintaxis utilizados en los ejemplos del captulo dos 3. Anlisis Factorial 3.1. Anlisis Factorial de Componentes Principales 3.2. Comandos de sintaxis utilizados en el ejemplo del captulo tres 4. Anlisis de Correspondencias 4.1. Anlisis de Correspondencias Simples 4.2. Comandos de sintaxis utilizados en el primer ejemplo del captulo cuatro 4.3. Anlisis de Correspondencias Mltiples 4.4. Comandos de sintaxis utilizados en el segundo ejemplo del captulo cuatro 4.5. Proceso de elaboracin de tablas de datos para el Anlisis de Correspondencias Simples 4.6. Comandos de sintaxis utilizados en la elaboracin de tablas de contingencia para el Anlisis de Correspondencias Simples 5. Anlisis de Conglomerados (Cluster) 5.1. Conglomerados Jerrquicos 5.2. Comandos de sintaxis utilizados en el primer ejemplo del captulo cinco 5.3. Conglomerados no Jerrquicos (mtodo k-medias) 5.4. Comandos de sintaxis utilizados en el segundo ejemplo del captulo cinco 5.5. Medidas de distancias y proximidad 5.6. Comandos de sintaxis utilizados en el quinto apartado del captulo cinco