Vous êtes sur la page 1sur 214

CENTRO UNIVERSITARIO DE IXTLAHUACA, A. C.

Unidad de Extensin y Vinculacin Universitaria Centro Integral de Servicios Acadmicos, Empresariales y Comunitarios

ANLISIS ESTADSTICO CON SPSS


preedicin
Ing. Jess Antonio Vilchis Jurez

2009

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

INTRODUCCIN Desde sus orgenes, las computadoras se han empleado en el procesamiento estadstico de datos. En los primeros aos, las dificultades de accesibilidad a las computadoras, as como sus propias limitaciones, hacan selectivos los clculos estadsticos de gran dimensin. Pero es con la expansin de la microinformtica cuando se eliminan las acotaciones en los clculos numricos de gran dimensin y los problemas de acceso a las mquinas, lo que desemboca en facilidad para llevar acabo investigaciones estadsticas en todos los campos de la ciencia (Economa, Ciencias sociales, Educacin, Ciencias de la Salud, etc.). Aunque los campos de aplicacin de la estadstica sean diferentes, los mtodos son comunes, lo que ha dado lugar a la estandarizacin automatizada de las tcnicas estadsticas, apareciendo una amplia variedad de paquetes estadsticos que difieren entre s en los aspectos de capacidad, facilidad de uso, entornos de aplicacin, extensin, precio, documentacin y otras caractersticas similares. Entre estos paquetes estadsticos se encuentra SPSS (Statistical Package for the Social Sciences), paquete estadstico para las ciencias sociales, producto que fue creado en 1968 por la Compaa spss inc. (elaborado por Hull y Nie) y en 1992 se desarrolla la primera versin para Windows; y que tal vez sea el paquete estadstico con ms difusin a nivel mundial. SPSS se desarroll inicialmente para procesamiento por lotes (procesos batch) y an se puede trabajar as en determinados entornos. No obstante, la evolucin del proceso de datos ha hecho que el programa vaya adaptndose a los nuevos entornos de ventanas y a las interfaces avanzadas de los sistemas operativos actuales. Hoy en da SPSS es un software estadstico modular muy popular que implementa gran variedad de temas estadsticos en los distintos mdulos del programa. SPSS es un sistema global para el anlisis de datos. SPSS puede adquirir datos de casi cualquier tipo de archivo y utilizarlos para generar informes tabulares, grficos y diagramas de distribuciones y tendencias, estadsticos descriptivos y anlisis estadsticos complejos. El SPSS es de gran ayuda para descubrir los patrones y tendencias de los datos que no se aprecian cuando solo se utilizan hojas de clculo y bases de datos, no se requieren demasiados conocimientos de estadstica para efectuar anlisis avanzados y previsiones que permitan tomar mejores decisiones. El SPSS contiene todos los procedimientos mas utilizados en el anlisis estadstico bsico, entre estos procedimientos se encuentran las tablas estadsticas y los grficos interactivos y dinmicos que permiten obtener 2009 | Ing. Jess Antonio Vilchis Jurez. 1

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

mejores informes, en un entorno grafico, utilizando mens descriptivos y cuadros de dialogo sencillos que realizan gran parte del trabajo. Los pasos bsicos a seguir para realizar cualquier anlisis de datos estadsticos con SPSS son lo siguientes (figura 1): 1. La introduccin de datos en SPSS, puede ser de forma directa o abriendo un archivo de datos, una hoja de calculo, o un archivo de texto, o bien introducir sus datos directamente en el editor de datos. 2. Seleccionar un procedimiento para realizar anlisis estadstico o seleccionar un procedimiento para crear grficos. 3. Seleccionar las variables que se desean utilizar en el anlisis. 4. Ejecutar el procedimiento y observar los resultados. 1
IMPORTACION O CAPTURA DE DATOS A SPSS

2
SELECCIN DE UN PROCEDIMIENTO EN LOS MENUS

3
SELECCIN DE LAS VARIABLES PARA EL ANALISIS

4
EXAMEN DE RESULTADOS

Figura 1: Proceso general para usar SPSS.

SPSS - PAQUETE ESTADSTICO

QU ES UN PAQUETE ESTADSTICO. Un paquete estadstico es un conjunto de programas y subprogramas conectados de manera que funcionan de manera conjunta; es decir, para pasar de uno a otro no se necesita salir del programa y volver a l. Un paquete estadstico permite aplicar a un mismo fichero de datos un conjunto ilimitado de procedimientos estadsticos de manera sincronizada, sin salir del programa. De esta forma, la utilidad del conjunto integrado es mayor que la suma de las partes. En cierto modo, un paquete estadstico es similar a un paquete ofimtico (por ejemplo, Office de Microsoft). SPSS es uno de los principales paquetes estadsticos. Otros importantes ejemplos de paquetes estadsticos son SAS, Statistica, Mathlab, Statgraphics y Minitab. En el pasado, haba otros paquetes estadsticos, como BMDP y Systat, hoy absorbidos por la firma SPSS.

2009

Ing. Jess Antonio Vilchis Jurez.

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

SPSS analiza con detenimiento las variables implicadas en la investigacin, con el propsito de construir un modelo nico que sea capaz de explicar lo que aconteci, tanto antes como despus del anlisis estadstico. De alguna forma, SPSS trata de obtener informacin privilegiada a partir de la base de datos. Todas las caractersticas de SPSS abren un amplio campo de investigacin. SPSS es una tecnologa que:

Automatiza el proceso de descubrimiento del conocimiento. Ayuda a centrarse en un rea de inters. Permite predecir resultados. Permite encontrar patrones dentro de un fichero de datos. Ampla las capacidades ofrecidas por otras herramientas.

UTILIDAD DEL SPSS. El paquete estadstico SPSS tiene muchas utilidades, ya que puede ser utilizado como:
1.

2.

3.

4.

5.

Hoja de clculo. SPSS permite realizar funciones aritmticas, algebraicas y trigonomtricas sobre un fichero de datos. En este sentido, SPSS puede compararse, salvando las diferencias, a aplicaciones como Excel o Lotus. Gestor de bases de datos. SPSS permite gestionar de modo dinmico la informacin de un fichero de datos, pues se pueden actualizar los cambios operados (como ordenar, filtrar, etc.) o realizar informes personalizados de acuerdo con distintos criterios, etc. En este sentido, SPSS puede compararse, salvando las diferencias, a un gestor de bases de datos como Microsoft Access, Dbase, Oracle o Foxpro. Generador de informes. SPSS permite preparar de modo elegante atractivos informes de una investigacin realizada, permitiendo incorporar en un mismo archivo el texto del reporte, las tablas y resultados estadsticos que el reporte necesite presentar e, incluso, los grficos que se pudiesen generar. Todo ello apoyado por la posibilidad de exportar los reportes a una pgina web de modo completamente gil. En este sentido, el paquete estadstico SPSS puede compararse, salvando las diferencias, a otros realizadores de reportes, como Microsoft Access. Analizador de datos. SPSS tiene la capacidad de extraer de un fichero de datos toda la informacin recogida, ya sea superficial o profunda, permitiendo realizar procedimientos estadsticos descriptivos, inferenciales y multivariantes. En este sentido, SPSS puede compararse a programas como SAS, Statgraphics o Minitab. Ejecutor de Mineras de Datos. | Ing. Jess Antonio Vilchis Jurez. 3

2009

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

SPSS puede llevar a cabo bsquedas inteligentes, para extraer informacin que permaneca oculta, elaborando rboles de decisin, segmentaciones de mercados o diseos de redes neuronales de inteligencia artificial. En este sentido, SPSS puede compararse a programas como SAS.

PARTES DEL SPSS. SPSS est compuesto por varios programas o rutinas y subprogramas o subrutinas. A los programas de SPSS se les llama mdulos; a los componentes de un programa (es decir, a los subprogramas), se les conoce con el nombre de procedimientos. As, por ejemplo, el paquete estadstico SPSS tiene, entre otros, los siguientes programas o mdulos:

Avanzado Base Profesional Tendencias

A su vez, el mdulo Base tiene, por ejemplo, los siguientes subprogramas o procedimientos: 1. 2. 3. 4. Archivo (File) Frecuencias (Frequencies) Descriptivos (Descriptives) Tablas de Contingencia (Crosstabs)

Por otra parte, el paquete estadstico SPSS se ha desarrollado a partir de la adquisicin o creacin de otros paquetes, como CHAID, CONJOINT, etc. A su vez, SPSS permite abrir ficheros de datos de otras aplicaciones y utilizarlas dentro de SPSS.

SPSS Y EL DATA MINING. El Data Mining (DM) es una metodologa de trabajo especficamente concebida para descubrir filones de informacin en el interior de una montaa de datos. Se puede definir al DM mediante las siguientes 3 caractersticas:

Es un proceso sucesivo y racional de toma de decisiones. Supone la aplicacin de tcnicas estadsticas avanzadas. Representa un mtodo alternativo de creacin de preguntas.

2009

Ing. Jess Antonio Vilchis Jurez.

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

En definitiva, y a modo de smil, el DM equivaldra al arduo trabajo de un minero que, tras mucho cavar y desechar materiales inservibles, encuentra un diamante. Igualmente, en el terreno que nos ocupa (Tratamiento y Difusin de la Informacin), ser el investigador (minero) el encargado de pulir y dar forma a ese diamante (informacin privilegiada) para proponer nuevas estrategias que fructifiquen en futuros beneficios empresariales. Con la aplicacin consecutiva y racional de las distintas tcnicas estadsticas de SPSS se pueden realizar todas las funciones que componen el DM. De este modo, se pueden obtener nuevos e inesperados hallazgos, que darn paso irremediablemente a nuevas preguntas, consiguiendo as una potente metodologa de extraccin de informacin privilegiada que, desde el comienzo de la investigacin, estaba oculta en la mina de datos. En este sentido, SPSS puede incorporar las herramientas del DM en un proceso: 1. Sistemtico: La informacin aportada por el paquete estadstico SPSS al DM se convierte en un sistema inteligente de toma de decisiones. 2. Iterativo: La informacin obtenida por el paquete estadstico SPSS en una fase del proceso del DM se reutiliza en la siguiente fase, como un flujo.

SPSS Y EL DATA WAREHOUSE. El Data Warehouse (DW) naci para dar respuesta a nuevas necesidades de la empresa moderna, ms volcada en la administracin de informacin que en la creacin de la misma. Se puede resumir la gnesis del DW en los siguientes factores: La aparicin de enormes cantidades de informacin. La dificultad para encontrar informacin til en el momento y forma adecuados. La insuficiencia del servicio ofrecido por el DW y el Reporting para responder a preguntas cuyo planteamiento se hace inviable a partir de soluciones clsicas.

SPSS ofrece una magnfica plataforma de gestin de los datos del DW.

SPSS Y MODELADO ESTADSTICO. El uso de tcnicas estadsticas avanzadas se llama tambin modelado. Los avances en el software estn convirtiendo a SPSS en algo ms prctico. Nuevos productos para consumidores de informacin (frente a constructores de modelos) estn facilitando este proceso. Las herramientas de modelado de SPSS se pueden clasificar en los dos grupos: 2009 | Ing. Jess Antonio Vilchis Jurez. 5

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Herramientas dirigidas por la teora. El usuario, a priori, divide las variables en dos grupos bien diferenciados: Variable dependiente, VD (respuesta) y Variable Independiente, VI (predictores). Herramientas dirigidas por datos. No se otorga a priori a las variables ningn papel. El rol de estas tcnicas es formar grupos de variables que creen un perfil de los sujetos.

Modelado Dirigido por la Teora. El modelado dirigido por la teora realiza el contraste de hiptesis: Sustenta o desaprueba ideas preconcebidas. Especifica el modelo, basndose en el conocimiento previo. Y contrasta la validez del modelo. Algunas de las herramientas de modelado dirigido por la teora son: 1. Anlisis de la Varianza (ANOVA) 2. Anlisis de la Asociacin o Correlacin 3. Anlisis de Series Temporales 4. Anlisis de la Regresin 5. Anlisis Discriminante

Modelado Dirigido por los Datos. El modelado dirigido por los datos crea automticamente modelos, partiendo de patrones. Tambin debe contrastarse antes de ser aceptado como vlido. Algunas de las herramientas de modelado dirigido por los datos son: Reduccin de Datos (Factorial, ante todo) Anlisis Cluster Escalamiento ptimo Anlisis Conjunto

LA ESTADSTICA Y LA INVESTIGACIN. La estadstica es una rama de las matemticas aplicadas, dedicada al desarrollo de tcnicas especiales para el ptimo manejo, descripcin, entendimiento y razonamiento de datos, provenientes de observaciones. La estadstica ha demostrado gran utilidad para el mximo aprovechamiento de los datos recolectados en cualquier proceso de investigacin. Permite presentar los datos de modo ordenado para resolver problemas como diseo de experimentos y toma de decisiones. 2009 | Ing. Jess Antonio Vilchis Jurez. 6

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Actualmente se emplean con gran aceptacin tcnicas estadsticas para llevar a cabo estudios en diversas reas como lo es la investigacin de mercados, el control de calidad, el diseo de experimentos, etc.

LOS ROLES DE LA ESTADSTICA. La estadstica como tal hace hincapi en ganar conocimientos a travs del proceso de sistematizar las observaciones y realizar inferencias o razonamientos a partir de esas observaciones. La estadstica apoya el diseo de la investigacin por lo menos en: 1. 2. 3. 4. 5. 6. 7. 8. 9. definicin de elementos de estudio caractersticas generales, criterios de inclusin y de eliminacin definicin, control y vigilancia de la validez interna y externa seleccin de la muestra, evitando sesgos de seleccin tamao de la muestra determinar qu, cundo, cmo y con qu medir, cuntas veces Validez y confiabilidad de las mediciones eliminacin de sesgos durante la construccin planear el anlisis estadstico

Para llevar a cabo lo anterior es preciso comprender perfectamente el fenmeno de inters; dicho fenmeno ayudara a definir de manera correcta el problema. Problema: declaracin precisa de lo que se pretende conocer y por qu se quiere conocer. Mtodo: el plan definido para llevar a cabo la investigacin, es decir, cmo ser adquirido el conocimiento. Usualmente es conveniente considerar el mtodo en trminos de: 1. El tipo particular de mtodo de investigacin 2. Los sujetos a estudiar (personas a ser estudiadas, fenmenos, eventos), materiales, o procedimientos 3. Los anlisis estadsticos

TIPOS DE MTODOS. Resolver un problema de investigacin requiere el diseo de un plan para la reunin de los datos. Desde un punto de vista general, tales planes caen dentro de dos principales categoras, las caractersticas que las distingue es que las observaciones pueden ser conducidas sin intentar manipular las variables bajo estudio, o los investigadores pueden imponer manipulaciones particulares en 2009 | Ing. Jess Antonio Vilchis Jurez. 7

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

las variables a ser estudiadas y entonces observar las consecuencias de la manipulacin, estos dos enfoques se definen como: metodo descriptivo: plan de investigacin que se emprende para definir las caractersticas, relaciones o ambas, entre variables basadas en observaciones sistemticas de esas variables. metodo experimental: plan de investigacin que se emprende para probar relaciones entre variables basadas en observaciones sistemticas de variables que son manipuladas por el investigador.

El mtodo descriptivo implica observacin pero no el control directo sobre las variables. Por ejemplo: Algunos estudios descriptivos comunes incluyen estudios de contenido de mensajes, encuestas de opinin pblica, raitings de radiodifusin, uso de material educativo nuevo, actitudes de profesores encaminadas a la integracin de los grupos, etc. La clave fundamental en todas estas investigaciones es que alguna situacin existente esta siendo estudiada. En el mtodo experimental se prueban hiptesis de causaefecto, es decir, manipulaciones en una variable causarn cambios en otra variable. Las dos variables se clasifican en dependiente e independiente.

variable independiente (VI): fenmeno que es manipulado por el investigador y que se presume produce un efecto en otro fenmeno. variable dependiente (VD): fenmeno que es afectado por manipulaciones del investigador o por otro fenmeno.

CLASIFICACIN DE TCNICAS ESTADSTICAS Las Tcnicas Estadsticas se pueden clasificar de dos formas: segn las caractersticas de la VD y la(s) VI(s) y segn el propsito del mtodo estadstico. Las Tcnicas Estadsticas segn las caractersticas de la VD y la(s) VI(s) a su vez, en Descriptivas y Explicativas. De este modo, se obtienen tres grandes categoras: Tcnicas Estadsticas Descriptivas (figura 2).

2009

Ing. Jess Antonio Vilchis Jurez.

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 2. Mtodos descriptivos.

Tcnicas Estadsticas Explicativas (figura 3). Tcnicas Estadsticas Segn Propsito (figura 4).

2009

Ing. Jess Antonio Vilchis Jurez.

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 3. Mtodos explicativos.

Figura 4. Mtodos multivariables. 2009 | Ing. Jess Antonio Vilchis Jurez. 10

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Resultados: declaracin precisa de todos los conocimientos que se adquirieron. Un buen plan de anlisis es aquel que ha sido elaborado con extrema precaucin, se entiende el problema a resolver y por tal motivo se sabe qu clase de tcnica ser para llegar a los resultados esperados. En pocas palabras el rol de la estadstica consiste en proveer herramientas que podamos utilizar para llevar a cabo todo tipo de investigaciones, ya sea de tipo cuantitativo o incluso de tipo cualitativo. El uso de la estadstica implica responsabilidad, pues es necesario conocer con qu clase de datos se cuenta, ya que estos suelen dividirse en diferentes categoras. En varias clases de estudios, las mediciones se centran en cada individuo que compone la poblacin o la muestra, tpicamente se les denomina sujetos. Los materiales en un estudio incluyen todas las herramientas que el investigador haya empleado para realizar la investigacin. En un experimento, los materiales incluyen todo aquello que el investigador haya utilizado para manipular la variable independiente, adems de instrumentos para medir. Los procedimientos en un estudio se refieren a la manera precisa en la cual los materiales han sido aplicados a los sujetos y cmo se han guiado los datos en el estudio. Generalmente los procedimientos influyen en el tipo de estadsticas a utilizar. Se deber identificar qu procedimientos estadsticos se utilizarn, y qu criterios sern utilizados en el razonamiento de los resultados que se obtengan de la poblacin bajo estudio. La seleccin del mtodo estadstico depende, por supuesto, de qu tipo de deducciones matemticas se tengan que realizar, qu caractersticas de la poblacin interesan (promedios, dispersiones, etc.), qu comparaciones poblacionales se pueden hacer y qu tipo de escala de medicin se utilizar.

ESCALAS DE MEDICIN. Escala nominal o clasificatoria. Asignacin de nmeros o smbolos para nombrar subclases que representan caractersticas nicas. A veces es llamada escala clasificatoria, la escala nominal es la escala ms dbil de medicin. De las cuatro escalas de medicin, sta implica la menor informacin acerca de las observaciones. Por ejemplo: Si los investigadores clasifican las observaciones en categoras mutuamente excluyentes, como dividir la gente por el color de sus ojos (una clase), en subclases (ojos azules, cafs, verdes), estn utilizando una escala nominal. No hay ninguna intencin de ordenamiento entre las categoras. 2009 | Ing. Jess Antonio Vilchis Jurez. 11

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Diferentes clases de observaciones pueden ser identificadas numricamente. Por ejemplo: En cuanto a los ojos, los colores pueden numerarse de la siguiente manera: Azul=1, caf=2, verde=3. El uso de los nmeros implica nicamente la operacin de numeracin. La escala nominal consiste simplemente en la divisin de caractersticas (clases) en subclases mutuamente excluyentes, es decir, diferentes unas de otras, pero que en conjunto forman la clase total de caractersticas del fenmeno de estudio.

Escala ordinal o de rango. Asignacin de nmeros o smbolos para el propsito de identificar relaciones ordenadas de algunas caractersticas. El orden no cuenta con intervalos especificados. Al igual que la escala nominal, la escala ordinal es dbil. Lo importante de la escala ordinal, es que entre subclase se presenta un orden, esto es, cada subclase puede ser comparada con cualquier otra subclase en trminos de una relacin de mayor que, o menor que. Se debe tener en cuenta que la escala ordinal no indica la diferencia en cuanto a magnitud entre categoras ordenadas. Por ejemplo: Los cuestionarios utilizados en las encuestas a menudo utilizan escalas ordinales. Los nios del kinder ven la televisin: 1. Demasiado 2. Un poco 3. No la ven Por favor ordene en orden de importancia, para usted, los siguientes medios de comunicacin para mantenerse informado (radio, peridicos, televisin, revistas) 1______________________________ 2______________________________ 3______________________________ 4______________________________ 5______________________________ En ambos casos arriba mencionados los nmeros son asignados para indicar el orden relativo de las respuestas, pero no se asume que la diferencia entre, 1 y 2 es igual a la diferencia entre 3 y 4, del mismo modo la diferencia entre 2 y 4 no es el doble en cuanto a la magnitud, de la diferencia entre 1 y 3. En pocas palabras nada esta dicho o asumido en cuanto a la magnitud de los intervalos 2009 | Ing. Jess Antonio Vilchis Jurez. 12

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

entre nmeros, pero s es un hecho que 2 es menor que 3, o 6 es mayor que 5, y as sucesivamente los nmeros son nicamente etiquetas. Otros ejemplos: Tecnologa baja, tecnologa media, tecnologa alta Ordenar los nios por altura (sin medirlos) En esta escala de medicin pueden asignarse nmeros a las observaciones, pero la distancia entre ellos no se conoce. (Se sabe que un nio es mas alto que el que lo antecede, pero no se sabe cuanto mas alto, y el siguiente no tiene por que ser mas alto como l lo es respecto de su anterior). Escala de intervalo. Las observaciones medidas en esta escala son susceptibles de clasificarse en categoras, pueden ser ordenadas de menor a mayor y adems puede medirse la distancia entre dos observaciones. En esta escala de medida se requiere una unidad de distancia de un cero, aunque ambos sean arbitrarios. Ejemplos:

La temperatura; que usualmente se mide en grados Celcius o Fahrenheit. La unidad de medida y el cero son arbitrarios. 212 92 100 33.3 212 152 100 66.7 32o 92o 152o 212o

FAHRENHEIT congelado 0o 33.3o CELCIUS


o

66.7

hirviendo 100o

El nivel de dao en un cultivo. Puede clasificarse en una escala de medida con un cero arbitrario de dao: Menos de 5% 10% 20% 30% 0 1 2 3

Dao Escala

Esta escala de medida es la primera realmente cuantitativa, como se habr notado, las escalas de medicin son acumulativas, o sea, tienen todas las propiedades del nivel anterior y algunas ms. Para esta escala lo que 2009 | Ing. Jess Antonio Vilchis Jurez. 13

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

agregamos es que la diferencia entre dos observaciones tienen sentido (obviamente tambin la suma). En resumen, esta escala tiene asignacin de nmeros con el propsito de identificar relaciones ordenadas de algunas caractersticas. El orden tiene asignados intervalos arbitrarios de igual magnitud, pero un punto cero arbitrario. Cuando se considera una escala de intervalo, la atencin se enfoca a las diferencias entre los valores de la escala.

Escala de razn o de proporcin. Asignacin de nmeros para el propsito de identificar relaciones ordenadas de algunas caractersticas, el orden tiene asignados intervalos de igual magnitud, pero con un punto cero absoluto. Con las escalas de razn se puede reflejar de manera mas acertada la realidad, que con cualquier otra escala. Las observaciones medidas en esta escala son susceptibles de clasificarse en categoras, ser ordenadas de menor a mayor, puede medirse la distancia entre dos observaciones, se tiene un cero que no es arbitrario y la razn entre dos observaciones tiene sentido, ejemplos:

rendimiento de una hectrea de maz las estaturas de un grupo de 10 nios 36 12 91.44 30.48 = 36 24 91.44cm 60.96cm 0 12 24 36

0cm

30.48cm

60.96cm

91.44cm

En los casos donde la investigacin requiera ms de una simple clasificacin u orden, ser preferible trabajar con escalas de razn lo mismo que en operaciones de enumeracin. El siguiente esquema indica el nivel comparativo de confiabilidad entre las escalas.

Menos confiable NOMINAL

ORDINAL

INTERVALO

Ms confiable RAZN

2009

Ing. Jess Antonio Vilchis Jurez.

14

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Para hacer un uso apropiado y eficiente, desde el punto de vista de la informtica, deben usarse los mtodos estadsticos ms potentes que la escala permita, de lo contrario se est perdiendo informacin; es decir se est haciendo un uso inapropiado de los datos. Cuando se est en la etapa de captura de datos se debe tener en cuenta, como gua, el tipo de anlisis que se har, para obtener los datos apropiados y medidos en el nivel apropiado. Es un error no capturar datos o con un nivel dbil, pero igualmente es un error capturar datos con un nivel mas fuerte del necesario para el anlisis posterior.

ndices de tendencia central. Con frecuencia se escuchan preguntas como: cul es el ingreso per cpita de la poblacin en Mxico?, cuntos cigarrillos se fuma un adolecente en promedio?, cul es el promedio de horas que la poblacin urbana ve la televisin?, cul es el numero promedio de llamadas telefnicas que se reciben en un conmutador a diferentes horas del da o la noche?; en promedio cuntos accidentes automovilsticos ocurren como resultado directo del alcohol o las drogas?; etc.. Una forma elemental y prctica de describir a un grupo en su totalidad es encontrar un nmero nico que represente lo tpico o promedio de ese grupo. En matemticas, este valor se conoce como una medida de tendencia central, ya que generalmente est localizada a la mitad o en el centro de una distribucin de datos. Por lo que la tendencia central de un conjunto de datos es la disposicin de estos para agruparse ya sea alrededor del centro o de ciertos valores numricos. Se distinguen bsicamente tres medidas de tendencia central:

Moda o modo: la categora que ocurre con mayor frecuencia. Mediana: valor para el cual, cuando todas las observaciones se ordenan de manera creciente, la mitad de estas es menor que este valor y la otra mitad mayor. Media: suma de las puntuaciones en una distribucin, dividida por el nmero de puntuaciones.

ndices de dispersin Existen ndices que describen la variabilidad de un conjunto de datos. Variabilidad: dispersin de las observaciones en el conjunto de datos. Se distinguen bsicamente tres medidas de dispersin:

Rango: puntuacin ms alta en una distribucin menos la ms baja. | Ing. Jess Antonio Vilchis Jurez. 15

2009

ANLISIS ESTADSTICO CON SPSS


CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Varianza: promedio del cuadrado de las distancias entre cada observacin y la media del conjunto de observaciones. Desviacin estndar: raz cuadrada positiva de la varianza.

ESTADSTICAS EMPLEADAS PARA EL RESUMEN DE DATOS. Son las medidas que proveen una representacin de algunas caractersticas de un grupo de datos. qu hacen? 1. Media, mediana y moda proveen una medida de localidad (promedio). 2. Varianza, desviacin estndar y otras estadsticas relacionadas proveen una medida de dispersin (extensin). 3. Porcentaje, puntuacin top box, y otras estadsticas relacionadas proveen una medida de incidencia. 4. Otras estadsticas proveen una medida de sesgo (asimetra) y curtosis (picudez de una distribucin). para qu se utilizan? Para sumarizar datos clasificados, y otras variables obtenidas en la investigacin. Como datos de entrada para pruebas de significancia y otros anlisis estadsticos. Para comparar diferencias entre grupos y cambios en el tiempo, en varias evaluaciones. Para combinar datos de varios grupos. dnde se pueden localizar? En cualquier paquete estadstico de mltiples propsitos como SAS, SPSS, STATGRAPHICS., etc..

PRESENTACIN GRFICA. Diagrama de barras. Es el procedimiento grfico empleado para representar los datos tanto en escalas nominales como ordinales. Para cada categora se traza una barra vertical en la que la altura de la barra representa el numero de miembros de esa clase. Las barras deben de ser siempre del mismo ancho, y el espacio que las separa no debe ser mayor que el espesor de ellas mismas (figura 5).

2009

Ing. Jess Antonio Vilchis Jurez.

16

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 5. Ejemplo de diagrama de barras.

Diagrama de barras dobles. Este diagrama, el cual puede servir para barras triples o cudruples, se emplea para representar datos de asociacin cuyas dos escalas sean cualitativas. Tambin se emplea cuando se quiere comparar dos distribuciones de frecuencias en relacin al tiempo (figura 6).

Diagrama de sectores. Otra grfica que se utiliza para escalas de variables ordinales y nominales es el diagrama por sectores, se utiliza con fines comparativos y a menudo se emplea en lugar del diagrama de barras. En l pueden representarse cifras absolutas o porcentuales. Como el crculo tiene 360, la manera mas fcil de elaboracin es expresar los datos que se estudian en forma de porcentajes, pues en tal caso cada 1% corresponde a 3.6 del crculo (figura 7).

2009

Ing. Jess Antonio Vilchis Jurez.

17

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 6. Ejemplo de diagrama de barras dobles.

Figura 7. Ejemplo de diagrama de sectores. 2009 | Ing. Jess Antonio Vilchis Jurez. 18

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Histograma. La grfica que se utiliza para representar distribuciones de frecuencias en escala cuantitativa como por ejemplo; peso, estatura; y cuantitativa discreta, como por ejemplo: numero de nios en una familia, numero de das de ausencia; etc., es el histograma. En este, el fenmeno que se estudia queda representado por una serie de rectngulos semejantes al del diagrama de barras y estos tienen una rea igual o proporcional a su respectiva frecuencia. Adems las barras del histograma siempre se colocan en forma vertical y deben ir unas al lado de las otras, sin que haya ningn espacio que las separe (figura 8).

Figura 8. Ejemplo de histograma.

EL PLAN DE LA INVESTIGACIN. Es importante considerar a fondo cada uno de los aspectos involucrados en una investigacin, ya que a medida que se comprenda cada una de las partes involucradas se realizar un mejor estudio.

2009

Ing. Jess Antonio Vilchis Jurez.

19

ANLISIS ESTADSTICO CON SPSS El problema

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Una investigacin inicia con la presencia de un problema o la necesidad de informacin, es imprescindible preguntarse por qu es importante estudiar el fenmeno de inters. El problema en s mismo, se define en una declaracin. Por ejemplo: el propsito de este estudio es determinar el promedio de estudiantes universitarios, en el Estado de Mxico, que consumen cerveza x; o cul es el promedio de estudiantes universitarios, en el Estado de Mxico, que consumen cerveza la corona? Otra manera de declarar una investigacin o estudio es mediante una hiptesis. Hiptesis: declaracin susceptible de ser probada (aceptada o rechazada), mediante la aplicacin de razonamientos y tcnicas apropiadas. Por ejemplo: los estudiantes universitarios del Estado de Mxico, consumen ms cerveza x que los estudiantes universitarios de Chiapas. Un problema se declara en forma de hiptesis nicamente cuando hay suficientes razones para llevar a cabo predicciones futuras. Declarar un problema es muy importante, pues a partir de la declaracin se elige el tipo de herramienta estadstica a utilizar. Adems la declaracin del problema provee una definicin preliminar de la poblacin a ser estudiada; esto tambin tiene consecuencias en cuanto a las estadsticas que sern utilizadas. Quiz el investigador analice a la poblacin entera y se utilicen nicamente estadsticas descriptivas, o se tome una muestra de la poblacin y se utilicen estadsticas descriptivas y muestrales.

OBSERVACIONES Y ESTADSTICA. Es importante comparar aquellos fenmenos que el investigador observa y la manera en que la estadstica analiza y reporta esas observaciones. fenmeno: caractersticas susceptibles de ser observadas para cualquier objeto o evento. Cualquier segmento de la realidad que puede estar bajo observacin. variable: caracterstica observable de un objeto o evento que puede ser descrita de acuerdo a alguna clasificacin o esquema de medicin. datos: reportes de las observaciones de las variables. mediciones: asignacin de caractersticas de una variable. nmeros o smbolos para diferenciar

Por ejemplo: Supngase que el inters de los lectores de ciertos artculos se clasifica en tres clases, donde 1 significa mucho inters, 2 medio inters, 3 poco inters. 2009 | Ing. Jess Antonio Vilchis Jurez. 20

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Todas las observaciones, y de lo que de ellas emana (variables, escalas, mediciones, etc.), provienen de lo que se llama poblacin. poblacin: coleccin de toda la posible informacin y observaciones que caracterizan a un fenmeno. Lo que sea que se haya definido como poblacin, es puramente arbitraria; depende de los lmites del problema a investigar. En la prctica es bastante difcil realizar estudios de una poblacin en su conjunto, en lugar de analizar cada dato de la poblacin se analiza una parte de ellos. Muestra: subconjunto representativo seleccionado de una poblacin.

METODOLOGAS ESTADSTICAS METODOLOGA ESTADSTICA SIMPLE. Slo afecta a una o dos variables. Mtodos descriptivos: Estadstica descriptiva. Ofrece una visin superficial de las caractersticas. Frecuencias, Tablas de contingencia o Exploracin. Mtodos explicativos: Estadstica inferencial. Ofrece una visin profunda de las caractersticas del fenmeno. - ANOVA, - T-test y - Medias.

METODOLOGA ESTADSTICA MLTIPLE O COMPLEJA. Afecta a una multiplicidad de variables: Mtodos multivariantes. Mtodos jerrquicos: Estadstica que divide las variables en dependientes (VD) e independientes (VI). - Anlisis de regresin mltiple. Mtodos no jerrquicos: Estadstica que no divide a las variables en dos, sino que todas ellas tienen idntico status. - Anlisis cluster, - Anlisis factorial o - Escalamiento. 2009 | Ing. Jess Antonio Vilchis Jurez. 21

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

ANLISIS DESCRIPTIVO BIVARIANTE. VD Mtrica y VI No mtrica: Explore (examine). o Frecuencias, Histograma, Estadsticas. o Tests (Normalidad y Homocedasticidad). o Grficas de cajas (Boxplot). VD Mtrica y VI Temporal (fecha): Graphs-sequence (tsplot). Anlisis de series temporales (ARIMA) VD Mtrica y VI Mtrica: Grafico de dispersin (Scatterplot). VD Mtrica y VI Mtrica: Anlisis de correlacin (Correlate). VD No mtrica y VI No mtrica: Anlisis o tabla de asociacin ode contingencia. Tablas cruzadas o de la Chi-Cuadrada (Crosstabs). Tablas de frecuencias por celdas (frecuencias relativas (%) y absolutas). Estadsticos que miden la fuerza de la asociacin. Pueden ser de varios tipos: Pearsonianos o simtricos (tienen valores entre 0 y 1). Direccionales o RPE (tienen valores entre -1 y 1). VD Mtrica y VI No mtrica: Anlisis de la varianza simple (t-test de muestras independientes. T-test realiza una comparacin simple de medias. Contrasta las H0 de igualdad de varianzas (homocedasticidad) y de igualdad de medias. VD Mtrica y VI No mtrica: Anlisis de correlacin (t-test de muestras dependientes). VD Mtrica y VI No mtrica: Comparacin de medias (Means). VD Mtrica y VI No mtrica: Comparacin de varianzas (ANOVA de una va Oneway).

2009

Ing. Jess Antonio Vilchis Jurez.

22

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

ANLISIS DESCRIPTIVO MULTIVARIANTE.

2009

Ing. Jess Antonio Vilchis Jurez.

23

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

INICIO DE SPSS Para iniciar SPSS: Elija en el men Inicio de Windows (figura 9): Programas SPSS para Windows SPSS para Windows

Figura 9. Ventana para iniciar SPSS 15.0 para Windows. Al iniciar el programa se abre automticamente el asistente de inicio (figura 10), el cual plantea la pregunta Qu desea hacer? Y abarca 6 posibilidades: 2009 Ejecutar tutorial. Introducir datos. Ejecutar una consulta creada anterior mente. Crear una nueva consulta mediante el asistente de datos. Abrir una fuente de datos existente. | Ing. Jess Antonio Vilchis Jurez. 24

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 10. Asistente de inicio. 2009 | Ing. Jess Antonio Vilchis Jurez. 25

ANLISIS ESTADSTICO CON SPSS Abrir otro tipo de archivo.

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

TUTORIAL DE SPSS El tutorial muestra cmo utilizar muchas de las funciones disponibles en SPSS (figura 11). Est diseado para proporcionar una gua prctica paso a paso. Todos los ejemplos que aparecen vienen instalados con el tutorial para que se puedan seguir a la hora de realizar el mismo anlisis y obtener los mismos resultados que aparecen ah.

Figura 11. Ventana del Tutorial de SPSS.

Tambin est diseado para que sea fcil comenzar y parar en cualquier punto que se desee. Si slo se desea conocer algunas tareas especficas, hay que utilizar los botones Contenido e ndice (junto a los botones Anterior y Siguiente) que se encuentran en la parte inferior de esta ventana para buscar la informacin que se necesita o simplemente pulsar en el botn Siguiente (la flecha que apunta a la derecha) para recorrer todos los tutoriales desde el principio hasta el final (figura 12). Si se desea ver ejemplos detallados de diversas tcnicas de anlisis estadsticos, acceder a los Estudios de casos.

2009

Ing. Jess Antonio Vilchis Jurez.

26

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 12. Botones para seleccionar un tema del tutorial de SPSS.

USO DEL EDITOR DE DATOS En el Editor de datos se muestra el contenido del archivo de datos activo (figura 13). La informacin incluida en el Editor de datos consta de variables y casos. En la Vista de datos, las columnas representan las variables y las filas representan los casos (observaciones). En la Vista de variables, cada fila es una variable y cada columna es un atributo asociado a dicha variable.

Las variables se utilizan para representar los diferentes tipos de datos que haya recopilado. Una analoga comn es la de una encuesta. La respuesta a cada pregunta de una encuesta equivale a una variable. Las variables son de distintos tipos, incluyendo nmeros, cadenas, moneda y fechas.

INTRODUCCIN DE DATOS NUMRICOS Los datos se pueden introducir en el Editor de datos, lo que puede resultar til para archivos de datos pequeos o para realizar tareas de edicin menores en archivos de datos ms grandes. 2009 | Ing. Jess Antonio Vilchis Jurez. 27

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 13. Editor de datos SPSS.

VENTANA EDITOR DE DATOS. Esta es la ventana principal del paquete; en ella encontramos las herramientas fundamentales del programa, adems esta ventana es la nica que nos permite observar la informacin (Datos y Variables), en su forma original (desagrupada), para tener una idea ms clara debemos conocer algunos conceptos fundamentales. Antes de conocer las partes del editor de datos es necesario conocer cmo est diseada la estructura de los datos en SPSS (tabla 1). Tabla 1. Estructura de los datos. VARIABLE 1 Observaciones Observaciones

CASO 1 CASO 2

VARIABLE 2 Observaciones Observaciones

Las columnas representan las variables o preguntas y las filas contienen las observaciones, mediciones o respuestas. Cada caso contiene las respuestas de un individuo a la totalidad de las preguntas o variables.

PARTES DE LA VENTANA. El editor de datos de divide en 5 partes: o Barra de mens. 2009 | Ing. Jess Antonio Vilchis Jurez. 28

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Como cualquier programa basado en ambiente Windows, el editor de datos del SPSS posee una barra de mens desplegables, dentro de los cuales podemos encontrar diferentes aplicaciones, procedimientos o procesos. En SPSS se cuenta con 10 diferentes mens desplegables como lo son: Archivo, Edicin, Ver, Datos, Transformar, Analizar, Grficos, Utilidades, Ventana y Ayuda (?). o Barra de herramientas. En esta barra se encuentran los procedimientos ms comnmente utilizados, se puede personalizar el contenido de esta barra mediante la opcin men Ver Barra de herramientas (figura 14). Al hacer clic nos abre un nuevo cuadro de dilogo llamado mostrar barra de herramientas (figura 15), en el cual encontraremos la opcin personalizar en la parte inferior derecha; al hacer clic en ella, se abre un nuevo cuadro llamado Personalizar barra de herramientas (figura 16a), en el cual encontraremos cada uno de los procesos, procedimientos o elementos que posee el programa.

Figura 14. Men Ver.

Por defecto la barra posee las funciones: (1) Abrir archivo, (2) Guardar archivo, (3) Imprimir Como podemos observar, estos 3 iconos son comunes en casi todos los programas para Windows, por lo cual no entraremos en detalle de ellos. (4) Recuperar cuadro de dilogo

2009

Ing. Jess Antonio Vilchis Jurez.

29

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 15. Mostrar barra de herramientas.

10

11 0 12

13 0

1 2

14

Figura 16a. Personalizar barra de herramientas.

Este icono nos permite acceder de forma rpida a los ltimos procedimientos que hayamos efectuado en SPSS, es decir, nos muestra los diferentes cuadros de dilogo (ventanas) a que hayamos ejecutado (entrado) con anterioridad como frecuencias, grficos, tablas, etc. Lo que hace es abrirlo nuevamente. (5) Deshacer, (6) rehacer

2009

Ing. Jess Antonio Vilchis Jurez.

30

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Estepar de iconos tambin son comunes en la mayora de los programas para Windows. Se activan despus de realizar alguna operacin en el paquete. (7) Ir a caso Como su nombre lo indica, nos permite ir a un caso especfico, es decir, ir a la posicin donde se ubica dicho caso. (8) Variables Cuando seleccionamos este icono se abre un nuevo cuadro de dilogo (figura 17), en el cual nos muestra toda la informacin de cada una de las variables (el nombre, la etiqueta, si hay o no valores perdidos, el nivel de medida, los valores y las etiquetas de cada valor).

Figura 17. Variables. La forma de utilizarlo es haciendo clic sobre la variable que deseemos en la lista. (9) Buscar Este icono nos permite ubicar un valor dentro de una variable, es decir, nos permite encontrar un nmero o una combinacin de caracteres dentro de los registros. Dado que generalmente se utilizan nmeros para representar una categora (hombre = 0 y mujer = 1), y las bases de datos poseen mltiples variables, sera ilgico esperar que la bsqueda se realice en todo el archivo, es por este motivo que al activar el icono aparece en la parte superior del cuadro de dilogo (figura 18) la frase Buscar datos en la variable ***** (***** = nombre de la variable). La forma de seleccionar una variable es hacer clic sobre ella en el editor de datos, con lo cual el nombre de la variable en la frase cambiar por el de la seleccionada. Podemos observar en el cuadro de dilogo Buscar, una pequea casilla en 2009 | Ing. Jess Antonio Vilchis Jurez. 31

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 18. Buscar datos en variable. la parte inferior izquierda la cual nos da la posibilidad de pedirle que la bsqueda sea lo ms exacta posible; esta opcin slo se utiliza en variables alfanumricas. Por ltimo tenemos el botn Buscar siguiente el cual nos permite pasar de un caso o registro encontrado al siguiente. (10) Insertar caso Como su nombre lo indica nos permite ingresar un nuevo caso, es decir, las respuestas de un nuevo individuo. Hago nfasis en las respuestas, ya que generalmente se trabaja con encuestas, pero tambin pueden ser observaciones si se trata de un experimento. (11) Insertar variable Nos permite ingresar una nueva variable o pregunta, no necesariamente tiene que ser respondida por todos los individuos. (12) Segmentar archivo Este icono nos permite dividir nuestra base en distintos grupos de acuerdo a la variable que utilicemos para la segmentacin, al hacer clic sobre el icono se abre un nuevo cuadro de dilogo (figura 19), el cual nos brinda 3 posibilidades: Analizar todos los casos, no crear los grupos: Esta opcin nos permite trabajar con todos los casos de la base y sacar resultados (estadsticos), con todos los casos u observaciones. Comparar los grupos: Esta opcin nos permite comparar los resultados de cada uno de los grupos. Organizar los resultados por grupos: Esta opcin nos permite ver de forma organizada los resultados (grficos, tablas, estadsticos) por cada uno de los grupos. Esta opcin es bastante til si nosotros deseamos hacer un nlisis separado de la muestra por algn tipo de rango, como por ejemplo el gnero, o la regin, o la fecha, etc.. | Ing. Jess Antonio Vilchis Jurez. 32

2009

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 19. Segmentar archivo. La forma de utilizarlo es seleccionar una de las dos ltimas opciones e ingresar la variable o las variables que deseamos utilizar como rango y luego darle aceptar, despus de esto cada procedimiento (tablas, grficos o estadsticos) que le pidamos al programa nos lo mostrar de acuerdo a la segmentacin. (13) Ponderar Ponderar es dar un peso o valor diferente a cada uno de los casos, es decir, darle mayor importancia a unos valores que a otros, esto se hace con el fin de poder sacar algn resultado representativo de la poblacin y no de la muestra. (14) Seleccionar casos Selecciona slo aquellos casos que cumplan una condicin o tambin podemos pedirle al programa que tome un fragmento de los casos ya sea de forma arbitraria o no. (15) Etiquetas de valor (figura 16b) Esta opcin nos permite observar los valores de los datos o la categora a la que corresponde, es decir, cuando est activada vemos en el editor de datos las palabras de cada uno de los rangos de las variables y por el contrario, cuando est desactivada, vemos los nmeros que les corresponde dentro de cada variable, es til para hacerse una idea de los datos. (16) Usar conjuntos (figura 16b) Este icono nos permite generar o utilizar conjuntos de variables, es til cuando trabajamos con preguntas de respuesta mltiple o tenemos variables que podemos agrupar para hacer un anlisis especfico. 2009 | Ing. Jess Antonio Vilchis Jurez. 33

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

15

16

Figura 16b. Personalizar barra de herramientas.

Barra de posicin.

La barra de posicin la encontramos ubicada debajo de la barra de herramientas, esta barra al igual que en Excel, nos indica la fila (caso), la columna (variable) y el valor que corresponde a esa posicin (figura 17).

Variable

Caso

Valor

Figura 17. Barra de posicin. 2009 | Ing. Jess Antonio Vilchis Jurez. 34

ANLISIS ESTADSTICO CON SPSS Vistas del editor de datos.

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

El editor de datos cuenta con dos vistas, la primera es la vista de datos (figura 18), en la cual se puede visualizar cada uno de los datos (variables y casos); debemos recordar que los casos se representan en las filas y las variables en las columnas.

REA DE TRABAJO

Figura 18. Vistas de editor de datos.

Al igual que en una hoja de clculo, SPSS cuenta con un rea de trabajo, es decir, un espacio determinado en el cual podemos ingresar nuestras variables y casos, esta rea es de 33.000 variables y 2.000.000 de casos; lo cual garantiza que se puede manejar cualquier base.

Vista de variables. La segunda vista que posee el editor de datos es la vista de variables, y es la parte ms importante del paquete, de la correcta definicin de las variables depende la efectividad del anlisis. La forma de seleccionar esta vista es sencillamente hacer clic sobre la pestaa vista de variables; una vez hecho esto se puede ver que la forma en el editor de datos a cambiado (figura 19). Se puede observar que la estructura ha cambiado, se ve que la fila principal tiene diferentes propiedades que ya vienen establecidas en el paquete, estas propiedades son las del recuadro rojo de la figura 19. Cada una de ellas tiene un propsito especfico y es necesario, antes de generar algn tipo de anlisis, comprobar que estn correctamente activados cada uno de los campos. 2009 | Ing. Jess Antonio Vilchis Jurez. 35

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 19. Vista de variables.

Tambin se puede notar que ahora las filas corresponden a cada una de las variables de la base o archivo. Por lo tanto la estructura de la vista de variables es como se muestra en la tabla 2. Tabla 2. Estructura de la Vista de variables. Propiedades Propiedades Variable 1 Definicin Definicin Variable 2 Definicin Definicin

Es importante hacer notar que en esta vista hay una gran diferencia con la vista de datos (figura 20), esto es debido a que en la vista de variables se definen las caractersticas de las variables, es decir, sus propiedades y no se van a modificar los datos; lo nico que se realiza es ingresar informacin importante de las variables, la cual ser utilizada en el anlisis.

Vista de datos Variables Registros columnas

Vista de variables Definicin Variables columnas

Filas

Filas

Figura 20. Comparacin de las estructuras de las vistas.

Una vez aclaradas las diferencias estructurales de las vistas, podemos continuar. Ahora conoceremos cada una de las propiedades de las vistas, las cuales son:

2009

Ing. Jess Antonio Vilchis Jurez.

36

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Nombre. El nombre de la variable es la forma de identificarla, cada variable debe tener un nombre nico y sus caractersticas son: Puede ser alfanumrica, es decir letras y nmeros. El primer carcter debe ser siempre una letra. No se puede utilizar palabras clave (reservadas) como AND, OR y NOT. No se pueden utilizar caracteres especficos (+, -, *, /, !, , etc.). Tipo. El tipo de la variable especifica la forma de los datos de cada variable, es decir, identifica el tipo de caracteres que encontraremos en los registros. Es aconsejable trabajar las variables de forma numrica, ya que el anlisis estadstico es una ciencia matemtica y para su correcto funcionamiento es necesario realizar las operaciones con nmeros. En algunos casos no es posible tener los datos de forma numrica, para estos casos el paquete nos permite trabajarlos como una cadena de caracteres. La forma de activarlo, es haciendo clic en la casilla tipo correspondiente a la variable que estamos editando; con lo cual la activaremos. En ese momento podemos ver un pequeo botn con unos pontos suspensivos, haciendo clic sobre l activaremos el cuadro de dilogo tipo de variable (figura 21). Los tipos que maneja SPSS son:

Figura 21. Tipo de variable. 2009 | Ing. Jess Antonio Vilchis Jurez. 37

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Numrico: una variable numrica cuyos valores son nmeros y se muestran de forma estndar, es decir, asume la notacin por defecto de Windows para la separacin decimal (enteros (,) decimales) 1000,00; es el tipo ms usado. Coma: una variable numrica cuyos valores se muestran con comas que delimitan cada tres posiciones y con el punto como delimitador decimal 1,000,00. Punto: una variable numrica cuyos valores se muestran con puntos que delimitan cada tres posiciones y con la coma como delimitador decimal 1.000,00. Notacin cientfica: una variable numrica cuyos valores son demasiado grandes o pequeos, por lo cual se utiliza un exponente con signo que representa una potencia en base diez. Por ejemplo: 1,000,000.00 = 1.0E+6 0.000001 = 1.0E-6

SPSS nos permite representarlo de varias formas, como: 1000000, 1.0E6, 1.0D6, 1.0E+6, 1.0+6. La notacin es til cuando manejamos cifras extremas, de lo contrario es mejor manejarlo de forma numrica. Fecha: una variable numrica cuyos valores representan uno de los diferentes formatos de fecha-calendario u hora-reloj (figura 22). Se puede introducir la fecha utilizando como delimitadores barras, guiones, puntos, comas, o espacios.

Figura 22. Tipo de variable: Fecha. En la parte derecha de la ventana aparece una lista donde podemos seleccionar el formato de fecha que ms til nos sea o el que mejor se acomode a nuestros datos. Dlar: una variable numrica cuyos valores representan sumas de dinero en dlares (figura 23), al seleccionarla se abre un nuevo cuadro de dilogo, en la cual debemos seleccionar uno de los formatos preestablecidos. 2009 | Ing. Jess Antonio Vilchis Jurez. 38

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 23. Tipo de variable: Dlar. Moneda personalizada: una variable numrica cuyos valores representan sumas de dinero, al seleccionarla se abre una nueva ventana en la cual debemos seleccionar uno de los formatos preestablecidos (figura 24).

Figura 24. Tipo de variable: Moneda personalizada. La diferencia con el tipo dlar, es que nos permite trabajar con 5 tipos de moneda diferentes; al seleccionar alguno, el programa desconocer el origen de la moneda, slo tendr en cuenta que es un tipo de moneda diferente al dlar. Cadena: variable cuyos valores no son numricos y por ello, no se utilizan en los clculos. Pueden contener cualquier tipo de caracteres siempre que no exceda la longitud mxima de 255; las maysculas y las minsculas se consideran diferentes, ya que trabaja bajo el cdigo ASCII. Tambin se conoce como variable alfanumrica. Anchura. Determina el mximo de dgitos que podemos esperar en una variable, este ancho incluye los dgitos enteros y los decimales. Anchura 5=xxx.xx x,xxx.x xx,xxx donde x representa un nmero aleatorio. No se debe cometer el error de pensar que una vez establecida la anchura ya no se podr encontrar una cifra con mayor cantidad de nmeros; ya que esta opcin es para darle una idea al investigador de 2009 | Ing. Jess Antonio Vilchis Jurez. 39

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

las cifras que encontrar cuando le pida al paquete informacin de las variables, es decir, no restringe la cantidad de nmeros sino que es un parmetro informativo, el cual le brinda a la persona que opere el programa una idea de los rangos mximos que puede tomar esta variable, pero no impide sobrepasarlo. Decimales. Determina el mximo de dgitos decimales que se tendrn, las cifras que superen la longitud sern aproximadas hacia arriba; si superan el valor 5, al contrario sern aproximadas hacia abajo, es decir: En 1.07X, si X5 entonces se aproxima a 0, es decir 1.07 En 1.07X, si X>5 entonces se aproxima a 10, es decir 1.08 Estas dos columnas (Anchura y Decimales) pueden ser editadas directamente desde la ventana de Tipo de variable (figura 25) ya que esta ventana nos da la posibilidad de definirlas.

Figura 25. Tipo de variable: Anchura y Decimales. Hay que notar que cuando seleccionamos Tipos de variables, como Fecha, etas opciones se desactivan ya que el formato de la fecha est predefinido y no se puede alterar, la nica opcin que se tiene es escoger otro formato de fecha. Etiqueta. SPSS nos brinda la posibilidad de utilizar una etiqueta en la cual podemos describir la variable mediante la utilizacin de un mximo de 255 caracteres. El uso de la etiqueta es bastante til para facilitar la interpretacin de los resultados (tablas o grficos), para las personas que no han participado en la generacin de los procedimientos y desconocen el significado del nombre de la variable. El uso de la etiqueta es opcional, el programa en caso de no existir una etiqueta utiliza el nombre de la variable para generar los resultados. Podemos darnos cuenta de las etiquetas manteniendo el cursor sobre el nombre de la variable en la vista de datos. 2009 | Ing. Jess Antonio Vilchis Jurez. 40

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

En la figura 26, podemos observar claramente la diferencia que existe al utilizar las etiquetas y las etiquetas de valor en los resultados. Estado civil Etiquetas Con etiquetas Frecuencia Porcentaje Soltero 3224 50.4 Casado 3176 49.6 Total 6400 100.0 ECIVIL Sin etiquetas Frecuencia Porcentaje 0 3224 50.4 1 3176 49.6 Total 6400 100.0

Etiquetas de valor

Vlidos

Vlidos

Figura 26. Resultado de la variable ECIVIL. Perdidos. Los valores perdidos son razones por las cuales no obtenemos una respuesta coherente de algn entrevistado, es decir, es una razn que me indica la causa para la que el entrevistado no me aporta informacin. Dentro de los valores perdidos podemos encontrar: No sabe No responde o se niega a responder No aplica o sencillamente la pregunta no lo afecta. Ej.: preguntarle a una persona soltera la edad a la que se cas por primera vez, si no se ha casado nunca esta pregunta no le afecta. Se debe tener claro que los valores perdidos son razones y no errores, generalmente se tiende a confundir un valor perdido con un valor que no esta dentro de nuestro rango. Ejemplo: En la variable gnero (sexo), se tienen los valores 1=mujer y 2=hombre, despus de revisar el archivo nos damos cuenta que tenemos en algunos registros el valor 3; generalmente cometemos el error de pensar que este es un valor perdido, pero no lo es, este tipo de valores se deben considerar como errores ya sea de digitacin o de captura y la forma de corregirlos es ir hasta la fuente (entrevista) y determinar a qu grupo perteneca el individuo. Si no se puede determinar el grupo y los valores son muy pocos, es recomendable prescindir de estos casos. SPSS maneja dos tipos de valores perdidos, el primero es perdido por el sistema, el cual se identifica por la ausencia total de datos, es decir 2009 | Ing. Jess Antonio Vilchis Jurez. 41

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

casillas vacas; y la segunda es datos perdidos definidos por el usuario. Sea cual sea el tipo de valor perdido, se deben definir, ya que si no se hace, SPSS realizar los clculos contando con estos valores lo cual afectar severamente los resultados. La forma de definirlos es activando la casilla correspondiente a perdidos, una vez activa observaremos de nuevo el botn en la parte derecha, al hacer clic sobre l, se abrir la ventana de valores perdidos la cual nos da tres posibilidades(figura 27):

Figura 27. Ventana: Valores perdidos. No hay valores perdidos. Valores perdidos discretos: son un mximo de tres valores perdidos que tendremos en nuestra variable, pueden tomar los valores que deseemos. Se recomienda que exista una distancia considerable entre los valores representativos y los perdidos con el fin de facilitar su identificacin. Rango ms un valor perdido discreto opcional: Se utiliza cuando tenemos varios parmetros de valores perdidos los cuales se encuentran dentro de un rango y no hay valores representativos de grupos dentro de ellos, adems me da la opcin de ingresar un valor discreto adicional. Columnas y alineacin. Estos dos parmetros son netamente de formato, es decir, de presentacin y veremos sus efectos nicamente en la vista de datos, la primera (columna) nos indica el ancho de la columna y la segunda la alineacin dentro de la celda. La columna, al igual que en una hoja de clculo, podemos alterarla de forma directa en la vista de datos colocando el cursor al lado de la columna hasta que aparezca el indicador, hacemos clic y lo sostenemos arrastrando hasta obtener el ancho deseado. Medida. Es el parmetro ms importante de las variables, de su definicin depende el tipo de anlisis que se puede realizar, dentro de la 2009 | Ing. Jess Antonio Vilchis Jurez. 42

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

estadstica se han catalogado cuatro diferentes escalas de medida, pero para SPSS estas escalas se resumen en tres: Nomial: son variables numricas cuyos valores indican una categora de pertenencia, sin tener un orden dentro de sus categoras. Un ejemplo de variable nominal puede ser el gnero, la raza, el estado civil, etc. Ordinal: Son variables numricas cuyos valores indican una categora de pertenencia y poseen un orden lgico dentro de sus categoras. Un ejemplo de variable ordinal puede ser el nivel de ingresos, categora del vehculo, nivel educativo, etc. Escala: Son variables numricas cuyos valores representan una magnitud y no una categora. Un ejemplo de variable de escala puede ser la edad, aos estudiados, la distancia en metros, la altura, el sueldo, etc. Valores. Los valores o Etiquetas de valor nos permiten generar una leyenda que facilite la interpretacin de los valores de una variable, ya sea en los resultados o en la vista de datos. Debido a que se utilizan nmeros para representar cada categora es necesario crear una pequea leyenda que nos permita ver en letras la categora a la que corresponde cada nmero. Las etiquetas de valor no pueden exceder los 60 caracteres y se utilizan si: La variable es categrica, es decir Nominal u Ordinal. Se tienen valores perdidos por el usuario. Para ingresar se debe activar la celda correspondiente, hacer clic sobre el botn, con lo cual se abre la ventana Etiquetas de valor (figura 28), en esta ventana se encuentran tres celdas:

Figura 28. Ventana: Etiquetas de valor. 2009 | Ing. Jess Antonio Vilchis Jurez. 43

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

La primera corresponde al valor o nmero, en ella se deb digitar el nmero al se desea dar la etiqueta, la segunda celda es la etiqueta de valor, en ella se digita la categora a la que corresponde ese valor (mximo 60 caracteres) y la tercera celda corresponde a las etiquetas aadidas, es decir, las categoras que ya hemos ingresado. Si se desea cambiar una etiqueta que ya se haya aadido, la forma de hacerlo es seleccionndola en la celda (hacer clic sobre ella), editar ya sea el nmero o la etiqueta y dar cambiar. Si por el contrario se desea eliminarla se selecciona y se hace clic en eliminar.

rea del procesador.

Nos indica el estado del procesador, posee diversos estados de acuerdo del proceso que este realizando, es bastante til cuando se le pide un proceso al paquete y poseemos varios registros; en algunos casos la base es tan extensa que puede tardar bastante tiempo la ejecucin del resultado, en estos casos generalmente se tiende a pensar que el programa se bloque, antes de determinarlo es importante saber cul es el estado del procesador. Adems, cuando la licencia caduca, en esta rea se encuentra el mensaje: el procesador no est disponible.

OPCIONES DE LA BARRA DE MEN PRINCIPAL. A continuacin se explica la finalidad de las distintas opciones que aparecen en la barra de men del programa (parte superior de la pantalla). La mayora de las aplicaciones Windows presentan este tipo de mens desplegables, que facilitan la tarea con el programa. La opcin Archivo de la barra de men principal presenta las siguientes subopciones (figura 29): 2009 Nuevo. Abre nuevo archivo de datos, sintaxis, resultados o proceso. Abrir. Abrir archivo existente de datos, sintaxis, resultados o de proceso. Abrir base de datos. Crear, editar y ejecutar consultas a bases de datos. Leer datos de texto. Abrir archivos de texto. Guardar. Guardar el archivo actual. Guardar como. Guardar el archivo actual con otro nombre. Mostrar informacin de datos. Mostrar el archivo de datos posibles. Hacer cach de datos. Crear memoria para los datos que se introduzcan. Imprimir. Imprimir la tarea actual. Presentacin preliminar. Ver en pantalla completa la tarea actual. Cambiar servidor. Cambiar el servidor al que estamos conectados. | Ing. Jess Antonio Vilchis Jurez. 44

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Detener procesador. Interrumpir el procesamiento de SPSS.

Figura 29. Subopciones de la opcin Archivo. Datos usados recientemente. Ver los datos usados recientemente Archivos usados recientemente. Ver los archivos usados recientemente. Salir. Salir de SPSS.

La opcin Edicin de la barra de men principal presenta las siguientes subopciones (figura 30): Deshacer. Deshacer la ltima accin. Rehacer.Rehacer la ltima accin deshecha. Cortar. Cortar la seleccin para almacenarla en el portapapeles. Copiar. Copiar la seleccin para almacenarla en el portapapeles. Pegar. Pegar el contenido del portapapeles en la ubicacin actual del cursor.

2009

Ing. Jess Antonio Vilchis Jurez.

45

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Pegar variables. Pegar la variable del portapapeles en la ubicacin del cursor.

Figura 30. Subopciones de la opcin Edicin. Eliminar. Borrar la seleccin. Buscar. Buscar los datos que se especifiquen. Opciones. Opciones de tablas, grficos. Procesos, etc.

La opcin Ver de la barra de men principal presenta las siguientes subopciones (figura 31):

Figura 31. Subopciones de la opcin Ver. 2009 Barra de estado. Activa y desactiva la barra de estado. Barra de herramientas. Activa y desactiva la barra de herramientas. Fuentes. Permite cambiar estilos y tamaos para las fuentes. Cuadrcula. Activa y desactiva la cuadrcula del editor de datos. | Ing. Jess Antonio Vilchis Jurez. 46

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Etiquetas de valor. Permite situar etiquetas de valor en las variables.

La opcin Datos de la barra de men principal presenta las siguientes subopciones (figura 32):

Figura 32. Subopciones de la opcin Datos. Definir fechas. Permite la definicin de valores fecha. Ordenar casos. Permite ordenar casos segn criterios a definir. Transponer. Transpone filas por columnas en el editor. Fundir archivos. Permite mezclar archivos por casos o por variables. Agregar. Permite agregar variables a un archivo. Diseo ortogonal. Permite disear y mostrar diseos factoriales ortogonales. Segmentar archivo. Permite segmentar archivos segn ciertos criterios. Seleccionar casos. Permite elegir casos. Ponderar casos. Permite la ponderacin de casos.

La opcin Transformar de la barra de men principal presenta las siguientes subopciones (figura 33): 2009 Calcular. Realizar clculos. | Ing. Jess Antonio Vilchis Jurez. 47

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Recodificar. Recodificar los valores de una variable. Asignar rangos a casos. Ordenar a medida.

Figura 33. Subopciones de la opcin Transformar. Recodificacin automtica. Recodificacin rpida. Crear serie temporal. Crear una variable tipo serie de tiempo. Reemplazar valores perdidos. Reemplazar valores missing.

La opcin Analizar de la barra de men principal presenta las siguientes subopciones (figura 34): 2009 | Informes. Cubos OLAP, resmenes de casos e informes de estadsticos. Estadsticos descriptivos. Estadsticos, frecuencias y tablas de contingencia. Tablas personalizadas. Tablas de frecuencias y otros tipos de tablas. Comparar medias. ANOVA, prueba T, etc. Modelo lineal general. Modelos univariantes y multivariantes. Correlaciones. Correlaciones parciales, bivariadas y distancias. Regresin. Regresin lineal, no lineal, curvilnea, logstica, ordinal, Probit, etc. Loglineal. Modelos logartmicos lineales. Clasificar. Anlisis discriminante y de conglomerados. Reduccin de datos. Anlisis de correspondencias, factorial y escalamiento ptimo. Escalas. Escalamiento multidimensional y anlisis de la fiabilidad. Pruebas no paramtricas. Chi-cuadrado, binomial, rachas y K-S. Ing. Jess Antonio Vilchis Jurez. 48

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 34. Subopciones de la opcin Analizar. Series temporales. Modelos ARIMA, autorregresin, suavizado y descomposicin estacional. Supervivencia. Tablas de mortalidad, Kaplan-Meier y regresin de Cox. Respuesta mltiple. Definir conjuntos, frecuencias y tablas de contingencia.

La opcin Grficos de la barra de men principal (figura 35) presenta las clsicas subopciones de construccin de grficos de lneas, secuencias, barras, dispersin, reas, grficos de Pareto, grficos de control de procesos, grficos de dispersin, histogramas de frecuencias, grficos de normalidad, diagramas de caja y bigotes, curvas de correlacin, barras de error, grficos de series temporales, etc. La opcin Utilidades de la barra de men principal (figura 36) permite trabajar con variables, conjuntos, procesos, mens, etc. La opcin Ventana permite manejar ventanas (maximizar, minimizar, etc.). La opcin Ayuda (figura 37) presenta ayuda en lnea por temas, un asesor estadstico, una gua exhaustiva de sintaxis de SPSS y un tutorial. 2009 | Ing. Jess Antonio Vilchis Jurez. 49

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 35. Subopciones de la opcin Grficos.

Figura 36. Subopciones de la opcin Utilidades.

Figura 37. Subopciones de la opcin Ayuda. 2009 | Ing. Jess Antonio Vilchis Jurez. 50

ANLISIS ESTADSTICO CON SPSS AYUDA EN SPSS 15.0.

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Se puede conseguir ayuda desde cualquier ventana con el men de Ayuda (?) (figura 38). La opcin Temas del men de Ayuda (figura 39) abre la pestaa Contenido (figura 40) de la Ayuda. La pestaa Contenido est ordenada por temas, como un ndice de contenido. Pulse dos veces en los elementos que contengan un icono de libro para expandir o contraer el contenido (figura 41). Pulse en un elemento para acceder a ese tema de ayuda (figura 42). Todos los temas incluyen un cuadro de dilogo con una Demostracin del tema de ayuda (figura 43). Esta ventana tambin permite acceder directamente a un tutorial sobre ese tema.

Figura 38. Opcin Ayuda en la barra de men general de SPSS.

Figura 39. Opcin Temas del men de Ayuda.

Figura 40. Pestaa Contenido de la Ayuda. 2009 | Ing. Jess Antonio Vilchis Jurez. 51

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 41. Expansin de contenido de la ayuda.

Figura 42. Tema de ayuda.

Figura 43. Cuadro de dilogo del tema de ayuda.

2009

Ing. Jess Antonio Vilchis Jurez.

52

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Utilice la pestaa ndice para buscar por temas. La pestaa ndice est ordenada por orden alfabtico (figura 44), como el ndice de un libro. En la pestaa ndice se utiliza un mtodo incremental para realizar las bsquedas (figura 45). Escriba los caracteres que precise para encontrar el tema (figura 46). En la pestaa Buscar (figura 47) se pueden realizar bsquedas de texto en ndice. Para utilizar la bsqueda de texto debe seleccionar un tema de la base de datos con todas las palabras del sistema de ayuda. La bsqueda de texto en ndice slo se recomienda como ltimo recurso si no logra encontrar lo que busca con las pestaas ndice y Contenido.

Figura 44. Pestaa ndice de la ayuda en SPSS 15.0.

Figura 45. Bsqueda incremental en el ndice de la ayuda. La mayora de los cuadros de dilogo disponen de un botn de Ayuda que permite acceder directamente al tema de ayuda correspondiente (figura 48). El tema de ayuda ofrece informacin general sobre el cuadro de dilogo (figura 49). El botn Pantalla ofrece instrucciones paso a paso sobre el tema del cuadro de dilogo (figura 50). En la ventana de lado derecha del cuadro de dilogo, se encuentran Temas relacionados que proporciona enlaces a los 2009 | Ing. Jess Antonio Vilchis Jurez. 53

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

temas relacionados, incluyendo los relativos a cuadros de dilogo secundarios con funciones adicionales (figura 51).

Figura 46. Bsqueda de tema en el ndice de ayuda.

Figura 47. Pestaa Buscar y bsqueda de texto.

Figura 48. Botn de ayuda de un cuadro de dilogo. 2009 | Ing. Jess Antonio Vilchis Jurez. 54

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 49. Informacin sobre el cuadro de dilogo Definir propiedades de variables.

Figura 50. Cuadro de dilogo del botn Pantalla.

Figura 51. Enlaces a temas relacionados. 2009 | Ing. Jess Antonio Vilchis Jurez. 55

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

INTRODUCCIN A LA ESTADSTICA APLICADA

La estadstica nos ayuda a corroborar hiptesis dando un soporte matemtico a observaciones realizadas. La estadstica es la ciencia de la probabilidad y por ello no es correcto realizar afirmaciones categricas o negaciones rotundas, sino que estas afirmaciones o rechazos hay que enmarcarlos siempre en un nivel de significacin, que no es ms que encuadrarlo dentro de un margen de error que nosotros mismos nos estamos fijando (generalmente entre el 1-5%). Lo primero que debe considerarse al realizar un experimento que posteriormente llevar un tratamiento estadstico es: Plantear la hiptesis de trabajo que se quiere demostrar. Definir bien las variables a estudiar. Cmo recoger y recopilar los datos (TIPOS DE MUESTREO). 1. Eleccin del mtodo estadstico ms apropiado para demostrar la hiptesis de trabajo de la mejor manera posible. Es conveniente resaltar que el fin de los muestreos es extraer una muestra lo suficientemente representativa de una poblacin para que las conclusiones muestrales obtenidas puedan extrapolarse a nivel poblacional, de ah que sea de suma importancia la minuciosa eleccin y preparacin en la recoleccin de datos.

TIPOS DE MUESTREO Estratificado: Las muestras se toman por capas o estratos de condiciones homogneas. Es un muestreo muy utilizado en Ecologa. Estos muestreos sirven para confirmar algn tipo de distribucin. - Al azar. - Contagiosa. Regular (Sistemtico): Se basa en la obtencin al azar de una primera unidad a partir de la cual se seleccionan las siguientes mediante algn criterio fijo repetido peridicamente. Aleatorio simple: Se basa en la toma al azar y de manera independiente de una muestra. Es eficaz para zonas homogneas.

TIPOS DE VARIABLES VARIABLES CUANTITATIVAS Se trata de variables medibles (altura, peso,...). Pueden tomar valores enteros o con decimales. VARIABLES CUALITATIVAS Son variables de cualidad. Los datos que se toman son el nmero de individuos que presentan dicha cualidad (frecuencias de aparicin) y por tanto nmeros enteros. TRATAMIENTOS ESTADSTICOS TRATAMIENTOS ESTADSTICOS | Ing. Jess Antonio Vilchis Jurez. 56

2009

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

2 de Pearson: Se denominan test de bondad de ajuste, y buscan un modelo matemtico (terico) sobre una distribucin real.

2 de Pearson: En variables cualitativas se usa como un test de homogeneidad o de independencia. Se trata de un estudio de proporciones (probabilidades de t de Student: Se trata de un contraste encontrar una cualidad). para 1 o 2 muestras. Es un test en el que se comparan las medias muestrales (m1=m2) o bien si la muestra es representativa o no. ANOVA (Analisys of variance): En este test se contrastan ms de dos muestras (m1=m2=m3). Se aplica para estudios en los que se comparan medias. CORRELACIN / Regresin: Se aplican en estudios en los que se quieren relacionar variables, o bien para ajustar un comportamiento poblacional a un modelo matemtico con fines predictivos.

ESTUDIO DE HOMOGENEIDAD (DEPENDENCIA O INDEPENDENCIA)

INTRODUCCIN A LA HOMOGENEIDAD Ejemplo 1 Tomamos una muestra de una determinada especie vegetal en el cauce de un arroyo que, por su situacin, presenta una ladera en un sitio A y otra en otro sitio B. Los resultados sobre 100 observaciones realizadas aparecen resumidos en la tabla de frecuencias observadas. Existe alguna preferencia de la especie por alguna de las dos situaciones?. Observadas Presencia (+) Ausencia (-) Totales Sitio A 20 (a) 20 (c) 40 (TA) Sitio B 10 (b) 50 (d) 60 (TB) Totales 30 (T+) 70 (T-) N = 100

El estudio se realiza basndose en una variable cualitativa, ya que se est estudiando la cualidad de presencia en el sitio A o en el sitio B, y la muestra no es ms que un recuento de individuos que presentan la variable a estudiar. 2009 | Ing. Jess Antonio Vilchis Jurez. 57

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Por tanto, lo que se pretende estudiar es si esta especie se distribuye de forma homognea tanto en A como en B, o lo que es lo mismo si su presencia es independiente de la ladera del cauce del arroyo en la que estemos. Para este tipo de estudios se usa el test 2 de Pearson, aunque no hay que confundir esta aplicacin con la bondad de ajuste que se usa en variables cuantitativas.
1.

Lo primero que hay que realizar es una tabla de frecuencias esperadas a partir de la tabla de frecuencias observadas. Esta tabla es necesaria si queremos utilizar la frmula general del estadstico 2 de Pearson, aunque no se usa para el test si utilizamos la frmula simplificada para tablas de contingencia de 2x2 (ver la tabla siguiente). La tabla de frecuencias esperadas nos ayuda a saber como sera la presencia terica y ver si existe una gran diferencia con lo observado. Observadas Presencia (+) Ausencia (-) Totales Sitio A 12 28 40 Sitio B 18 42 60 Totales 30 70 N = 100

2.

En segundo lugar, se deben plantear las hiptesis de trabajo que queramos corroborar con el estudio. H0 = homogeneidad o independencia. (dependiendo de los casos). H1 = dependencia o no homogeneidad.

3.

En tercer lugar, se debe obtener el 2 cal. usando los datos de la tabla de contingencia de las frecuencias observadas mediante la siguiente frmula (nicamente vlida para tablas de contingencia de 2x2 g.l. = ( filas 1) (columnas 1) ):

4.

Por ltimo, se debe comparar el estadstico 2 cal. con el 2 terico para los niveles de significacin escogidos, generalmente =0.01 y =0.05.

Como criterio de decisin: 2009 | Ing. Jess Antonio Vilchis Jurez. 58

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

2. Si 2cal. < 2 terico entonces se acepta H0. Esto significa que existe homogeneidad o independencia para la cualidad estudiada. 0.05 0.01 2 terico 3.84 6.63

En este caso concreto: 2cal. > 2 terico con lo que se rechaza H0 para ambos niveles de significacin. Esto quiere decir que existe una dependencia significativa en la distribucin de la especie vegetal entre el sitio A y el sitio B.

Ejemplo 2 Se hizo un tratamiento para eliminar la procesionaria en un pinar, y tras este tratamiento se quiere comprobar cmo de efectivo es dicho tratamiento. Tras un muestreo en el que se anotaron los pinos enfermos y los sanos dentro de los tratados y de los no tratados se obtuvieron los siguientes resultados: Observadas Tratados No tratados Totales Esperadas Tratados No tratados Totales Enfermos 40 (a) 52 (c) 92 Enfermos 46 46 92 Sanos 110 (b) 98 (d) 208 Sanos 104 104 208 Totales 150 150 N = 300 Totales 150 150 N = 300

H0 = La respuesta de los pinos ante la enfermedad es independiente al tratamiento.

0.05 0.01

2 terico 3.84 6.63

En este caso concreto 2cal. < 2 terico con lo que se acepta H0 para ambos niveles de significacin. Esto quiere decir que el tratamiento no es significativamente eficaz. 2009 | Ing. Jess Antonio Vilchis Jurez. 59

ANLISIS ESTADSTICO CON SPSS Ejemplo 3

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

El rendimiento de una cosecha de cereal se considera bueno si es superior a 15 kg por rea de cultivo y malo si no llega a dicha cantidad. Se hacen 20 determinaciones en parcelas donde se ha sembrado cereales de tipo A y 18 determinaciones en parcelas con cereales tipo B. Son igualmente efectivos para el cultivo los cereales A y B?. Observadas Bueno Malo Totales Esperadas Bueno Malo Totales Cereal A 14 (a) 6 (c) 20 Cereal A 12.63 7.37 20 Cereal B 10 (b) 8 (d) 18 Cereal B 11.37 6.63 18 Totales 24 14 N = 38 Totales 24 14 N = 38

H0 = Los cereales A y B tienen un rendimiento homogneo. H1 = El rendimiento no es homogneo. 2cal. = 0.85 2cal. << 2 terico para ambos niveles de significacin, por lo que podemos aceptar H0 y afirmar que el rendimiento de ambos cereales es significativamente homogneo y, por tanto, igual de efectivo.

CONTRASTE PARA IGUALDAD DE MEDIAS (DATOS CUANTITATIVOS)

INTRODUCCIN A LA IGUALDAD DE MEDIAS El mtodo ms tradicional para comparar dos medias es el Test de la t. Este estadstico sigue la distribucin de la t de Student. El anlisis de la varianza (ANOVA) puede emplearse tambin para analizar las diferencias entre las medias de dos grupos, sin embargo, es un mtodo ms general que permite las comparaciones entre las medias de ms de dos grupos.

TEST DE LA t DE STUDENT. H0 = 1 =2. Las medias poblacionales son iguales. Si tcal < tterico entonces se acepta H0.

2009

Ing. Jess Antonio Vilchis Jurez.

60

ANLISIS ESTADSTICO CON SPSS Ejemplo 1

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Una especie vegetal que aparece en Jiquipilco y Jocotitln aparenta crecer de manera distinta en ambas ubicaciones. Para ello tomamos muestras de la altura de dicha planta en centmetros. Los resultados obtenidos para Jiquipilco y Jocotitln aparecen en la tabla siguiente. Altura en Jiquipilco (cm) 39 36 35 37 40 39 40 38 35 39 Altura en Jocotitln (cm) 43 45 42 35 37 38 33 38 41 43
1.

Calcular las medias (m) y las cuasivarianzas (S2) de ambos grupos separados por la variable ambiental.

Jocotitln: Jiquipilco:
2.

m1 = 39.5 m2 = 37.8

s21 = 13.65

S21 = 15.16 S22 = 3.73

Comprobar que las varianzas poblacionales (2) son iguales. Esta comprobacin se realiza mediante el test F de Fisher-Snedecor. H0 = 21 = 22. Las varianzas poblacionales son iguales.

Si Fobs < Fterico entonces se acepta H0. En nuestro caso Fobs = 4.06 < Fterico (para = 0.01) = 5.06, por lo que se acepta H0 y las varianzas poblacionales son significativamente iguales.
3.

Calcular el valor de tcal. En este punto, dependiendo de si las varianzas poblacionales son iguales o no, y de si el tamao muestral (n1+n2) es grande (>30) o pequeo, se aplican diferentes frmulas para realizar el Test de t. a. (n1+n2) > 30

En este caso no es necesario comprobar si 21 = 22 ya que aunque 21 22 se utiliza la misma frmula como solucin aproximada. b. (n1+n2) < 30 2 1 = 22 2009 | Ing. Jess Antonio Vilchis Jurez. 61

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Si n1 = n2 entonces

Si n1 n2 entonces

siendo n1 + n2 2 = grados de libertad. En este caso, el tamao muestral es < 30 , las varianzas poblacionales son iguales y n1 = n2 luego:

4.

Comparar tcal con tterico para los niveles de significacin designados y comprobar si las medias poblacionales () son iguales (aceptacin de H0).

g.l.

tterico

0.01 18 0.05

2.878

2.101

En este caso, tcal = 1.24 es menor que tterico para ambos niveles de significacin, por lo que se puede aceptar H0 y decir que estadsticamente la especie vegetal parece crecer de igual forma en Jocotitln y en Jiquipilco.

2009

Ing. Jess Antonio Vilchis Jurez.

62

ANLISIS ESTADSTICO CON SPSS Ejemplo 2

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Un laboratorio de antropologa fsica realiz un estudio sobre nutricin sometiendo a estudio dos dietas diferentes indicadas para el sobrepeso. As se tomaron datos sobre la reduccin de peso en individuos que siguieron la dieta A, y en individuos que siguieron la dieta B. A partir de los datos obtenidos se pretende comprobar si ambas dietas son significativamente iguales en su efectividad o no. Dieta Ind. Muestreados (n) 25 25 Media de prdida de peso 4.3 3.6 Varianza muestral (s2) 1.96 1.21 Cuasivarianza (S2) 2.04 1.26

A B

H0 = A = B . La media en la prdida de peso en las poblaciones que siguieron las distintas dietas es la misma.
1.

Comprobar que las varianzas poblacionales son iguales. Esto se hace con el test F de Fisher-Snedecor. H0 = 21 = 22. Las varianzas poblacionales son iguales.

Si Fobs < Fterico entonces se acepta H0.

que es menor que Fterico = 2.27 Se cumple que las varianzas poblacionales son significativamente iguales.
2.

Calcular el valor de tcal. En este caso (n1+n2 ) > 30

g.l.

0.01 0.05

tterico 2.57 1.64

48

2009

Ing. Jess Antonio Vilchis Jurez.

63

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

No se cumple H0 para ambos niveles de significacin, por lo que no se puede deducir si la diferencia en las dietas es significativa o no. Este tipo de solucin suele darse cuando los datos no estn bien tomados o son insuficientes. Por tanto lo ms lgico sera repetir las mediciones, y si estas volvieran a salir iguales, entonces habra que aumentar el tamao de muestra (generalmente al doble) y volver a tratar los datos estadsticamente.

ANLISIS DE LA VARIANZA (ANOVA).

Este test sirve para comparar las medias de ms de dos muestras. Se usa para clasificar muestras en funcin de una variable cuantitativa (altura, peso, ...). Para poder realizar este test han de cumplirse varias premisas:
1.

Las muestras deben ser recogidas al azar y provenir de poblaciones con distribucin normal. Las varianzas poblacionales han de ser homogneas (iguales). Esto se comprueba mediante el test de la Fmxima que no tiene nada que ver con el estadstico F de Fisher-Snedecor. H0 = 21 = 22 = 23 = .... = 2n

2.

Si Fmx < Fcrtica entonces se cumple H0 para los dados. El test ANOVA se realiza mediante la F de Fisher-Snedecor, y la hiptesis nula que se contrasta es que las muestras procedan de la misma poblacin, por lo que las medias poblacionales extradas de dichas muestras han de ser iguales. H0 = 1 = 2 = 3 = .. .= n H1 = alguna de las medias poblacionales es distinta. 3. Si Fcal < Fterico, entonces se acepta H0 para los niveles de significacin () dados.

EJEMPLO 1 Se tomaron muestras en tres regiones de una provincia sobre la altura que alcanzaban los ejemplares de una especie determinada de planta, en zonas abandonadas y no abandonadas por el pastoreo de cabras y ovejas. Se 2009 | Ing. Jess Antonio Vilchis Jurez. 64

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

pretende determinar si el comportamiento es el mismo. Los resultados del muestreo aparecen reflejados en la tabla siguiente: Regin I II III Ind. muestreados (ni) 104 102 69 Altura media en metros (mi) 4.99 4.63 4.53 Cuasivarianza (S2) 4.19 5.75 5.15

a) Plantear las hiptesis de contraste. Para este caso concreto seran H0 = Las plantas de las tres regiones se comportan de igual forma, por lo que sus medias poblacionales son iguales. H0 = 1 = 2 = 3 b) Comprobar si (homogneas). H0 = 21 = 22 = 23 las varianzas poblacionales son iguales

Si Fmx < Fcrtica entonces se cumple H0 para los dados. (p) 0.05 0.01 Fmx crtica 6.6 9.9

Como Fmx = 1.37 < Fmx crtica para ambos niveles de significacin, entonces se acepta la hiptesis nula. En el caso de que las varianzas poblacionales no fueran iguales, se podra continuar realizando el contraste ANOVA aunque aclarando que el contraste no va a ser significativo por no cumplirse la segunda premisa. c) Rellenar las tablas resumen con el fn de poder calcular Fcal. En este apartado, dependiendo de cmo se den los datos en el problema, hay que completar 1 o 2 tablas. Si no se dan las medias ya calculadas hay que rellenar dos tablas. GRUPOS I II III xi i x2i s2i ni

2009

Ing. Jess Antonio Vilchis Jurez.

65

ANLISIS ESTADSTICO CON SPSS TOTALES =

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

2 2 = Con los resultados de esta tabla se completa el cuadro siguiente. Suma de cuadrados Grados de libertad N de grupos - 1 N indTot N grupos Cuadrado medio = .

Fuente de variacin ENTRE GRUPOS DENTRO GRUPOS

Fcal.

2 ( ) =

A = ( 2 )
**

. = = .

B (**). Si usamos cuasivarianza muestral (S2) en la frmula habra que poner (ni 1). Siendo:

En el caso concreto de este problema, s nos dan calculadas las medias, por lo que slo es necesario rellenar el Cuadro 2.

( ni 1) S2i = 103 4.19 +101 5.75 + 68 5.15 = 1403.32


Fuente de variacin ENTRE GRUPOS DENTRO GRUPOS Suma de cuadrados 275 X 0.039 = 10.776 A 1403.32 B Cuadro 2. Grados de Cuadrado medio libertad 31=2 275 3 = 272 = 1403.32 272 = 5.16 = 10.776 2=5.39 Fcal.

. = 2.088

d) Comparar Fcal con Fterica y ver si se cumple la hiptesis nula. (p) 0.05 2009 | Fterica 2.99 66

Ing. Jess Antonio Vilchis Jurez.

ANLISIS ESTADSTICO CON SPSS 0.01

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

4.60

Fcal < Fterica por lo que se cumple H0, y las medias poblacionales son significativamente iguales.

EJEMPLO 2 Se sospecha que las aguas de un lago estn contaminadas por los compuestos fosforados procedentes de una industria. Para tratar de verificar esta sospecha, se midieron los niveles de fsforo en distintos puntos del lago, obtenindose los siguientes valores: Lago 1: 7.1 8.5 6.2 7.3 7.9

Despus, se midieron los niveles de fsforo en otros tres lagos, que no estaban contaminados, obtenindose: Lago 2: Lago 3: Lago 4: 7.2 5.6 7.2 6.5 7.1 6.6 5.9 6.3 6.3 7.8 6.7 7.4

6.5

Los valores obtenidos en lago bajo se sospecha que parecen ser algo superiores a los obtenidos en los otros tres. Es suficientemente importante esta diferencia como para poder concluir que el nivel de fsforo en el lago 1 es diferente que el que tienen los dems, y por tanto est contaminado? GRUPOS Lago 1 Lago 2 Lago 3 Lago 4 TOTALES xi 37 27.4 32.2 27.5 124.1 i 7.4 6.85 6.44 6.875 = 6.894 x2i 276.8 189.74 208.6 189.85 864.99 s2i 0.60 0.5125 0.2464 0.1969 2 = 0.522 ni 5 4 5 4 18

3.

Comprobar si las varianzas poblacionales son iguales (homogneas). H0 = 21 = 22 = 23 = 24

Como Fmx < Fcrtica entonces se cumple H0 para los dados. (p) 0.05 0.01 2009 | Fmx crtica 6.6 9.9 67

Ing. Jess Antonio Vilchis Jurez.

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Fuente de variacin ENTRE GRUPOS DENTRO GRUPOS

Suma de cuadrados 0.1295 X 18 = 2.332 A 7.0696 B

Grados de libertad 41=3 18 4 = 14

Cuadrado medio

Fcal.

= 0.7773 = 0.5050

. = 1.539

(p) 0.05 0.01

Fterica 3.344 5.564

Fcal < Fterica por lo que se cumple H0, y las medias poblacionales son significativamente iguales para los niveles de significacin dados, es decir, no hay suficiente evidencia estadstica para concluir que el primer lago tiene un nivel de contaminacin diferente al que tienen el resto.

CORRELACIN / REGRESIN.

INTRODUCCIN A LA CORRELACIN / REGRESIN La correlacin, como su nombre indica, es una medida del grado de relacin (lineal) entre dos variables. La regresin es un modelo estadstico que sirve para predecir un comportamiento real de una poblacin mediante un modelo matemtico (ecuacin). Antes de fabricar un modelo matemtico, es necesario saber si existe una correlacin entre variables, ya que si son incorreladas no tiene mucho sentido tratar de ajustar su relacin mediante una recta o una curva.

2009

Ing. Jess Antonio Vilchis Jurez.

68

ANLISIS ESTADSTICO CON SPSS EJEMPLO 1

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Se ha medido la superficie en (dm)2 ocupada por Poa bulbosa (x) y especies anuales (y) en 5 cuadros de muestreo de 10 (dm)2 para comprobar si se asocian o no. Los resultados obtenidos aparecen en la siguiente tabla: N Poa bulbosa (x) N plantas anuales (y) 9 1 2 7 2 8 1 10 6 4

1.

Calcular el coeficiente de correlacin (r).

N de cuadro 1 2 3 4 5 Total

Tabla 1. Resumen de valores de ambas variables. xi yi xy x2 9 2 2 1 6 20 1 7 8 10 4 30 9 14 16 10 24 73 81 4 4 1 36 126

y2 1 49 64 100 16 230

H0 = no hay correlacin a nivel poblacional entre las dos variables (variables incorreladas). = 0. H1 = existe correlacin entre las variables ( 0). 2009 | Ing. Jess Antonio Vilchis Jurez. 69

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Se acepta H0 si rcal< rterico (rterico realmente una tterica de Student). 0.05 0.01 rterica 0.878 0.959

Se rechaza H0 y, por tanto, existe suficiente evidencia estadstica de que existe correlacin entre variables y de que dicha correlacin es negativa.
2.

Ajustar las variables a una regresin. Aunque las regresiones pueden ser lineales (y = Bx + A), logartmicas, etc...., en este tipo de aplicaciones la regresin a la que se ajustan las variables correlacionadas es una recta. Se pueden obtener dos rectas diferentes segn se tome a la variable x o a la variable y como independiente. Recta de y sobre x (y/x):

Recta de x sobre y (x/y):

En este caso, vamos a calcular la recta ( y/x) utilizando los datos que aparecen reflejados en la tabla 1: 6 = 9.4 9.2

( 4), y despejando queda: = 1.02 + 10.08

Estime el nmero de plantas anuales que apareceran si encontrramos 5 individuos de Poa bulbosa. = 1.02 5 + 10.08 = 4.98 5 plantas anuales.

Estime el nmero de plantas anuales que apareceran si encontrramos 2 individuos de Poa bulbosa. OJO!!!, Esta pregunta tiene trampa, ya que podemos pensar que la respuesta puede obtenerse del cuadro de datos que nos dan como enunciado, y no es as. La respuesta ha de hallarse sustituyendo en la recta de regresin obtenida. = 1.02 2 + 10.08 = 8.04 8

3.

Calcular la absorcin de la varianza. Al error absoluto que se est cometiendo en el muestreo se le denomina coeficiente de determinacin(r2), que no es ms que la cantidad de varianza entre los dos grupos. La absorcin de la varianza es el coeficiente de determinacin expresado en tanto por ciento (%). | Ing. Jess Antonio Vilchis Jurez. 70

2009

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

2 = (. )2 = (0.98)2 = 0.96 96%


4.

Representar grficamente si fuera necesario. Sustituyendo valores en las rectas de regresin, pueden representarse ambas rectas. Si se representan ambas rectas sobre la misma grfica, se puede tener una idea visual del grado de correlacin entre las variables. Dicho grado viene determinado por el ngulo () que se forma entre las dos rectas, de modo que cuanto menor sea el ngulo, mayor ser la correlacin entre variables.

TIPOS DE DISTRIBUCIN ESPACIAL.

INTRODUCCIN A LA DISTRIBUCIN ESPACIAL La distribucin espacial puede ser estudiada a muchas escalas, desde la escala global o planetaria, a la local. Existen tres tipos posibles de patrones de distribucin espacial (Pattern): 4. Distribucin aleatoria. Los organismos se distribuyen al azar, y por tanto, la presencia de un individuo no aumenta ni disminuye la probabilidad de encontrar otro. Este patrn se ajusta a distribuciones como Binomial, Poisson y Normal.

2009

Ing. Jess Antonio Vilchis Jurez.

71

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

5. Distribucin contagiosa. Los organismos se distribuyen de tal forma que la presencia de un individuo aumenta la probabilidad de encontrar otro. Este tipo de distribucin es la ms corriente en la naturaleza, y puede estar propiciada por diversas causas: Morfolgicas, Ambientales, etc. 6. Distribucin regular. Los organismos se distribuyen de tal forma que la presencia de un individuo disminuye la probabilidad de encontrar otro. Con este tipo de estudio se pretende comprobar la distribucin que sigue una determinada poblacin problema. La distribucin puede observarse a diferentes escalas, y en ocasiones el tipo de distribucin cambia dependiendo de la escala escogida. En este tipo de estudios se trabaja con una nica variable. Para comprobar qu tipo de distribucin sigue la poblacin sometida a estudio, es necesario calcular el ndice de dispersin (I.D.). Lo que realmente se pretende observar con el ndice de dispersin es cmo estn relacionados los individuos y cul es su nivel de concentracin.

Adems de calcular el I.D. debemos comprobarlo estadsticamente mediante una t de Student, donde:

H0 = No hay evidencia estadstica de que la distribucin sea tal y como indica el ndice de dispersin. Se cumple H0 si tcal > tterica En caso de no existir suficientes evidencias estadsticas para aceptar que la distribucin sea contagiosa o regular, es conveniente comprobar si es aleatoria (aunque el I.D. no lo indicara) y a qu distribucin pertenece (binomial, Poisson, o Normal).
1.

Si la muestra es grande o la variable es continua (altura) hay que ajustar a una distribucin Normal.
2.

Si la muestra es pequea o la variable es discreta (nmeros enteros), hay que ajustar a una Binomial, o a una Poisson.

2009

Ing. Jess Antonio Vilchis Jurez.

72

ANLISIS ESTADSTICO CON SPSS EJEMPLO 1

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

En el cuadro siguiente se ha anotado la cobertura de una especie vegetal muestreada en un transecto, agrupndose las coberturas en diferentes clases. Comprobar qu distribucin espacial sigue la citada especie. CLASES (grupos) 0 1 2 3 Frec. Observadas (oi) 8 12 3 3 ** Probabilidades de clase (p) 0.223 0.335 0.251 0.125 Frec. Esperadas (ei)=p x N 5.98 8.71 6.526 3.25 N = 26 ** Las probabilidades de clase son valores tomados de las tablas de la distribucin escogida. En este caso estn sacados de una distribucin de Poisson con = 1.5 y = 0, 1, 2, 3. Si las frecuencias esperadas (ei) se parecen a las frecuencias observadas (oi) entonces intuitivamente se cumplir la distribucin de la que se han obtenido los valores de p. Para comprobar de forma estadstica lo que intuitivamente podemos aventurar observando el cuadro, se usa un Test de Bondad de Ajuste mediante un estimador que es 2 de Pearson. H0 = La distribucin se ajusta a la distribucin esperada. Se cumple H0 si 2cal < 2terica para los niveles de significacin dados.

Los grados de libertad (g.l.) para las distribuciones de Poisson y Binomial son de k-2, y para una distribucin Normal son k-3, siendo k = n de grupos. g.l. 0.01 2 0.05 5.99 2terico 9.21

Como 2cal < 2terico para ambos niveles de significacin, se acepta la H0, lo que implica que existe suficiente evidencia estadstica para decir que la distribucin de la muestra se ajusta a la distribucin esperada, en este caso una distribucin de Poisson.

2009

Ing. Jess Antonio Vilchis Jurez.

73

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

CONSTRUCCIN Y ANLISIS UNIVARIANTE DE DATOS TIPOS DE ANLISIS DE DATOS (UNI BI- MULTIVARIANTE) Los anlisis de datos pueden ser: 1. 2. 3. Univariantes, si afecta a una sola variable Bivariantes, si afecta a un par de variables Multivariantes, si afecta a un grupo de variables

TABLA DE DISTRIBUCIN DE FRECUENCIAS Una tabla de distribucin de frecuencias es una representacin organizada de los datos, que permite organizar dichos datos de manera que sirvan para apoyar la toma de decisiones.

PASOS PARA LA CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS Para describir el procedimiento de construccin de la tabla de distribucin de frecuencias, tomemos el siguiente ejemplo. A continuacin, se presenta un fichero de datos que representa las edades de 30 alumnos de una clase de spinning. Vamos a construir la tabla de distribucin de frecuencias para estos 30 alumnos. Tabla 1 Tabla de Distribucin de Frecuencias 26 29 32 41 28 31 45 40 30 31 40 37 33 28 39 38 33 35 31 36 37

32 45 30

38 35 41

36 30 32

Se va construir una tabla de distribucin de frecuencias siguiendo los siguientes pasos: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 2009 Clculo del rango Designacin del nmero de clases Clculo de la amplitud Clculo de los lmites de clase Clculo de los lmites reales de clase Encontrando la marca de clase Contabilizacin y Frecuencia Absoluta Frecuencia Relativa Frecuencias Absolutas y Relativas Acumuladas Histograma y Polgono de Frecuencias | Ing. Jess Antonio Vilchis Jurez. 74

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Clculo del Rango de una Variable El rango es la diferencia entre el valor de mayor magnitud y el de menor magnitud. Del fichero de datos en bruto, se busca el valor de mayor magnitud (abreviado, VM) y el de menor magnitud (abreviado, Vm). Con ellos se calcula el rango, con arreglo a la siguiente frmula: Rango = VM Vm Del conjunto de datos en bruto, se busca el valor de mayor magnitud (VM) y el de menor magnitud (Vm). Con ellos se calcula el rango, con arreglo a la frmula: Rango = VM -Vm = 45 - 26 = 19

Designacin del Nmero de Clases Una vez calculado el rango, se designa el nmero de clases de la tabla de distribucin, de acuerdo con el siguiente mtodo: Mtodo de Designacin del Nmero de Clases n: nmero de casos de la K: nmero de intervalos o de clases muestra recomendables para la tabla de distribucin n < 50 5a7 50 n < 100 6 a 10 100 n <250 7 a 12 n 250 10 a 20 Una vez calculado el rango, se designa el nmero de clases, a travs del mtodo siguiente: donde: n: nmero de casos de la muestra K: nmero de intervalos o de clases recomendables para la tabla de distribucin. Utilizando este mtodo, podremos observar que n = 30 es menor que 50 y se nos recomienda, de acuerdo a la tabla, que tomemos de 5 a 7 clases, por lo tanto K = 5 sera una buena asignacin.

2009

Ing. Jess Antonio Vilchis Jurez.

75

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Clculo de la Amplitud del Intervalo La amplitud se calcula redondeando el cociente del rango entre el nmero de clases (R/K) a la unidad ms pequea (u) inmediata superior en la que se encuentran los datos brutos. Frmula para el Clculo de la Amplitud Amplitud = R/K donde R es el rango y K el nmero de clases. Como los datos de nuestro ejemplo estn en enteros, la unidad ms pequea es un entero u = 1, de tal manera que la amplitud ser la siguiente: R/K = 19/5 = 3.8 Este valor, al redondearlo al entero inmediato superior, ser igual a 4. Es decir, respuesta: Amplitud : A = 4.

Clculo de los Lmites de Clase Lmites de la Primera Clase Para construir los lmites de clase (lmite inferior Li y lmite superior Ls), se coloca como lmite inferior de la primera clase al valor ms pequeo de los datos brutos, 26 para nuestro ejemplo, y cuatro enteros (puesto que la unidad ms pequea es un entero) ms adelante, incluyendo el 26, tendremos el lmite superior de la primera clase, 26 + 3 = 29 ( se suman solo tres enteros porque el 26 ya est incluido). Clase 1 Lmite inferior y Superior (Li Ls) Amplitud (Intervalos de clase) 26 - 29 4 Lmites de la Primera Clase Valores 26, 27, 28, 29

Lmites de la Segunda Clase Para calcular el lmite inferior de la segunda clase, hay que agregarle un entero al lmite superior de la primera clase, esto es 29 + 1 = 30 (Li=30). El lmite superior es 4 enteros ms adelante, incluyendo al 30; esto es 29 + 4 = 33 (Ls=33). Clase 2 2009 | Lmite Inferior y Superior (Li Ls) Amplitud (Intervalos de clase) 30 - 33 4 Lmites de la Segunda Clase Ing. Jess Antonio Vilchis Jurez. Valores 30, 31, 32 y 33 76

ANLISIS ESTADSTICO CON SPSS Lmites de la Tercera Clase

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Para calcular el lmite inferior de la tercera clase, hay que agregarle un entero al lmite superior de la segunda clase, esto es 33 + 1 = 34 (Li=34). El lmite superior es 4 enteros adelante, incluyendo al 34; esto es, 33 + 4 = 37 (Ls=37). Clase 3 Lmite Inferior y Superior (Li Ls) Amplitud (Intervalos de clase) 34 - 37 4 Lmites de la Tercera Clase Valores 34, 35, 36 y 37

Lmites de la Cuarta Clase Para calcular el lmite inferior de la cuarta clase, hay que agregarle un entero al lmite superior de la tercera clase, esto es 33 + 1 = 34. El lmite superior es 4 enteros adelante, incluyendo al 34, esto es 29 + 4 = 33. Clase 4 Lmite Inferior y Superior (Li Ls) Amplitud (Intervalos de clase) 38 - 41 4 Lmites de la Cuarta Clase Valores 38, 39, 40 y 41

Lmites de la Quinta Clase Para calcular el lmite inferior de la quinta clase, hay que agregarle un entero al lmite superior de la cuarta clase, esto es 33 + 1 = 34. El lmite superior es 4 enteros adelante, incluyendo al 34, esto es 29 + 4 = 33. Clase 5 Lmite Inferior y Superior (Li Ls) Amplitud (Intervalos de clase) 42 - 45 4 Lmites de la Quinta Clase Valores 42, 43, 44 y 45

Lmites de Todas las Clases Clase 1 2 3 4 5 Li - Ls Amplitud (A) Valores incluidos en este rango 26 29 4 26, 27, 28, 29 30 33 4 30, 31, 32 y 33 34 37 4 34, 35, 36 y 37 38 41 4 38, 39, 40 y 41 42 - 45 4 42, 43, 44 y 45 Lmites de Todas las Clases

Para calcular el lmite inferior de la segunda clase, hay que agregarle un entero al lmite superior de la primera clase, esto es 29 + 1 = 30. El lmite superior es 4 2009 | Ing. Jess Antonio Vilchis Jurez. 77

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

enteros adelante, incluyendo al 30, esto es 29 + 4 = 33. Este proceso se repite iterativamente hasta completar la clase nmero 5. Clases 1 2 3 4 5 Li - Ls 26 29 30 33 34 37 38 41 42 - 45 Clculo de los Lmites de Clase Amplitud (A) 4 (26, 27, 28, 29) 4 (30, 31, 32 y 33) 4 (34, 35, 36 y 37) 4 (38, 39, 40 y 41) 4 (42, 43, 44 y 45)

Clculo de los Lmites Reales de Clase Enseguida, se calculan los lmites reales de clase, llamados tambin fronteras de clase. Estos se calculan a partir de los lmites de clase, restndole media unidad (u/2) a los lmites inferiores de clase y sumndole la misma cantidad a los lmites superiores. u/2 = 1/2 = 0.5. Clases 1 2 3 4 5 Li - Ls Lri Lrs 26 29 25.5 29.5 30 33 29.5 33.5 34 37 33.5 37.5 38 41 37.5 42.5 42 - 45 41.5 45.5 Clculo de los Lmites Reales de Clase

Clculo de la Marca de Clase o Punto Medio del Intervalo Para calcular la marca de clase o punto medio del intervalo de la tabla, vamos a promediar, para cada clase, el lmite inferior y superior de clase o en su defecto los lmites reales. Para la primera clase, la marca de clase o punto medio del intervalo ser: X1 = (26 + 29)/2 = (25.5 + 29.5)/2 = 27.5. Para la segunda clase, se procede de la misma forma o simplemente se le suma la amplitud a la primera marca de clase: X2 = X1 + 4 = 27.5 + 4 = 31.5 Para la tercera clase, se procede de la misma forma o simplemente se le suma la amplitud a la segunda marca de clase: X3 = X2 + 4 = 31.5 + 4 = 35.5

2009

Ing. Jess Antonio Vilchis Jurez.

78

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Para la cuarta clase, se procede de la misma forma o simplemente se le suma la amplitud a la tercera marca de clase: X4 = X3 + 4 = 35.5 + 4 = 39.5 Para la quinta clase, se procede de la misma forma o simplemente se le suma la amplitud a la cuarta marca de clase: X5 = X4 + 4 = 39.5 + 4 = 43.5 Clases Li - Ls Lri Lrs Xi 1 26 29 25.5 29.5 27.5 2 30 33 29.5 33.5 31.5 3 34 37 33.5 37.5 35.5 4 38 41 37.5 42.5 39.5 5 42 - 45 41.5 45.5 43.5 Clculo de la Marca de Clase o Punto Medio del Intervalo

Clculo de los Lmites Reales de Clase Enseguida, se calculan los lmites reales de clase, llamados tambin fronteras de clase. Los lmites reales de clase se calculan a partir de los lmites de clase, restndole media unidad (es decir, u/2 = 0,5) a los lmites inferiores de clase (Lis u/2) y sumndole la misma cantidad a los lmites superiores (Lss + u/2) Clases 1 2 3 4 5 Li - Ls Lri Lrs 26 29 25.5 29.5 30 33 29.5 33.5 34 37 33.5 37.5 38 41 37.5 42.5 42 - 45 41.5 45.5 Clculo de los Lmites Reales de Clase

Clculo de la Marca de Clase o Punto Medio del Intervalo Para calcular la marca de clase o punto medio del intervalo de la tabla, vamos a promediar, para cada clase, el lmite inferior y superior de clase o en su defecto los lmites reales. Para la clase uno, X1 = (26 + 29)/2 = (25.5 + 29.5)/2 = 27.5. Para las siguientes clases, se procede de la misma forma o simplemente se le suma la amplitud a la marca de clase anterior, por ejemplo, X2 = X1 + 4 = 27.5 + 4 = 31.5, y as sucesivamente.

2009

Ing. Jess Antonio Vilchis Jurez.

79

ANLISIS ESTADSTICO CON SPSS Clases

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Intervalo de Intervalo real de Marca de clase, clases, Li - Ls clase, Lri Lrs Xi 1 26 29 25.5 29.5 27.5 2 30 33 29.5 33.5 31.5 3 34 37 33.5 37.5 35.5 4 38 41 37.5 42.5 39.5 5 42 - 45 41.5 45.5 43.5 Clculo de la Marca de Clase o Punto Medio del Intervalo

Clculo de los Recuentos y Frecuencia Absoluta El recuento es la asignacin de cada dato en la clase que le corresponde. La frecuencia absoluta es el nmero de datos que se encuentran ubicados en cada clase. Para nuestro ejemplo, tenemos: Tabla de Datos Brutos 29 32 41 28 31 30 31 40 37 33 38 33 35 31 36

32 45 30 Clases 1 2 3 4 5

38 35 41

26 40 39

45 28 37

36 30 32 Fi 4 11 6 7 2

Li - Ls Lri Lrs Xi 26 29 25.5 29.5 27.5 30 33 29.5 33.5 31.5 34 37 33.5 37.5 35.5 38 41 37.5 42.5 39.5 42 - 45 41.5 45.5 43.5 Tabla de Frecuencias Absolutas

Clculo de la Frecuencia Relativa La frecuencia relativa es la proporcin de los datos que se encuentran en cada clase. Se calcula dividiendo la frecuencia absoluta entre el total de los datos y se puede expresar como una fraccin o en forma de porcentaje. Clases 1 2 3 4 5 Li - Ls 26 29 30 33 34 37 38 41 42 - 45 Lri Lrs Xi Fi 25.5 29.5 27.5 4 29.5 33.5 31.5 11 33.5 37.5 35.5 6 37.5 42.5 39.5 7 41.5 45.5 43.5 2 Tabla de Frecuencias Absolutas Hi 4/30 11/30 6/30 7/30 2/30 Pi (%) 13.33 36.67 20.00 23.33 6.67

2009

Ing. Jess Antonio Vilchis Jurez.

80

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Clculo de las Frecuencias Absolutas Acumuladas y Relativas Acumuladas Para agregar a la tabla de distribucin de frecuencias las frecuencias acumuladas, tanto absolutas como relativas, hay que generar la columna menor que (<). La nomenclatura de las frecuencias absolutas acumuladas es Fi y la de las frecuencias relativas acumuladas, Hi. Frecuencias absolutas Frecuencias absolutas acumuladas Fi Frecuencias relativas Frecuencias relativas acumuladas Hi

Fi

hi

La columna menor que (<) est formada por todos los lmites reales de clase y quedara as: Lri Lrs 25.5 29.5 29.5 33.5 33.5 37.5 37.5 42.5 41.5 45.5 < 25.5 29.5 33.5 37.5 41.5 45.5

Clases 1 2 3 4 5

Li - Ls 26 29 30 33 34 37 38 41 42 - 45

Xi 27.5 31.5 35.5 39.5 43.5

Fi 4 11 6 7 2

hi 13.33 % 36.67 % 20.00 % 23.33 % 6.67 %

El cuadro anterior, ordenado, quedara de la siguiente manera: < Clases Li - Ls Lri Lrs Xi fi Fi hi Hi 25.5 1 26 29 25.5 29.5 27.5 29.5 4 4 13.33 % 13.33 % 2 30 33 29.5 33.5 31.5 33.5 11 15 36.67 % 50.00 % 3 34 37 33.5 37.5 35.5 37.5 6 21 20.00 % 70.00 % 4 38 41 37.5 42.5 39.5 41.5 7 28 23.33 % 93.33 % 5 42 - 45 41.5 45.5 43.5 45.5 2 30 6.67 % 100.00 % Clculo de Frecuencias Absolutas Acumuladas y Relativas Acumuladas Para generar la frecuencia absoluta acumulada, debemos de formularnos la siguiente pregunta: Cuntos datos son menores que los limites reales?. Por ejemplo: Cuntos datos son menores que 25.5? La respuesta es ninguno, ya que todos son mayores que esa cantidad. Cuntos datos son menores que 29.5? La respuesta es 4. 2009 | Ing. Jess Antonio Vilchis Jurez. 81

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

A la pregunta, cuntos datos son menores que 33.5?, la respuesta es 4 + 11 = 15, y as sucesivamente, hasta terminar con la columna menor que (<). Lri Lrs 25.5 29.5 29.5 33.5 33.5 37.5 37.5 42.5 41.5 45.5 < 25.5 29.5 33.5 37.5 41.5 45.5 Fi 0 4 15 21 28 30

Clases 1 2 3 4 5

Li - Ls 26 29 30 33 34 37 38 41 42 - 45

Xi 27.5 31.5 35.5 39.5 43.5

Fi 4 11 6 7 2

hi 13.33 % 36.67 % 20.00 % 23.33 % 6.67 %

El cuadro anterior, ordenado, quedara de la siguiente manera: < Clases fi Fi hi Hi 25.5 0 0 0 0 1 26 29 25.5 29.5 27.5 29.5 4 4 13.33 % 13.33 % 2 30 33 29.5 33.5 31.5 33.5 11 15 36.67 % 50.00 % 3 34 37 33.5 37.5 35.5 37.5 6 21 20.00 % 70.00 % 4 38 41 37.5 42.5 39.5 41.5 7 28 23.33 % 93.33 % 5 42 - 45 41.5 45.5 43.5 45.5 2 30 6.67 % 100.00 % Reclculo de Frecuencias Absolutas y Relativas Acumuladas Li - Ls Lri Lrs Xi

Anlogamente, para generar la frecuencia relativa acumulada, nos debemos de preguntar qu porcentaje de los datos es menor que los limites reales?. Por ejemplo: Qu porcentaje de los datos es menor que 25.5? La respuesta es ninguno, ya que todos son mayores que esa cantidad. Qu porcentaje de los datos es menor que 29.5? La respuesta es 13.33%. A la pregunta, qu porcentaje de los datos es menor que 33.5? La respuesta es 13.33 + 36.67 = 50%, y as sucesivamente hasta terminar con la columna menor que (<). Lri Lrs < 25.5 Fi 0 4 15 21 28 30

Clases 1 2 3 4 5

Li - Ls

Xi

Fi

hi

26 29 25.5 29.5 27.5 4 13.33 % 29.5 30 33 29.5 33.5 31.5 11 36.67 % 33.5 34 37 33.5 37.5 35.5 6 20.00 % 37.5 38 41 37.5 42.5 39.5 7 23.33 % 41.5 42 - 45 41.5 45.5 43.5 2 6.67 % 45.5 Frecuencias Absolutas Acumuladas y Relativas Acumuladas

Para concluir, en trminos de campos (lo que se llama en Estadstica, variables) y de frecuencias de variables, tendramos: 2009 | Ing. Jess Antonio Vilchis Jurez. 82

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Xi Fi 27.5 4 31.5 11 35.5 6 39.5 7 43.5 2 Variables y Frecuencias de Variables Utilizando este mtodo, observamos que n = 30 es menor que 50 y, de acuerdo con la tabla, se nos recomienda, tomar de 5 a 7 clases: Por tanto, K = 5 clases sera una buena asignacin.

Recuento y Frecuencia Absoluta El recuento es la asignacin de cada dato en la clase que le corresponde. La frecuencia absoluta es el nmero de datos que se encuentran ubicados en cada clase. Para nuestro ejemplo, tenemos: Tabla de Frecuencias Absolutas Li - Ls Lri Lrs Xi 26 29 25.5 29.5 27.5 30 33 29.5 33.5 31.5 34 37 33.5 37.5 35.5 38 41 37.5 42.5 39.5 42 - 45 41.5 45.5 43.5

Clases 1 2 3 4 5

Fi 4 11 6 7 2

Frecuencia Relativa del Intervalo La frecuencia relativa es la proporcin de los datos que se encuentran en cada clase. Se calcula dividiendo la frecuencia absoluta entre el total de los datos y se puede expresar como una fraccin o en forma de porcentaje. Tabla de Frecuencias Relativas Li - Ls Lri Lrs Xi Fi 26 29 25.5 29.5 27.5 4 30 33 29.5 33.5 31.5 11 34 37 33.5 37.5 35.5 6 38 41 37.5 42.5 39.5 7 42 - 45 41.5 45.5 43.5 2

Clases 1 2 3 4 5

hi 4/30 = 13.33 % 11/30 = 36.67 % 6/30 = 20.00 % 7/30 = 23.33 % 2/30 = 6.67 %

Frecuencias Absolutas Acumuladas y Relativas Acumuladas Para agregar a la tabla de distribucin de frecuencias las frecuencias acumuladas, tanto absolutas como relativas, hay que generar la columna menor que (<). 2009 | Ing. Jess Antonio Vilchis Jurez. 83

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

La columna menor que (<) est formada por todos los lmites reales de clase y quedara de la siguiente manera: Tabla de Frecuencias Absolutas Acumuladas y Relativas Acumuladas (I) < Clases Li - Ls Lri Lrs Xi Fi hi 25.5 1 2 3 4 5 26 29 30 33 34 37 38 41 42 - 45 25.5 29.5 29.5 33.5 33.5 37.5 37.5 42.5 41.5 45.5 27.5 31.5 35.5 39.5 43.5 4 11 6 7 2 13.33 % 36.67 % 20.00 % 23.33 % 6.67 % 29.5 33.5 37.5 41.5 45.5

Para generar la frecuencia absoluta acumulada nos debemos de preguntar cuntos datos son menores que los limites reales? Por ejemplo: Cuntos datos son menores que 25.5? La respuesta es ninguno, ya que todos son mayores que esa cantidad. Cuntos datos son menores que 29.5? La respuesta es 4. A la pregunta, cuntos datos son menores que 33.5?, la respuesta es 4 + 11 = 15, y as sucesivamente, hasta terminar con la columna menor que (<). Tabla de Frecuencias Absolutas y Relativas Acumuladas (II) < Clases Li - Ls Lri Lrs Xi Fi hi 25.5 1 2 3 4 5 26 29 30 33 34 37 38 41 42 - 45 25.5 29.5 29.5 33.5 33.5 37.5 37.5 42.5 41.5 45.5 27.5 31.5 35.5 39.5 43.5 4 11 6 7 2 13.33 % 36.67 % 20.00 % 23.33 % 6.67 % 29.5 33.5 37.5 41.5 45.5

Fi 0 4 15 21 28 30

Para generar la frecuencia relativa acumulada, nos debemos de preguntar qu porcentaje de los datos es menor que los limites reales? Por ejemplo: Qu porcentaje de los datos es menor que 25.5? La respuesta es ninguno, ya que todos son mayores que esa cantidad. Qu porcentaje de los datos es menor que 29.5? La respuesta es 13.33%. A la pregunta, qu porcentaje de los datos es menor que 33.5? La respuesta es 13.33 + 36.67 = 50%, y as sucesivamente hasta terminar con la columna menor que (<).

2009

Ing. Jess Antonio Vilchis Jurez.

84

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Tabla de Frecuencias Absolutas y Relativas Acumuladas (III) < Fi Hi Clases Li - Ls Lri Lrs Xi Fi hi 25.5 0 0 1 2 3 4 5 26 29 30 33 34 37 38 41 42 - 45 25.5 29.5 29.5 33.5 33.5 37.5 37.5 42.5 41.5 45.5 27.5 4 13.33 % 29.5 31.5 11 36.67 % 33.5 35.5 6 20.00 % 37.5 39.5 7 23.33 % 41.5 43.5 2 6.67 % 45.5 4 13.33 % 15 50.00 % 21 70.00 % 28 93.33 % 30 100.00 %

Histograma y Polgono de Frecuencias El histograma es una grfica de barras construida sobre una grfica cartesiana, en donde cada clase se levanta por medio de una barra sobre sus lmites reales de clase. La altura de cada barra es la frecuencia absoluta o relativa de cada clase. El polgono de frecuencias se forma uniendo los puntos formados por la interseccin de la marca de clase o punto medio, con la frecuencia absoluta o con la relativa. Para poder cerrar el polgono, hay que comenzar con la marca de clase anterior a la primera clase, y terminar con la marca de clase posterior a la ltima, ya que estas clases ficticias tienen una frecuencia nula. A continuacin, se va a proceder a la creacin de un Histograma y un Polgono de Frecuencias.

Editor de Datos con los datos. 2009 | Ing. Jess Antonio Vilchis Jurez. 85

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Editor de Datos con las variables definidas. Nota: Para ver cmo se definen las variables, ver las pginas siguientes.

Grfico histograma con los datos 2009 | Ing. Jess Antonio Vilchis Jurez. 86

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Creacin de un Fichero de Datos con SPSS Una vez recogida la informacin relativa a las edades de los alumnos del ejemplo anterior, y arrancado el programa SPSS: Seleccionar en la barra de men: Archivo/Nuevo/Datos. Hacer doble clic sobre la cabecera de la primera columna. Aparece la ventana de Vista de variables. Escribir " edad " en el cuadro Nombre de Variable. Se abrir el cuadro de dilogo Definir Variable.

Ventana Vista de variables. Hacer doble clic sobre la cabecera de la columna Tipo. Dejar seleccionada la opcin predeterminada Numrico. Escribir el valor "2" en el cuadro Anchura1. Este ancho representa el nmero de caracteres de la variable edad: 2 (ya que no se espera que ningn alumno tenga por encima de los 99 aos, en cuyo caso ya se necesitaran 3 dgitos). Esto significa que la variable edad tendr 2 dgitos, es decir, podr tomar valores de 0 a 99.

Existe otro ancho en el subcomando Formato de Columna, que permite especificar el ancho de la columna de una variable en el Editor de Datos.
1

2009

Ing. Jess Antonio Vilchis Jurez.

87

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Escribir el valor "0" en el cuadro Decimales (Lugares Decimales2). El cuadro Decimales (Cifras Decimales), permite especificar el nmero de cifras decimales de la variable edad: 0 (ya que no se le pregunta a los alumnos edad en aos cumplidos) que ningn profesor tenga un nmero de aos fraccionario, en cuyo caso se necesitara especificar decimales).

Ficha Vista de variables En Etiqueta escribir una palabra o frase para identificar de qu variable se trata: Edad del alumno de spinning. Aparece el cuadro de dilogo Definir Etiquetas.

Cuadro de Dilogo Definir etiquetas

Es lgico, pues no se contemplan cifras decimales en los datos del estudio. | Ing. Jess Antonio Vilchis Jurez. 88

2009

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

En el cuadro "Valores " (Etiquetas de los valores de la variable) tan slo escribir el valor que definir los valores perdidos (99). Por ello: Escribir el valor 99 en el cuadro Valor. Escribir la etiqueta Ns/Nc en el cuadro Etiqueta.

Cuadro de Dilogo Etiquetas de valor Pulsar Aadir. Por ltimo, pulsar el botn Aceptar.

Cuadro de Dilogo Etiquetas de valor

2009

Ing. Jess Antonio Vilchis Jurez.

89

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Hacer clic en la celda Perdidos (Valores Perdidos3). Seleccionar la opcin Valores perdidos discretos. Escribir el valor "99" en el primer cuadro habilitado4.

Ficha Definir valores perdidos

Ficha Vista de variables En la celda de Columnas (Ancho de Columna) especificar "8" que es la opcin mejor y ms usual. Hacer clic en la celda Alineacin que permite especificar la alineacin de la variable sobre la columna y dejar activada la opcin por defecto derecha. En Medida dejar activada la opcin por defecto: Escala. De esta forma hemos terminado de definir la estructura de la variable edad.

3 4

Los valores perdidos representan valores codificados, pero sin respuesta o ausentes. El valor 9, la opcin ms usada para valores perdidos, designa la respuesta "NS/NC" (no sabe/no contesta). Si el ancho de la variable fuera uno, se utilizara 9. Si fuera dos, 99; etc.

2009

Ing. Jess Antonio Vilchis Jurez.

90

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Procedimientos de Exploracin Estadstica Para la exploracin estadstica de una base de datos existe una multiplicidad de procedimientos. Cada uno de ellos aborda esta tarea desde su propio enfoque. En SPSS, los procedimientos de exploracin estadstica estn concentrados en un bloque aparte, llamado Analizar. Los ms importantes procedimientos de exploracin estadstica de SPSS son los siguientes: Anlisis Descriptivo de una Base Datos (DESCRIPTIVOS), cuya principal contribucin es permitir la estandarizacin de variables, esto es, la transformacin de variables mediante una tipificacin, con el fin de facilitar su comparacin, siendo completamente anecdtico su papel en el anlisis descriptivo. Anlisis Descriptivo de una Tabla de Frecuencias (FREQUENCIAS), cuya mayor importancia es dar una rpida pincelada de las caractersticas de una variable, que incluye una representacin grfica de las variables. Exploracin Estadstica de una Base Datos (EXPLORAR) que, a las facilidades del procedimiento FREQUENCIAS, aade las ventajas de los contrastes de la normalidad y la homocedasticidad, adems de poseer eficaces representaciones grficas, como grficas de cajas y de linealidad. Anlisis de la Asociacin entre 2 Variables (TABLAS DE CONTINGENCIA), que crea una tabla de contingencia y posibilita el clculo de estadsticos que cuantifican la fuerza de la asociacin entre variables.

Frecuencias (Frequencies) El procedimiento Frecuencias genera estadsticos y grficos que son tiles para la descripcin de variables. Es til como una primera visin de los datos. Se pueden organizar los distintos valores en orden ascendente o descendente, u ordenar las categoras por sus frecuencias.

Aplicacin del Procedimiento FRECUENCIAS Seleccionar en la barra de men: Archivo / Abrir. Localizar el fichero de datos HEALTH.SPINNING.sav' y abrirlo. Seleccionar en la barra de men: Analizar / Estadsticos decriptivos / Frecuencias. 2009 | Ing. Jess Antonio Vilchis Jurez. 91

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Llamada del Procedimiento Frecuencias Aparece el cuadro de dilogo Frecuencias.

Cuadro de Dilogo Frecuencias

Variable(s). Muestra la(s) variable(s) seleccionadas para el anlisis. Seleccionar las variables estatura y 'pulsaciones' en la lista de variables fuente. Pulsar el botn, para introducirlas en la lista Variable(s).

2009

Ing. Jess Antonio Vilchis Jurez.

92

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Cuadro de Dilogo Frecuencias

Cuadro de Dilogo Frecuencias

Mostrar tablas de frecuencias. Si se deselecciona esta opcin, las tablas de frecuencias no se muestran en las salidas. Sin embargo, se muestran los estadsticos y grficos solicitados. Si, aparte de deseleccionar esta opcin, no se solicita ningn estadstico, ni grfico, en las salidas slo aparecen los nmeros de casos vlidos y perdidos. Dejar seleccionada la opcin Mostrar tablas de frecuencias.

Configuracin de Estadsticos de FRECUENCIAS Pulsar el botn (Estadsticos). Aparece el cuadro de dilogo Frecuencias: Estadsticos.

2009

Ing. Jess Antonio Vilchis Jurez.

93

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Cuadro de Dilogo Frecuencias: Estadsticos

Valores de Percentiles. Representan los valores de una variable cuantitativa que dividen los datos ordenados en grupos de forma que cierto porcentaje est por encima y otro est por debajo, sumando ambos porcentajes el 100%. Cuartiles. Dividen las observaciones en 4 grupos de igual tamao, con puntos de corte correspondientes a los percentiles 25, 50 y 75. Puntos de corte para 10 grupos iguales. Permite dividir los casos en varios grupos iguales. SPSS admite entre 2 y 100 grupos iguales; proponiendo, por defecto, 10 grupos. Percentiles. Permite introducir tantos puntos de corte como se desee y, adems, admite grupos desiguales, por ejemplo: 10, 25, 50, 60. Seleccionar la opcin Puntos de corte para 10 grupos iguales y dejar el nmero de puntos de corte predeterminado (10).

Dispersin. Estadsticos que miden la variacin o dispersin en los datos. Desviacin tpica. Medida de dispersin alrededor de la media. Es igual a la raz cuadrada de la varianza y se expresa en las mismas unidades de medida que las observaciones. En una distribucin normal, el 68% de los casos caen dentro de una desviacin tpica alrededor de la media y el 95%, dentro de dos desviaciones tpicas. Varianza. Medida de dispersin alrededor de la media. Es igual a la suma de los cuadrados de las desviaciones respecto de la media 2009 | Ing. Jess Antonio Vilchis Jurez. 94

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

dividida por el nmero de casos menos uno. La unidad de medida de la varianza es el cuadro de la unidad de la variable. Rango. Diferencia entre el valor ms grande (mximo) y el ms pequeo (mnimo) de una variable numrica. Mnimo. El valor ms pequeo de una variable numrica. Mximo. El valor ms grande de una variable numrica. Error tpico de la media. Medida de cuanto puede variar el valor de la media de una muestra a otra, seleccionada de la misma distribucin. Se utiliza para una comparacin poco precisa de la media observado y un valor hipottico.

Seleccionar las seis opciones del cuadro Dispersin. Tendencia Central. Estadsticos que describen la localizacin de distribucin. Media. La media aritmtica: la suma de los valores divida por el nmero de casos. La medida de tendencia central ms caracterstica, muy influenciada por valores atpicos. Mediana. Medida de tendencia central insensible a la influencia de valores atpicos. El valor por debajo y por encima del cual cae la mitad del los casos (percentil 50). Cuando el nmero de casos es par, la mediana se calcula como el promedio de los dos casos centrales cuando estos se ordenan en orden ascendente o descendente. Moda. El valor ms frecuente. Si varios valores son los ms frecuentes, cada uno de ellos es una moda. El procedimiento FRECUENCIAS utiliza la ms pequea de estas modas. Suma. La suma o el total de los valores de todos los casos con valores no perdidos. Seleccionar las cuatro opciones del cuadro Tendencia Central. Los valores son puntos medios de grupos. Calcula los valores percentiles y la mediana suponiendo que los datos han sido agrupados y que los valores de los datos son los puntos medios de los grupos originales. Seleccionar la opcin Los valores son puntos medios de grupos. Distribucin. Los coeficientes de asimetra y curtosis son estadsticos que miden la forma y la simetra de la distribucin. Estos estadsticos se muestran con sus errores tpicos. Asimetra. Una medida de asimetra de la distribucin. La distribucin normal es simtrica y tiene asimetra igual a 0. Una distribucin con un significativo valor positivo de asimetra tiene una gran asimetra a la derecha. Una distribucin con un significativo valor negativo de asimetra tiene una gran asimetra a la izquierda. 2009 | Ing. Jess Antonio Vilchis Jurez. 95

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Curtosis. Medida de agrupacin de los casos alrededor de un punto central. Para una distribucin normal, el valor de curtosis es 0. La curtosis positiva indica que los casos se agrupan ms y tienen colas ms largas que la normal, mientras que la curtosis negativa indica que los casos se agrupan menos y tienen colas ms cortas que la normal. Seleccionar las dos opciones del cuadro Distribucin.

Cuadro de Dilogo Frequencies: Statistics Pulsar el botn (Continuar), para confirmar las opciones seleccionadas. Vuelve a aparecer el cuadro de dilogo Frecuencias.

Configuracin de Grficos de FRECUENCIAS Pulsar el botn (Grficos). Aparece el cuadro de dilogo Frecuencias: Grficos.

Cuadro de Dilogo Frecuencias: Grficos 2009 | Ing. Jess Antonio Vilchis Jurez. 96

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Tipo de Grfico. Permite solicitar el tipo de grfico. Ninguno. No presentar ningn grfico. Grficos de barras. Mide la frecuencia para cada valor distinto o categora como una barra separada, permitiendo una comparacin visual de las categoras. Grficos de sectores. Muestra la contribucin de las partes al todo. Cada trozo del mismo corresponde a un grupo definido por una sola VI. Histogramas. Un histograma tambin tiene barras, pero se representan a lo largo de una escala de intervalo. La altura de cada barra es la frecuencia de los valores de una variable cuantitativa, situados dentro de este intervalo. Un histograma muestra la forma, el centro y la dispersin de la distribucin. Con curva normal. Sobrepone la curva normal al histograma, para ayudar a juzgar visualmente si los datos se distribuyen normalmente. Seleccionar la opcin Histogramas. Al hacerlo, se habilita la opcin adjunta Con curva normal. Seleccionar la opcin Con curva normal. Valores de Grfico. Para los diagramas de barras, el eje de escalas puede ser etiquetado segn las frecuencias o porcentajes de frecuencias. Frecuencias. Etiqueta el eje vertical de grfico de barras con frecuencias. Porcentajes). Etiqueta el eje vertical de grfico de barras con porcentajes. Dejar la opcin por defecto - Frecuencias.

Cuadro de Dilogo Frecuencias: Graficos 2009 | Ing. Jess Antonio Vilchis Jurez. 97

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Pulsar el botn (Continuar), para confirmar las opciones seleccionadas. Vuelve a aparecer el cuadro de dilogo Frecuencias.

Configuracin de Formato de Presentacin de FRECUENCIAS Pulsar el botn (Formato). Aparece el cuadro de dilogo Frecuencias: Formato.

Cuadro de Dilogo Frecuencias: Formato Ordenar por. La tabla de frecuencias puede ordenarse segn los valores reales de los datos o segn la frecuencia de ocurrencia de dichos valores, y en orden ascendente o descendente. Sin embargo, si se solicita un histograma o percentiles, SPSS asume que la variable es cuantitativa y muestra sus valores en orden ascendente. Valores ascendentes. Ordena la tabla de frecuencias segn el orden ascendente de los valores reales de los datos. Valores descendentes. Ordena la tabla de frecuencias segn el orden descendente de los valores reales de los datos. Frecuencias ascendentes. Ordena la tabla de frecuencias segn el orden ascendente de las frecuencias de los valores de los datos. Frecuencias descendentes. Ordena la tabla de frecuencias segn el orden descendente de las frecuencias de los valores de los datos. Dejar la opcin por defecto - Valores ascendentes. Suprimir tablas con ms de 10 categoras). Permite no visualizar tablas con ms categoras que las especificadas (por defecto, 10). Esta opcin es til cuando una variable tiene muchas categoras y no interesa verla en las salidas. Seleccionar la opcin Suprimir tablas con ms de 10 categoras.

2009

Ing. Jess Antonio Vilchis Jurez.

98

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Cuadro de Dilogo "Frecuencias: Formato" Pulsar el botn (Continuar), para confirmar las opciones seleccionadas. Vuelve a aparecer el cuadro de dilogo Frecuencias.

Ejecucin del Procedimiento FRECUENCIAS

Cuadro de Dilogo Frecuencias Pulsar el botn (Aceptar), para ejecutar el procedimiento.

Interpretacin de las Salidas de FREQUENCIES El histograma de la variable estatura nos da idea de un comportamiento que asemeja en gran medida a la normal. La variable pulsaciones tiene un comportamiento lo mas ajustado posible a la curva normal. Esto quiere decir que el grupo de alumnos de la clase de spinning tiene un comportamiento homogneo en esta variable. La variable estatura tiene una asimetra modesta, frente a una casi despreciable asimetra de la variable pulsaciones. As tambin la curtosis de ambas variables es baja. Estamos frente a variables que presentan comportamientos homogneos. (Ver Anexo al final de este apartado) 2009 | Ing. Jess Antonio Vilchis Jurez. 99

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Histograma de estatura

Histograma de pulsaciones 2009 | Ing. Jess Antonio Vilchis Jurez. 100

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Tabla de estadsticos Estadsticos estatura pulsaciones N Vlidos 31 27 Perdidos 0 4 Media 1,7242 140,22 Error tp. de la media ,01383 4,652 a Mediana 1,7220 136,00a Moda 1,65b 120b Desv. tp. ,07698 24,171 Varianza ,006 584,256 Asimetra ,099 -,055 Error tp. de asimetra ,421 ,448 Curtosis ,101 -,170 Error tp. de curtosis ,821 ,872 Rango ,34 98 Mnimo 1,55 90 Mximo 1,89 188 Suma 53,45 3786 Percentiles 10 1,6348c 105,60c 20 1,6548 122,88 30 1,6880 129,47 40 1,7051 134,60 50 1,7220 136,00 60 1,7373 144,70 70 1,7660 153,60 80 1,7853 161,60 90 1,8300 173,80 a Calculado a partir de los datos agrupados. b Existen varias modas. Se mostrar el menor de los valores. c Los percentiles se calcularn a partir de los datos agrupados.

Descriptivos El procedimiento Descriptivos muestra estadsticos univariados de resumen para varias variables en una sola tabla y calcula valores estandarizados (puntuaciones Z).

Aplicacin de DESCRIPTIVOS Seleccionar en la barra de men: Archivo/Abrir. Localizar el fichero de datos HEALTH.SPINNING.sav' y abrirlo. Seleccionar en la barra de men: Analizar / Estadsticos descriptivos / Descriptivos.

2009

Ing. Jess Antonio Vilchis Jurez.

101

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Llamada del Procedimiento Descriptivos Aparece el cuadro de dilogo Descriptivos.

Cuadro de Dilogo Descriptivos Variables. Muestra la(s) variable(s) seleccionadas para el anlisis. Seleccionar las variables estatura, pulsacio e imc en la lista de variables fuente. Pulsar el botn, para introducirlas en la lista Variables. Guardar valores estandarizado como variables. Calcula y guarda en el fichero de datos de trabajo las puntuaciones Z para cada variable seleccionada. Los nombres de nuevas variables creadas

2009

Ing. Jess Antonio Vilchis Jurez.

102

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

tienen el prefijo "z" y los siete primeros caracteres del nombre de la variable original5. Seleccionar la opcin Guardar valores tipificados como variables.

Cuadro de Dilogo Descriptivos

Configuracin de Opciones de DESCRIPTIVOS Pulsar el botn (Opciones). Aparece el cuadro de dilogo Descriptivos: Opciones.

Cuadro de Dilogo Descriptivos: Opciones

Las variables tipificadas Z se calculan dividiendo el resultado de restar a cada variable su valor medio entre la desviacin tpica de dicha variable. Las variables tipificadas son unos valores normalizados que, situados en la curva normal, pueden ser usados como estadsticos de la dispersin. De hecho, el intervalo de confianza del 95% est comprendido entre las puntuaciones tipificadas -2 y + 2.

2009

Ing. Jess Antonio Vilchis Jurez.

103

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Media. La media aritmtica: la suma de los valores dividida por el nmero de casos. La medida de tendencia central ms caracterstica, muy influenciada por valores atpicos. Suma. La suma o el total de los valores de todos los casos con valores no perdidos. Seleccionar la opcin Suma. Dispersin. Estadsticos que miden la variacin o dispersin en los datos. Desviacin tpica. Medida de dispersin alrededor de la media. Es igual a la raz cuadrada de la varianza y se expresa en las mismas unidades de medida que las observaciones. En una distribucin normal, el 68% de los casos caen dentro de 1 desviacin tpica alrededor de la media y el 95%, dentro de 2 desviaciones tpicas. Varianza. Medida de dispersin alrededor de la media. Es igual a la suma de los cuadrados de las desviaciones respecto de la media dividida por el nmero de casos menos uno. La unidad de medida de la varianza es el cuadro de la unidad de la variable. Rango. Diferencia entre el valor ms grande (mximo) y el ms pequeo (mnimo) de una variable numrica. Mnimo. El valor ms pequeo de una variable numrica. Mximo. El valor ms grande de una variable numrica. Error tpico de la media). Medida de cuanto puede variar el valor de la media de una muestra a otra, seleccionada de la misma distribucin. Se utiliza para una comparacin poco precisa de la media observado y un valor hipottico. Seleccionar las Dispersin. cuatro opciones no seleccionadas del cuadro

Distribucin. Los coeficientes de asimetra y curtosis son estadsticos que miden la forma y la simetra de la distribucin. Estos estadsticos se muestran con sus errores tpicos. Asimetra. Una medida de asimetra de la distribucin. La distribucin normal es simtrica y tiene "asimetra" igual a 0. Una distribucin con un significativo valor positivo de "asimetra" tiene una gran asimetra a la derecha. Una distribucin con un significativo valor negativo de "asimetra" tiene una gran asimetra a la izquierda. Curtosis. Una medida de hasta que punto se agrupan las observaciones alrededor de un punto central. Para una distribucin normal, el valor del estadstico Curtosis es 0. Curtosis positiva indica que las observaciones se agrupan ms y tienen colas ms largas que las de la distribucin normal. Curtosis negativa indica que las observaciones se agrupan menos y tienen colas ms cortas que la distribucin normal. Seleccionar las dos opciones del cuadro Distribucin. 2009 | Ing. Jess Antonio Vilchis Jurez. 104

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Orden de Visualizacin. Define el orden de visualizacin de variables. Lista de variables). Deja las variables en el orden en el que han sido seleccionadas. Alfabtico. Clasifica las variables en orden alfabtico. Medias ascendentes. Clasifica las variables en orden ascendente de la media. Medias descendentes. Clasifica las variables en orden descendente de la media. Dejar la opcin por defecto - Medias ascendentes.

Cuadro de Dilogo "Descriptivos: Opciones" Pulsar el botn (Continuar), para confirmar las opciones seleccionadas. Vuelve a aparecer el cuadro de dilogo Descriptivos.

Ejecucin del Procedimiento DESCRIPTIVOS

Cuadro de Dilogo Descriptivos 2009 | Ing. Jess Antonio Vilchis Jurez. 105

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Pulsar el botn (Aceptar), para ejecutar el procedimiento.

Interpretacin de las Salidas de un Ejemplo con DESCRIPTIVES Se ofrece una tabla de los estadsticos descriptivos solicitados. Tabla de Estadsticos Descriptivos
Estadsticos descriptivos N Rango Mnimo Mximo Suma Media Desv. tp. Varianza Asimetra Curtosis Estadstico Estadstico Estadstico Estadstico Estadstico Estadstico Error tpico Estadstico Estadstico Estadstico Error tpico Estadstico Error tpico estatura 31 ,34 1,55 1,89 53,45 1,7242 ,01383 ,07698 ,006 ,099 ,421 ,101 ,821 imc 31 30,422 ,000 30,422 686,353 22,14042 ,921670 5,131639 26,334 -2,578 ,421 11,364 ,821 pulsaciones 27 98 90 188 3786 140,22 4,652 24,171 584,256 -,055 ,448 -,170 ,872 N vlido (segn lista) 27

El Error Tpico de Estimacin de la Media (ETE), tambin llamado Error Estndar (Std Error, SE) cuantifica el sesgo de una estimacin de un parmetro poblacional: la media poblacional, en este caso. El ETE se calcula dividiendo la desviacin tpica entre la raz cuadrada del resultado de restar 1 al tamao muestral:

El coeficiente de Asimetra (As) es un estadstico que alude a la forma de una distribucin y mide el alejamiento de la media de la mediana. Se calcula con la frmula siguiente:

As oscila entre los valores: -3 (mxima asimetra negativa) y +3 (mxima asimetra positiva), indicando el valor 0 la nula asimetra (esto es, simetra perfecta).

2009

Ing. Jess Antonio Vilchis Jurez.

106

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

El coeficiente de apuntamiento o curtosis, K, expresa el grado de concentracin de los datos en torno al valor central. Se calcula con la frmula:

K oscila entre los valores: -3 (mximo apuntamiento negativo, forma platicrtica) y +3 (mximo apuntamiento positivo, forma leptocrtica), indicando el valor 0 un apuntamiento nulo o una distribucin mesocrtica. Los estadsticos curtosis y Asimetra tienen, en este ejemplo, valores prximos a 0, lo que supone que esas variables estn prximas a la distribucin normal. Esta aseveracin est apoyada por los valores de los estadsticos de tendencia central y de la dispersin. Se muestra a continuacin una vista del fichero de datos de trabajo con las puntuaciones tpicas de las variables solicitadas.

Tabla de Estadsticos Descriptivos

Volviendo a aplicar el procedimiento DESCRIPTIVOS, pero esta vez a las puntuaciones Z calculadas: 'zestatura', 'zpulsaciones' y 'zimc', y sin guardar las nuevas puntuaciones Z, se obtiene la siguiente tabla:

2009

Ing. Jess Antonio Vilchis Jurez.

107

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Tabla de Estadsticos Descriptivos


Estadsticos descriptivos Puntua(imc) N Rango Mnimo Mximo Suma Media Desv. tp. Varianza Asimetra Curtosis Estadstico Estadstico Estadstico Estadstico Estadstico Estadstico Error tpico Estadstico Estadstico Estadstico Error tpico Estadstico Error tpico 31 5,92832 -4,31449 1,61383 ,00000 ,0000000 ,17960530 1,00000000 1,000 -2,578 ,421 11,364 ,821 Puntua: estatura 31 4,41701 -2,26299 2,15403 ,00000 ,0000000 ,17960530 1,00000000 1,000 ,099 ,421 ,101 ,821 Puntua(pulsaciones) 27 4,05438 -2,07775 1,97662 ,00000 ,0000000 ,19245009 1,00000000 1,000 -,055 ,448 -,170 ,872 N vlido (segn lista) 27

Podemos ver cmo las variables zpulsacio y zestatura, tienen poca desviacin respecto de la normal, con una baja asimetra de 0.119 y 0.442 respectivamente. Sin embargo la variable zimc (ndice de masa corporal) se comporta de modo muy heterogneo, tiene una alta dispersin, con una asimetra de 2.43. Al contar con estadsticos estandarizados, hemos podido comparar si el comportamiento de estas variables se asemeja a una normal. Es decir si tienen valores ms o menos concentrados alrededor de la media.

Anexo: Medidas Estadsticas: Concepto y Caractersticas de una Medida Estadstica: El Estadstico Yule ha definido algunas propiedades deseables para una medida estadstica: Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo resultado numrico. Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna observacin la medida considerada debe reflejar esta variacin. Tener un significado concreto: la interpretacin debe ser inmediata y sencilla. Ser sencilla de calcular. Prestarse fcilmente al clculo algebraico: Lo que permitir demostraciones ms elegantes. Ser poco sensible a las fluctuaciones muestrales. Esta condicin es imprescindible en la Estadstica Matemtica y en la Teora de Sondeos.

2009

Ing. Jess Antonio Vilchis Jurez.

108

ANLISIS ESTADSTICO CON SPSS Anexo: Tipos de Medida:

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

1. Medidas de Centralizacin: Que sirven para determinar los valores centrales o medios de la distribucin. 2. Medidas de Dispersin: Nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersin menor representatividad. 3. Medidas de Localizacin: tiles para encontrar determinados valores importantes, para una "clasificacin" de los elementos de la muestra o poblacin. 4. Medidas de la Curtosis: Sirven para ver si la distribucin tiene el mismo apuntamiento por encima y por debajo de los valores centrales. 5. Medidas de la Simetra: Sirven para ver si la distribucin tiene el mismo comportamiento por encima y por debajo de los valores centrales.

Medida de Tendencia Central o de Centralizacin (Promedios) Medida de Tendencia Central o de Centralizacin (Promedios): Un nico valor que resume un conjunto de datos. Seala el centro de valores. No hay una sola medida de tendencia central, sino que se consideran cinco: 1. la media aritmtica, 2. la media ponderada, 3. la mediana, 4. la moda 5. y la media geomtrica. Vamos a estudiar en este apartado los distintos tipos de medias.

Media (Aritmtica) La media aritmtica de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresin:

donde: xi representa el valor de la variable o en su caso la marca de clase. Media de la Poblacin La Media de la poblacin:

2009

Ing. Jess Antonio Vilchis Jurez.

109

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

A partir de datos en vivo, los que no han sido agrupados en una distribucin de frecuencias o en una representacin de tallo y hoja, la media de una poblacin es: Suma de todos los valores de la poblacin X Media de una poblacin = Nmero de valores en la poblacin N donde: N X representa la media de poblacin n total de elementos en la poblacin cualquier valor en particular sumatoria

La media de una poblacin es un parmetro (una caracterstica medible de una poblacin) , as como la amplitud de variacin (la diferencia entre el valor ms grande y el ms pequeo en un conjunto de datos).

Media de una Muestra Media de una muestra: Para datos en vivo, no agrupados la media es: Suma de todos los valores de una muestra Media de una muestra = Nmero de valores en la muestra Donde n es el nmero total de valores de la muestra. La media de una muestra, o cualquier otra medida basada en datos muestrales, se denomina dato estadstico (una caracterstica de una muestra). X X n

Propiedades de la Media Aritmtica: Propiedades: 1. Todo conjunto de datos de nivel de intervalo y de nivel de razn tiene un valor medio. 2. Al evaluar la media se incluyen todos los valores. 3. Un conjunto de datos slo tiene una media. Esta es un valor nico. 4. La media es una medida muy til para comparar dos o ms poblaciones. 5. La media es la nica medida de ubicacin donde la suma de las desviaciones de cada valor es con respecto a la media, siempre ser cero LAS DESVIACIONES RESPECTO DE LA MEDIA SUMAN CERO (XX)=0 6. La media podra no ser un promedio adecuado para representar datos. La media se ve afectada de modo notable por valores extraordinariamente grandes o pequeos. 2009 | Ing. Jess Antonio Vilchis Jurez. 110

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

7. No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor).

Media Ponderada: Media ponderada: Es un caso especial de la media aritmtica. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribucin de frecuencias. Para determinar la media ponderada multiplicamos cada observacin por el nmero de veces que aparece. w1X1 + w2X2 + w3X3 +...+ wnXn Media ponderada = w1 + w2 + w3 +...+ wn Mediana: La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra. Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua. Clculo de la mediana en el caso discreto: Tendremos en cuenta el tamao de la muestra. Si N es Impar, hay un trmino central, el trmino (wX) Xw w

que ser el valor de la mediana. Si N es Par, hay dos trminos centrales, la mediana

ser la media de esos dos valores. Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeos, la media aritmtica puede no ser representativa. El punto central puede describirse mejor utilizando una medida de tendencia central denominada mediana.

2009

Ing. Jess Antonio Vilchis Jurez.

111

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Mediana: Punto medio de los valores despus de ordenarlos de menor a mayor, o de mayor a menor. Se tiene que 50% de las observaciones se encuentran por arriba de la mediana y 50% por debajo de ella.

Propiedades de la Mediana Las propiedades de la mediana son: 1. Es nica, slo existe una mediana para un conjunto de datos. 2. No se ve afectada por valores muy grandes o muy pequeos. 3. Puede calcularse para una distribucin de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo. 4. Puede obtenerse para datos de nivel de razn, de intervalo y ordinal (excepto para el nominal). Veamos un ejemplo. N Impar 1, 4, 6, 7, 8, 9, 12, 16, 20, 24, 25, 27, 30. N=13 Trmino Central el 7, 12 Me = (9+12) / 2 = 10,5

N par 1, 4, 6, 7, 8, 9, 12, 16, 20, 24, 25, 27. N=13 Trminos Centrales el 6 y 7, 9 y 12 Me = 12

Clculo de la mediana en caso de que la variable est dividida en intervalos (sea continua, por ejemplo, Salario < 12.000 $, de 12.000 a 15.000, y > 15.000 $): Si la variable es continua, la tabla vendr en intervalos, por lo que se calcula de la siguiente forma (nos vamos a apoyar en un grfico de un histograma de frecuencias acumuladas):

2009

Ing. Jess Antonio Vilchis Jurez.

112

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

De donde mediana vale: donde ai amplitud intervalo. Vemoslo por medio de un ejemplo. es

la

la del

Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma: Li-1 Li ni Ni Como el tamao de la muestra es N=50, buscamos el intervalo en el que la Frecuencia acumulada es mayor que 50/2=25, que en este caso es el 3 y aplicamos la frmula anterior. Luego la Mediana ser = +

45 55 65 75 85

55 65 75 85 95

6 10 19 11 4

6 16 35 46 50

= ,

Moda: La Moda: La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite, es la nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin de ningn clculo. Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o polimodal segn el caso. Por lo tanto, el clculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacin mayor; sin embargo, debemos detenernos un poco en el clculo de la moda para distribuciones cuantitativas continuas. Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y de razn. No se ve afectada por valores muy altos o muy bajos. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.

Desventajas de la moda: 1. Para muchos conjuntos de datos no hay valor modal porque ningn valor aparece ms de una vez. 2009 | Ing. Jess Antonio Vilchis Jurez. 113

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

2. Para algunos conjuntos de datos hay ms de una moda (bimodal = que tiene dos modas).

Apoyndonos en el grfico, podemos llegar a la determinacin de la expresin para la Moda que es:

Otros autores dan una expresin aproximada para la moda que viene dada por la siguiente expresin:

Veamos su clculo mediante un ejemplo. Para ello, usaremos los datos del apartado anterior. Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma: Li-1 Li ni Ni 19 10 45 55 6 6 = 65 + 10 = 70,29 55 65 10 16 19 10 + (19 11) 65 75 19 35 Utilizando la frmula aproximada 11 75 85 11 46 = 65 + 10 = 70,24 85 95 4 50 10 + 11 Media geomtrica: til para encontrar el promedio de porcentajes, razones, ndices o tasas de crecimiento. Se utiliza ampliamente en los negocios y la economa porque frecuentemente interesa encontrar el cambio porcentual en ventas, sueldos o cifras econmicas, como el Producto Nacional Bruto. Siempre ser menor o igual a (nunca mayor que) la media aritmtica. Todos los valores de datos deben ser positivos.

2009

Ing. Jess Antonio Vilchis Jurez.

114

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

La media geomtrica de N observaciones es la raz de ndice N del producto de todas las observaciones. La representaremos por G.

Medidas de Forma (Curtosis o Apuntamiento)

Medidas de Simetra: Las medidas de la asimetra, al igual que la curtosis, van a ser medidas de la forma de la distribucin, es frecuente que los valores de una distribucin tiendan a ser similares a ambos lados de las medidas de centralizacin. La simetra es importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable. As < 0 Asimetra Negativa o por la Izquierda

As = 0

Simtrica

Cont.

Cont.

Cont.

2009

Ing. Jess Antonio Vilchis Jurez.

115

ANLISIS ESTADSTICO CON SPSS As > 0 Asimetra Positiva o por la Derecha

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios: Comparando la Media y la Moda. Comparando los valores de la variable con la media.

Comparando la Media y la Moda: Si, Comparando la Media y la Moda, la diferencia resulta positiva, diremos que hay asimetra positiva o a la derecha. En en el caso de que sea negativa, diremos que hay asimetra negativa o a la izquierda. No obstante, esta medida es poco operativa al no ser una medida relativa, ya que esta influida por la unidad en que se mida la variable, por lo que se define el coeficiente de Asimetra como:

Esta medida es muy fcil de calcular, pero menos precisa que el coeficiente de asimetra de Pearson. El coeficiente de asimetra de Pearson, se basa en la comparacin con la media de todos los valores de la variable, as que es una medida que se basar en las diferencias, como vimos en el caso de la dispersin si medimos la media de esas desviaciones sera nula, si las elevamos al cuadrado, seran siempre positivas por lo que tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo. Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de su desviacin tpica. Con lo que resulta la siguiente expresin:

2009

Ing. Jess Antonio Vilchis Jurez.

116

ANLISIS ESTADSTICO CON SPSS Medidas de Dispersin:

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Las Medidas de Dispersin nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersin menor representatividad. Hasta el momento, hemos estudiado los valores centrales de la distribucin, pero tambin es importante conocer si los valores en general estn cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersin.

Rango Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribucin. Lo denotaremos como R. Realmente no es una medida muy significativa en la mayora de los casos, pero indudablemente es muy fcil de calcular. Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media.

Concepto de desviacin Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La denotaremos por di. No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviacin, por lo que precisaremos una medida que resuma dicha informacin. La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solucin es mala pues como veremos siempre va a ser 0. Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas. Para resolver este problema, tenemos dos caminos: Tomar el valor absoluto de las desviaciones. Desviacin media. Elevar al cuadrado las desviaciones. Varianza.

Desviacin Media Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm. 2009 | Ing. Jess Antonio Vilchis Jurez. 117

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Varianza Es la media de los cuadrados de las desviaciones, y la denotaremos por

o tambin por

Aunque tambin es posible calcularla como:

Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm2.

Desviacin Tpica Es la raz cuadrada de la varianza, se denota por Sx.

Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que, como veremos cuando estudiemos el tema de estimacin estadstica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente.

2009

Ing. Jess Antonio Vilchis Jurez.

118

ANLISIS ESTADSTICO CON SPSS Cuasi-Varianza

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Es una medida de dispersin, cuya nica diferencia con la varianza es que dividimos por N-1, la representaremos por

O y la calcularemos de la siguiente forma:

Cuasi-Desviacin tpica La raz cuadrada de la cuasivarianza y la denotaremos por SN1.

Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadsticos se vean a su vez modificados. Adems, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersin. Pues no es posible comparar unidades de distinto tipo. Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida.

Coeficiente de Variacin Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V.

2009

Ing. Jess Antonio Vilchis Jurez.

119

ANLISIS ESTADSTICO CON SPSS Ejemplo

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Veamos, por ltimo, un ejemplo de cmo se calculan todas estas medidas.

. . =

, = , % ,

Medidas de Localizacin: Cuartiles, Deciles y Percentiles. Las Medidas de Localizacin son tiles para encontrar determinados valores importantes, para una "clasificacin" de los elementos de la muestra o poblacin. Las medidas de localizacin dividen la distribucin en partes iguales, sirven para clasificar a un individuo o elemento dentro de una determinada poblacin o muestra. As en Psicologa los resultados de los test o pruebas que realizan a un determinado individuo, sirve para clasificar a dicho sujeto en una determinada categora en funcin de la 53-1-u- puntuacin obtenida. Tenemos las siguientes Medidas de Localizacin: Cuartiles. Deciles. Percentiles.

2009

Ing. Jess Antonio Vilchis Jurez.

120

ANLISIS ESTADSTICO CON SPSS Cuartiles

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Medida de localizacin que divide la poblacin o muestra en cuatro partes iguales. Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin. Q2= Valor de la variable que deja a la izquierda el 50% de la distribucin = mediana. Q3= Valor de la variable que deja a la izquierda el 75% de la distribucin. Al igual que ocurre con el clculo de la mediana, el clculo de estos estadsticos, depende del tipo de variable. 1. Caso I: Variable cuantitativa discreta: En este caso, tendremos que observar el tamao de la muestra: N y para calcular Q1 o Q3 procederemos como si tuvisemos que calcular la mediana de la correspondiente mitad de la muestra. 2. Caso II: Variable cuantitativa continua: En este caso, el clculo es ms simple:, sea la distribucin que sigue: [Li-2 -- Li-1) ni-1 Ni-1 [Li-1 -- Li) ni Ni Intervalo donde se encuentra el cuartil correspondiente: Siendo el intervalo inferior donde se encuentra el Cuartil correspondiente:

Cuartil 1: Y

Cuartil 3:

Deciles Medida de localizacin que divide la poblacin o muestra en 10 partes iguales No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables continuas. dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucin.

2009

Ing. Jess Antonio Vilchis Jurez.

121

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

[Li-2 -- Li-1) ni-1 Ni-1 [Li-1 -- Li) ni Ni Intervalo donde se encuentra el Decil correspondiente:

k = 1 .. 9

Percentiles: Medida de localizacin que divide la poblacin o muestra en 100 partes iguales No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables continuas. pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucin. [Li-2 -- Li-1) [Li-2 -- Li-1) ni-1 Ni-1 [Li-1 -- Li) ni Ni Intervalo donde se encuentra el Percentil correspondiente:

k=1 .. 99

EJEMPLO: Como se puede observar, la forma de calcular estas medidas es muy similar a la del clculo de la mediana. Veamos el clculo de algunas de estas medidas en el ejemplo que estamos estudiando. Vamos a calcular Q1,Q3, d3, y p45 Li-1 45 55 65 75 85 2009 | Li 55 65 75 85 95 Ing. Jess Antonio Vilchis Jurez. ni 6 10 19 11 4 Ni 6 16 35 46 50 122

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Clculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25% de N=50, corresponde al 2 intervalo.(50/4=12.5) = + = ,

Anlogamente, calculemos Q3: Buscamos ahora en la misma columna el correspondiente al 75 % de N que en este caso es el 4 intervalo (3.50/4=37.5) = + = , Veamos ahora el decil 3. (corresponde al 30% 3 50 / 10 = 15) sera el 2 intervalo. = + = Por ltimo, veamos el percentil 45 (4550/100 = 22.5) Corresponde al intervalo 3. = + = ,

Algunas medidas de Dispersin asociadas Una vez estudiadas las medidas de localizacin surgen dos nuevas medidas de dispersin, que son: Recorrido intercuartlico:

Semirecorrido intercuartlico:

Recorrido interdeclico:

Recorrido intercentilico:

2009

Ing. Jess Antonio Vilchis Jurez.

123

ANLISIS ESTADSTICO CON SPSS Medidas de la Simetra:

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Las Medidas de la Simetra sirven para ver si la distribucin tiene el mismo comportamiento por encima y por debajo de los valores centrales. Las medidas de la asimetra, al igual que la curtosis, van a ser medidas de la forma de la distribucin, es frecuente que los valores de una distribucin tiendan a ser similares a ambos lados de las medidas de centralizacin. La simetra es importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable. As < 0 Asimetra Negativa o por la Izquierda

As = 0

Simtrica

As > 0

Asimetra Positiva o por la Derecha

Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios: 2009 | Ing. Jess Antonio Vilchis Jurez. 124

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Comparando la Media y la Moda. Comparando los valores de la variable con la media.

Comparando la Media y la Moda: Si la diferencia

es positiva, diremos que hay asimetra positiva o a la derecha, en el caso de que sea negativa diremos que hay asimetra negativa o a la izquierda. No obstante, esta medida es poco operativa al no ser una medida relativa, ya que esta influida por la unidad en que se mida la variable, por lo que se define el coeficiente de Asimetra como:

Esta medida es muy fcil de calcular, pero menos precisa que el coeficiente de asimetra de Pearson. El coeficiente de asimetra de Pearson, se basa en la comparacin con la media de todos los valores de la variable, as que es una medida que se basar en las diferencias, como vimos en el caso de la dispersin si medimos la media de esas desviaciones sera nula, si las elevamos al cuadrado, seran siempre positivas por lo que tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo. Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de su desviacin tpica. Con lo que resulta la siguiente expresin:

2009

Ing. Jess Antonio Vilchis Jurez.

125

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Medidas de la Curtosis o Apuntamiento: La curtosis (k) es una medida del apuntamiento, que nos indicar si la distribucin es muy apuntada o poco apuntada. K < 0 Curtosis Negativa Leptocrtica

K=0

Curtosis Nula

K>0

Curtosis Positiva

2009

Ing. Jess Antonio Vilchis Jurez.

126

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Como podemos observar, el coeficiente de curtosis nos mide el grado de apuntamiento de la distribucin. Este coeficiente lo vamos a denotar por K y se calcula segn la siguiente expresin:

Veamos, por ltimo, el clculo de estos dos ltimos coeficientes en el ejemplo que estamos estudiando.

final de captulo: Construccin y Anlisis Univariante de Datos

2009

Ing. Jess Antonio Vilchis Jurez.

127

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Estudio Bivariante - Correlacin y Asociacin

Utilidad de Una Base de Datos para la Empresa Una base de datos es una espada de doble filo: Por un lado, es una herramienta fundamental para la defensa de los intereses de la Empresa. Pero, por otro, si esta arma no estuviese adecuadamente "preparada", puede ser un "boomerang", cuyos efectos pueden llegar a volverse contra nosotros. Por ejemplo, si una base de datos no estuviese preparada para darnos el servicio que de ella se espera, y tuviese errores, puede ser absolutamente funesta para nuestros intereses. Por ello, es completamente necesario que se lleve a cabo una adecuada exploracin de la base de datos, con el fin de poder detectar posibles anomalas o irregularidades en la misma que pudieran alterar el buen comportamiento o rendimiento de la base de datos. Se supone que la Estadstica descansa fundamentalmente sobre la suposicin de que la distribucin de los valores de una variable se asemeja de modo razonable a la de la distribucin normal, esto es, que la curva de valores de la variable se parece a una curva campaniforme, gaussiana. Asimismo, se supone que los valores de una variable se distribuyen de modo aleatorio, es decir, que no siguen ningn patrn predeterminado. Esto no siempre es cierto, ya que en ocasiones hay individuos que reaccionan de forma extraa, atpica o inesperada a un factor dado. Estos valores atpicos provocan problemas que pueden llegar a ser graves. Por otro lado, no siempre se consigue una respuesta vlida a nuestras preguntas. En tales casos, se dice que estamos ante un caso con valor perdido. Otro problema grave que puede ocurrir en una distribucin es la falta de homogeneidad entre la dispersin de los grupos de valores respecto de una determinada variable de agrupacin. Este problema, llamado heterogeneidad de las varianzas, (o heterocedasticidad) se da cuando los grupos de valores de una misma variable no pueden ser considerados como procedentes de la misma distribucin.

Esquema de los Estudios Estadsticos En este caso, se va a aplicar este diseo de investigacin a un deporte llamado spinning.

2009

Ing. Jess Antonio Vilchis Jurez.

128

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Podemos realizar estudios estadsticos de los datos de los sujetos que practican spinning a travs de los siguientes procedimientos estadsticos (en este caso, se va seguir este estricto orden): 1. Estudio Bivariante: Variable Pulsaciones (por ej.) y Edad (por ej.) como variables continuas, es decir, mtricas. CORRELACIONES 2. Estudio Bivariante: Variable Pulsaciones (por ej.) e IMC (por ej.) como variables continuas, es decir, mtricas. CORRELACIONES 3. Estudio Bivariante: Variable Pulsaciones (por ej.) y Peso (por ej.) como variables continuas, es decir, mtricas. CORRELACIONES 4. Estudio Bivariante: Variable Pulsaciones (por ej.) y Estatura (por ej.) como variables continuas, es decir, mtricas. CORRELACIONES 5. Estudio Bivariante: Variable Pulsaciones (por ej.) como variable continua, es decir, mtrica, y Sexo (por ej.) como categrica. CORRELACIONES 6. Exploracin del Fichero: Variable Pulsaciones (por ej.), Edad, Estatura (por ej.) como variables dependientes (que sern continuas, es decir, mtricas), frente a Sexo (por ej.) como variable independiente (que ser categrica). EXPLORAR, CON ESTADISTICOS, GRAFICOS CON PRUEBAS DE NORMALIDAD 7. Anlisis de la Asociacin (Crosstabs): Variable Pulsaciones (por ej.), Edad, Estatura (por ej.) como variables dependientes (que sern continuas, es decir, mtricas), frente a Sexo (por ej.) como variable independiente (que ser categrica).

Estudio Bivariante con Variables MTRICAS Pulsaciones y Edad En este caso, se va a realizar un estudio Bivariante, con la variable pulsaciones (por ej.) y la variable edad (por ej.) como variables continuas, es decir, mtricas. 2009 | Ing. Jess Antonio Vilchis Jurez. 129

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Ejemplo. para analizar el procedimiento Correlaciones Bivariadas se utiliza el fichero de datos HEALTH.FITNESS.sav. Es un fichero de datos que pretende conocer cules son los factores determinantes del rendimiento de un grupo de alumnos que practica Spinning (aero-bici).

Obtencin de Correlaciones Bivariadas Seleccionar en la barra de men: Archivo/Abrir Localizar el fichero de datos HEALTH.FITNESS.sav Seleccionar en la barra de men: Analizar/Correlaciones/Bivariadas

Llamada del Procedimiento Bivariate Aparece el cuadro de dilogo Correlaciones Bivariadas.

Llamada del Procedimiento Bivariate 2009 | Ing. Jess Antonio Vilchis Jurez. 130

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Las especificaciones mnimas son dos o ms variables numricas continuas. Las variables numricas del fichero de datos aparecen en la lista de variables fuente. Se debe seleccionar dos o ms variables para el anlisis. Para obtener los coeficientes de correlacin de Pearson por defecto, utilizando los tests de significacin de dos colas, pulsar en el botn " ACEPTAR". Si todos los casos tienen un valor perdido para una o ambas de un par de variables dadas, o si todos tienen el mismo valor para una variable, no se puede calcular el coeficiente mencionado y se muestra en su lugar un punto en el Editor de Datos. Se muestra el cuadro de dilogo Correlaciones Bivariadas, Bivariante.

Llamada del Procedimiento Bivariante Seleccionar las variables continuas edad y pulsacio de la lista de variables fuente. Pulsar el botn para trasladarlas a la lista de variables destino.

Coeficientes de correlacin. Al menos, se debe seleccionar un tipo de coeficiente de correlacin. Para variables cuantitativas distribuidas normalmente, se debe elegir el coeficiente de correlacin de Pearson. Si los datos no estn distribuidos normalmente, o tienen categoras ordenadas, elegir los estadsticos Tau-b de Kendall o Spearman, que miden la asociacin entre los rdenes de los rangos. Todos estos coeficientes de correlacin oscilan en valor desde 1 (una relacin negativa perfecta entre las variables) y +1 (una relacin positiva perfecta). Un valor de 0 indica la inexistencia de relacin lineal. Cuando se interpreten los resultados, se debe ser cuidadoso en no extraer ninguna conclusin de causa y efecto debido a una correlacin significativa. Adems, el valor 0 del coeficiente de correlacin no indica la inexistencia de 2009 | Ing. Jess Antonio Vilchis Jurez. 131

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

relacin, sino slo la inexistencia de relacin lineal, lo que no impide que haya algn otro tipo de relacin. El cuadro Coeficientes de correlacin permite elegir una o ms de los siguientes opciones: Correlacin de Pearson. Medida de asociacin lineal entre dos variables. Los valores del coeficiente de correlacin oscilan de -1 a 1. El valor absoluto del coeficiente de correlacin indica el grado de la relacin lineal entre las variables, con los valores absolutos grandes, indicando las relaciones ms fuertes. El signo del coeficiente indica la direccin de la relacin. Esta es la configuracin por defecto de este comando. Muestra una matriz cuadrado de correlaciones. La correlacin de una variable consigo misma es siempre 1'0000 y se la puede encontrar en la diagonal de la matriz. Cada variable aparece dos veces en la matriz con coeficientes idnticos, y los tringulos superior e inferior de la matriz son imgenes espejo. Tau-b de Kendall. Medida no paramtrica de asociacin para variables ordinales, cuyos valores posibles oscilan de -1 a 1. El valor absoluto de tau-b indica la fuerza de la relacin entre las variables, con los valores absolutos mayores indicando las relaciones ms fuertes. Tau b puede obtenerse slo un valor de -1 o +1 para tablas cuadradas. El signo del coeficiente indica la direccin de la relacin. Este coeficiente muestra un coeficiente de rdenes de rangos. Muestra la correlacin de cada variable con todas las dems variables en una matriz triangular con valores en su parte inferior. No se muestran la correlacin de una variable consigo misma (la diagonal) y los coeficientes redundantes. Correlacin de Spearman6. El coeficiente de Correlacin de Spearman es una versin no paramtrica del coeficiente de correlacin de Pearson. Este estadstico es adecuado para los datos ordinales, o los de intervalo, que no satisfagan el supuesto de normalidad. La correlacin de Spearman se basa en los rangos de los datos en lugar de los valores reales. Los valores del coeficiente oscilan de -1 a +1. El valor absoluto de la r de Spearman indica la fuerza de la relacin entre las variables, con los valores absolutos mayores indicando relaciones ms fuertes. El signo del coeficiente indica la direccin de la relacin. Seleccionar del Cuadro Coeficientes de coeficientes de correlacin. Correlacin los tres

Tests de significacin. Al realizar la prueba del procedimiento "Correlaciones Bivariadas" se debe elegir siempre una significacin. La significacin de una prueba estadstica se compara con el valor 0'05. Si el valor de la significacin
6

Al final de esta seccin se presenta un ejemplo de clculo del estadstico (rho) de Spearman.

2009

Ing. Jess Antonio Vilchis Jurez.

132

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

de la prueba es menor que este valor, se considera que la prueba es significativa y se rechaza la hiptesis nula de la ausencia de correlacin entre las variables intervinientes. El procedimiento "Correlaciones Bivariadas" permite elegir uno o ms de los siguientes: Bilateral. Este test es apropiado cuando no es posible determinar el sentido de la relacin de antemano, como sucede frecuentemente en el caso del anlisis exploratorio de datos. Es la opcin por defecto. Unilateral. Este test es apropiado cuando el sentido de la relacin entre las dos variables puede especificarse antes del anlisis. En el cuadro Prueba de significacin, dejar la opcin por defecto Bilateral

Llamada del Procedimiento Bivariate

Resaltar las correlaciones significativas. Los coeficientes de correlacin significativos al nivel del 0'05 son identificados con un solo asterisco, los significativos al nivel de 0'01 son identificados con dos asteriscos. Esta opcin aparece seleccionada por defecto. Dejar esta opcin activada. Pulsar el botn Opciones para llamar al cuadro de dilogo correspondiente. En el cuadro de dilogo "Opciones..." se definen los estadsticos a visualizar y el mtodo de tratamiento de los valores perdidos.

2009

Ing. Jess Antonio Vilchis Jurez.

133

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Stadsticos. Para las correlaciones de Pearson se pueden elegir las siguientes opciones: Medias y desviaciones estndar. Mostrado para cada variable. Muestra la media, la desviacin tpica y el nmero de casos no perdidos para cada variable. El nmero de casos con valores perdidos no se muestra. Los valores perdidos se manejan sobre una base variable-por-variable, independientemente de la configuracin de los valores perdidos. Desviaciones de productos cruzados y covarianzas. Mostrado para cada par de variables. El producto cruzado de las desviaciones es igual a la suma de los productos de las variables corregidas por la media. Este es el numerador del coeficiente de correlacin de Pearson. La covarianza es una medida no estandarizada de la relacin entre dos variables, igual a la desviacin de los productos cruzados dividida por (N-1). Seleccionar los dos estadsticos disponibles; es decir, pulsar en las dos casillas del cuadro "Estadsticos" del Cuadro de Dilogo "Correlaciones bivariadas: Opciones". Valores perdidos. Se puede elegir una de las siguientes alternativas: Excluir casos segn pareja. Se excluye del anlisis los casos con valores perdidos para una o ambas de un par de variables. Como cada coeficiente se basa en todos los casos que tengan cdigos vlidos para cualquier caso particular de variables, se utiliza en todos los clculos la mxima informacin disponible. Esto puede resultar en un conjunto de coeficientes basados en un nmero variable de casos. Excluir casos segn lista. Excluye del anlisis los casos con valores perdidos para cualquier variable de la lista de variables.

Llamada del Procedimiento Bivariante/Opciones 2009 | Ing. Jess Antonio Vilchis Jurez. 134

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Seleccionar del cuadro Estadsticos los dos estadsticos disponibles. Del cuadro Valores perdidos dejar la opcin Excluir casos segn lista. Pulsar el botn Continuar.

Llamada del Procedimiento Bivariate/Options Vuelve a aparecer el cuadro de dilogo Correlaciones bivariadas.

Llamada del Procedimiento Bivariate Pulsar el botn Acetar para ejecutar el procedimiento.

Salidas del Procedimiento de Correlaciones Bivariadas Tras la ejecucin del procedimiento "Correlaciones bivariadas" configurado en el apartado anterior, SPSS presenta en la ventana del Navegador de Resultados las salidas correspondientes.

2009

Ing. Jess Antonio Vilchis Jurez.

135

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Tabla de Estadsticos Descriptivos.


Estadsticos descriptivos Media 32,81 143,19 Desviacin tpica 7,287 24,563 N 16 16

edad pulsaciones

Tabla de Correlaciones Paramtricas.


Correlaciones edad Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza pulsaciones Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza a. N por lista = 16 796,438 53,096 -,180 ,504 -484,438 -32,296 9050,438 603,363
a

edad 1

pulsaciones -,180 ,504 -484,438 -32,296 1

Tabla de Correlaciones No Paramtricas.


Correlaciones Tau_b de Kendall edad
a

edad Coeficiente de correlacin Sig. (bilateral) pulsaciones Coeficiente de correlacin Sig. (bilateral) Rho de Spearman edad Coeficiente de correlacin Sig. (bilateral) pulsaciones Coeficiente de correlacin Sig. (bilateral) a. N segn lista = 16 1,000 . -,278 ,145 1,000 . -,392 ,134

pulsaciones -,278 ,145 1,000 . -,392 ,134 1,000 .

Interpretacin de las Salidas de Correlaciones Bivariadas A la luz de la salidas del procedimiento "Correlaciones Bivariadas se puede deducir que la correlacin entre las variables "pulsacio" y "edad" no es significativa. Analizando tanto la tabla de correlaciones paramtricas como la tabla de correlaciones no paramtricas arribamos a la misma conclusin, ya que el nivel de significacin del estadstico Sig. (bilateral) es mayor a 0.05.

2009

Ing. Jess Antonio Vilchis Jurez.

136

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Estudio Bivariante: Variables Continuas. Ej. Variables Pulsaciones e IMC. Ejemplo. Seguiremos analizando el fichero de datos HEALTH.FITNESS.sav.

Obtencin de Correlaciones Bivariadas Seleccionar en la barra de men: Analizar/Correlaciones/Bivariadas

Llamada del Procedimiento Bivariante Aparece el cuadro de dilogo Correlaciones Bivariadas

Llamada del Procedimiento Bivariate 2009 | Ing. Jess Antonio Vilchis Jurez. 137

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Se muestra el cuadro de dilogo Correlaciones bivariadas.

Llamada del Procedimiento Bivariate Seleccionar las variables continuas pulsacio e imc de la lista de variables fuente. Pulsar el botn para trasladarlas a la lista de variables destino. Seleccionar del Cuadro Coeficientes de correlacin los tres coeficientes de correlacin. En el cuadro Prueba de significacin dejar la opcin por defecto Bilateral Se muestra el cuadro de dilogo Correlaciones bivariadas.

Llamada del Procedimiento Bivariante 2009 | Ing. Jess Antonio Vilchis Jurez. 138

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Resaltar las correlaciones significativas. Dejar esta opcin activada. Pulsar el botn Opciones para llamar el cuadro de dilogo correspondiente. En el cuadro de dilogo "Opciones..." se definen los estadsticos a visualizar y el mtodo de tratamiento de los valores perdidos. Seleccionar los dos estadsticos disponibles; es decir, pulsar en las dos casillas del cuadro "Estadsticos" del Cuadro de Dilogo "Correlaciones bivariadas: Opciones".

Llamada del Procedimiento Bivariate/Options Seleccionar del cuadro Estadsticos los dos estadsticos disponibles. Del cuadro Valores perdidos dejar la opcin Excluir casos segn lista. Pulsar el botn Continuar.

Llamada del Procedimiento Bivariante/Opciones Vuelve a aparecer el cuadro de dilogo Correlaciones bivariadas

2009

Ing. Jess Antonio Vilchis Jurez.

139

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Llamada del Procedimiento Bivariante Pulsar el botn Aceptar para ejecutar el procedimiento.

Salidas del Procedimiento de Correlaciones Bivariadas Tras la ejecucin del procedimiento "Correlaciones bivariadas" configurado en el apartado anterior, SPSS presenta en la ventana del "Navegador de Resultados las salidas correspondientes. Tabla de Estadsticos Descriptivos.
Estadsticos descriptivos Media pulsaciones imc 143,19 21,66031 Desviacin tpica 24,563 6,235159 N 16 16

Tabla de Correlaciones Paramtricas.


Correlaciones pulsaciones Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza imc Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza a. N por lista = 16 9050,438 603,363 -,205 ,447 -470,446 -31,363 583,158 38,877
a

pulsaciones 1

imc -,205 ,447 -470,446 -31,363 1

2009

Ing. Jess Antonio Vilchis Jurez.

140

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Tabla de Correlaciones No Paramtricas.


Correlaciones Tau_b de Kendall pulsaciones
a

pulsaciones Coeficiente de correlacin Sig. (bilateral) imc Coeficiente de correlacin Sig. (bilateral) Rho de Spearman pulsaciones Coeficiente de correlacin Sig. (bilateral) imc Coeficiente de correlacin Sig. (bilateral) a. N segn lista = 16 1,000 . -,172 ,363 1,000 . -,256 ,338

imc -,172 ,363 1,000 . -,256 ,338 1,000 .

Interpretacin de las Salidas de Correlaciones Bivariadas Concluimos que la correlacin existente entre las variables "pulsacio" e "imc" carece de significacin estadstica (sig >0.05).Tanto la tabla de correlaciones paramtricas como la tabla de correlaciones no paramtricas nos muestran la ausencia de significacin entre las correlaciones de estas variables.

Estudio Bivariante: Variables Continuas: Ej. Variables Pulsaciones y Peso. Ejemplo. Seguiremos analizando el fichero de datos HEALTH.FITNESS.sav.

Obtencin de Correlaciones Bivariadas Seleccionar en la barra de men: Analizar/Correlaciones/Bivariadas

Llamada del Procedimiento Bivariante 2009 | Ing. Jess Antonio Vilchis Jurez. 141

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Aparece el cuadro de dilogo Correlaciones Bivariadas.

Llamada del Procedimiento Bivariate Se muestra el cuadro de dilogo Correlaciones bivariadas. Seleccionar las variables continuas pulsacio y peso de la lista de variables fuente. Pulsar el botn para trasladarlas a la lista de variables destino. Seleccionar del Cuadro Coeficientes de correlacin los tres coeficientes de correlacin. En el cuadro Prueba de significacin dejar la opcin por defecto Bilateral Se muestra el cuadro de dilogo Bivariate Correlations.

Llamada del Procedimiento Bivariante 2009 | Ing. Jess Antonio Vilchis Jurez. 142

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Resaltar las correlaciones significativas Dejar esta opcin activada. Pulsar el botn Opciones para llamar el cuadro de dilogo correspondiente. En el cuadro de dilogo "Opciones..." se definen los estadsticos a visualizar y el mtodo de tratamiento de los valores perdidos.

Llamada del procedimiento Bivariante/Opciones Seleccionar los dos estadsticos disponibles; es decir, pulsar en las dos casillas del cuadro "Estadsticos" del Cuadro de Dilogo "Correlaciones bivariadas: Opciones". Del cuadro Valores perdidos dejar la opcin Excluir casos segn lista.

Llamada del Procedimiento Bivariante/Opciones Pulsar el botn Continuar. Vuelve a aparecer el cuadro de dilogo Correlaciones bivariadas.

2009

Ing. Jess Antonio Vilchis Jurez.

143

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Llamada del Procedimiento Bivariante Pulsar el botn Aceptar para ejecutar el procedimiento.

Salidas del Procedimiento de Correlaciones Bivariadas Tras la ejecucin del procedimiento "Correlaciones bivariadas" configurado en el apartado anterior, SPSS presenta en la ventana del "Navegador de Resultados las salidas correspondientes. Tabla de Estadsticos Descriptivos.
Estadsticos descriptivos Media pulsaciones peso 142,33 70,87 Desviacin tpica 25,178 11,243 N 15 15

Tabla de Correlaciones Paramtricas.


Correlaciones pulsaciones Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza peso Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza a. N por lista = 15 8875,333 633,952 -,262 ,345 -1039,333 -74,238 1769,733 126,410
a

pulsaciones 1

peso -,262 ,345 -1039,333 -74,238 1

2009

Ing. Jess Antonio Vilchis Jurez.

144

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Tabla de Correlaciones No Paramtricas.


Correlaciones Tau_b de Kendall pulsaciones
a

pulsaciones Coeficiente de correlacin Sig. (bilateral) peso Coeficiente de correlacin Sig. (bilateral) Rho de Spearman pulsaciones Coeficiente de correlacin Sig. (bilateral) peso Coeficiente de correlacin Sig. (bilateral) a. N segn lista = 15 1,000 . -,350 ,079 1,000 . -,385 ,156

peso -,350 ,079 1,000 . -,385 ,156 1,000 .

Interpretacin de las Salidas de Correlaciones Bivariadas Concluimos que la correlacin existente entre las variables "pulsacio" y "peso" carece de significacin estadstica (sig >0.05). Tanto la tabla de correlaciones paramtricas como la tabla de correlaciones no paramtricas nos muestran la ausencia de significacin estadstica entre las correlaciones de estas variables.

Estudio Bivariante: Variables Continuas: Ej. Variables Pulsaciones y Estatura. Ejemplo. para analizar el procedimiento Correlaciones Bivariadas se utiliza el fichero de datos HEALTH.SPINNING.sav. Es un fichero de datos que pretende conocer cules son los factores determinantes del rendimiento de un grupo de alumnos que practica Spinning (aero-bici).

Obtencin de Correlaciones Bivariadas Seleccionar en la barra de men: Analizar/Correlaciones/Bivariadas.

2009

Ing. Jess Antonio Vilchis Jurez.

145

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Llamada del Procedimiento Bivariate Aparece el cuadro de dilogo Correlaciones Bivariadas.

Llamada del Procedimiento Bivariante Se muestra el cuadro de dilogo Correlaciones bivariadas.

2009

Ing. Jess Antonio Vilchis Jurez.

146

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Seleccionar las variables continuas estatura y pulsacio de la lista de variables fuente. Pulsar el botn para trasladarlas a la lista de variables destino.

Llamada del procedimiento bivariante. Seleccionar del Cuadro Coeficientes de correlacin los tres coeficientes de correlacin. En el cuadro prueba de significacin dejar la opcin por defecto bilateral Se muestra el cuadro de dilogo Bivariate Correlations.

Llamada del procedimiento Bivariante.

2009

Ing. Jess Antonio Vilchis Jurez.

147

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Resaltar las correlaciones significativas. Dejar esta opcin activada. Pulsar el botn Opciones para llamar el cuadro de dilogo correspondiente. En el cuadro de dilogo "Opciones..." se definen los estadsticos a visualizar y el mtodo de tratamiento de los valores perdidos. Seleccionar los dos estadsticos disponibles; es decir, pulsar en las dos casillas del cuadro "Estadsticos" del Cuadro de Dilogo "Correlaciones bivariadas: Opciones".

Llamada del Procedimiento Bivariante/Opciones Seleccionar del cuadro Estadsticos los dos estadsticos disponibles. Del cuadro Valores perdidos dejar la opcin Excluir casos segn lista. Pulsar el botn Continuar. Vuelve a aparecer el cuadro de dilogo Bivariate Correlations

Llamada del Procedimiento Bivariante 2009 | Ing. Jess Antonio Vilchis Jurez. 148

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Pulsar el botn Aceptar para ejecutar el procedimiento.

Salidas del Procedimiento de Correlaciones Bivariadas Tras la ejecucin del procedimiento "Correlaciones bivariadas" configurado en el apartado anterior, SPSS presenta en la ventana del "Navegador de Resultados las salidas correspondientes. Tabla de Estadsticos Descriptivos.
Estadsticos descriptivos Media 1,7230 140,22 Desviacin tpica ,06899 24,171 N 27 27

estatura pulsaciones

Tabla de Correlaciones Paramtricas


Correlaciones estatura Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza pulsaciones Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza a N por lista = 27 ,124 ,005 -,169 ,400 -7,318 -,281 15190,667 584,256
a

estatura 1

pulsaciones -,169 ,400 -7,318 -,281 1

Tabla de Correlaciones No Paramtricas


Correlaciones Tau_b de Kendall estatura
a

estatura Coeficiente de correlacin Sig. (bilateral) pulsaciones Coeficiente de correlacin Sig. (bilateral) Rho de Spearman estatura Coeficiente de correlacin Sig. (bilateral) pulsaciones Coeficiente de correlacin Sig. (bilateral) a N segn lista = 27 1,000 . -,130 ,355 1,000 . -,198 ,322

pulsaciones -,130 ,355 1,000 . -,198 ,322 1,000 .

2009

Ing. Jess Antonio Vilchis Jurez.

149

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Interpretacin de las Salidas de Correlaciones Bivariadas Concluimos que la correlacin existente entre las variables "pulsacio" y "estatura" carece de significacin estadstica (sig >0.05).Tanto la tabla de correlaciones paramtricas como la tabla de correlaciones no paramtricas nos muestran la ausencia de significacin estadstica entre las correlaciones de estas variables.

Estudio Bivariante: V. Continuas: Rendimiento y Pulsaciones Ejemplo. Seguiremos HEALTH.SPINNING.sav. analizando el fichero de datos

Seleccionar en la barra de men: Analizar/Correlaciones/Bivariadas.

Llamada del Procedimiento Bivariante Aparece el cuadro de dilogo Correlaciones Bivariadas. Se muestra el cuadro de dilogo Bivariate Correlations

2009

Ing. Jess Antonio Vilchis Jurez.

150

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Llamada del Procedimiento Bivariante Seleccionar las variables continuas pulsacio y rendimie de la lista de variables fuente. Pulsar el botn para trasladarlas a la lista de variables destino.

Llamada del Procedimiento Bivariante Seleccionar del Cuadro Coeficientes de correlacin los tres coeficientes de correlacin. En el cuadro prueba de significacin dejar la opcin por defecto Bilateral Pulsar el botn Opciones para llamar el cuadro de dilogo correspondiente.

2009

Ing. Jess Antonio Vilchis Jurez.

151

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Llamada del Procedimiento Bivariante/Opciones En el cuadro de dilogo "Options..." se definen los estadsticos a visualizar y el mtodo de tratamiento de los valores perdidos. Seleccionar del cuadro Estadsticos los dos estadsticos disponibles. Del cuadro Valores perdidos dejar la opcin Excluir casos segn lista.

Llamada del Procedimiento Bivariante/Opciones Pulsar el botn Continuar. Vuelve a aparecer el cuadro de dilogo Correlaciones bivariadas.

Llamada del Procedimiento Bivariante 2009 | Ing. Jess Antonio Vilchis Jurez. 152

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Pulsar el botn Aceptar para ejecutar el procedimiento.

Salidas del Procedimiento de Correlaciones Bivariadas Tras la ejecucin del procedimiento "Correlaciones bivariadas" configurado en el apartado anterior, SPSS presenta en la ventana del "Navegador de Resultados las salidas correspondientes. Tabla de Estadsticos Descriptivos.
Estadsticos descriptivos Media 140,22 76,426296 % Desviacin tpica 24,171 12,0847479% N 27 27

pulsaciones rendimiento

Tabla de Correlaciones Paramtricas.


Correlaciones pulsaciones Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza rendimiento Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza 15190,667 584,256 ,636** ,000 4828,392 3797,069 146,041
a

pulsaciones 1

rendimiento ,636** ,000 4828,392 185,707 1

185,707 ** La correlacin es significativa al nivel 0,01 (bilateral). a N por lista = 27

Tabla de Correlaciones No Paramtricas.


Correlaciones Tau_b de Kendall pulsaciones
a

pulsaciones Coeficiente de correlacin Sig. (bilateral) rendimiento Coeficiente de correlacin Sig. (bilateral) Rho de Spearman pulsaciones Coeficiente de correlacin Sig. (bilateral) rendimiento Coeficiente de correlacin Sig. (bilateral) ** La correlacin es significativa al nivel 0,01 (bilateral). a N segn lista = 27 1,000 . ,692** ,000 1,000 . ,733** ,000

rendimiento ,692** ,000 1,000 . ,733** ,000 1,000 .

2009

Ing. Jess Antonio Vilchis Jurez.

153

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Interpretacin de las Salidas de Correlaciones Bivariadas Si observamos las salidas del procedimiento Correlaciones bivariadas se deduce que la correlacin entre las variables "pulsacio" y "rendimi" es bastante elevada (0.961). Sin embargo, cuando analizamos la tabla de correlaciones no paramtricas, la correlacin si bien ha disminuido levemente an sigue siendo alta, siendo 0.848 en el estadstico tau-b de Kendall, y 0.952 en el estadstico rho de Spearman. Todas las correlaciones son significativas al nivel del 0.01.

Exploracin de las Variables del Anlisis de Grupos La Exploracin de las Variables del Anlisis de Grupos es una fase necesaria previo al anlisis de grupos, por tanto, del valor de una variable mtrica (continua) frente a los valores representados por los grupos de una variable cualitativa. A la primera de ellas la llamaremos variable dependiente; a la segunda, variable independiente o factor. En este ejemplo, se contempla el anlisis de las Variables Pulsaciones, Edad, Estatura (por ejemplo) como variables dependiente (continuas, es decir, mtricas), frente a Sexo (por ejemplo) como variable independiente (categrica). EXPLORAR, con las opciones ESTADSTICOS y GRFICA DE NORMALIDAD CON PRUEBAS

Exploracin de las Variables del Anlisis de Grupos 2009 | Ing. Jess Antonio Vilchis Jurez. 154

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Exploracin de las Variables del Anlisis de Grupos

Exploracin de las Variables del Anlisis de Grupos

Salidas de la Exploracin de las Variables del Anlisis de Grupos Tras la ejecucin del procedimiento "Analizar/Estadsticos descriptivos/Explorar" configurado en el apartado anterior, SPSS presenta en la ventana del " Navegador de Resultados las salidas correspondientes.
Resumen del procesamiento de los casos Casos Vlidos rendimiento sexo H M N 15 16 Porcentaje 100,0% 100,0% N 0 0 Perdidos Porcentaje ,0% ,0% N 15 16 Total Porcentaje 100,0% 100,0%

Exploracin de las Variables del Anlisis de Grupos 2009 | Ing. Jess Antonio Vilchis Jurez. 155

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC


Descriptivos

rendimiento

sexo H

Media Intervalo de confianza para la media al 95% Lmite inferior Lmite superior Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis

Estadstico 60,730667 % 42,620119 % 78,841214 % 62,176852 % 72,730000 % 1069,513 32,7034150 % ,0000% 95,4300% 95,4300% 22,2300% -1,356 ,404 72,034375 % 59,587821 % 84,480929 % 74,482639 % 73,725000 % 545,592 23,3579140 % ,0000% 100,0000% 100,0000% 22,8675% -1,994 5,791

Error tp. 8,4439854 %

,580 1,121 5,8394785 %

Media Intervalo de confianza para la media al 95% Lmite inferior Lmite superior Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis

,564 1,091

Exploracin de las Variables del Anlisis de Grupos


Pruebas de normalidad Kolmogorov-Smirnov rendimiento sexo H M Estadstico ,294 ,249 gl 15 16
a

Shapiro-Wilk Sig. ,001 ,009 Estadstico ,747 ,816 gl 15 16 Sig. ,001 ,004

a Correccin de la significacin de Lilliefors

Exploracin de las Variables del Anlisis de Grupos

2009

Ing. Jess Antonio Vilchis Jurez.

156

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Prueba de homogeneidad de la varianza Estadstico de Levene 1,832 ,543

gl1 1 1

gl2 29 29

rendimiento

Basndose en la media Basndose en la mediana. Basndose en la mediana y con gl corregido Basndose en la media recortada

Sig. ,186 ,467

,543

24,674

,468

1,523

29

,227

Exploracin de las Variables del Anlisis de Grupos Rendimiento (Grfico de tallo y hojas)
rendimiento Stem-and-Leaf Plot for sexo= H Frequency Stem & Leaf (=<0) 044 2234 0245 5

3,00 Extremes 3,00 6 . 4,00 7 . 4,00 8 . 1,00 9 . Stem width: Each leaf:

10,0000 1 case(s)

Rendimiento (Grfico de tallo y hojas)


rendimiento Stem-and-Leaf Plot for sexo= M Frequency Stem & Leaf (=<0) 0 45779 336 069 34 0

1,00 Extremes 1,00 5 . 5,00 6 . 3,00 7 . 3,00 8 . 2,00 9 . 1,00 10 . Stem width: Each leaf:

10,0000 1 case(s)

2009

Ing. Jess Antonio Vilchis Jurez.

157

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Exploracin de las Variables del Anlisis de Grupos

Exploracin de las Variables del Anlisis de Grupos

2009

Ing. Jess Antonio Vilchis Jurez.

158

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Exploracin de las Variables del Anlisis de Grupos

Exploracin de las Variables del Anlisis de Grupos

2009

Ing. Jess Antonio Vilchis Jurez.

159

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Exploracin de las Variables del Anlisis de Grupos

2009

Ing. Jess Antonio Vilchis Jurez.

160

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Interpretacin de las Salidas de la Exploracin del Anlisis de Grupos Si observamos las Salidas de la Exploracin del Anlisis de Grupos, se deduce que las mujeres muestran un mayor rendimiento que los hombres.. Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs7 La Exploracin de las Variables del Anlisis de Grupos es una fase necesaria previo al anlisis de grupos, por Anlisis de la Asociacin de Variables (Cualitativas). En este ejemplo, con los datos de 1.HEALTH.SPINNING.sav, se contempla el anlisis de la Variable peso (como variable de fila), frente a la variable rendimient (como variable de columna). Se utilizarn las variables de capa gym y sexo. Obsrvese que todas y cada una de las variables es categrica.

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs.

Ver captulo siguiente de este mismo documento. | Ing. Jess Antonio Vilchis Jurez. 161

2009

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs.

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs.


Resumen del procesamiento de los casos Casos Perdidos N Porcentaje

N Peso del deportista medido en kgs. * Porcentaje de la capacidad aerbica mxima alcanzada

Vlidos Porcentaje

Total Porcentaje

26

83,9%

16,1%

31

100,0%

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs. 2009 | Ing. Jess Antonio Vilchis Jurez. 162

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Tabla de contingencia Peso del deportista medido en kgs. * Porcentaje de la capacidad aerbica mxima alcanzada Recuento Porcentaje de la capacidad aerbica mxima alcanzada bajo (50,0 a 65,0)% 2 3 0 5 medio (65,1 a 75,0)% 7 1 3 11 alto (75,1 a 100,0)% 10 0 0 10 Total 19 4 3 26

Peso del deportista medido en kgs. Total

normal (45 a75) sobrepeso (76 a 85) obesidad (86 a 95)

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs.

Pruebas de chi-cuadrado Sig. asinttica (bilateral) ,007 ,007 ,060

Chi-cuadrado de Pearson Razn de verosimilitudes Asociacin lineal por lineal N de casos vlidos

Valor a 14,256 14,201 3,551 26

gl 4 4 1

a 7 casillas (77,8%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es ,58.

Anlisis de la Asociacin de Variables (Cualitativas):

Medidas direccionales Error tp. a asint. ,105 ,099 T b aproximad -3,415 -3,415 Sig. aproximada ,001 ,001

Simtrica Peso del deportista medido en kgs. -,344 dependiente Porcentaje de la capacidad aerbica mxima -,510 alcanzada dependiente a Asumiendo la hiptesis alternativa. b Empleando el error tpico asinttico basado en la hiptesis nula.

Ordinal por ordinal

d de Somers

Valor -,411

,139

-3,415

,001

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs.

2009

Ing. Jess Antonio Vilchis Jurez.

163

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs.

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs. 2009 | Ing. Jess Antonio Vilchis Jurez. 164

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs.

Salidas del Anlisis de la Asociacin de Variables (Cualitativas) Tras la ejecucin del procedimiento " Crosstabs", SPSS presenta en la ventana del "Navegador de Resultados las salidas correspondientes.
Resumen del procesamiento de los casos Casos Vlidos N Peso del deportista medido en kgs. * Porcentaje de la capacidad aerbica mxima alcanzada * Gimnacio al que pertenece el deportista Peso del deportista medido en kgs. * Porcentaje de la capacidad aerbica mxima alcanzada * Gnero del deportista Porcentaje N Perdidos Porcentaje N Total Porcentaje

26

83,9%

16,1%

31

100,0%

26

83,9%

16,1%

31

100,0%

Anlisis de la Asociacin de Variables (Cualitativas)

2009

Ing. Jess Antonio Vilchis Jurez.

165

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Peso del deportista medido en kgs. * Porcentaje de la capacidad aerbica mxima alcanzada * Gimnacio al que pertenece el deportista
Tabla de contingencia Recuento Porcentaje de la capacidad aerbica mxima alcanzada bajo medio alto (75,1 (50,0 a (65,1 a a 65,0)% 75,0)% 100,0)% 1 4 3 1 0 2 normal (45 a75) sobrepeso (76 a 85) obesidad (86 a 95) 1 2 0 3 0 2 6 3 1 1 5 0 0 3 7 0 0 7

Gimnacio al que pertenece el deportista Cast

Total 8 1 2 11 11 3 1 15

Peso del deportista medido en kgs.

normal (45 a75) sobrepeso (76 a 85) obesidad (86 a 95)

Total HF Peso del deportista medido en kgs.

Total

Anlisis de la Asociacin de Variables (Cualitativas): Crosstabs.

Pruebas de chi-cuadrado Gimnacio al que pertenece el deportista Cast Sig. asinttica (bilateral) ,156 ,178 ,423

Chi-cuadrado de Pearson Razn de verosimilitudes Asociacin lineal por lineal N de casos vlidos

Valor a 6,646 6,299 ,641 11 8,121


b

gl 4 4 1

HF

Chi-cuadrado de Pearson Razn de verosimilitudes

,087

8,574 4 ,073 Asociacin lineal por lineal 3,265 1 ,071 N de casos vlidos 15 a 9 casillas (100,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es ,18. b 8 casillas (88,9%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es ,20.

Tabla de Estadsticos Descriptivos. Chi-Square Tests

2009

Ing. Jess Antonio Vilchis Jurez.

166

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC


Medidas direccionales

Gimnacio al que pertenece el deportista Cast

Ordinal por ordinal

d de Somers

HF

Ordinal por ordinal

d de Somers

Simtrica Peso del deportista medido en kgs. dependiente Porcentaje de la capacidad aerbica mxima alcanzada dependiente Simtrica Peso del deportista medido en kgs. dependiente Porcentaje de la capacidad aerbica mxima alcanzada dependiente

Valor -,290

Error tp. a asint. ,169

T aproxima b da -1,578

Sig. aproxima da ,115

-,250

,150

-1,578

,115

-,346

,218

-1,578

,115

-,508

,139

-2,970

,003

-,423

,142

-2,970

,003

-,638

,174

-2,970

,003

a Asumiendo la hiptesis alternativa. b Empleando el error tpico asinttico basado en la hiptesis nula.

Tabla de Estadsticos Descriptivos.


Medidas simtricas Gimnacio al que pertenece el deportista Cast Sig. aproximada ,156

Valor Nominal por nominal N de casos vlidos Coeficiente de contingencia Coeficiente de contingencia ,614 11 ,593 15

HF

Nominal por nominal N de casos vlidos

,087

a Asumiendo la hiptesis alternativa. b Empleando el error tpico asinttico basado en la hiptesis nula.

Tabla de Estadsticos Descriptivos. Obsrvese que no existe una asociacin muy alta entre el Nivel de PESO y el Nivel de rendimiento deportivo controlado por el gym, pues el valor del coeficiente de asociacin (que va de 0 a 1) slo es 0,6.

2009

Ing. Jess Antonio Vilchis Jurez.

167

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Grfica de Estadsticos Descriptivos del gimnasio Cast.

Grfica de Estadsticos Descriptivos del gimnasio HF. 2009 | Ing. Jess Antonio Vilchis Jurez. 168

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Peso del deportista medido en kgs. * Porcentaje de la capacidad aerbica mxima alcanzada * Gnero del deportista
Tabla de contingencia Recuento Porcentaje de la capacidad aerbica mxima alcanzada bajo medio alto (75,1 (50,0 a (65,1 a a 65,0)% 75,0)% 100,0)% 0 0 4 3 0 3 normal (45 a75) 2 2 7 7 6 6 15 15 1 3 4 0 0 4

Gnero del deportista H

Total 4 4 3 11

Peso del deportista medido en kgs.

normal (45 a75) sobrepeso (76 a 85) obesidad (86 a 95)

Total Peso del deportista medido en kgs. Total

Tabla de Estadsticos Descriptivos. Crosstab


Pruebas de chi-cuadrado Sig. asinttica (bilateral) ,002 ,001 ,074

Gnero del deportista H

Chi-cuadrado de Pearson Razn de verosimilitudes Asociacin lineal por lineal N de casos vlidos

Valor a 17,188 19,483 3,201 11

gl 4 4 1

b Chi-cuadrado de Pearson . N de casos vlidos 15 a 9 casillas (100,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es ,82. b No se calcular ningn estadstico porque Peso del deportista medido en kgs. es una constante.

Tabla de Estadsticos Descriptivos. Chi-Square Tests


Medidas direccionales Error tp. a asint. ,242 T aproxima b da -2,040 Sig. aproxim ada ,041

Gnero del deportista H

Ordinal por ordinal

d de Somers

Ordinal por d de c . ordinal Somers a Asumiendo la hiptesis alternativa. b Empleando el error tpico asinttico basado en la hiptesis nula. c No se calcular ningn estadstico porque Peso del deportista medido en kgs. es una constante.

Simtrica Peso del deportista medido en kgs. dependiente Porcentaje de la capacidad aerbica mxima alcanzada dependiente Simtrica

Valor -,475

-,475

,243

-2,040

,041

-,475

,243

-2,040

,041

Tabla de Estadsticos Descriptivos. 2009 | Ing. Jess Antonio Vilchis Jurez. 169

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC


Medidas simtricas Sig. aproximada ,002

Gnero del deportista H

Valor Nominal por nominal N de casos vlidos Coeficiente de contingencia Coeficiente de contingencia ,781 11 .
c

Nominal por nominal N de casos vlidos

15

a Asumiendo la hiptesis alternativa. b Empleando el error tpico asinttico basado en la hiptesis nula. c No se calcular ningn estadstico porque Peso del deportista medido en kgs. es una constante.

Tabla de Estadsticos Descriptivos.

Obsrvese que s existe una asociacin alta entre el Nivel de PESO y el Nivel de rendimiento deportivo controlado por el sexo, pues el valor del coeficiente de asociacin (que va de 0 a 1) es 0,78.

Grfica de Estadsticos Descriptivos del Hombre.

2009

Ing. Jess Antonio Vilchis Jurez.

170

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Grfica de Estadsticos Descriptivos de la Mujer.

Interpretacin de las Salidas del Anlisis de la Asociacin de Variables Si observamos las Salidas del Anlisis de la Asociacin de Variables (Cualitativas) o Crosstabs, se deduce que existe una baja relacin entre el nivel de rendimiento deportivo y el nivel de PESO, que es slo 0,6 (recurdese que el mximo es 1 y el mnimo 0). Si observamos las Salidas del Anlisis de la Asociacin de Variables (Cualitativas) o Crosstabs, se deduce que existe una alta relacin entre el nivel de rendimiento deportivo y el sexo, que es 0,78 (recurdese que el mximo es 1 y el mnimo 0).

final de captulo: Estudio Bivariante - Correlacin y Asociacin

2009

Ing. Jess Antonio Vilchis Jurez.

171

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Anlisis de Asociacin c/ Tablas de Contingencia

Definicin de Tabla de Contingencia o de Asociacin La Tabla de Contingencia o de Asociacin es una tcnica estadstica que describe dos o ms variables en forma simultnea y da como resultado tablas que reflejan la distribucin conjunta de ellas con un nmero limitado de categoras o valores distintivos. Las categoras de una variable se clasifican en forma cruzada con las categoras de una o ms variables, es decir, que la distribucin de frecuencias de una variable se subdivide de acuerdo con los valores o categoras de las otras variables.

Tipologa de Datos Todos los datos (variables) debern ser cualitativos (categricos, es decir, nominales u ordinales).

Caractersticas Fcil interpretacin y comprensin de los datos. Pueden proporcionar mayores conocimientos sobre un fenmeno complejo que un solo anlisis multivariante.

Tipos de Tabulacin Cruzada Dos Variables (Tabulacin Cruzada Bivariada) Una actuar como VD y la otra como VI. Regla General: Calcular los porcentajes en direccin de la VI, en toda la VD. Es decir: Tabulacin Cruzada Bivariada O sea, debemos calcular los porcentajes de modo que los 100% queden en el total de columnas(de la VI).

Tres Variables Interviene una tercera variable que explique la ausencia o no de asociacin inicial entre las dos variables primeras (VD y VI). La inclusin de esta tercera variable puede ratificar la asociacin entre las dos variables iniciales, cambiarla o descubrir nuevas asociaciones. .. 2009 | Ing. Jess Antonio Vilchis Jurez. 172

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Ejemplo de Anlisis Estadstico

Fases en el Ejemplo de Anlisis Estadstico a) b) c) d) e) f) g) h) i) Apertura de los ficheros de datos de SPINNING Apertura de los ficheros de datos de SPINNING en SPSS Almacenamiento de fichero de datos SPINNING Almacenamiento de fichero de datos HELATH.FITNES Fusin de los ficheros de datos HEALTH.FITNES y SPINNING Recodificacin de variables Definicin de las variables recodificadas Eliminacin de casos perdidos Anlisis de la regresin lineal

Apertura de los Ficheros de Datos del Anlisis El fichero de datos que se muestra se llama spinning y est en formato de Microsoft Excel. Este estudio pretende conocer cules son los factores determinantes al momento de evaluar el rendimiento deportivo de los alumnos asistentes a una clase de spinning. Este fichero contiene las siguientes variables: Alumno: nombre del deportista Estatura: talla del deportista medida en metros. Edad: edad en aos cumplidos del deportista. Peso: peso del deportista medido en Kgs. Pulsaciones: nmero de pulsaciones que alcanza el deportista en un minuto. IMC (ndice de masa corporal): ndice que relaciona el peso y la estatura del deportista. IMC = (Peso/Estatura2) CAE (capacidad aerbica mxima): ndice que expresa la cantidad mxima de pulsaciones que el deportista puede alcanzar en un minuto haciendo mximo esfuerzo. Su valor se determina en funcin del sexo y de la edad. CAEmujeres: 226-Edad CAEhombres: 220-Edad Rendimiento: porcentaje de la capacidad aerbica mxima alcanzada por el deportista en un minuto, luego de realizados los sprints. Cal_p_bi (calidad percibida de la bicicleta): calificacin asignada a la bicicleta del 1 al 10 segn el estado en que se encontraba. Aire_aco (aire acondicionado): presencia de aire acondicionado en la sala de prctica de Spinning. Sexo: gnero del deportista. Gym: gimnasio al que pertenece el deportista. 2009 | Ing. Jess Antonio Vilchis Jurez. 173

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

En la figura 1, se muestra en pantalla el fichero SPINNING.xls, correspondiente a un gimnasio de la Capital con informacin de 12 alumnos a los que se les ha medido las variables descriptas en el prrafo anterior, para establecer los factores determinantes del rendimiento deportivo a lo largo de una clase de spinning.

Figura 1 Base de Datos SPINNING. En la figura 2, se muestra otro fichero llamado HEALTH.FITNESS.xls, con informacin de 20 alumnos correspondientes a otro gimnasio de la Capital, a los cules se les ha medido las mismas caractersticas del grupo anterior para estudiar los factores determinantes del rendimiento deportivo a lo largo de una clase de spinning.

Apertura de los Ficheros de Datos de Spinning en SPSS Si queremos analizar estadsticamente en SPSS los datos de los respectivos gimnasios, tendremos que exportar la informacin contenida en dichos ficheros desde Microsoft Excel a SPSS. Para ello: Seleccionar en la barra de men Archivo / Abrir / Datos Se muestra el cuadro de dilogo Abrir datos (figura 3). 2009 | Ing. Jess Antonio Vilchis Jurez. 174

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 2 Base de Datos HEALTH.FITNESS.

Figura 3 Base de Datos SPINNING (spss) 2009 | Ing. Jess Antonio Vilchis Jurez. 175

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Seleccionar en la barra de men: Archivo/Abrir Archivo Localizar en la pestaa Tipo de archivos la opcin Excel (*.xls) (figura 4).

Figura 4 Base de Datos SPINNING (spss) Aparece el cuadro de dilogo Apertura de la Fuente de Datos de Excel (figura 5). Activar la opcin Leer los nombres de las variables de la primera fila. Pulsar el botn Aceptar. Se muestra la ventana Vista de variables con informacin del fichero SPINNING que tenamos en formato de Microsoft Excel (figura 6). 2009 | Ing. Jess Antonio Vilchis Jurez. 176

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 5 Base de Datos SPINNING (spss)

Figura 6 Base de Datos SPINNING (spss)

Si hacemos clic en la ficha Vista de datos podremos ver la estructura de los datos exportados (figura 7). Ahora tendremos que asignar en el campo etiquetas, de la Vista de variables, las etiquetas a cada una de las variables (figura 8).

2009

Ing. Jess Antonio Vilchis Jurez.

177

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 7 Base de Datos SPINNING (spss)

Figura 8 Base de Datos SPINNING (spss) 2009 | Ing. Jess Antonio Vilchis Jurez. 178

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Almacenamiento de Fichero de Datos Castellana Una vez abierto el fichero, tendremos que asignarle un nombre. Seleccionar el men Archivo/ Guardar Como (figura 9).

Figura 9 Base de Datos SPINNING (spss) Nos aparece el cuadro de dilogo Guardar datos como (figura 10).

Figura 10 Base de Datos SPINNING (spss) 2009 | Ing. Jess Antonio Vilchis Jurez. 179

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Asignar el nombre SPINNING. Pulsar el botn Guardar. Ahora ya est guardada la base de datos de trabajo (figura 11).

Figura 11 Base de Datos SPINNING (spss)

Almacenamiento de Fichero de Datos Health Fitness Del mismo modo que hemos abierto el fichero SPINNING.xls, procederemos a exportar los datos contenidos en el fichero HEALTH.FITNES.xls. Seleccionar en la barra de men: Archivo/ Abrir/ Datos (figura 12).

Figura 12 Base de Datos HEALTH.FITNES (spss) 2009 | Ing. Jess Antonio Vilchis Jurez. 180

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Aparece en pantalla el cuadro de dilogo Abrir datos (figura 13).

Figura 13 Base de Datos HEALTH.FITNES (spss) Localizar en la pestaa Tipo de archivos, la opcin Excel (*.xls) Seleccionar el fichero HEALTH.FITNES. Pulsar el botn Abrir. Aparece nuevamente el cuadro de dilogo Apertura de origen de datos de Excel (figura 14).

Figura 14 Base de Datos HEALTH.FITNES (spss) 2009 | Ing. Jess Antonio Vilchis Jurez. 181

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Activar la opcin Leer nombre de variables de la primera fila de datos. Pulsar el botn Aceptar Una vez abierto el fichero HEALTH.FITNES en SPSS, se muestra la ventana Vista de variables con la informacin del fichero que tenamos en formato de Microsoft Excel (figura 15).

Figura 15 Base de Datos HEALTH.FITNES desde Vista de variables Si hacemos clic en la ficha Vista de datos, veremos cmo SPSS ha considerado la estructura de los datos del fichero de datos exportado (figura 16). Ahora, tendremos que asignar en el campo etiquetas las etiquetas para cada una de las variables (figura 17). Una vez abierto el fichero, tendremos que asignarle un nombre. Asignar el nombre HEALTH.FITNES.

2009

Ing. Jess Antonio Vilchis Jurez.

182

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 16 Base de Datos HEALTH.FITNES desde Vista de datos

Figura 17 Base de Datos HEALTH.FITNES (spss) 2009 | Ing. Jess Antonio Vilchis Jurez. 183

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Fusin de los Ficheros de Datos HEALTH.FITNES y SPINNING Ahora, nos interesa fusionar estos dos archivos exportados para poder comparar el rendimiento deportivo de los alumnos que asisten a estos gimnasios. Estando abierto en SPSS el fichero HEALTH.FITNES.sav, procederemos a agregar, dentro de este mismo archivo, los casos correspondientes al fichero SPINNING.sav. Seleccionar en el men Datos/ Fundir Archivos/ Aadir Casos (figura 18).

Figura 18 Ventana con el men Datos/Fundir archivos/Aadir casos... Se muestra el cuadro de dilogo Add Cases: Read File (figura 19). Seleccionar el fichero de datos SPINNING que deseamos forme parte del archivo actual (HELATH.FITNES). Pulsar el botn Abrir. Se muestra un cuadro de dilogo Aadir casos desde... (figura 20)

2009

Ing. Jess Antonio Vilchis Jurez.

184

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 19 Fusin de Ficheros HEALTH.FITNES y SPINNING

Figura 20 Fusin de Ficheros HEALTH.FITNES y SPINNING 2009 | Ing. Jess Antonio Vilchis Jurez. 185

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

En la parte derecha de dicho cuadro Variables en el Nuevo Fichero de Datos podemos apreciar las variables que forman parte del fichero fundido. Pulsar el botn Aceptar (figura 21).

Figura 21 Fusin de Ficheros HEALTH.FITNES y SPINNING Vemos que el fichero anterior contena 21 registros procedentes del fichero HEALTH.FITNES.sav y que tras la fusin con el fichero SPINNING, tenemos 32 casos. Seleccionar en la barra de men: Archivo/ Guardar Cmo. (Figura 22) Se muestra el cuadro de dilogo : Guardar datos como (figura 23). En el cuadro Nombre de archivo llamaremos HEALTH.SPINNING al fichero fundido. Pulsar el botn Guardar. Aparece, por ltimo, el fichero nombrado como HEALTH.SPINNING.sav. (Figura 24)

2009

Ing. Jess Antonio Vilchis Jurez.

186

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 22 Fusin de Ficheros HEALTH.FITNESS y SPINNING

Figura 23 Fusin de Ficheros HEALTH.FITNESS y SPINNING 2009 | Ing. Jess Antonio Vilchis Jurez. 187

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 24 Fusin de Ficheros HEALTH.FITNESS y SPINNING

Recodificacin de Variables Ahora tenemos algunas dificultades para efectuar las comparaciones entre los diferentes grupos de alumnos y realizar el Anlisis de la Regresin Lineal (ARL). Nos encontramos con variables de tipo Texto, que necesitamos convertir en numricas; para aplicar el procedimiento de ARL. Utilizaremos el Procedimiento de Recodificacin de Variables. Pero como nos interesa de momento, seguir contando con los valores originales de dichas variables, usaremos el procedimiento Recodificar en Diferentes Variables. Seguidamente, veremos cmo se transforma una variable de tipo Texto a una de tipo Numrica. Seleccionar en la barra de men: Transformar/ Recodificar/ En Diferentes Variables. (Figura 25) Nos aparece el cuadro de dilogo Recodificar en distintas variables. (Figura 26) Seleccionar de la lista de variables fuente, la variable tiempo. Hacer doble clic para trasladarla a la lista de Variables destino Var.de entrada Var.de resultado. En el cuadro Nombre especificar time, que ser el nombre de la nueva variable (figura 27). Pulsar el botn Cambiar. (Figura 28) 2009 | Ing. Jess Antonio Vilchis Jurez. 188

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 25 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 26 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 27 Recodificacin Fichero HEALTH.SPINNING.sav 2009 | Ing. Jess Antonio Vilchis Jurez. 189

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Asignar en Etiqueta la etiqueta correspondiente a la variable time.

Figura 28 Recodificacin Fichero HEALTH.SPINNING.sav Seleccionar Valores antiguos y nuevos. Se abre el cuadro de dilogo Recodificar en distintas variables: Valores antiguos y nuevos. (Figura 29)

Figura 29 Recodificacin Fichero HEALTH.SPINNING.sav Tendremos que especificar los antiguos valores y los nuevos valores para efectuar la recodificacin.

2009

Ing. Jess Antonio Vilchis Jurez.

190

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

En el sector de Valor Antiguo, hacer clic en la opcin Valor y escribir 30. En Nuevo Valor, especificar en el cuadro Valor el valor 1. Pulsar el botn Aadir. (Figura 30)

Figura 30 Recodificacin Fichero HEALTH.SPINNING.sav En el cuadro Valor Antiguo, hacer clic en la opcin Valor y escribir 45. En el cuadro Nuevo Valor, especificar en el cuadro Valor el valor 2. Pulsar el botn Aadir. (Figura 31)

Figura 31 Recodificacin Fichero HEALTH.SPINNING.sav 2009 | Ing. Jess Antonio Vilchis Jurez. 191

ANLISIS ESTADSTICO CON SPSS Pulsar el botn Continuar.

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Se muestra el cuadro de dilogo inicial Recodificar en distintas variables. (Figura 32)

Figura 32 Recodificacin Fichero HEALTH.SPINNING.sav Pulsar el botn Aceptar. De este modo ya hemos terminado de recodificar la variable tiempo como time. Para las dems variables que nos restan por recodificar (aire_aco; sexo y gym) procederemos de la misma forma (figuras 33 a 48).

Figura 33 Recodificacin Fichero HEALTH.SPINNING.sav

2009

Ing. Jess Antonio Vilchis Jurez.

192

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 34 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 35 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 36 Recodificacin Fichero HEALTH.SPINNING.sav 2009 | Ing. Jess Antonio Vilchis Jurez. 193

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 37 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 38 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 39 Recodificacin Fichero HEALTH.SPINNING.sav 2009 | Ing. Jess Antonio Vilchis Jurez. 194

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 40 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 41 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 42 Recodificacin Fichero HEALTH.SPINNING.sav 2009 | Ing. Jess Antonio Vilchis Jurez. 195

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 43 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 44 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 45 Recodificacin Fichero HEALTH.SPINNING.sav 2009 | Ing. Jess Antonio Vilchis Jurez. 196

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 46 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 47 Recodificacin Fichero HEALTH.SPINNING.sav

Figura 48 Recodificacin Fichero HEALTH.SPINNING.sav 2009 | Ing. Jess Antonio Vilchis Jurez. 197

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Definicin de las Variables Recodificadas Aparecen en la ficha Vista de datos las nuevas variables (time, aire, sexo_al, gyms) con sus respectivos valores (figura 49).

Figura 49 Definicin de las Variables Recodificadas en Vista de datos Hacer clic en la ficha Vista de Variables. (Figura 50)

Figura 50 Definicin de las Variables Recodificadas. Variable time. Escribir en el campo Etiqueta las etiquetas de las nuevas variables: time: duracin de la clase aire: aire acondicionado sexo_al: sexo del alumno gyms: gimnasios 2009 | Ing. Jess Antonio Vilchis Jurez. 198

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Una vez especificadas las etiquetas, definimos los valores de las variables recodificadas. Valores de la variable time (figura 51):

Figura 51 Definicin de las Variables Recodificadas. Variable time. En el cuadro Valor especificar 1. Hacer clic en el cuadro Etiqueta y especificar 30. Pulsar el botn Aadir. En el cuadro Valor especificar 2. Hacer clic en el cuadro Etiqueta y especificar 45. Pulsar el botn Aadir. (Figura 52)

Figura 52 Definicin de las Variables Recodificadas. Variable time. 2009 | Ing. Jess Antonio Vilchis Jurez. 199

ANLISIS ESTADSTICO CON SPSS Pulsar el botn Aceptar.

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Valores de la variable aire (figura 53): En el cuadro Valor especificar 0. Hacer clic en el cuadro Etiqueta y especificar No. Pulsar el botn Aadir. En el cuadro Valor especificar 1. Hacer clic en el cuadro Etiqueta y especificar S. Pulsar el botn Aadir. (Figura 53)

Figura 53 Definicin de las Variables Recodificadas. Variable aire. Pulsar el botn Aceptar. Valores de la variable sexo_al (figura 54): En el cuadro Valor especificar 0. Hacer clic en el cuadro Etiqueta y especificar H. Pulsar el botn Aadir. En el cuadro Valor especificar 1. Hacer clic en el cuadro Etiqueta y especificar F. Pulsar el botn Aadir. (Figura 54)

Figura 54 Definicin de las Variables Recodificadas. Variable sexo_al. 2009 | Ing. Jess Antonio Vilchis Jurez. 200

ANLISIS ESTADSTICO CON SPSS Pulsar el botn Aceptar.

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Valores de la variable gyms (figura 55): En el cuadro Valor especificar 1. Hacer clic en el cuadro Etiqueta y especificar Health Fitness. Pulsar el botn Aadir. En el cuadro Valor especificar 2. Hacer clic en el cuadro Etiqueta y especificar Castillo. Pulsar el botn Aadir. (Figura 55)

Figura 55 Definicin de las Variables Recodificadas. Variable gyms. Pulsar el botn Ok. Vemos en pantalla cmo han quedado definidas las variables recodificadas (figura 56).

Figura 56 Definicin de las Variables Recodificadas 2009 | Ing. Jess Antonio Vilchis Jurez. 201

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Para visualizar las etiquetas de los valores de las variables, pulsar el botn Value Label de la barra de herramientas (figura 57).

Figura 57 Definicin de las Variables Recodificadas

Eliminacin de Casos Perdidos Sin embargo, an nos quedan casos de alumnos que no tienen registro de pulsaciones (celdas vacas), que ser preciso eliminar para evitar que en el Anlisis de la Regresin Lineal (ARL), se alteren los resultados. Seleccionar el men Datos/ Seleccionar casos (figura 58).

Figura 58 Eliminacin de casos perdidos 2009 | Ing. Jess Antonio Vilchis Jurez. 202

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Se muestra el cuadro de dilogo Seleccionar casos (figura 59).

Figura 59 Eliminacin de casos perdidos Seleccionar la variable rendimiento de la lista de variables fuente Dentro del cuadro Seleccionar, seleccionar la opcin Si se satisface la condicin. (Figura 60)

Figura 60 Eliminacin de casos perdidos 2009 | Ing. Jess Antonio Vilchis Jurez. 203

ANLISIS ESTADSTICO CON SPSS Pulsar el botn Si...

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Aparece el siguiente cuadro de dilogo Seleccionar casos: Si. (Figura 61)

Figura 61 Eliminacin de casos perdidos Seleccionar la variable rendimiento de la lista de variables fuente. Hacer doble clic sobre la variable rendimiento para llevarla al cuadro de las reglas de seleccin. Pulsar el operando (no es igual) a 0. (Figura 62)

Figura 62 Eliminacin de casos perdidos Pulsar el botn Continue. Aparece otra vez el cuadro de dilogo inicial Seleccionar casos (figura 63).

2009

Ing. Jess Antonio Vilchis Jurez.

204

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 63 Eliminacin de casos perdidos Puede visualizarse al lado derecho del botn Si... la regla de seleccin que hemos expresado. En el cuadro Resultado: Elegir la opcin Decantar casos no seleccionados, para que los casos que no satisfagan la condicin sean eliminados de la base de datos. Vista de la base de datos sin casos perdidos en la variable rendimiento (figura 64).

Figura 64 Eliminacin de casos perdidos 2009 | Ing. Jess Antonio Vilchis Jurez. 205

ANLISIS ESTADSTICO CON SPSS Anlisis de la Regresin Lineal

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Ahora estamos en condiciones de aplicar el Anlisis de la Regresin Lineal al fichero HEALTH.SPINNING.sav. Seleccionar el men Analizar/Regresin/Lineal... (figura 65).

Figura 65 Anlisis de la Regresin Lineal Aparece el cuadro de dilogo Regresin lineal (figura 66).

Figura 66 Anlisis de la Regresin Lineal 2009 | Ing. Jess Antonio Vilchis Jurez. 206

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Seleccionar la variable rendimiento (VD). Pulsar el botn para introducirla en el cuadro Dependiente. Seleccionar de la lista de variables fuente las variables independientes (VI). Pulsar el botn para introducirlas en el cuadro Independientes Seleccionar en la pestaa Mtodo, el mtodo Pasos suc.. Seleccionar la variable alumno. Pulsar el botn para introducirla en el cuadro Etiquetas de caso. (Figura 67)

Figura 67 Anlisis de la Regresin Lineal Pulsar el botn Estadsticos. Aparece el cuadro de dilogo Regresin lineal: Estadsticos. (figura 68)

Figura 68 Anlisis de la Regresin Lineal 2009 | Ing. Jess Antonio Vilchis Jurez. 207

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

En el cuadro de dilogo Estadsticos activamos las opciones sealadas. Pulsar el botn Continuar. Pulsar el botn Grficos. Aparece el cuadro de dilogo Regresin lineal: Grficos. (Figura 69)

Figura 69 Anlisis de la Regresin Lineal Activar las opciones que figuran en pantalla. Pulsar el botn Continuar. Pulsar el botn Guardar. Aparece el cuadro de dilogo Linear Regresin: Guardar. (Figura 70)

Figura 70 Anlisis de la Regresin Lineal 2009 | Ing. Jess Antonio Vilchis Jurez. 208

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Activar las opciones que figuran en pantalla. Pulsar el botn Continuar. En las salidas de la Regresin podemos apreciar en primer lugar las correlaciones existentes entre pares de variables. La nica variable que mantiene una alta correlacin con la variable rendimiento (VD) es la variable pulsaciones, que muestra una Correlacin de Pearson igual a 100% . (Figura 71) A continuacin se muestra una tabla donde figuran las dos variables que han sido introducidas en el modelo por el mtodo Pasos suc.. (Figura 72) La primera variable introducida en el modelo (pulsaciones), contribuye a predecir en un 41.9% el rendimiento de los alumnos. Todas estas pruebas son significativas, ya que el valor de F es menor que 0.05. (Figura 73) El estadstico Durbin-Watson Mide la Auto correlacin Serial (influencia de los valores residuales). Si este valor fuese 2,0, no existira Autocorrelacin Serial. En este caso, Durbin-Watson tiene un valor muy alto y positivo, es decir, existe una excesiva tendencia a que los rendimientos sean altos. (Figura 74) El anlisis de la varianza del modelo, constata lo dicho anteriormente cuando introducimos en primer lugar la variable pulsaciones y luego agregamos la variable capacidad aerbica mxima. Las variaciones de la VD son suficientemente explicadas por el modelo, porque el estadstico F tiene una significacin menor a 0.05. Se aprecia en la tabla 75 que los valores de rendimiento mnimos y mximos predichos son muy diferentes entre s. Tienen una alta variabilidad. En la figura 76 se aprecian los residuales estandarizados de la regresin estn muy estirados, lo que evidencia enormes diferencias en los valores de la VD. El grfico de normalidad (figura 77) contrasta la H0 de la normalidad de los residuales estandarizados de la regresin. Cuanto ms alejados estn los residuales estandarizados de la recta de la regresin, peor ser el ajuste de los valores a la condicin de normalidad. Existen algunos valores que se alejan bastante de la recta de regresin, evidenciando una falta de adecuacin al modelo.

2009

Ing. Jess Antonio Vilchis Jurez.

209

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC


Correlaciones
Nmero de pulsacione s que alcanza el deportista en un minuto ,647

Porcentaje de la capacidad aerbica mxima alcanzada Correlacin de Pearson Porcentaje de la capacidad aerbica mxima alcanzada Talla del deportista medida en metros Edad en aos cumplidos del deportista Peso del deportista medido en Kgs. Nmero de pulsaciones que alcanza el deportista en un minuto Capacidad aerbica mxima Calidad percibida de la bicicleta Porcentaje de la capacidad aerbica mxima alcanzada Talla del deportista medida en metros Edad en aos cumplidos del deportista Peso del deportista medido en Kgs. Nmero de pulsaciones que alcanza el deportista en un minuto Capacidad aerbica mxima Calidad percibida de la bicicleta Porcentaje de la capacidad aerbica mxima alcanzada Talla del deportista medida en metros Edad en aos cumplidos del deportista Peso del deportista medido en Kgs. Nmero de pulsaciones que alcanza el deportista en un minuto Capacidad aerbica mxima Calidad percibida de la bicicleta 1,000

Talla del deportist a medida en metros -,188

Edad en aos cumplidos del deportista -,077

Peso del deportist a medido en Kgs. -,233

Capacida d aerbica mxima ,031

Calidad percibida de la bicicleta -,160

-,188 -,077 -,233

1,000 -,250 ,757

-,250 1,000 ,113

,757 ,113 1,000

-,135 -,246 -,254

,061 -,942 -,334

-,355 ,262 -,234

,647

-,135

-,246

-,254

1,000

,273

-,070

,031 -,160

,061 -,355

-,942 ,262

-,334 -,234

,273 -,070

1,000 -,200

-,200 1,000

Sig. (unilateral)

,173

,351

,121

,000

,440

,213

,173 ,351 ,121

. ,104 ,000

,104 . ,287

,000 ,287 .

,251 ,108 ,100

,382 ,000 ,044

,034 ,093 ,120

,000

,251

,108

,100

,084

,365

,440 ,213

,382 ,034

,000 ,093

,044 ,120

,084 ,365

. ,159

,159 .

27

27

27

27

27

27

27

27 27 27

27 27 27

27 27 27

27 27 27

27 27 27

27 27 27

27 27 27

27

27

27

27

27

27

27

27 27

27 27

27 27

27 27

27 27

27 27

27 27

Figura 71 Anlisis de la Regresin Lineal 2009 | Ing. Jess Antonio Vilchis Jurez. 210

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC


a

Variables introducidas/eliminadas Modelo 1 Variables introducidas

Variables eliminadas

Mtodo

Nmero de pulsaciones que alcanza el deportista en un minuto

Por pasos (criterio: Prob. de F para entrar <= ,050, Prob. de F para salir >= ,100).

a Variable dependiente: Porcentaje de la capacidad aerbica mxima alcanzada

Figura 72 Anlisis de la Regresin Lineal


Resumen del modelo
b

Modelo 1 R R cuadrado R cuadrado corregida Error tp. de la estimacin Estadsticos de cambio Cambio en R cuadrado Cambio en F gl1 gl2 Sig. del cambio en F Durbin-Watson ,647
a

,419 ,395 9,48838 ,419 18,004 1 25 ,000 1,950

a Variables predictoras: (Constante), Nmero de pulsaciones que alcanza el deportista en un minuto b Variable dependiente: Porcentaje de la capacidad aerbica mxima alcanzada

Figura 73 Anlisis de la Regresin Lineal


ANOVA Modelo 1 Suma de cuadrados Regresin Residual Total 1620,847 2250,735 3871,582 gl 1 25 26
b

Media cuadrtica 1620,847 90,029

F 18,004

Sig. ,000
a

a Variables predictoras: (Constante), Nmero de pulsaciones que alcanza el deportista en un minuto b Variable dependiente: Porcentaje de la capacidad aerbica mxima alcanzada

Figura 74 Anlisis de la Varianza (ANOVA)

2009

Ing. Jess Antonio Vilchis Jurez.

211

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC


a

Estadsticos sobre los residuos Mnimo 60,3498 -2,052 1,842 50,4987 -13,53842 -1,427 -1,540 -15,77043 -1,586 ,017 ,000 ,001 Mximo 91,5980 1,906 4,233 90,7756 39,65017 4,179 4,669 49,50130 12,789 4,211 2,708 ,162

Valor pronosticado Valor pronosticado tip. Error tpico del valor pronosticado Valor pronosticado corregido Residuo bruto Residuo tip. Residuo estud. Residuo eliminado Residuo eliminado estud. Dist. de Mahalanobis Distancia de Cook Valor de influencia centrado

Media 76,7255 ,022 2,471 76,4541 ,15412 ,016 ,029 ,42552 ,319 ,941 ,111 ,036

Desviacin tp. 7,80184 ,988 ,712 8,40597 9,16655 ,966 1,058 11,02193 2,503 1,187 ,510 ,046

N 28 28 28 28 28 28 28 28 28 28 28 28

a Variable dependiente: Porcentaje de la capacidad aerbica mxima alcanzada

Figura 75 Valores Residuales.

Figura 76 Anlisis de la Regresin Lineal

2009

Ing. Jess Antonio Vilchis Jurez.

212

ANLISIS ESTADSTICO CON SPSS

CENTRO UNIVERSITARIO DE IXTLAHUACA A. C. CISAEC

Figura 77 Anlisis de la Regresin Lineal

final de captulo: Ejemplo de Anlisis Estadstico Completo

2009

Ing. Jess Antonio Vilchis Jurez.

213