Vous êtes sur la page 1sur 20

Correspondencia: marianoaguayo@telefonica.

net
1 de 20

DOCUWEB FABIS
Dot. Nm 0702004

Cmo realizar "paso a paso" un contraste de hiptesis con
SPSS para Windows y alternativamente con EPIINFO y
EPIDAT: (II) Asociacin entre una variable cuantitativa y una
categrica (comparacin de medias entre dos o ms grupos
independientes).
Aguayo Canela, Mariano.
Hospital Universitario Virgen Macarena (Sevilla), Servicio de Medicina Interna.
Resumen
Cuando queremos evaluar el grado de asociacin o independencia entre una variable cuantitativa y
una variable categrica (y recurdese que sta clasifica o diferencia a los individuos en grupos, tantos
como categoras tiene dicha variable), el procedimiento estadstico inferencial recurre a comparar las
medias de la distribuciones de la variable cuantitativa en los diferentes grupos establecidos por la
variable categrica. Si sta tiene solo dos categoras (es dicotmica), la comparacin de medias entre
dos grupos independientes se lleva a cabo por el test t de Student; si tiene tres o ms categoras, la
comparacin de medias entre tres o ms grupos independientes se realiza a travs de un modelo
matemtico ms general, el Anlisis de la Varianza (ANOVA). En ambos casos, las pruebas
estadsticas son exigentes con ciertos requisitos previos: la distribucin Normal de la variable
cuantitativa en los grupos que se comparan y la homogeneidad de varianzas en las poblaciones de
las que proceden los grupos; su no cumplimiento conlleva la necesidad de recurrir a pruebas
estadsticas no paramtricas. En este documento se ensea a hacer estos anlisis con el programa
SPSS para Windows, y alternativamente con los programas EPIINFO 6.0 y su versin 3.3.2
(actualizada en 2005) y con el programa EPIDAT 3.1.

0. INTRODUCCIN TERICA.

Cuando tengamos que evaluar la asociacin entre una variable categrica (o nominal) y una
variable cuantitativa, el procedimiento es analizar y comparar las medias de la distribucin de
la variable cuantitativa en cada uno de los grupos que conforma la variable categrica.

Si la variable cualitativa slo tiene dos categoras (por ejemplo la variable sexo) el
procedimiento se reduce a comparar las medias de la variable cuantitativa en esos dos
grupos (hombres y mujeres en el ejemplo). El contraste de hiptesis es la t de Student, para
comparar las medias (de la variable contnua) en dos grupos independientes, que en SPSS
est en:

Analizar > Comparar medias > Prueba t para dos muestras independientes

Si la variable categrica tiene tres o ms categoras (por ejemplo la variable raza con las
siguientes mediciones: blanca, negra, otras) el procedimiento tambin consiste en comparar
las medias de la variable cuantitativa en cada uno de los grupos que conforma cada estrato
o categora de la variable nominal, pero el procedimiento ya no es la t de Student sino un
modelo matemtico ms amplio: el Anlisis de la Varianza (ANOVA de una va), que va a
permitir no slo saber si hay diferencias en las medias en los diferentes grupos sino explorar
Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 2 de 20
entre qu grupos concretos estn o no esas diferencias (a travs de los llamados contrastes
a posteriori). El anlisis en SPSS est en:

Analizar > Comparar medias > ANOVA de un factor

Un aspecto muy importante de estos contrastes, tanto la t de Student como el ANOVA,
es que son muy exigentes sobre una serie de requisitos en la distribucin de la
variable cuantitativa que est evaluando; en concreto sobre dos aspectos:

a) La variable cuantitativa debe distribuirse segn la Ley Normal en cada uno de los
grupos que se comparan (CRITERIO DE NORMALIDAD).

b) Las varianzas de la distribucin de la variable cuantitativa en las poblaciones de las
que provienen los grupos que se comparan deben ser homogneas (CRITERIO DE
HOMOCEDASTICIDAD).

El primero es el ms importante. Aunque puede asumirse que se cumple para muestras
grandes (n > 100), debe explorarse siempre, con grficos y pruebas de normalidad.
1
En
SPSS las pruebas de normalidad ms completas estn en la opcin EXPLORAR y al que
se llega con la rutina:

Analizar > Estadsticos Descriptivos > Explorar

Con respecto al segundo requisito para aplicar estos contrastes (ANOVA y t de Student), es
menos exigente, y existen alternativas para hacer el contraste. As veremos que en SPSS
hay una lectura de la prueba asumiendo varianzas desiguales.

Cuando estos requisitos se incumplen hay que recurrir a las PRUEBAS NO
PARAMTRICAS, que en SPSS estn en:

Analizar > Pruebas no paramtricas > 2 muestras independientes ( k muestras
independientes)


Vamos a trabajar con el ejemplo del estudio de obesidad e hipertensin. En esta base de
datos, la variable obesidad es categrica (obeso / no obeso) y desearamos saber si est
relacionada con la edad de los individuos (una variable cuantitativa, cuya medida son los
aos cumplidos), esto es, responder a la pregunta hay diferencias en la edad de los
individuos segn sean o no obesos? O de forma alternativa, est relacionada la edad con
la presencia de obesidad?



1. PASOS A DAR EN SPSS PARA COMPARAR LAS MEDIAS DE
UNA VARIABLE (CUANTITATIVA) EN DOS GRUPOS
ESTABLECIDOS POR UNA VARIABLE DICOTMICA.

1. Antes que nada debe explorarse la variable cuantitativa para comprobar que se
cumplen los requisitos que van a permitir aplicar las pruebas paramtricas. Para ello
recurrimos al procedimiento EXPLORAR en la pestaa de Analizar > Estadsticos
descriptivos:

1
Debe recordarse aqu tambin que en determinados casos en que una variable cuantitativa no sigue
una Ley Normal puede transformarse mediante una operacin matemtica (por ejemplo una
transformacin logartmica), consiguiendo entonces que su transformada s cumpla el criterio de
normalidad. Merece la pena probar antes de optar por una prueba no paramtrica.
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 3 de 20


Como puede apreciarse, se
selecciona como factor de
exploracin la variable nominal,
esto es, la categrica que nos va
a permitir establecer los grupos a
comparar (en este ejemplo la
variable Obesidad, con sus dos
categoras posibles, obeso / no
obeso); y como variable
dependiente a explorar la
variable cuantitativa (en nuestro
caso la variable Edad, medida
en aos cumplidos).

En la pestaa de Grficos
elegimos la opcin Grficos con
pruebas de normalidad. Vemos
que esta ventana de Explorar >
Grficos tambin es posible obtener:

Diagramas de caja (box-plot) para evaluar grficamente la distribucin de la variable
cuantitativa en los diferentes grupos que se comparan, y tener una aproximacin
visual a lo que luego haremos en el contraste de hiptesis.

Grficos descriptivos de la variable cuantitativa, como los de tallo y hojas
(stem&leaf) o los histogramas de frecuencias.

A continuacin mostramos la salida de SPSS con las opciones marcadas anteriormente:

Explorar
PRESENCIA DE OBESIDAD

Primero se muestra un resumen de los casos (individuos) que se van a explorar o procesar.
Resumen del procesamiento de los casos
33 100,0% 0 ,0% 33 100,0%
17 100,0% 0 ,0% 17 100,0%
PRESENCIA
DE OBESIDAD
obeso
no obeso
EDAD EN AOS
CUMPLIDOS
N Porcentaje N Porcentaje N Porcentaje
Vlidos Perdidos Total
Casos

Luego un cuadro resumen con la estadstica descriptiva de la variable cuantitativa (el dependiente
para el programa SPSS) en cada uno de los grupos establecidos por las diferentes categoras e la
variable cualitativa (el factor para el programa SPSS).
En esta salida podemos ver un aspecto muy interesante: los IC
95%
para la media en cada grupo, una
forma alternativa al contraste de hiptesis clsico para tomar decisiones sobre la relacin entre
variables
Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 4 de 20
40 45 50 55 60
Valor observado
-2
-1
0
1
2
N
o
r
m
a
l

e
s
p
e
r
a
d
o
para obesi= obeso
Grfico Q-Q normal de EDAD EN AOS CUMPLIDOS
.
En nuestro ejercicio vemos que, tanto la estimacin puntual de la media de la variable edad en
ambos grupos (48,70 vs 50,24) como sus intervalos de confianza (46,84 50,55 en el grupo obeso
vs 47,89 52,78 en el grupo no obeso) son muy superponibles, por lo que es altamente
improbable que las variables edad y obesidad estn relacionadas en la poblacin (lo que conllevara a
que las edades medias en ambos grupos fueran muy diferentes).

Seguidamente, se nos muestra las pruebas de normalidad que lleva a cabo el programa SPSS. Nos
hemos de fijar en la significacin estadstica de estos dos contrastes, asumiendo la normalidad de la
distribucin si en ambos grupos el nivel de p es no significativo (esto es, p>0,05). En nuestro
ejemplo podemos asumir la normalidad de la variable cuantitativa edad en ambos grupos (obesos /
no obesos).


Si hemos solicitado otros grficos, la salida nos lo mostrar:

EDAD EN AOS CUMPLIDOS
Grficos de tallo y hojas

EDAD EN AOS CUMPLIDOS Stem-and-Leaf Plot for obesi=
obeso

Frequency Stem & Leaf

3,00 4 . 111
5,00 4 . 22333
Pruebas de normalidad
,124 33 ,200 * ,951 33 ,142
,145 17 ,200 * ,950 17 ,450
PRESENCIA
DE OBESIDAD
obeso
no obeso
EDAD EN AOS
CUMPLIDOS
Estadstico gl Sig. Estadstico gl Sig.
Kolmogorov-Smirnov
a
Shapiro-Wilk
Este es un lmite inferior de la significacin verdadera. *.
Correccin de la significacin de Lilliefors a.
Descriptivos
48,70 0,90
9
46,84
50,55
48,60
49,00
27,280
5,223
41
59
18
10
,085 0,40
9
-1,067 0,79
8
50,24 1,199
47,69
52,78
50,21
49,00
24,441
4,944
42
59
17
7
,101 0,55
0
-,583 1,063
Media
Lmite inferior
Lmite superior
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Lmite inferior
Lmite superior
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
PRESENCIA
DE OBESIDAD
obeso
no obeso
EDAD EN AOS
CUMPLIDOS
Estadstico Error tp.
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 5 de 20
obeso no obeso
PRESENCIA DE OBESIDAD
40
45
50
55
60
E
D
A
D

E
N

A

O
S

C
U
M
P
L
I
D
O
S
4,00 4 . 4555
2,00 4 . 77
3,00 4 . 899
4,00 5 . 0001
6,00 5 . 222333
3,00 5 . 445
2,00 5 . 77
1,00 5 . 9

Stem width: 10
Each leaf: 1 case(s)


EDAD EN AOS CUMPLIDOS Stem-and-Leaf Plot for
obesi= no obeso

Frequency Stem & Leaf

2,00 4 . 22
7,00 4 . 7778889
5,00 5 . 02344
3,00 5 . 779

Stem width: 10
Each leaf: 1 case(s)

Grficos Q-Q normales



En el box-plot tenemos una representacin grfica
de la distribucin de la variable cuantitativa (edad)
en los dos grupos establecidos por la variable
cualitativa (obesidad), y nos sirve para una
aproximacin visual al contraste de hiptesis, que
plantear como hiptesis nula (H
0
) que no son
diferentes las medias de edad en estos grupos.

Como puede verse en nuestro ejemplo, las edades
medias en el grupo no obeso son ligeramente
mayores que en el grupo obeso, pero las
medianas son idnticas y un amplio porcentaje de
individuos (los situados dentro de cada caja, el 50%
de cada muestra) tienen unas edades muy
parecidas.
Con lo ya visto hasta ahora tenemos una
aproximacin inferencial sin necesidad de recurrir al contraste. Tanto el anlisis de los
intervalos de confianza de las medias como el estudio de los grficos de caja nos permiten
una evaluacin de hasta qu punto pueden estas dos variables estar relacionadas en la
poblacin de la que proviene la muestra. Es muy probable que no estn asociadas. Pero
para completar el anlisis inferencial debemos recurrir al contraste de hiptesis.

2. Cuando se cumple el criterio de NORMALIDAD puede llevarse a cabo una
evaluacin inferencial, bien a travs de comparar los intervalos de confianza de las medias
en ambos grupos o bien a travs del contraste de hiptesis, siendo la hiptesis nula

H
0

1
=
2


En el programa SPSS este ltimo procedimiento se encuentra en la secuencia de ventanas:

Analizar > Comparar medias > Prueba T para muestras independientes

40 45 50 55 60
Valor observado
-1
0
1
2
N
o
r
m
a
l

e
s
p
e
r
a
d
o
para obesi= no obeso
Grfico Q-Q normal de EDAD EN AOS CUMPLIDOS
Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 6 de 20


En el siguiente cuadro de dilogo que se abre tras
optar por Prueba T para muestras
independientes, debemos seleccionar la variable a
contrastar la variable cuantitativa, en nuestro
caso edad, y la variable de agrupacin la
variable categrica dicotmica, en nuestro ejemplo
la variable obesidad-, a la que habr que definir
grupos activando la casilla correspondiente
(mientras tanto aparecen en la ventana unos signos
de interrogacin entre parntesis):


Si usamos los valores especificados
anotaremos en cada grupo los valores con los que est recogida cada categora de la
variable categrica en nuestra base de datos (en nuestro ejemplo 1 = obeso; 2 = no obeso).
2


La salida del programa es:

Prueba T
Estadsticos de grupo
33 48,70 5,223 ,909
17 50,24 4,944 1,199
PRESENCIA
DE OBESIDAD
obeso
no obeso
EDAD EN AOS
CUMPLIDOS
N Media
Desviacin
tp.
Error tp. de
la media


Primero se muestran los estadsticos resumen en cada grupo: N (tamao), media, desviacin tpica y
el error estndar de la media.

Luego el programa SPSS nos aporta informacin de la prueba T en un nico cuadro resumen, donde
se nos ofrecen varias cosas, que no debemos confundir:

Una prueba de homogeneidad de varianzas (la prueba de Levene), que nos va a informar
sobre el segundo requisito para aplicar la comparacin de medias mediante la prueba t de
Student: la homogeneidad de varianzas. El programa hace un contraste a travs del
estadstico F de Snedecor y nos aporta una significacin estadstica, o valor p asociado a la
hiptesis nula de que las varianzas son homogneas (sealado en color naranja en el
siguiente cuadro). Cuando ese valor p es significativo (p<0,05) debemos dudar de la
homogeneidad de varianzas.

Una doble salida de la comparacin de medias en los dos grupos, expresada en dos
filas de la ventana:
o en la fila superior la salida es cuando se han asumido varianzas iguales en el

2
Vemos como tambin es posible agrupar por una variable cuantitativa estableciendo un punto de
corte, lo que la transformara de facto en una variable categrica con dos niveles o estratos.

Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 7 de 20
contraste anteriormente comentado (o prueba de Levene);
o en la lnea inferior los resultados son los que habra que elegir cuando no se han
asumido varianzas iguales, esto es, cuando la prueba de Levene en el paso anterior
es significativa (p<0,05). El programa hace en este caso una variante de la t de de
Student, aplicando -para construir el estadstico de contraste- una varianza
promediada entre las varianzas de cada grupo.

La prueba T propiamente dicha, para la igualdad de medias nos da diversa informacin:
o El valor de T (t), los grados de libertad del estadstico (gl) y, lo ms importante, el
valor de p (Sig. Bilateral) asociado al contraste (en color amarillo en el cuadro
siguiente).
o El valor de la diferencia de medias entre los dos grupos, su error tpico, y el
intervalo de confianza al 95% de dicha diferencia de medias, que nos da una
informacin sobre cun diferentes son las medias en la poblacin, no slo mediante
una estimacin puntual sino tambin a travs de un intervalo de valores que tiene una
elevada probabilidad de contener la verdadera diferencia de medias (en color celeste
en el cuadro siguiente). Esta informacin tambin es til para comprender si las
medias son o no diferentes entre ambos grupos, aportando adems datos para
conocer con cunta precisin estamos estimando: un intervalo de confianza que
contenga el valor cero supone que no hay diferencias en las medias de ambos
grupos, y si su recorrido (rango entre el valor superior e inferior) es pequeo estamos
diciendo que esta estimacin es bastante precisa.


En el ejemplo con el que estamos trabajando, la prueba de Levene no es significativa (p =
0,604), por lo que asumimos la homogeneidad de varianzas y leemos la t de Student en la
fila superior (se han asumido varianzas iguales): el estadstico t vale -1,004 (con 48 grados
de libertad) y el valorpasociado es 0,32. Conclusin: No hay asociacin entre la edad y
la obesidad, ya que la media de edad de obesos y no obesos no son estadsticamente
diferentes al nivel de significacin alfa = 0,05).

Por otra parte, si interpretamos la diferencia de medias de edad entre ambos grupos, sta se
situara en la poblacin, con una elevada confianza, entre -4,619 y +1,542 aos. Es una
estimacin algo imprecisa (unos cinco aos arriba o abajo) y contiene el valor cero, que
nos hace llegar a la misma conclusin: por la variabilidad del muestreo (error aleatorio) es
posible explicar las pequeas diferencias de medias de edad (1,53 aos) encontradas en
nuestro estudio, por lo que debemos asumir la no-diferencia de medias de edad en la
poblacin.

3. Vamos a ver ahora cmo proceder cuando no es posible aplicar una prueba t de
Student, empleando entonces una prueba no paramtrica.


Como ejemplo hagamos un segundo anlisis aprovechando el estudio de obesidad e
hipertensin. En esta base de datos, la variable obesidad es categrica (obeso / no obeso) y
desearamos saber si est o no relacionada con la presin arterial sistlica (TAS) de los
individuos (una variable cuantitativa, cuya medida son los mm de Hg en la toma de TAS),
esto es, responder a la pregunta hay diferencias en la TAS de los individuos segn sean o
no obesos? O de forma alternativa, est relacionada la TAS con la presencia de obesidad?
Prueba de muestras independientes
,273 ,604 -1,004 48 ,320 -1,538 1,532 -4,619 1,542
-1,022 34,059 ,314 -1,538 1,505 -4,596 1,520
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
EDAD EN AOS
CUMPLIDOS
F Sig.
Prueba de Levene
para la igualdad de
varianzas
t gl Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia Inferior Superior
95% Intervalo de
confianza para la
diferencia
Prueba T para la igualdad de medias
Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 8 de 20

Como en el ejercicio anterior, lo primero es comprobar si se dan los requisitos para aplicar
las pruebas paramtricas, basadas en la media y la varianza. Esto es, hay que explorar
cmo es la distribucin de la variable TAS en cada grupo determinado por la variable
obesidad, solicitando pruebas de normalidad que nos permitan tomar una decisin.

La salida de SPSS es ahora la siguiente:

Explorar
PRESENCIA DE OBESIDAD
Resumen del procesamiento de los casos
33 100,0% 0 ,0% 33 100,0%
17 100,0% 0 ,0% 17 100,0%
PRESENCIA
DE OBESIDAD
obeso
no obeso
PRESIN ARTERIAL
SISTLICA
N Porcentaje N Porcentaje N Porcentaje
Vlidos Perdidos Total
Casos


Como siempre, primero un resumen de los casos (individuos) explorados, e inmediatamente un
cuadro con los estadsticos ms importantes que recogen informacin de la variable cuantitativa
(dependiente para SPSS) en cada grupo de estudio segn los niveles o estratos de la variable
categrica introducida como factor.
Descriptivos
125,97 3,191
119,47
132,47
125,69
120,00
336,030
18,331
95
160
65
28
,398 ,409
-,682 ,798
144,94 6,505
131,15
158,73
144,93
150,00
719,434
26,822
100
190
90
45
-,045 ,550
-,932 1,063
Media
Lmite inferior
Lmite superior
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Lmite inferior
Lmite superior
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
PRESENCIA
DE OBESIDAD obeso
no obeso
PRESIN ARTERIAL
SISTLICA
Estadstico Error tp.


Como podemos ver en el cuadro resumen de estadsticos, la media de TAS en los dos grupos de
comparacin (obesos / no obesos) es ms elevada en el grupo de no obesos (144,95 con un IC
95%

entre 131,15 y 158,73) que en el grupo de obesos (125,97 con un IC
95%
entre 119,47 y 132,47). La
diferencia puntual de estas medias es:

144,95 125,97 = 18,98

casi 19 mm de Hg ms alta en no obesos!; y los IC
95%
de las medias en ambos grupos se
superponen en un rango muy corto (el que va desde 131,15 a 132,47). Es probable que ambas
medias sean estadsticamente diferentes y que podamos concluir que las dos variables (TAS y
Obesidad) estn asociadas en la poblacin de la que proviene la muestra.

El programa nos muestra ahora las pruebas de normalidad, para tomar una decisin sobre la
adecuacin de los test paramtricos a la comparacin de medias.

Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 9 de 20
obeso no obeso
PRESENCIA DE OBESIDAD
80
100
120
140
160
180
200
P
R
E
S
I

N

A
R
T
E
R
I
A
L

S
I
S
T

L
I
C
A

Ambas pruebas de normalidad muestran que en el grupo obeso la variable TAS no se distribuye
segn una Ley Normal, ya que la p asociada a los contrastes de K-S (0,001) y S-W (0,036) da por
debajo del nivel de significacin alfa prefijado (0,05). Esto nos obligar a tomar un camino diferente en
el anlisis de la relacin entre estas dos variables, optando por pruebas no paramtricas.

PRESIN ARTERIAL SISTLICA
Si hemos solicitado un grfico de caja para la distribucin
de la variable TAS en cada grupo de la variable obesidad,
obtendremos una imagen como la que se acompaa,
donde llama la atencin una mayor dispersin de los
valores de TAS en el grupo no obeso y una tendencia,
as mismo, a mostrar valores ms elevados de TAS en
este ltimo grupo.

Llegados a este punto, si deseamos hacer un
contraste de hiptesis para evaluar hasta qu punto
las medias de TAS son diferentes, debemos optar
por una de las Pruebas no paramtricas > (para)
2 muestras independientes, con el casi
convencimiento de que el test va a ser
estadsticamente significativo.

Una vez seleccionada la opcin no paramtrica y
para dos muestras independientes, el cuadro de
dilogo del SPSS es el que sigue:

Es muy parecido a la que hemos visto en Comparar
medias > Prueba T para muestras independientes:
en las ventanas hay que seleccionar al menos una
variable a contrastar (la cuantitativa) y una variable
de agrupacin (la categrica), que debe servir para
Definir grupos

Se pueden elegir entre varios Tipo de prueba, siendo la ms comn la U de Mann-
Whitney, sealada por defecto en el programa
SPSS. Tras aplicar, la salida es la siguiente:


Pruebas no paramtricas
Estadsticos descriptivos
50 132,42 23,168 95 190
50 1,34 ,479 1 2
PRESIN ARTERIAL
SISTLICA
PRESENCIA DE
OBESIDAD
N Media
Desviacin
tpica Mnimo Mximo


Pruebas de normalidad
,203 33 ,001 ,930 33 ,036
,163 17 ,200 * ,958 17 ,587
PRESENCIA
DE OBESIDAD
obeso
no obeso
PRESIN ARTERIAL
SISTLICA
Estadstico gl Sig. Estadstico gl Sig.
Kolmogorov-Smirnov
a
Shapiro-Wilk
Este es un lmite inferior de la significacin verdadera. *.
Correccin de la significacin de Lilliefors a.
Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 10 de 20
Prueba de Mann-Whitney
Rangos
33 22,05 727,50
17 32,21 547,50
50
PRESENCIA
DE OBESIDAD
obeso
no obeso
Total
PRESIN ARTERIAL
SISTLICA
N
Rango
promedio
Suma de
rangos


Tras hacer un pequeo resumen de los casos procesados a travs de sus estadsticos descriptivos
(tamao muestral, media, desviacin tpica y valores mximo y mnimo), el programa procesa la
informacin contenida en la variable cuantitativa en cada grupo, y calcula varios estadsticos de
contraste. Lo que debemos interpretar es la Sig. Asinttica (bilateral), que en nuestro caso vale
0,018 y lleva a concluir que se rechaza la hiptesis nula de que la media de TAS es similar en ambos
grupos; o lo que es alternativamente igual, que existe una asociacin estadsticamente significativa
entre la TAS y la Obesidad).


2. PASOS A DAR EN SPSS PARA COMPARAR LAS MEDIAS DE
UNA VARIABLE CUANTITATIVA EN TRES O MS GRUPOS
ESTABLECIDOS POR UNA VARIABLE CATEGRICA.

Cuando la variable cualitativa tiene tres o ms categoras, el anlisis de asociacin entre
esta variable y una cuantitativa ya no puede llevarse a cabo por el test t de Student, sino que
debe recurrirse a una tcnica matemtica conocida como ANALISIS DE LA VARIANZA. Esta
prueba contrasta la hiptesis H
0
de que las medias de las distribuciones de la variable
cuantitativa en todos y cada uno de los grupos independientes son iguales:

H
0

1
=
2
=
3
=
n


Esto es, con que exista una media diferente a las dems, el test estadstico ser significativo
al nivel alfa establecido.

El ANOVA tiene las mismas exigencias que la t de Student: requiere que la variable
cuantitativa se distribuya segn una Ley Normal en cada uno de los grupos a comparar, y
adems exige que las varianzas sean homogneas.

Vamos a realizar una prueba de ANOVA, para lo cual vamos a convertir la variable cuantitativa edad
de la base de datos OBESIDAD Y HTA en una variable categrica (edadrec) con tres categoras:
a) menos de 47 aos
b) de 47 a 52 aos
c) ms de 52 aos

Y ahora desearamos comprobar si existe relacin entre la presin arterial sistlica (TAS) y los tres
segmentos de edad establecidos por edadrec. Consistira en evaluar si las medias de TAS son
diferentes en los grupos de edad, y si fuese as en qu sentido y en qu estratos etarios.
Estadsticos de contraste
a
166,500
727,500
-2,358
,018
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilateral)
PRESIN
ARTERIAL
SISTLICA
Variable de agrupacin: PRESENCIA DE OBESIDAD a.
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 11 de 20
Ms de 52 aos De 47 a 52 aos Menos de 47 aos
EDAD EN AOS CUMPLIDOS (Banded)
200
180
160
140
120
100
80
P
R
E
S
I
N
A
R
T
E
R
IA
L
S
IS
T

L
IC
A
7







Case Processing Summary
19 100,0% 0 ,0% 19 100,0%
16 100,0% 0 ,0% 16 100,0%
15 100,0% 0 ,0% 15 100,0%
EDAD EN AOS
CUMPLIDOS (Banded)
Menos de 47 aos
De 47 a 52 aos
Ms de 52 aos
PRESIN ARTERIAL
SISTLICA
N Percent N Percent N Percent
Valid Missing Total
Cases
1. Antes que nada debemos comprobar si se
cumple el requisito de normalidad en la distribucin de la variable cuantitativa en
todos y cada uno de los estratos o grupos que establece la variable categrica.

Procedemos como ya hemos visto
antes, a travs de Analizar >
Estadsticos descriptivos >
Explorar

La salida del programa SPSS ser:

Vemos en el cuadro anterior los
estadsticos descriptivos en cada uno
de los tres grupos establecidos por la
variable edadrec. Las medias
puntuales de TAS son 128.79, 133,38
y 136.00 mm de Hg. Los IC95% de
estas medias son algo anchos y se
superponen en gran parte de su
recorrido, por lo que es muy probable
que no existan diferencias en las
medias y que estas dos variables no se
asocien en la poblacin de la que
proviene la muestra analizada.

Con respecto a los test de normalidad,
se encuentra significacin estadstica
(p<0,05) en los dos contrastes de
hiptesis en uno de los grupos (el de
menos edad), y en el test de Shapiro-
Wilk en el grupo de edad media, lo que
lleva a asumir la no-normalidad en la
distribucin de la variable TAS en la poblacin de la que provienen los individuos de la muestra.

Tests of Normality
,278 19 ,000 ,823 19 ,002
,193 16 ,112 ,850 16 ,013
,117 15 ,200* ,953 15 ,574
EDAD EN AOS
CUMPLIDOS (Banded)
Menos de 47 aos
De 47 a 52 aos
Ms de 52 aos
PRESIN ARTERIAL
SISTLICA
Statistic df Sig. Statistic df Sig.
Kolmogorov-Smirnov
a
Shapiro-Wilk
This is a lower bound of the true significance. *.
Lilliefors Significance Correction a.

Y en el grfico de cajas puede visualizarse como las distribuciones
de la variable TAS en los tres grupos erarios establecidos por
edadrec es bastante similar, aunque con dispersin o
variabilidad creciente segn aumenta la edad.

Descriptives
128,79 4,140
120,09
137,49
126,99
120,00
325,620
18,045
110
180
70
20
1,484 ,524
2,300 1,014
133,38 5,994
120,60
146,15
133,75
142,00
574,917
23,977
100
160
60
48
-,281 ,564
-1,707 1,091
136,00 7,355
120,23
151,77
135,28
130,00
811,429
28,486
95
190
95
35
,492 ,580
-,597 1,121
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
EDAD EN AOS
CUMPLIDOS (Banded) Menos de 47 aos
De 47 a 52 aos
Ms de 52 aos
PRESIN ARTERIAL
SISTLICA
Statistic Std. Error
Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 12 de 20
Con los datos previos ya intumos que no van a encontrarse diferencias estadsticamente
significativas entre las medias de TAS al comparar los tres grupos de edad.

Por otra parte no sera demasiado correcto aplicar un ANOVA, ya que la variable
TAS no se distribuye como una Normal en los grupos de comparacin. De todas
formas, y con carcter puramente instructivo, vamos llevar a cabo el contraste.

2. Anlisis de la varianza de una va. En la ventana correspondiente del SPSS aplicamos
Analizar > Comparar medias > ANOVA de un factor...



En la nueva ventana de dilogo seleccionamos la variable categrica que establecer los
grupos a comparar y la trasladamos a la ventana Factor; en la ventana Dependientes
colocamos la variable cuantitativa,
en nuestro caso Presin arterial
sistlica.

En la pestaa que pone Post
hoc... (contrastes o
comparaciones mltiples a
posteriori) seleccionamos alguno
de los procedimientos que se nos
ofrecen. El ms habitual es el de
Bonferroni (tambin el de
Scheff). Estos contrastes tienen
sentido slo si el ANOVA sale
significativo o prximo a la significacin estadstica, ya que lo que realizan es comparaciones
de las medias en las mltiples parejas de grupos que puedan contrastarse, para intentar
averiguar dnde est la diferencia (o diferencias) que ha causado que se rechace la
hiptesis nula en la primera parte del ANOVA.

Tambin debemos explorar los contenidos de la pestaa Opciones..., para solicitar una
prueba de homogeneidad de varianzas y, si lo deseamos, un resumen de los principales
descriptivos en cada grupo de comparacin.




Los resultados de las pruebas solicitadas son los siguientes:

Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 13 de 20
ANOVA de un factor

Primero se nos muestra un cuadro resumen con los estadsticos descriptivos (de la variable
cuantitativa) ms relevantes en cada grupo que se va a contrastar: las medias (y sus IC
95%
), las
desviaciones tpicas y los valores mximo y mnimo.

Descriptivos
PRESIN ARTERIAL SISTLICA
19 128,79 18,045 4,140 120,09 137,49 110 180
16 133,38 23,977 5,994 120,60 146,15 100 160
15 136,00 28,486 7,355 120,23 151,77 95 190
50 132,42 23,168 3,277 125,84 139,00 95 190
Menos de 47
De 47 a 52
Ms de 52
Total
N Media
Desviacin
tpica Error tpico Lmite inferior
Lmite
superior
Intervalo de confianza para
la media al 95%
Mnimo Mximo


Luego, el programa SPSS nos ofrece un test para evaluar la homogeneidad de varianzas: es el mismo
que se aplicaba de rutina en el procedimiento comparacin de medias en dos grupos independientes
(prueba T): el test de Levene. En nuestro ejemplo la significacin estadstica p vale 0.056, pudiendo
asumirse la homogeneidad de varianzas (aunque en el lmite de la no significacin).

Prueba de homogeneidad de varianzas
PRESIN ARTERIAL SISTLICA
3,059 2 47 ,056
Estadstico
de Levene gl1 gl2 Sig.


Por ltimo, aparece la salida del ANOVA propiamente dicho, con sus diferentes componentes o
fuentes de variabilidad: la inter-grupos y la intra-grupos. Esta ltima representara la variabilidad o
dispersin que no es explicada por el factor de agrupamiento (la variable categrica), y que sera
explicable slo por el azar.

ANOVA
PRESIN ARTERIAL SISTLICA
457,272 2 228,636 ,416 ,662
25844,908 47 549,892
26302,180 49
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrtica F Sig.


Para llevar a cabo el contraste, se recurre al estadstico F de Snedecor, que en nuestro ejemplo vale
0.416 y tiene un valor p asociado de 0.662 (no significativo). Con esto concluiramos nuestra
evaluacin, diciendo que las variables TAS y grupos de edad no muestran asociacin; o que se
acepta la hiptesis nula de que las medias de TAS son iguales en los diferentes grupos de
edad. En este caso no habra lugar a evaluar los contrastes a posteriori, puesto que no se han
encontrado diferencias significativas en el ANOVA. An as mostramos la salida de SPSS:

Pruebas post hoc
Comparaciones mltiples
Variable dependiente: PRESIN ARTERIAL SISTLICA
Bonferroni
-4,586 7,957 1,000 -24,34 15,17
-7,211 8,099 1,000 -27,32 12,90
4,586 7,957 1,000 -15,17 24,34
-2,625 8,428 1,000 -23,55 18,30
7,211 8,099 1,000 -12,90 27,32
2,625 8,428 1,000 -18,30 23,55
(J) EDAD EN AOS
CUMPLIDOS
(Categorizada)
De 47 a 52
Ms de 52
Menos de 47
Ms de 52
Menos de 47
De 47 a 52
(I) EDAD EN AOS
CUMPLIDOS
(Categorizada)
Menos de 47
De 47 a 52
Ms de 52
Diferencia de
medias (I-J) Error tpico Sig. Lmite inferior
Lmite
superior
Intervalo de confianza al
95%

Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 14 de 20

En el cuadro de comparaciones mltiples vemos que cada grupo de edad se compara con los otros
dos, obtenindose en cada contraste la diferencia de medias, el IC
95%
, el error estndar y el
valorpasociado, que en todos los casos es no-significativo, como ya sabamos que iba a suceder.

3. Pasos a dar cuando no puede aplicarse ANOVA. En nuestro ejercicio, al haberse
detectado problemas con la normalidad de la variable TAS en alguno de los grupos etarios,
lo correcto habra sido recurrir a una prueba no paramtrica en:

Analizar > Pruebas no paramtricas > k muestras independientesUna vez abierta
la ventana del procedimiento, vemos que es muy parecida a la del ANOVA, debiendo
seleccionarse una variable a contrastar (la cuantitativa, en el ejemplo la Presin arterial
sistlica) y una variable de agrupacin (la categrica, en nuestro caso la edadrec que
corresponde a la primitiva variable edad que hemos recodificado en nominal, con tres
grupos o estratos), debiendo especificarle al programa SPSS el rango de valores (en
nuestro caso de 1 a 3, que son los nmeros con los que se han codificado los tres estratos).
El tipo de prueba es por defecto el test de Kruskal-Wallis.

La salida que obtendremos, tras dar al botn de aceptar, ser la siguiente (nos hemos
pasado ahora a la versin en ingls del programa SPSS 13.0):

NPar Tests (Pruebas No Paramtricas)

Primero un resumen de los estadsticos para cada variable incluida en el contraste. En nuestro
ejemplo son slo dos, a las que SPSS considera numricas (realmente para la segunda variable -
edadrec- no tiene sentido la estadstica descriptiva llevada a cabo, pues es una variable categrica.
Descriptive Statistics
50 132,42 23,168 95 190
50 1,92 ,829 1 3
PRESIN ARTERIAL
SISTLICA
EDAD EN AOS
CUMPLIDOS (Banded)
N Mean Std. Deviation Minimum Maximum


Luego aparece la prueba de contraste, el test de Kruskal-Wallis, con los tamaos de muestra (N) y los
rangos promedio para cada uno de los grupos a comparar. Y despus, en una segunda tabla, aparece
el estadstico Chi-cuadrado, que vale 0,487, sus grados de libertad (el nmero de grupos -3- menos
uno), y su significacin estadstica (p = 0,784). Llegamos a la misma conclusin que con el ANOVA:
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 15 de 20
las variables contrastadas no estn asociadas en la poblacin de la que provienen la muestra
estudiada, pudiendo achacarse las pequeas diferencias apreciadas en la presin arterial
sistlica -en los diferentes grupos de edad- al puro azar o error aleatorio del muestreo.
Ranks
19 23,71
16 26,28
15 26,93
50
EDAD EN AOS
CUMPLIDOS (Banded)
Menos de 47 aos
De 47 a 52 aos
Ms de 52 aos
Total
PRESIN ARTERIAL
SISTLICA
N Mean Rank


En este ejemplo slo puede concluirse que no tenemos
pruebas para rechazar la hiptesis nula, esto es
aceptaremos la igualdad de medias en la poblacin de la
que proviene la muestra y concluiremos diciendo que
no se han encontrado argumentos que relacionen la
TAS con los tres rangos de edad analizados. Por otra
parte, si hubisemos detectado diferencias hemos de
aclarar que con este tipo de contrastes no paramtricos
no es posible realizar contrastes a posteriori.


3. PASOS A DAR PARA HACER UNA COMPARACIN DE MEDIAS
CON EL PROGRAMA EPI-INFO.

El programa EPI-INFO permite evaluar medias en dos o ms grupos con dos procedimientos
o aproximaciones diferentes:

En la versin EPI INFO 6, a travs de la rutina EPITABLE, siempre que tengamos
ya calculados los estadsticos resumen (media y varianza) de la variable
cuantitativa en cada uno de los estratos o grupos establecidos por la variable
categrica.
En la versin EPI INFO 2002 o posterior, a travs del programa ANALIZAR
DATOS, tras cargar el fichero que contiene los datos individuales y las variables
medidas, de forma muy parecida a lo que se ha hecho en el programa SPSS.

1. Si tenemos los estadsticos resumen de la variable cuantitativa en todos y cada uno
de los grupos establecidos por la variable categrica o, simplemente, en los grupos
independientes que van a compararse, el programa EPI INFO 6.0 nos permite una
doble aproximacin inferencial: la comparacin de los intervalos de confianza de las
medias en cada grupo y el contraste de hiptesis que parte de la hiptesis nula de que las
medias de los diferentes grupos son iguales.

Vamos a trabajar con el mismo ejemplo que en el apartado 1 paso 3, esto es, vamos a
comparar las medias de TAS entre los dos grupos establecidos por la variable Obesidad
(obesos / no obesos). Pero en este caso ya tenemos calculados sus ndices resumen: la
media, la varianza y el tamao muestral.
Existe asociacin? Presin arterial sistlica
Obesidad N Media Varianza Desv. Estndar
Obeso 33 125,97 336,030 18,331
No obeso 17 144,94 719,434 26,822

Test Statistics
a,b
,487
2
,784
Chi-Square
df
Asymp. Sig.
PRESIN
ARTERIAL
SISTLICA
Kruskal Wallis Test
a.
Grouping Variable: EDAD EN
AOS CUMPLIDOS (Banded)
b.
Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 16 de 20
1.1. En primer lugar vamos a calcular los intervalos de confianza de la media de
TAS en ambos grupos. Esta es una primera aproximacin inferencial. Abrimos en
EPITABLE la opcin Describe > Mean


Y ahora debemos introducir los datos que nos pide la calculadora: la media, la desviacin
estndar y el tamao de la muestra, para cada grupo (obesos y no obesos). Mostramos a
continuacin la salida para el grupo obesos:



El intervalo de confianza al 95% que nos da el programa EPI INFO (119,72 132,22) es ligeramente
ms pequeo que el que aportaba el programa SPSS para la misma media (119,47 132,47). De
forma similar se hara el clculo en el otro grupo (no obesos), y con ambos intervalos de confianza
deberamos tomar la decisin de hasta qu punto ambas medias en la poblacin seran diferentes.

1.2. En segundo lugar, procedamos a comparar las medias de TAS en los dos
grupos. Esta es la aproximacin inferencial ms clsica, a travs del contraste
de hiptesis. En la calculadora estadstica EPITABLE se realiza a travs de la
opcin Compare > Means


Una vez abierta la ventana de dilogo, nos pide cuantas muestras o grupos vamos a
comparar (how many samples?). En nuestro ejemplo son solo dos (obesos y no
obesos), por lo que sealamos 2 y aceptamos. El programa nos ofrece una nueva ventana
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 17 de 20
para hacer un ANOVA para dos grupos, debiendo introducir para cada uno de los grupos la
media, la varianza y el tamao.

Al aceptar (Calculate) el programa nos ofrece la salida de un Anlisis de la Varianza (ANOVA), con la
variabilidad intergrupos (Variance between samples), la varianza residual (Residual variance), el
estadstico de contraste de Snedecor (F Statistic) y el valor p asociado (p value), que en nuestro
ejemplo vale 0,004749. Al ser menor del nivel de significacin habitualmente prefijado (0,05),
concluimos que las medias de presin arterial sistlica son diferentes en obesos y no
obesos.
3





2. Cuando tengamos a base de datos completa, con datos individuales, es posible
recurrir a su explotacin de forma similar a como lo hace el programa SPSS, ya que
EPI INFO 2000 -y versiones posteriores- es capaz de reconocer e importar archivos en
formato DBase (.dbf), Excel (.xls) o Access (.mdb), entre otros.

Vamos a resumir aqu los pasos para evaluar la relacin entre obesidad y edad con el
subprograma ANALIZAR DATOS del programa EPI INFO en su versin 3.3.2 (2005).

Tras leer el fichero que contiene los datos, en la ventana Analysis buscamos Estadsticas
bsicas, y marcamos Medias. Se abrir un cuadro de dilogo donde es posible seleccionar
la variable cuantitativa en la ventana Medias de, y la variable categrica -que establece
los grupos de comparacin- en la ventana Tabulado por valores de. As mismo es posible
establecer ciertas Preferencias en la salida del anlisis.



Hechas estas selecciones se oprime el botn
Aceptar, y la salida que se muestra es un anlisis
estadstico completo: primero un resumen de los
estadsticos bsicos en los grupos que se comparan
(n, media, varianza, desviacin tpica, mediana,
mximo mnimo, moda, y percentiles 25% y 75%).

Luego aparece la salida del ANOVA (test
paramtrico para comparacin de medias)
aclarndonos que debe emplearse slo para datos
normalmente distribuidos. En este ejemplo, como se

3
Recurdese que este contraste lo hicimos en SPSS con una prueba no paramtrica (la U de Mann-
Whitney), porque la evaluacin de la normalidad de la distribucin de la variable presin arterial
sistlica result crtica y asumimos que no deberamos emplear la prueba de comparacin de medias
t de Student. El resultado fue parecido (p = 0,018) y la decisin la misma. Con el programa EPITABLE
corremos el riesgo de aplicar incorrectamente una prueba paramtrica si no hemos evaluado
previamente los requisitos para llevarla a cabo.
Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 18 de 20
trata de comparar dos grupos, aparte del ANOVA hace un test T de Student, que puede comprobarse
que arroja un valor idntico al obtenido en el punto 1 paso 1 de este mismo documento, con una
probabilidad p asociada al contraste de 0,32 (no significativo).

Si en la opcin Preferencias hubisemos marcado Estadsticas Avanzado, seguidamente se nos
muestra el test de Bartlett para comprobar la homogeneidad de varianzas poblacionales (en este caso
no es significativo, por lo que se asume la igualdad), y el test no paramtrico de Mann-
Whitney/Wilconxon para dos grupos.




4. PASOS A DAR PARA HACER UNA COMPARACIN DE DOS
MEDIAS CON EL PROGRAMA EPIDAT 3.1.

El programa EPIDAT trabaja con datos agrupados de forma similar a la calculadora
EPITABLE de EPI INFO 6.0, pero en este caso restringido a comparar slo dos muestras o
grupos. Conociendo, por tanto, los valores resumen (medias y varianzas) de las
distribuciones de la variable cuantitativa en los grupos que van a contrastarse, se procede a
seleccionar en la pantalla inicial del programa EPIDAT 3.1:

Mtodos > Inferencia sobre parmetros > Dos poblaciones > Muestras independientes



Enseguida se abre una ventana donde debemos introducir datos: la media, la varianza y el
tamao (n) de cada grupo que se desea contrastar. El nivel de confianza (%) viene prefijado
en el 95%, pero puede modificarse.

Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
fabis.org, 2007

DocuWeb fabis.org 19 de 20


Tras entrar los datos solicitados se oprime en la barra de herramientas situada arriba el
icono que parece una pequea calculadora de bolsillo, obtenindose la siguiente salida:

Comparacin de dos medias. Muestras independientes

Nivel de confianza: 95,0%

Muestra 1 Muestra 2
-------------------- ---------- ----------
Media 48,697 50,235
Desviacin estndar 5,223 4,944
Tamao de muestra 33 17


Prueba de comparacin de varianzas

Estadstico F gl numerador gl denominador Valor p
------------------ --------------- --------------- -------
1,1160 32 16 0,8408


Diferencia de medias Varianzas IC (95,0%)
-------------------- ---------- ----------------------
1,538 Iguales -1,542 4,618
Distintas -1,520 4,596

Prueba de comparacin de medias
Varianzas Estadstico t gl Valor p
------------------ ------------------ ------- -------
Iguales 1,0039 48 0,3205
Distintas 1,0220 34 0,3140

Vemos como este programa tambin realiza una prueba previa para comprobar la igualdad de las
varianzas, y luego aporta dos aproximaciones: la diferencia de medias entre ambos grupos y su
intervalo de confianza, y la prueba de comparacin de medias t de Student. Los resultados son
idnticos a los obtenidos con el programa SPSS. De forma similar nos ofrece dos opciones de lectura,
segn sean o no homogneas las varianzas poblacionales.


Aguayo Canela, Mariano DocuWeb fabis.org
DocuWeb fabis.org 20 de 20
Anexo.

Tabla de datos del estudio sobre Hipertensin y Obesidad.

EDAD PAS PAD SEXO OBESIDAD
41 120 70 2 1
41 140 80 1 1
41 110 80 2 1
42 120 85 2 1
42 120 86 1 2
42 140 90 1 1
42 180 110 2 2
43 120 70 1 1
43 120 86 2 1
43 140 90 1 1
44 110 80 1 1
45 120 70 1 1
45 120 80 1 1
45 122 80 1 1
47 130 80 2 1
47 120 80 1 1
47 155 80 2 2
47 110 80 1 2
47 150 85 2 2
48 110 70 2 2
48 150 100 2 2
48 160 102 2 1
48 160 110 2 2
49 110 70 1 1
49 150 90 1 1
49 139 90 2 2
50 145 70 1 1
50 100 70 2 1
50 120 85 1 2
50 160 100 1 1
51 120 80 1 1
52 100 60 2 1
52 100 70 2 1
52 150 80 2 2
52 160 100 1 1
53 125 75 2 1
53 115 75 1 1
53 110 78 2 1
53 170 100 2 2
54 100 60 1 2
54 120 80 1 1
54 120 80 1 1
54 190 120 2 2
55 135 80 1 1
57 95 70 1 1
57 150 75 1 1
57 130 80 1 2
57 180 95 2 2
59 150 80 1 1
59 150 80 1 2
1= HOMBRE 1= OBESO
2= MUJER 2= NO OBESO

Vous aimerez peut-être aussi