Vous êtes sur la page 1sur 64

Fundamentos de Biologa

Aplicada I

Cuaderno de Prcticas de
Estadstica con SPSS
Curso 2010-2011

Departamento de Estadstica e I.O.


Universidad de Granada

Autores:

Profesores de la asignatura:

Ana Mara Lara Porras


Javier Esquivel Snchez
Nuria Rico Castro
M Dolores Huete Ruiz
Ismael R. Snchez Borrego Ismael R. Snchez Borrego
Diego Torrecillas de Amo
Silvia Valenzuela Ruiz

ndice
pg.
CONTRASTES DE HIPTESIS
PARAMTRICOS Y NO PARAMTRICOS
Ejercicio 1
Ejercicio 2
Ejercicio 3
Ejercicio 4
Ejercicio 5

3
5
6
7
9

ANLISIS DE REGRESIN
Ejercicio 1
Ejercicio 2
Ejercicio 3
Ejercicio 4
Ejercicio 5

10
10
14
17
19
22

DISEO DE EXPERIMENTOS
Ejercicio 1
Ejercicio 2
Ejercicio 3
Ejercicio 4
Ejercicio 5
Ejercicio 6

25
25
27
28
29
31
33

ANLISIS DE LA COVARIANZA
Ejercicio 1
Ejercicio 2
Ejercicio 3
Ejercicio 4

35
35
37
39
41

ANLISIS CLUSTER
Ejercicio 1
Ejercicio 2

43
43
50

ANLISIS DE DATOS CUALITATIVOS


Ejercicio 1
Ejercicio 2
Ejercicio 3

Bibliografa

54

54
57
60

62

FBA I Cuaderno de Prcticas de Estadstica con SPSS

CONTRASTES DE HIPTESIS
PARAMTRICOS Y NO PARAMTRICOS
Ejercicio 1:
En un estudio sobre angina de pecho en ratas se dividi aleatoriamente a 18 animales
afectados en dos grupos de 9 individuos cada uno. A un grupo se le suministr un
placebo y al otro un frmaco experimental FL113. Despus de un ejercicio controlado
sobre una cinta sin fin se determin el tiempo de recuperacin de cada rata. Se piensa
que el FL113 reducir el tiempo medio de recuperacin. Se dispone de la siguiente
informacin:
Placebo 203 229 215 220 223 233 208 228 209
FL113 221 207 185 203 187 190 195 204 212
Suponiendo que las distribuciones del tiempo necesario para la recuperacin son
normales, comparar las muestras dadas para saber si se puede admitir que ambas
muestras provienen de la misma poblacin. Efectuar los correspondientes contrastes
(sobre medias y varianzas) al nivel de significacin = 0.05.

X: tiempo de recuperacin de las ratas tratadas con placebo N(1, 1)


Y: tiempo de recuperacin de las ratas tratadas con FL113 N(2, 2)

Primer contraste

H0: 1= 2
H1: 1 2

Segundo contraste

H0: 12= 22
H1: 12 22

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Estadsticos de grupo

Tiempo de recuperacin

Grupo placebo o FL113


Grupo placebo
Grupo FL113

Departamento de Estadstica e I.O.

N
9

Media
218,67

Desviacin tp.
10,524

Error tp. de la
media
3,508

200,44

12,126

4,042

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Ejercicio 2:
Se ha realizado un estudio para investigar el efecto del ejercicio fsico en el nivel de
colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron
muestras de sangre para determinar el nivel del colesterol de cada participante. Despus,
los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras
y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras
de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los
sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y
despus del ejercicio. Se recogieron los siguientes datos
Nivel previo mg/dl
182
232
191
200
148
249
276
213
241
480
262

Nivel posterior mg/dl


198
210
194
220
138
220
219
161
210
313
226

Decidir si existen diferencias significativas entre estos niveles antes y despus del
ejercicio fsico.

Prueba de muestras relacionadas


Diferencias relacionadas
95% Intervalo de
confianza para la
diferencia
DesviacinError tp. de
Media
la media Inferior Superior
tp.
Par 1 Colesterol antes d
ejercicio - Coleste 33,18
despues del ejerc

51,066

Departamento de Estadstica e I.O.

15,397

-1,12

67,49

t
2,155

gl

Sig. (bilateral)
10

Universidad de Granada

,057

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Ejercicio 3:
En unos laboratorios clnicos se toman muestras de 650 anlisis de sangre y se anota el
nmero de eritrocitos por milmetro cbico de sangre. Se puede admitir que el nmero
de eritrocitos se distribuye normalmente? Los resultados agrupados en 7 clases son los
que figuran en la tabla adjunta
N de eritrocitos en millones
0-2,5
2.5-3.5
3.5-4.5
4.5-5.5
5.5-6.5
6.5-7.5
7.5-8.5

N de muestras
8
52
140
210
160
70
10

Prueba de Kolmogorov-Smirnov para una muestra


Eritrocitos
N

650
Media

Parmetros normales(a,b)

Desviacin tpica

Diferencias ms extremas

Absoluta

5,0862
1,23238
,164

Positiva

,159

Negativa

-,164

Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)

4,192
,000

a La distribucin de contraste es la Normal.


b Se han calculado a partir de los datos.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Ejercicio 4:
Se realiza una investigacin para determinar si el hecho de contraer hepatitis es
independiente de haber sido vacunado contra la enfermedad. Para ello se utilizan 1083
voluntarios varones. De ellos, se eligen aleatoriamente 549 y son vacunados con un
nuevo frmaco. Los restantes, 534, no son vacunados. Despus de un cierto tiempo, se
observ que 70 de los 534 voluntarios no vacunados contrajeron la hepatitis, mientras
que solamente 11 de los 549 vacunados no la contrajeron. Los datos se muestran en la
tabla adjunta
Vacunacin
Hepatitis
SI
NO

SI
11
538

NO
70
464

Contrastar la independencia entre la vacunacin y la enfermedad con =0.05.

Tabla de contingencia HEPATITI * VACUNACI


Recuento
VACUNACI
no
HEPATITI

Total
si

no

464

538

1002

si

70

11

81

534

549

1083

Total

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Correccin por
continuidad(a)
Razn de verosimilitud

Sig. asinttica
(bilateral)
,000

46,650

,000

53,194

,000

Valor
48,242(b)

gl

Estadstico exacto de
Fisher
Asociacin lineal por lineal

Sig. exacta
(bilateral)

,000
48,197

Sig. exacta
(unilateral)

,000

,000

N de casos vlidos

1083
a Calculado slo para una tabla de 2x2.
b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 39,94.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Ejercicio 5:
Se realiza un estudio para investigar la asociacin entre el color de las flores y la
fragancia de las azaleas silvestres. Se observan 200 plantas floridas seleccionadas
aleatoriamente. Cada una de ellas se clasifica segn el color y la presencia o ausencia de
fragancia. Los datos se muestran en la tabla adjunta

Fragancia
SI
NO

Color
Rosa
60
10

Blanca
12
50

Naranja
58
10

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por lineal
N de casos vlidos

Valor
82,293(a)
83,848
59,712

gl
2
2
1

Sig. asinttica
(bilateral)
,000
,000
,000

200

a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 21,70.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

10

ANLISIS DE REGRESIN
Ejercicio 1:
Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la
longitud en cm. de una cierta variedad de planta al cabo de un ao de vida para predecir
la longitud de esa variedad de planta en edad adulta:

Longitud en cm.
el primer ao
15.3
14.8
12.6
18.4
17.9
15.6
18.4
14.1
20.2
21.7
20.4
16.5
15.9
17.9
16.7

Longitud en cm.
en edad adulta
30.7
32.5
26.3
35.9
34.3
28.5
37.4
29.7
38.8
40.4
40.9
33.3
30.1
35.7
31.4

Se pide:
a)
b)
c)
d)

Representar el diagrama de dispersin


Estimar los parmetros del modelo
Coeficientes de correlacin lineal y de determinacin. Interpretacin
Plantear y contrastar el test para conocer la significacin de la variable
independiente a un nivel de significacin del 5 %

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

11

a) Diagrama de dispersin

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

12

42
40
38
36
34

LONG_ADU

32
30
28
26
12

14

16

18

20

22

LONG_1

b) Estimacin de los parmetros del modelo

Coeficientesa

Modelo
1

(Constante)
LONG_1

Coeficientes no
estandarizados
B
Error tp.
5,296
2,694
1,663
,156

Coeficientes
estandarizad
os
Beta
,947

t
1,965
10,657

Sig.
,071
,000

a. Variable dependiente: LONG_ADU

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

13

c) Coeficientes de correlacin lineal y de determinacin. Interpretacin


Resumen del modelo

Modelo
1

R
,947a

R cuadrado
corregida
,889

R cuadrado
,897

Error tp. de la
estimacin
1,4666

a. Variables predictoras: (Constante), LONG_1

d) Test de significacin de la variable independiente.


ANOVAb

Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
244,306
27,963
272,269

gl
1
13
14

Media
cuadrtica
244,306
2,151

F
113,577

Sig.
,000a

a. Variables predictoras: (Constante), LONG_1


b. Variable dependiente: LONG_ADU

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

14

Ejercicio 2:
Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la
concentracin de estrona en la saliva para predecir la concentracin de dicho esteroide
en plasma libre. Se tomaron los siguientes datos de 13 varones sanos:

Concentracin de estrona
en saliva pg./mL.
7.4
7.5
8.5
9
9
11
13
14
14.5
16
17
18
20

Concentracin de estrona
en plasma libre en pg./mL.
30
25
31.5
27.5
39.5
38
43
49
55
48.5
51
64.5
63

Se pide:
a) Representar el diagrama de dispersin
b) Plantear el modelo de regresin y estimar los parmetros del modelo.
Interprtalos
c) Obtener el coeficiente de correlacin lineal de Pearson y el coeficiente de
determinacin
d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de
regresin
e) Contrastar la significacin del coeficiente de regresin
a) Diagrama de dispersin
70,0

60,0

estrona

50,0

40,0

30,0

20,0
7,5

10,0

12,5

15,0

17,5

20,0

saliva

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

15

b) Planteamiento del modelo, estimacin de los parmetros y su interpretacin


Coeficientesa

Modelo
1

(Constante)
saliva

Coeficientes no
estandarizados
B
Error tp.
6,887
3,965
2,886
,297

Coeficientes
estandarizad
os
Beta

t
1,737
9,705

,946

Sig.
,110
,000

a. Variable dependiente: plasma

c) Coeficiente de correlacin lineal de Pearson y coeficiente de determinacin

Resumen del modelo


Modelo
1

R
R cuadrado
,946a
,895

R cuadrado
corregida
,886

Error tp. de la
estimacin
4,3997

a. Variables predictoras: (Constante), saliva

d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de


regresin

Coeficientesa
Coeficientes no
estandarizados
Modelo
1

(Constante)
saliva

B
6,887
2,886

Error tp.
3,965
,297

Coeficientes
estandarizad
os
Beta
,946

t
1,737
9,705

Sig.
,110
,000

Intervalo de confianza para


B al 95%
Lmite
Lmite inferior
superior
-1,841
15,614
2,232
3,541

a. Variable dependiente: plasma

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

16

e) Contrastar la significacin del coeficiente de regresin

ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
1823,070
212,930
2036,000

gl
1
11
12

Media
cuadrtica
1823,070
19,357

F
94,180

Sig.
,000a

a. Variables predictoras: (Constante), saliva


b. Variable dependiente: plasma

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

17

Ejercicio 3:
Un aficionado a las apuestas en las carreras de caballos desea estudiar la descendencia
de una conocida raza de caballos que tiene mucho xito en dichas carreras. Para ello
estudia la relacin existente entre el peso en gramos de embriones de caballos y el
nmero de das transcurridos de vida de los mismos. Los datos aparecen en la siguiente
tabla:
Das
Peso
7
51.3
8
79.1
9
127.4
10
183.5
11
271.3
12
431.5
13
743.7
14
1143.2
15
1893.8
16
3102.4
17
4702.7
Se pide:
a) Representar la nube de puntos
b) Plantear el modelo de regresin y obtener la ecuacin del modelo ajustado
c) Bondad del ajuste

a) Representar la nube de puntos


5000

4000

3000

2000

1000

PESO

-1000
6

10

12

14

16

18

DIAS

b) Plantear el modelo de regresin y obtener la ecuacin del modelo ajustado.

MODEL: MOD_1.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

18

Lineal
ANOVA

Regresin
Residual
Total

Suma de
cuadrados
16841317
5932167,3
22773485

gl
1
9
10

Media
cuadrtica
16841317
659129,695

F
25,551

Sig.
,001

La variable independiente esdas.

Resumen del modelo


R
,860

R cuadrado
corregida
,711

R cuadrado
,740

Error tpico de
la estimacin
811,868

La variable independiente esdas.

Exponencial
ANOVA

Regresin
Residual
Total

Suma de
cuadrados
22,756
,032
22,789

gl
1
9
10

Media
cuadrtica
22,756
,004

F
6384,193

Sig.
,000

La variable independiente esdas.

Resumen del modelo


R
,999

R cuadrado
,999

R cuadrado
corregida
,998

Error tpico de
la estimacin
,060

La variable independiente esdas.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

19

Ejercicio 4:
Una empresa fabricante de cereales para el desayuno desea conocer la ecuacin que
permita predecir las ventas (en miles de euros) en funcin de los gastos en publicidad
infantil en televisin (en miles de euros), el tiempo diario de aparicin en televisin (en
minutos) y los gastos en publicidad en los peridicos (en miles de euros). Se realiza un
estudio en el que se renen los datos mensuales correspondientes a los ltimos 20
meses. Estos datos aparecen en la siguiente tabla:

Ventas
10
12
11
13
12
14
16
12
14
11
10
19
8.5
8
9
13
16
18
20
22

Pub. en
tv.
1
1.2
1.3
1.4
1.5
1.7
1.75
1.3
1.45
0.9
0.8
0.9
0.8
1
1.7
1.8
1.85
1.9
2
2

Tiempo
en tv.
50
57
56
55
60
65
69
67
68
67
97
66
65
60
70
110
75
80
85
90

Pub. en
per.
0.4
0.4
0.42
0.5
0.4
0.44
0.4
0.44
0.46
0.46
0.45
1.1
0.3
0.5
0.45
0.4
0.8
0.9
0.9
1.1

Se pide:
a) Ajustar un modelo de regresin lineal mltiple. Obtener una estimacin de los
parmetros del modelo y su interpretacin
b) Obtener e interpretar el valor de la suma de cuadrados residual
c) Contrastar la significacin del modelo propuesto

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

20

a) Ajustar un modelo de regresin lineal mltiple. Obtener una estimacin de los


parmetros del modelo y su interpretacin

Coeficientesa

Modelo
1

(Constante)
PUBL_TV
TIEMP_TV
PUBL_PER

Coeficientes no
estandarizados
B
Error tp.
2,108
2,055
3,432
1,121
1,477E-03
,030
11,347
1,802

Coeficientes
estandarizad
os
Beta
,358
,006
,711

t
1,026
3,060
,050
6,298

Sig.
,320
,007
,961
,000

a. Variable dependiente: VENTAS

b) Obtener e interpretar el valor de la suma de cuadrados residual


ANOVAb

Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
247,677
49,960
297,638

gl
3
16
19

Media
cuadrtica
82,559
3,123

F
26,440

Sig.
,000a

a. Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TV


b. Variable dependiente: VENTAS

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

21

c) Contrastar la significacin del modelo propuesto


ANOVAb

Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
247,677
49,960
297,638

gl
3
16
19

Media
cuadrtica
82,559
3,123

F
26,440

Sig.
,000a

a. Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TV


b. Variable dependiente: VENTAS

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

22

Ejercicio 5:
Se desea estudiar la relacin entre la intensidad de regado (medida en litros por metro
cuadrado) y la productividad (medida en Kg/Ha) de una huerta de tomates. Se han
obtenido los siguientes datos:

Productividad de
un cultivo
2500.9
2000.8
3300.4
2500.6
1995.8
3312.3
3409

Intensidad de
regado
590.5
540.4
690
605.2
650
724
704.8

Se pide:
a) Podemos afirmar la existencia de relacin lineal entre las variables?
b) Coeficiente de correlacin y coeficiente de determinacin. Interpretacin
Adems del regado se cree que el empleo de un abono ha influido de forma lineal
en la productividad del cultivo. Por tanto se introduce en el modelo de regresin la
variable que mide el nmero de Kg. de abono por hectrea.
Abono 200.6

160.6

407.6

212.7

145

387.8

355

c) Ajustar un modelo de regresin lineal mltiple


d) Interpretacin de los coeficientes del modelo de regresin. Qu variable tiene
mayor influencia en la variacin de la productividad?
e) Valor de la suma de cuadrados de la regresin. Interpretacin
f) Contrastar la significacin del modelo propuesto
g) Coeficiente de determinacin mltiple y coeficiente de determinacin mltiple
corregido. Interpretacin
h) Ha sido til la adicin de la variable abono?

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

23

a) Muestran los datos una relacin lineal?


3600
3400
3200
3000
2800
2600

PRODUCT

2400
2200
2000
1800
500

600

700

800

REGADIO

ANOVAb

Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
1557184,3
743017,305
2300201,6

Media
cuadrtica
1557184,3
148603,461

gl
1
5
6

F
10,479

Sig.
,023a

a. Variables predictoras: (Constante), REGADIO


b. Variable dependiente: PRODUCT

b) Coeficiente de correlacin lineal y coeficiente de determinacin. Interpretacin


Correlaciones

Correlacin de Pearson
Sig. (unilateral)
N

PRODUCT
REGADIO
PRODUCT
REGADIO
PRODUCT
REGADIO

PRODUCT
1,000
,823
,
,012
7
7

REGADIO
,823
1,000
,012
,
7
7

Resumen del modelo

Modelo
1

R
R cuadrado
,823a
,677

R cuadrado
corregida
,612

Error tp. de la
estimacin
385,491

a. Variables predictoras: (Constante), REGADIO

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

24

c) Ajustar un modelo de regresin lineal mltiple


Coeficientesa

Modelo
1

(Constante)
REGADIO
ABONO

Coeficientes no
estandarizados
B
Error tp.
942,755
988,031
,674
1,897
5,021
1,141

Coeficient
es
estandari
zados
Beta

t
,954
,355
4,402

,073
,911

Sig.
,394
,740
,012

a. Variable dependiente: PRODUCT

e) Valor de la suma de cuadrados de la regresin. Interpretacin


ANOVAb

Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
2173045,5
127156,069
2300201,6

gl
2
4
6

Media
cuadrtica
1086522,8
31789,017

F
34,179

Sig.
,003a

a. Variables predictoras: (Constante), ABONO, REGADIO


b. Variable dependiente: PRODUCT

g) Coeficiente de determinacin mltiple y coeficiente de determinacin mltiple


corregido
Resumen del modelo

Modelo
1

R
R cuadrado
,972a
,945

R cuadrado
corregida
,917

Error tp. de la
estimacin
178,295

a. Variables predictoras: (Constante), ABONO, REGADIO

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

25

DISEO DE EXPERIMENTOS
Ejercicio 1:
Se sabe que el dixido de carbono tiene un efecto crtico en el crecimiento
microbiolgico. Cantidades pequeas de CO2 estimulan el crecimiento de muchos
microorganismos, mientras que altas concentraciones inhiben el crecimiento de la
mayor parte de ellos. Este ltimo efecto se utiliza comercialmente cuando se almacenan
productos alimenticios perecederos. Se realiz un estudio para investigar el efecto del
CO2 sobre la tasa de crecimiento de Pseudomonas fragi, un corruptor de alimentos. Se
administr dixido de carbono a cinco presiones atmosfricas diferentes. La respuesta
anotada fue el cambio porcentual en la masa celular despus de un tiempo de
crecimiento de una hora. Se utilizaron diez cultivos en cada nivel. Se obtuvieron los
siguientes datos:

Nivel del factor (presin de CO2 en atmsferas)


0.0
0.083
0.29
0.5
0.86
62.6
50.9
45.5
29.5
24.9
59.6
44.3
41.1
22.8
17.2
64.5
47.5
29.8
19.2
7.8
59.3
49.5
38.3
20.6
10.5
58.6
48.5
40.2
29.2
17.8
64.6
50.4
38.5
24.1
22.1
50.9
35.2
30.2
22.6
22.6
56.2
49.9
27
32.7
16.8
52.3
42.6
40
24.4
15.9
62.8
41.6
33.9
19.6
8.8
a) Se suponen efectos fijos: qu implica esto respecto de los niveles atmosfricos
elegidos?
b) Plantear la hiptesis nula a contrastar
c) Evaluar el estadstico F utilizado para contrastar H0
d) Puede rechazarse H0? Explicarlo basndose en el p-valor del contraste

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

26

ANOVA
CRECIMIE

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
11274,319
1248,038
12522,357

Departamento de Estadstica e I.O.

gl
4
45
49

Media
cuadrtica
2818,580
27,734

F
101,628

Sig.
,000

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

27

Ejercicio 2:
Una compaa textil utiliza diversos telares para la produccin de telas. Aunque se
desea que los telares sean homogneos con el objeto de producir tela de resistencia
uniforme se supone que puede existir una variacin significativa en la resistencia de la
tela debida a la utilizacin de distintos telares. A su disposicin tiene 5 tipos de telares
con los que realiza determinaciones de la resistencia de la tela. Este experimento se
realiza en orden aleatorio y los resultados se muestran en la tabla adjunta. Analizar los
datos y obtener las conclusiones apropiadas.
Telares
1
2
3
4
5

51
56
48
47
43

Resistencia
50
49
56
56
53
44
49
44
46
47

49
60
50
48
43

51
57
45

50

45

46

a) Plantear la hiptesis nula a contrastar


b) Puede rechazarse H 0 ? Explicarlo basndose en el p-valor del contraste
c) Comprobar la hiptesis de homocedasticidad

ANOVA
RESIST

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
439,885
98,000
537,885

gl
4
21
25

Media
cuadrtica
109,971
4,667

F
23,565

Sig.
,000

Prueba de homogeneidad de varianzas


RESIST
Estadstico
de Levene
2,367

Departamento de Estadstica e I.O.

gl1

gl2
4

21

Sig.
,086

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

28

Ejercicio 3:
En una determinada fbrica de galletas se desea saber si las harinas de sus cuatro
proveedores producen la misma viscosidad en la masa. Para ello, produce durante un da
16 masas, 4 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se
muestran en la siguiente tabla:

Proveedor
A
98
91
96
95

Proveedor
B
97
90
95
96

Proveedor
C
99
93
97
99

Proveedor
D
96
92
95
98

a) Plantear la hiptesis nula a contrastar


b) Puede rechazarse H 0 ? Explicarlo basndose en el p-valor del contraste
c) Comprobar la hiptesis de normalidad

ANOVA
VISCOSID

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
14,188
97,750
111,938

Media
cuadrtica
4,729
8,146

gl
3
12
15

F
,581

Sig.
,639

Normal grfico Q-Q de Residuo para VIS


6

Valor Normal esperado

-2

-4

-6
-6

-4

-2

Valor observado

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

29

Ejercicio 4:
Los cientficos comprometidos en el tratamiento del agua residual de arenas asflticas
estudiaron tres mtodos de tratamientos para la eliminacin del carbono orgnico
(basado en W.R. Pirie, Statistical Planning and Analysis for Treatments of Tar Sand
Waste-water, Centro de Informacin Tcnica, Oficina de Informacin Tecnolgica y
Cientfica, Departamento de Energa de Estados Unidos). Los tres mtodos de
tratamiento utilizados fueron: flotacin de aire (FA), separacin de espuma (SF) y
coagulacin ferroclrica (CFC). Las mediciones del material de carbono orgnico para
los tres tratamientos arrojaron los siguientes datos:
FA
34.6
35.1
35.6
35.8
36.1
36.5
36.8
37.2
37.4
37.7

SE
38.8
39.0
40.1
40.9
41.0
43.2
44.9
46.9
51.6
53.6

CFC
26.7
26.7
27.0
27.1
27.5
28.1
28.1
28.7
30.7
31.2

a) Contrastar H 0 : 1 = 2 = 3 al nivel =0.10


b) Si se rechaza H 0 utilizar los contrastes de Tukey para precisar qu mtodos difieren
estadsticamente entre s

ANOVA
CARBONO

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
1251,603
278,172
1529,775

Departamento de Estadstica e I.O.

gl
2
27
29

Media
cuadrtica
625,801
10,303

F
60,742

Sig.
,000

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

30

Comparaciones mltiples
Variable dependiente: carbono
HSD de Tukey

(I) metodo
1
2
3

(J) metodo
2
3
1
3
1
2

Diferencia de
medias (I-J)
Error tpico
-7,72000*
1,43546
8,10000*
1,43546
7,72000*
1,43546
15,82000*
1,43546
-8,10000*
1,43546
-15,82000*
1,43546

Sig.
,000
,000
,000
,000
,000
,000

Intervalo de confianza al
90%
Lmite
superior
Lmite inferior
-10,7960
-4,6440
5,0240
11,1760
4,6440
10,7960
12,7440
18,8960
-11,1760
-5,0240
-18,8960
-12,7440

*. La diferencia entre las medias es significativa al nivel .1.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

31

Ejercicio 5:
Se ha realizado un estudio sobre el efecto de las temporadas de caza del ciervo en los
hbitos de stos. Se seleccionan cuatro sendas que se sabe utilizan los ciervos. Antes de
comenzar la temporada de caza, durante la temporada y al terminar la temporada se
determin el promedio de huellas halladas por semana en un rea especfica de cada
senda. Las sendas se trataron como bloques y se obtuvieron los siguientes datos:

Senda
1
2
3
4

Antes
62.5
46.5
45
24

Durante
57
53.3
59.3
35.7

Despus
49
50
37
50

a) Contrastar la hiptesis nula de igualdad de medias en los tratamientos al nivel


=0.05
b) Contrastar la hiptesis nula de igualdad de medias en los bloques al nivel
=0.05

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

32

Pruebas de los efectos inter-sujetos


Variable dependiente: HUELLAS

Fuente
Modelo corregido
Interseccin
TEMPORAD
SENDA
Error
Total
Total corregida

Suma de
cuadrados
tipo III
700,631a
27008,541
98,482
602,149
611,198
28320,370
1311,829

gl
5
1
2
3
6
12
11

Media
cuadrtica
140,126
27008,541
49,241
200,716
101,866

F
1,376
265,137
,483
1,970

Significacin
,351
,000
,639
,220

a. R cuadrado = ,534 (R cuadrado corregida = ,146)

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

33

Ejercicio 6:
Una industria desea comprobar el efecto que tienen cinco productos qumicos sobre la
resistencia de un tipo particular de fibra. Como tambin puede influir la mquina
empleada en la fabricacin, decide utilizar un diseo en bloques aleatorizados,
considerando las distintas mquinas como bloques. La industria dispone de cuatro
mquinas a las que asigna los cinco productos qumicos en orden aleatorio. Los
resultados obtenidos se muestran en la tabla adjunta.

Producto qumico
1
2
3
4
5

A
87
85
90
89
99

Tipos de mquinas
B
C
86
88
87
95
92
95
97
98
96
91

D
83
85
90
88
90

a) Contrastar la hiptesis nula de igualdad de medias en los tratamientos al nivel


=0.05
b) Contrastar la hiptesis nula de igualdad de medias en los bloques al nivel
=0.05
c) Si se rechaza H 0 en los apartados a) o b), utilizar los contrastes LSD y Tukey,
respectivamente, para precisar qu medias difieren estadsticamente entre s

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

34

Comparaciones mltiples
Variable dependiente: RESIST
DMS

(I)
PRODUCT
1

(J)
PRODUCT
2
3
4
5
1
3
4
5
1
2
4
5
1
2
3
5
1
2
3
4

Diferencia
entre
medias (I-J)
-2,00
-5,75*
-7,00*
-8,00*
2,00
-3,75
-5,00
-6,00*
5,75*
3,75
-1,25
-2,25
7,00*
5,00
1,25
-1,00
8,00*
6,00*
2,25
1,00

Error tp.
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336

Significacin
,409
,030
,011
,005
,409
,134
,054
,025
,030
,134
,602
,355
,011
,054
,602
,676
,005
,025
,355
,676

Intervalo de confianza al
95%.
Lmite
Lmite inferior
superior
-7,09
3,09
-10,84
-,66
-12,09
-1,91
-13,09
-2,91
-3,09
7,09
-8,84
1,34
-10,09
,09
-11,09
-,91
,66
10,84
-1,34
8,84
-6,34
3,84
-7,34
2,84
1,91
12,09
-,09
10,09
-3,84
6,34
-6,09
4,09
2,91
13,09
,91
11,09
-2,84
7,34
-4,09
6,09

Basado en las medias observadas.


*. La diferencia de medias es significativa al nivel ,05.
*. Se ha detectado el smbolo ,05 donde se esperaba un parntesis de cierre en el subcomando
TEST.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

35

ANLISIS DE LA COVARIANZA
Ejercicio 1:
Un distribuidor de bebidas est estudiando la efectividad de los mtodos de descarga,
para lo cual se mide el tiempo de descarga de unas cajas en minutos. Las bebidas se
distribuyen en tres tipos distintos de furgonetas (atendiendo a su diferente capacidad de
carga y antigedad). Se conoce que el tiempo de descarga guarda una estrecha relacin
con el volumen de cajas descargadas. Se obtuvieron los siguientes datos:

1
y
12
19
15
21
11
19

x
20
23
22
30
15
22

Furgoneta
2
y
x
70
64
64
62
55
47
77
66
66
50
44
42

3
y
31
28
25
22
29
28

x
27
25
22
26
28
29

a) Planteamiento del modelo


b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta
c) Indicar el porcentaje de variabilidad explicada por el modelo propuesto
SOLUCIN:
b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

36

Pruebas de los efectos inter-sujetos


Variable dependiente: TIEMPO

Fuente
Modelo corregido
Interseccin
FURGONET
VOLUMEN
Error
Total
Total corregida

Suma de
cuadrados
tipo III
7679,373a
3,758
174,246
592,373
222,627
30374,000
7902,000

gl
3
1
2
1
14
18
17

Media
cuadrtica
2559,791
3,758
87,123
592,373
15,902

F
160,974
,236
5,479
37,252

Significacin
,000
,634
,017
,000027

a. R cuadrado = ,972 (R cuadrado corregida = ,966)

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

37

Ejercicio 2:
Se quiere analizar el efecto que tienen tres tipos distintos de terreno en el rendimiento
de una determinada plantacin de almendros. Se sospecha que el rendimiento del
cultivo (medido en kg.) est relacionado con la cantidad de kg. de abono recibidos. Los
datos observados se muestran en la tabla adjunta:

Terreno
B

A
Y
130,5
144,6
133,9
128,4
119,2
133,8
122,8
119,4
122,7
130,8

x
20,3
44,9
33,8
20,8
18,2
32,8
33,9
18,3
22,7
29,7

y
110,3
100,8
109,6
122,7
97,4

x
15,9
22
16,9
20,2
16,9

C
y
155,9
149,1
188,9
199,4
185,7

x
44,9
42,33
58,9
70,8
61,9

Se pide
a) Indicar el valor de la suma de cuadrados entre tratamientos ajustada.
Interpretacin
b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

38

Pruebas de los efectos inter-sujetos


Variable dependiente: PRODUCC

Fuente
Modelo corregido
Interseccin
TERRENO
ABONO
Error
Total
Total corregida

Suma de
cuadrados
tipo III
14135,521a
10205,154
404,959
1804,347
1080,639
381321,724
15216,159

gl
3
1
2
1
16
20
19

Media
cuadrtica
4711,840
10205,154
202,479
1804,347
67,540

F
69,764
151,098
2,998
26,715

Significacin
,000
,000
,078
,000

a. R cuadrado = ,929 (R cuadrado corregida = ,916)

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

39

Ejercicio 3:
Una empresa pretende estudiar la resistencia a la ruptura de la fibra de la que est
compuesta una cuerda. Se realiza un estudio para determinar si existe diferencia
significativa en la resistencia de los tres tipos de cuerdas disponibles (atendiendo al tipo
de fibra disponible). Se cree que la temperatura a la que se realiza el experimento puede
influir en la resistencia, por lo que se utiliza un diseo en bloques aleatorizados
considerando la temperatura como bloque, con 4 niveles. La resistencia de la cuerda a la
ruptura (medida en libras) se ve afectada por su grosor (medido en 103 pulgadas).
Los datos se presentan en la siguiente tabla:

1
Temperatura
1
2
3
4

y
33
41
35
42

x
20
25
24
25

Cuerda
2
y
44
23
44
37

3
x
28
22
33
27

y
41
39
37
26

x
23
22
23
21

Se pide
a) Formular el diseo empleado
b) Analizar estos datos y extraer las conclusiones apropiadas

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

40

Pruebas de los efectos inter-sujetos


Variable dependiente: Y

Fuente
Modelo corregido
Interseccin
CUERDA
TEMP
X
Error
Total
Total corregida

Suma de
cuadrados
tipo III
423,966a
55,091
170,503
91,799
358,133
71,701
16776,000
495,667

gl
6
1
2
3
1
5
12
11

Media
cuadrtica
70,661
55,091
85,251
30,600
358,133
14,340

F
4,928
3,842
5,945
2,134
24,974

Significacin
,050
,107
,048
,215
,004

a. R cuadrado = ,855 (R cuadrado corregida = ,682)

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

41

Ejercicio 4:
Se pretende comparar la presin arterial sistlica de un grupo de fumadores segn su
nivel de estudios. Para ello se realiza un estudio en el que se controla el nmero de
cigarrillos consumidos al da por cada una de estas personas. El nivel de estudios se
clasifica en tres niveles: estudios bsicos, estudios de Secundaria y estudios
universitarios, codificados por 1, 2 y 3 respectivamente. Adems se cree que la presin
arterial que sufren estos individuos podra relacionarse en forma lineal con la edad de
los fumadores. Los datos se muestran en la tabla adjunta:

y
153,4
157,5
140,5
162,7
153,5

1
X
24,2
25,6
24,9
57,2
46,3

z
46
55
49
44
64

Nivel de estudios
2
y
x
z
141,3
18,3
22
133,9
28
51
128,7
12,1
36
144,2
27,4
51
137,4
33,5
35

y
135,5
137,9
140,4
126,9
130,1

3
x
20,3
22,9
33
20,3
11,2

z
35
17
40
39
29

a) Formular el diseo empleado


b) Variacin de la presin arterial sistlica que queda sin explicar y suma total de
cuadrados de la respuesta ajustada por la covariable
c) Contrastar la igualdad de los efectos del factor, as como la significacin de cada
covariable
d) Proporcin de variacin explicada por el modelo propuesto
e) Comprobar que se cumple la hiptesis de homocedasticidad

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

42

Pruebas de los efectos inter-sujetos


Variable dependiente: PRESIN

Fuente
Modelo corregido
Intercept
ESTUDIOS
N_CIGAR
EDAD
Error
Total
Total corregida

Suma de
cuadrados
tipo III
1294,773a
11452,003
410,072
203,031
24,663
336,176
302361,030
1630,949

gl
4
1
2
1
1
10
15
14

Media
cuadrtica
323,693
11452,003
205,036
203,031
24,663
33,618

F
9,629
340,655
6,099
6,039
,734

Significacin
,002
,000
,019
,034
,412

a. R cuadrado = ,794 (R cuadrado corregida = ,711)

Contraste de Levene sobre la igualdad de las varianzas error


Variable dependiente: PRESIN
F

gl1
,973

gl2
2

12

Significacin
,406

Contrasta la hiptesis nula de que la varianza error de la


variable dependiente es igual a lo largo de todos los grupos.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

43

ANLISIS CLUSTER
Ejercicio 1:
Se analiza la leche de las hembras de 20 mamferos, obtenindose los porcentajes en
agua, protenas, grasa y lactosa siguientes:
Mamfero
CABALLO
BURRO
CEBRA
HAMSTER
RATA
OVEJA
RENO
MULA
CERDO
CAMELLO
BFALO
ZORRO
CONEJO
LLAMA
CIERVO
BISONTE
GATO
PERRO
FOCA
DELFN

Agua
90.1
90.3
86.2
81.9
72.5
82.0
64.8
90.0
82.8
87.7
82.1
81.6
71.3
86.5
65.9
86.9
81.6
76.3
46.4
44.9

Protenas
2.6
1.7
3.0
7.4
9.2
5.6
10.7
2.0
7.1
3.5
5.9
6.6
12.3
3.9
10.4
4.8
10.1
9.3
9.7
10.6

Grasa
1.0
1.4
4.8
7.2
12.6
6.4
20.3
1.8
5.1
3.4
7.9
5.9
13.1
3.2
19.7
1.7
6.3
9.5
42.0
34.9

Lactosa
6.9
6.2
5.3
2.7
3.3
4.7
2.5
5.5
3.7
4.8
4.7
4.9
1.9
5.6
2.6
5.7
4.4
3.0
0.0
0.9

Clasificar estos mamferos de forma jerrquica atendiendo a dichas variables realizando


el estudio de acuerdo a las siguientes opciones de medidas de asociacin y mtodos de
amalgamamiento:
a) Distancia eucldea y linkage simple
b) Distancia bloque y linkage simple
c) Distancia eucldea y mtodo del centroide
d) Distancia bloque y mtodo del centroide
Para cada uno de las anteriores opciones se pide la matriz de distancias, el dendrograma
y la clasificacin resultante si se toman 2, 3, 4 o 5 grupos diferentes.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Departamento de Estadstica e I.O.

44

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Departamento de Estadstica e I.O.

45

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

46

Historial de conglomeracin

Etapa
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

Conglomerado que se
combina
Conglom
Conglom
erado 1
erado 2
2
8
6
12
1
2
7
15
10
14
6
11
10
16
3
10
6
9
4
6
1
3
4
17
5
18
5
13
1
4
1
5
19
20
1
7
1
19

Departamento de Estadstica e I.O.

Coeficientes
,911
1,204
1,225
1,292
1,510
1,533
1,797
1,884
1,942
2,512
3,254
3,329
3,969
4,389
5,227
6,352
7,367
8,765
24,733

Etapa en la que el
conglomerado
aparece por primera
vez
Conglom
Conglom
erado 1
erado 2
0
0
0
0
0
1
0
0
0
0
2
0
5
0
0
7
6
0
0
9
3
8
10
0
0
0
13
0
11
12
15
14
0
0
16
4
18
17

Prxima
etapa
3
6
11
18
7
9
8
11
10
12
15
15
14
16
16
18
19
19
0

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

47

Conglomerado de pertenencia

Caso
1:caballo
2:burro
3:cebra
4:hamster
5:rata
6:oveja
7:reno
8:mula
9:cerdo
10:camello
11:bfalo
12:zorro
13:conejo
14:llama
15:ciervo
16:bisonte
17:gato
18:perro
19:foca
20:delfn

5
conglome
rados
1
1
1
1
2
1
3
1
1
1
1
1
2
1
3
1
1
2
4
5

Departamento de Estadstica e I.O.

4
conglome
rados
1
1
1
1
1
1
2
1
1
1
1
1
1
1
2
1
1
1
3
4

3
conglome
rados
1
1
1
1
1
1
2
1
1
1
1
1
1
1
2
1
1
1
3
3

2
conglome
rados
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS


* * * * * * H I E R A R C H I C A L
* * * * *

C L U S T E R

48
A N A L Y S I S *

Dendrogram using Single Linkage


Rescaled Distance Cluster Combine
C A S E
Label

Num

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

burro

mula

caballo

camello

10

llama

14

bisonte

16

cebra

oveja

zorro

12

bfalo

11

cerdo

hamster

gato
rata

17
5

perro

18

conejo

13

reno

19

delfn

20

Departamento de Estadstica e I.O.

2 grupos

15

foca

5 grupos
4 grupos
3 grupos

ciervo

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Departamento de Estadstica e I.O.

49

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

50

Ejercicio 2:
Se pretende clasificar un conjunto de 26 animales mamferos en 4 grupos
homogneos atendiendo a su configuracin dental. La informacin de la que se dispone
es la del nmero de piezas dentales. Los datos de los que se dispone son los siguientes:
Mamfero

Incisivos
Sup.

Incisivos
Inf.

Caninos
Sup.

Caninos
Inf.

Premolares
Inf.

Premolares
Sup.

Molares
Sup.

Molares
Inf.

ALCE
ANTLOPE
ARDILLA
BISONTE
BUEY
CABRA
CASTOR
CIERVO
COMADREJA
HURN
JAGUAR
LEN
LINCE
LOBO
MARTA
MOFETA
MURCILAGO
NUTRIA
OCELOTE
OSO
OVEJA
RATN
RENO
TEJN
VISN
ZORRO

0
0
1
0
0
0
1
0
3
3
3
3
3
3
3
3
2
3
3
3
0
1
0
3
3
3

4
4
1
4
4
4
1
4
3
3
3
3
3
3
3
3
3
2
3
3
4
1
4
3
3
3

1
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
1
1
1
1

0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
1
1
1

3
3
1
3
3
3
2
3
3
3
3
3
2
4
4
3
1
1
3
4
3
0
3
3
3
4

3
3
1
3
3
3
1
3
3
3
2
2
2
4
4
3
2
2
2
4
3
0
3
3
3
4

3
3
3
3
3
3
3
3
1
1
1
1
1
2
1
1
3
3
1
2
3
3
3
1
1
2

3
3
3
3
3
3
3
3
2
2
1
1
1
3
2
2
3
3
1
3
3
3
3
2
2
3

Clasificar estos mamferos utilizando el mtodo de las k-medias para agrupar a los
mamferos en 4 grupos.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Departamento de Estadstica e I.O.

51

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

52

Centros iniciales de los conglomerados


Conglomerado
1

Incisivos Superiores

Incisivos Inferiores

Caninos Superiores

Caninos Inferiores

Premolares Inferiores

Premolares Superiores

Molares Superiores

Molares Inferiores

Historial de iteraciones(a)
Cambio en los centros de los conglomerados
Iteracin
1

1
1,150

,000

2
,250

3
1,202

,000

,000

4
,354
,000

a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningn
cambio o ste es pequeo. El cambio mximo de coordenadas absolutas para cualquier centro es de
,000. La iteracin actual es 2. La distancia mnima entre los centros iniciales es de 3,606.
Pertenencia a los conglomerados
MAMIFERO
alce

Conglome
rado
2

Distancia
,750

antlope

,250

ardilla

,333

bisonte

,250

buey

,250

cabra

,250

castor

1,054

ciervo

,250

Nmero de caso
1

comadrej

,828

10

hurn

,828

11

jaguar

1,110

12

len

1,110

13

lince

1,150

14

lobo

,354

15

marta

1,061

16

mofeta

,828

17

murcila

2,739

18

nutria

2,739

19

ocelote

1,110

20

oso

,354

21

oveja

,250

22

ratn

1,202

23

reno

,750

24

tejn

,828

25

visn

,828

26

zorro

,354

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

53

Centros de los conglomerados finales


Conglomerado
1

Incisivos Superiores

Incisivos Inferiores

Caninos Superiores

Caninos Inferiores

Premolares Inferiores

Premolares Superiores

Molares Superiores

Molares Inferiores

Distancias entre los centros de los conglomerados finales


Conglomerado
1

2
3,974

3,974

4,353

4,417

2,353

3,897

3
4,353

4
2,353

4,417

3,897
5,633

5,633

Nmero de casos en cada conglomerado


Conglomerado

11,000

8,000

3,000

4
Vlidos
Perdidos

Departamento de Estadstica e I.O.

4,000
26,000
,000

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

54

ANLISIS DE DATOS CUALITATIVOS


Ejercicio 1:
Un grupo de bilogos ha opinado acerca del plan de actuacin de la
Administracin sobre el Parque Natural de Doana clasificando el mismo como Bueno,
Aceptable o Malo. Los resultados de opinin teniendo en cuenta la procedencia laboral
de los mismos, segn trabajen para algn organismo pblico o pertenezcan a otros
organismos no gubernamentales se muestran a continuacin:
Opinin
Bueno Aceptable Malo
Procedencia
Organismo Pblico
67
56
35
Organismo no Gubernamental 12
40
50
a) Clasificar las variables contempladas.
b) Introducir la informacin anterior y construir la tabla de contingencia plasmando
los porcentajes por columna. Comentar los resultados.
c) La procedencia laboral de los bilogos influye en la opinin que expresan sobre
el plan de actuacin?

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

55

Tabla de contingencia Procedencia * Opinin

Procedencia

Pblico
No Gubernamental

Total

Recuento
% de Opinin
Recuento
% de Opinin
Recuento
% de Opinin

Departamento de Estadstica e I.O.

Bueno
67
84,8%
12
15,2%
79
100,0%

Opinin
Aceptable
56
58,3%
40
41,7%
96
100,0%

Malo
35
41,2%
50
58,8%
85
100,0%

Total
158
60,8%
102
39,2%
260
100,0%

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

56

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

Valor
33,078a
35,395

2
2

Sig. asinttica
(bilateral)
,000
,000

,000

gl

32,401
260

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 30,99.

Medidas simtricas

Nominal por
nominal

Phi
V de Cramer
Coeficiente de
contingencia

Valor
,357
,357

Sig.
aproximada
,000
,000

,336

,000

N de casos vlidos
a A

260

d l hi t

lt

ti

Medidas direccionales

Nominal
por nominal

Lambda

Tau de Goodman
y Kruskal

Simtrica
Procedencia dependiente
Opinin dependiente
Procedencia dependiente
Opinin dependiente

Departamento de Estadstica e I.O.

Valor
,135
,147
,128
,127
,060

Error tp.
a
asint.
,071
,083
,083
,037
,019

T aproximada
1,816
1,635
1,445

Sig.
aproximada
,069
,102
,149
,000c
,000c

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

57

Ejercicio 2:
Se est llevando a cabo un estudio sobre la raza canina Boxer para investigar el
grado de agresividad que presentan los perros de dicha raza. Se supone en principio, que
los sntomas de agresividad dependen fundamentalmente del nivel de adiestramiento
que han tenido estos perros durante los dos primeros aos de su vida. Por este motivo,
se han investigado a 208 perros Boxer ofreciendo los siguientes resultados:
Nivel de adiestramiento
Grado de agresividad
Bajo
Medio
Alto

Bajo Medio Alto


12
28
42

13
34
31

28
15
5

a) Qu tipo de variables son?


b) Obtener la distribucin condicionada del grado de agresividad al nivel de
adiestramiento.
c) Son independientes?.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

58

Tabla de contingencia Grado de Agresividad * Grado de Adiestramiento

Grado de
Agresividad

Bajo

Medio

Alto

Total

Recuento
% de Grado de
Adiestramiento
Recuento
% de Grado de
Adiestramiento
Recuento
% de Grado de
Adiestramiento
Recuento
% de Grado de
Adiestramiento

Departamento de Estadstica e I.O.

Grado de Adiestramiento
Bajo
Medio
Alto
12
13
28

Total
53

14,6%

16,7%

58,3%

25,5%

28

34

15

77

34,1%

43,6%

31,3%

37,0%

42

31

78

51,2%

39,7%

10,4%

37,5%

82

78

48

208

100,0%

100,0%

100,0%

100,0%

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

59

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

Valor
41,629a
40,522

4
4

Sig. asinttica
(bilateral)
,000
,000

,000

gl

31,093
208

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 12,23.

Medidas direccionales

Ordinal por ordinal

d de Somers

Simtrica
Grado de Agresividad
dependiente
Grado de Adiestramiento
dependiente

Valor
-,336

Error tp.
a
asint.
,058

T aproximada
-5,668

Sig.
aproximada
,000

-,338

,058

-5,668

,000

-,334

,058

-5,668

,000

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis nula.

Medidas simtricas

Ordinal por ordinal

Tau-b de Kendall
Tau-c de Kendall
Gamma

N de casos vlidos

Valor
-,336
-,330
-,492
208

Error tp.
a
asint.
,058
,058
,078

T aproximada
-5,668
-5,668
-5,668

Sig.
aproximada
,000
,000
,000

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis nula.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

60

Ejercicio 3:
En la siguiente tabla se muestra la informacin de la Unidad de Paritorio de un
hospital granadino, donde aparecen las frecuencias observadas de utilizacin de
analgesia epidural y realizacin de episiotoma a las mujeres cuyo parto es asistido en
dicho centro. Los responsables de esta Unidad creen que la utilizacin de analgesia
epidural en el proceso del parto influye en la realizacin de episiotoma.
Analgesia Epidural No
Episitoma
No
S

405 243
239 235

Se pide la realizacin de un estudio de asociacin que de respuesta a los


responsables de la Unidad de Paritorio.

Tabla de contingencia Realizacin de Episiotoma * Utilizacin de


analgesia epidural

Realizacin de
Episiotoma

NO
Si

Total

Departamento de Estadstica e I.O.

Utilizacin de
analgesia epidural
No
S
405
243
62,9%
50,8%
239
235
37,1%
49,2%
644
478
100,0%
100,0%

Total
648
57,8%
474
42,2%
1122
100,0%

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

61

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
N de casos vlidos

Sig. asinttica
(bilateral)
,000

15,841

,000

16,316

,000

Valor
16,332b

gl

Sig. exacta
(bilateral)

Sig. exacta
(unilateral)

,000

,000

1122

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada
es 201,94.

Medidas simtricas

Nominal por
nominal

Phi
V de Cramer
Coeficiente de
contingencia

Valor
,121
,121

Sig.
aproximada
,000
,000

,120

,000

N de casos vlidos

1122

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis
nula.

Medidas direccionales

Nominal
por nominal

Lambda

Tau de Goodman

Simtrica
Realizacin de
Episiotoma dependiente
Utilizacin Analgesi
Epidural dependiente
Realizacin de

Departamento de Estadstica e I.O.

Valor
,000

Error tp.
a
asint.
,000

T aproximada
.c
c

,000

,000

,000

,000

Sig.
aproximada
.c
c

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

62

Bibliografa Recomendada:

Aguilera del Pino, A. M. (2001). Tablas de Contingencia Bidimensionales. Ed


La Muralla, S.A.
Garca Leal, J., Lara Porras, A.M., Navarrete lvarez, E., Rico Castro, N.,
Romn Montoya, Y., Ruiz Castro, E. y Snchez Borrego, I.R. (2007). Tcnicas
Estadsticas aplicadas en Biologa con SPSS. Editorial Proyecto Sur.
Gutirrez Jimez, R., Gonzlez Carmona, A., Torres Ruiz, F y Gallardo
Sansalvador, J.A. (1994). Tcnicas de Anlisis de datos Multivariable.
Tratamiento computacional. Universidad de Granada.
Lara Porras, A.M. (2001) Diseo Estadstico de Experimentos, Anlisis de la
Varianza y Temas relacionados. Tratamiento Informtico mediante SPSS. Ed.
Proyecto Sur.
Lara Porras, A.M., Snchez Borrego, I.R., Ramos balos, E.M.Raya Miranda,
R., Tarifa Blanco, J.A. y Alfonso Ux, A. (2008) Gua Interactiva de
Autoaprendizaje de SPSS. versin 2.1 Ed. Proyecto Sur.
Visauta Vinacua, B. (1998) Anlisis Estadstico con SPSS para Windows.
Volumen II: Estadstica multivariante. McGraw-Hill.
Visauta Vinacua, B. (2007) Anlisis Estadstico con SPSS 14. Estadstica
Bsica. McGraw-Hill.

Bibliografa General:

Box, G.E.P., Hunter W.G. & Hunter J.S. (1988).


Estadstica para
Investigadores. Ed. Revert.
Canavos, G.C. (1990). Probabilidad y Estadstica. Aplicaciones y Mtodos.
Ed. McGraw-Hill.
Ferrn Aranaz, M. (1996). SPSS para Windows. Programacin y Anlisis
Estadstico. Serie McGraw-Hill de informtica.
Garca Leal, J. y Lara Porras, A.M. (1998). Diseo Estadstico de
Experimentos. Anlisis de la Varianza. Grupo Editorial Universitario.
Lara Porras, A.M. (2010) Estadstica para Biologa y Ciencias Ambientales:
Tratamiento Informtico mediante SPSS. Ed. Proyecto Sur.
Lara Porras, A.M. y Romn Montoya, Yolanda (2010) Aprender Estadstica
analizando datos: Mtodos multimedia. Ed. Proyecto Sur.
Lizasoain, L. y Joaristi, L. (1998) SPSS para Windows. Ed Paraninfo.
Ludwig, J.A. y Reynolds, J.F. (1988) Statistical Ecology. J. Willey & Sons.
Martin Andrs, A., Luna del Castillo, J.D. (2004). Bioestadstica para las
Ciencias de la Salud. Ed. Capitel.
Mason, R.L., Gunst, R.F. y Hess, J.L. (1989), Statistical Design and Analysis
of Experiments. J. Willey & Sons.
Milton, J.S. (2007) Estadstica para Biologa y Ciencias de la Salud. Ed.
McGraw-Hill.
Ollero Hinojosa, J., Garca Leal, J., Lara Porras. A.M., Martnez Andrs, A.,
Rodrguez, C., Ramos, H. (1997) Diseo y Anlisis Estadstico de
Experimentos. Grupo Editorial Universitario.
Sharma, S. (1996) Applied Multivariate Techniques. Ed. J. Wiley & Sons.

Departamento de Estadstica e I.O.

Universidad de Granada

Vous aimerez peut-être aussi