Académique Documents
Professionnel Documents
Culture Documents
Aplicada I
Cuaderno de Prcticas de
Estadstica con SPSS
Curso 2010-2011
Autores:
Profesores de la asignatura:
ndice
pg.
CONTRASTES DE HIPTESIS
PARAMTRICOS Y NO PARAMTRICOS
Ejercicio 1
Ejercicio 2
Ejercicio 3
Ejercicio 4
Ejercicio 5
3
5
6
7
9
ANLISIS DE REGRESIN
Ejercicio 1
Ejercicio 2
Ejercicio 3
Ejercicio 4
Ejercicio 5
10
10
14
17
19
22
DISEO DE EXPERIMENTOS
Ejercicio 1
Ejercicio 2
Ejercicio 3
Ejercicio 4
Ejercicio 5
Ejercicio 6
25
25
27
28
29
31
33
ANLISIS DE LA COVARIANZA
Ejercicio 1
Ejercicio 2
Ejercicio 3
Ejercicio 4
35
35
37
39
41
ANLISIS CLUSTER
Ejercicio 1
Ejercicio 2
43
43
50
Bibliografa
54
54
57
60
62
CONTRASTES DE HIPTESIS
PARAMTRICOS Y NO PARAMTRICOS
Ejercicio 1:
En un estudio sobre angina de pecho en ratas se dividi aleatoriamente a 18 animales
afectados en dos grupos de 9 individuos cada uno. A un grupo se le suministr un
placebo y al otro un frmaco experimental FL113. Despus de un ejercicio controlado
sobre una cinta sin fin se determin el tiempo de recuperacin de cada rata. Se piensa
que el FL113 reducir el tiempo medio de recuperacin. Se dispone de la siguiente
informacin:
Placebo 203 229 215 220 223 233 208 228 209
FL113 221 207 185 203 187 190 195 204 212
Suponiendo que las distribuciones del tiempo necesario para la recuperacin son
normales, comparar las muestras dadas para saber si se puede admitir que ambas
muestras provienen de la misma poblacin. Efectuar los correspondientes contrastes
(sobre medias y varianzas) al nivel de significacin = 0.05.
Primer contraste
H0: 1= 2
H1: 1 2
Segundo contraste
H0: 12= 22
H1: 12 22
Universidad de Granada
Estadsticos de grupo
Tiempo de recuperacin
N
9
Media
218,67
Desviacin tp.
10,524
Error tp. de la
media
3,508
200,44
12,126
4,042
Universidad de Granada
Ejercicio 2:
Se ha realizado un estudio para investigar el efecto del ejercicio fsico en el nivel de
colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron
muestras de sangre para determinar el nivel del colesterol de cada participante. Despus,
los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras
y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras
de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los
sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y
despus del ejercicio. Se recogieron los siguientes datos
Nivel previo mg/dl
182
232
191
200
148
249
276
213
241
480
262
Decidir si existen diferencias significativas entre estos niveles antes y despus del
ejercicio fsico.
51,066
15,397
-1,12
67,49
t
2,155
gl
Sig. (bilateral)
10
Universidad de Granada
,057
Ejercicio 3:
En unos laboratorios clnicos se toman muestras de 650 anlisis de sangre y se anota el
nmero de eritrocitos por milmetro cbico de sangre. Se puede admitir que el nmero
de eritrocitos se distribuye normalmente? Los resultados agrupados en 7 clases son los
que figuran en la tabla adjunta
N de eritrocitos en millones
0-2,5
2.5-3.5
3.5-4.5
4.5-5.5
5.5-6.5
6.5-7.5
7.5-8.5
N de muestras
8
52
140
210
160
70
10
650
Media
Parmetros normales(a,b)
Desviacin tpica
Diferencias ms extremas
Absoluta
5,0862
1,23238
,164
Positiva
,159
Negativa
-,164
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
4,192
,000
Universidad de Granada
Ejercicio 4:
Se realiza una investigacin para determinar si el hecho de contraer hepatitis es
independiente de haber sido vacunado contra la enfermedad. Para ello se utilizan 1083
voluntarios varones. De ellos, se eligen aleatoriamente 549 y son vacunados con un
nuevo frmaco. Los restantes, 534, no son vacunados. Despus de un cierto tiempo, se
observ que 70 de los 534 voluntarios no vacunados contrajeron la hepatitis, mientras
que solamente 11 de los 549 vacunados no la contrajeron. Los datos se muestran en la
tabla adjunta
Vacunacin
Hepatitis
SI
NO
SI
11
538
NO
70
464
Total
si
no
464
538
1002
si
70
11
81
534
549
1083
Total
Universidad de Granada
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Correccin por
continuidad(a)
Razn de verosimilitud
Sig. asinttica
(bilateral)
,000
46,650
,000
53,194
,000
Valor
48,242(b)
gl
Estadstico exacto de
Fisher
Asociacin lineal por lineal
Sig. exacta
(bilateral)
,000
48,197
Sig. exacta
(unilateral)
,000
,000
N de casos vlidos
1083
a Calculado slo para una tabla de 2x2.
b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 39,94.
Universidad de Granada
Ejercicio 5:
Se realiza un estudio para investigar la asociacin entre el color de las flores y la
fragancia de las azaleas silvestres. Se observan 200 plantas floridas seleccionadas
aleatoriamente. Cada una de ellas se clasifica segn el color y la presencia o ausencia de
fragancia. Los datos se muestran en la tabla adjunta
Fragancia
SI
NO
Color
Rosa
60
10
Blanca
12
50
Naranja
58
10
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por lineal
N de casos vlidos
Valor
82,293(a)
83,848
59,712
gl
2
2
1
Sig. asinttica
(bilateral)
,000
,000
,000
200
Universidad de Granada
10
ANLISIS DE REGRESIN
Ejercicio 1:
Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la
longitud en cm. de una cierta variedad de planta al cabo de un ao de vida para predecir
la longitud de esa variedad de planta en edad adulta:
Longitud en cm.
el primer ao
15.3
14.8
12.6
18.4
17.9
15.6
18.4
14.1
20.2
21.7
20.4
16.5
15.9
17.9
16.7
Longitud en cm.
en edad adulta
30.7
32.5
26.3
35.9
34.3
28.5
37.4
29.7
38.8
40.4
40.9
33.3
30.1
35.7
31.4
Se pide:
a)
b)
c)
d)
Universidad de Granada
11
a) Diagrama de dispersin
Universidad de Granada
12
42
40
38
36
34
LONG_ADU
32
30
28
26
12
14
16
18
20
22
LONG_1
Coeficientesa
Modelo
1
(Constante)
LONG_1
Coeficientes no
estandarizados
B
Error tp.
5,296
2,694
1,663
,156
Coeficientes
estandarizad
os
Beta
,947
t
1,965
10,657
Sig.
,071
,000
Universidad de Granada
13
Modelo
1
R
,947a
R cuadrado
corregida
,889
R cuadrado
,897
Error tp. de la
estimacin
1,4666
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
244,306
27,963
272,269
gl
1
13
14
Media
cuadrtica
244,306
2,151
F
113,577
Sig.
,000a
Universidad de Granada
14
Ejercicio 2:
Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la
concentracin de estrona en la saliva para predecir la concentracin de dicho esteroide
en plasma libre. Se tomaron los siguientes datos de 13 varones sanos:
Concentracin de estrona
en saliva pg./mL.
7.4
7.5
8.5
9
9
11
13
14
14.5
16
17
18
20
Concentracin de estrona
en plasma libre en pg./mL.
30
25
31.5
27.5
39.5
38
43
49
55
48.5
51
64.5
63
Se pide:
a) Representar el diagrama de dispersin
b) Plantear el modelo de regresin y estimar los parmetros del modelo.
Interprtalos
c) Obtener el coeficiente de correlacin lineal de Pearson y el coeficiente de
determinacin
d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de
regresin
e) Contrastar la significacin del coeficiente de regresin
a) Diagrama de dispersin
70,0
60,0
estrona
50,0
40,0
30,0
20,0
7,5
10,0
12,5
15,0
17,5
20,0
saliva
Universidad de Granada
15
Modelo
1
(Constante)
saliva
Coeficientes no
estandarizados
B
Error tp.
6,887
3,965
2,886
,297
Coeficientes
estandarizad
os
Beta
t
1,737
9,705
,946
Sig.
,110
,000
R
R cuadrado
,946a
,895
R cuadrado
corregida
,886
Error tp. de la
estimacin
4,3997
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
saliva
B
6,887
2,886
Error tp.
3,965
,297
Coeficientes
estandarizad
os
Beta
,946
t
1,737
9,705
Sig.
,110
,000
Universidad de Granada
16
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
1823,070
212,930
2036,000
gl
1
11
12
Media
cuadrtica
1823,070
19,357
F
94,180
Sig.
,000a
Universidad de Granada
17
Ejercicio 3:
Un aficionado a las apuestas en las carreras de caballos desea estudiar la descendencia
de una conocida raza de caballos que tiene mucho xito en dichas carreras. Para ello
estudia la relacin existente entre el peso en gramos de embriones de caballos y el
nmero de das transcurridos de vida de los mismos. Los datos aparecen en la siguiente
tabla:
Das
Peso
7
51.3
8
79.1
9
127.4
10
183.5
11
271.3
12
431.5
13
743.7
14
1143.2
15
1893.8
16
3102.4
17
4702.7
Se pide:
a) Representar la nube de puntos
b) Plantear el modelo de regresin y obtener la ecuacin del modelo ajustado
c) Bondad del ajuste
4000
3000
2000
1000
PESO
-1000
6
10
12
14
16
18
DIAS
MODEL: MOD_1.
Universidad de Granada
18
Lineal
ANOVA
Regresin
Residual
Total
Suma de
cuadrados
16841317
5932167,3
22773485
gl
1
9
10
Media
cuadrtica
16841317
659129,695
F
25,551
Sig.
,001
R cuadrado
corregida
,711
R cuadrado
,740
Error tpico de
la estimacin
811,868
Exponencial
ANOVA
Regresin
Residual
Total
Suma de
cuadrados
22,756
,032
22,789
gl
1
9
10
Media
cuadrtica
22,756
,004
F
6384,193
Sig.
,000
R cuadrado
,999
R cuadrado
corregida
,998
Error tpico de
la estimacin
,060
Universidad de Granada
19
Ejercicio 4:
Una empresa fabricante de cereales para el desayuno desea conocer la ecuacin que
permita predecir las ventas (en miles de euros) en funcin de los gastos en publicidad
infantil en televisin (en miles de euros), el tiempo diario de aparicin en televisin (en
minutos) y los gastos en publicidad en los peridicos (en miles de euros). Se realiza un
estudio en el que se renen los datos mensuales correspondientes a los ltimos 20
meses. Estos datos aparecen en la siguiente tabla:
Ventas
10
12
11
13
12
14
16
12
14
11
10
19
8.5
8
9
13
16
18
20
22
Pub. en
tv.
1
1.2
1.3
1.4
1.5
1.7
1.75
1.3
1.45
0.9
0.8
0.9
0.8
1
1.7
1.8
1.85
1.9
2
2
Tiempo
en tv.
50
57
56
55
60
65
69
67
68
67
97
66
65
60
70
110
75
80
85
90
Pub. en
per.
0.4
0.4
0.42
0.5
0.4
0.44
0.4
0.44
0.46
0.46
0.45
1.1
0.3
0.5
0.45
0.4
0.8
0.9
0.9
1.1
Se pide:
a) Ajustar un modelo de regresin lineal mltiple. Obtener una estimacin de los
parmetros del modelo y su interpretacin
b) Obtener e interpretar el valor de la suma de cuadrados residual
c) Contrastar la significacin del modelo propuesto
Universidad de Granada
20
Coeficientesa
Modelo
1
(Constante)
PUBL_TV
TIEMP_TV
PUBL_PER
Coeficientes no
estandarizados
B
Error tp.
2,108
2,055
3,432
1,121
1,477E-03
,030
11,347
1,802
Coeficientes
estandarizad
os
Beta
,358
,006
,711
t
1,026
3,060
,050
6,298
Sig.
,320
,007
,961
,000
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
247,677
49,960
297,638
gl
3
16
19
Media
cuadrtica
82,559
3,123
F
26,440
Sig.
,000a
Universidad de Granada
21
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
247,677
49,960
297,638
gl
3
16
19
Media
cuadrtica
82,559
3,123
F
26,440
Sig.
,000a
Universidad de Granada
22
Ejercicio 5:
Se desea estudiar la relacin entre la intensidad de regado (medida en litros por metro
cuadrado) y la productividad (medida en Kg/Ha) de una huerta de tomates. Se han
obtenido los siguientes datos:
Productividad de
un cultivo
2500.9
2000.8
3300.4
2500.6
1995.8
3312.3
3409
Intensidad de
regado
590.5
540.4
690
605.2
650
724
704.8
Se pide:
a) Podemos afirmar la existencia de relacin lineal entre las variables?
b) Coeficiente de correlacin y coeficiente de determinacin. Interpretacin
Adems del regado se cree que el empleo de un abono ha influido de forma lineal
en la productividad del cultivo. Por tanto se introduce en el modelo de regresin la
variable que mide el nmero de Kg. de abono por hectrea.
Abono 200.6
160.6
407.6
212.7
145
387.8
355
Universidad de Granada
23
PRODUCT
2400
2200
2000
1800
500
600
700
800
REGADIO
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
1557184,3
743017,305
2300201,6
Media
cuadrtica
1557184,3
148603,461
gl
1
5
6
F
10,479
Sig.
,023a
Correlacin de Pearson
Sig. (unilateral)
N
PRODUCT
REGADIO
PRODUCT
REGADIO
PRODUCT
REGADIO
PRODUCT
1,000
,823
,
,012
7
7
REGADIO
,823
1,000
,012
,
7
7
Modelo
1
R
R cuadrado
,823a
,677
R cuadrado
corregida
,612
Error tp. de la
estimacin
385,491
Universidad de Granada
24
Modelo
1
(Constante)
REGADIO
ABONO
Coeficientes no
estandarizados
B
Error tp.
942,755
988,031
,674
1,897
5,021
1,141
Coeficient
es
estandari
zados
Beta
t
,954
,355
4,402
,073
,911
Sig.
,394
,740
,012
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
2173045,5
127156,069
2300201,6
gl
2
4
6
Media
cuadrtica
1086522,8
31789,017
F
34,179
Sig.
,003a
Modelo
1
R
R cuadrado
,972a
,945
R cuadrado
corregida
,917
Error tp. de la
estimacin
178,295
Universidad de Granada
25
DISEO DE EXPERIMENTOS
Ejercicio 1:
Se sabe que el dixido de carbono tiene un efecto crtico en el crecimiento
microbiolgico. Cantidades pequeas de CO2 estimulan el crecimiento de muchos
microorganismos, mientras que altas concentraciones inhiben el crecimiento de la
mayor parte de ellos. Este ltimo efecto se utiliza comercialmente cuando se almacenan
productos alimenticios perecederos. Se realiz un estudio para investigar el efecto del
CO2 sobre la tasa de crecimiento de Pseudomonas fragi, un corruptor de alimentos. Se
administr dixido de carbono a cinco presiones atmosfricas diferentes. La respuesta
anotada fue el cambio porcentual en la masa celular despus de un tiempo de
crecimiento de una hora. Se utilizaron diez cultivos en cada nivel. Se obtuvieron los
siguientes datos:
Universidad de Granada
26
ANOVA
CRECIMIE
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
11274,319
1248,038
12522,357
gl
4
45
49
Media
cuadrtica
2818,580
27,734
F
101,628
Sig.
,000
Universidad de Granada
27
Ejercicio 2:
Una compaa textil utiliza diversos telares para la produccin de telas. Aunque se
desea que los telares sean homogneos con el objeto de producir tela de resistencia
uniforme se supone que puede existir una variacin significativa en la resistencia de la
tela debida a la utilizacin de distintos telares. A su disposicin tiene 5 tipos de telares
con los que realiza determinaciones de la resistencia de la tela. Este experimento se
realiza en orden aleatorio y los resultados se muestran en la tabla adjunta. Analizar los
datos y obtener las conclusiones apropiadas.
Telares
1
2
3
4
5
51
56
48
47
43
Resistencia
50
49
56
56
53
44
49
44
46
47
49
60
50
48
43
51
57
45
50
45
46
ANOVA
RESIST
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
439,885
98,000
537,885
gl
4
21
25
Media
cuadrtica
109,971
4,667
F
23,565
Sig.
,000
gl1
gl2
4
21
Sig.
,086
Universidad de Granada
28
Ejercicio 3:
En una determinada fbrica de galletas se desea saber si las harinas de sus cuatro
proveedores producen la misma viscosidad en la masa. Para ello, produce durante un da
16 masas, 4 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se
muestran en la siguiente tabla:
Proveedor
A
98
91
96
95
Proveedor
B
97
90
95
96
Proveedor
C
99
93
97
99
Proveedor
D
96
92
95
98
ANOVA
VISCOSID
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
14,188
97,750
111,938
Media
cuadrtica
4,729
8,146
gl
3
12
15
F
,581
Sig.
,639
-2
-4
-6
-6
-4
-2
Valor observado
Universidad de Granada
29
Ejercicio 4:
Los cientficos comprometidos en el tratamiento del agua residual de arenas asflticas
estudiaron tres mtodos de tratamientos para la eliminacin del carbono orgnico
(basado en W.R. Pirie, Statistical Planning and Analysis for Treatments of Tar Sand
Waste-water, Centro de Informacin Tcnica, Oficina de Informacin Tecnolgica y
Cientfica, Departamento de Energa de Estados Unidos). Los tres mtodos de
tratamiento utilizados fueron: flotacin de aire (FA), separacin de espuma (SF) y
coagulacin ferroclrica (CFC). Las mediciones del material de carbono orgnico para
los tres tratamientos arrojaron los siguientes datos:
FA
34.6
35.1
35.6
35.8
36.1
36.5
36.8
37.2
37.4
37.7
SE
38.8
39.0
40.1
40.9
41.0
43.2
44.9
46.9
51.6
53.6
CFC
26.7
26.7
27.0
27.1
27.5
28.1
28.1
28.7
30.7
31.2
ANOVA
CARBONO
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
1251,603
278,172
1529,775
gl
2
27
29
Media
cuadrtica
625,801
10,303
F
60,742
Sig.
,000
Universidad de Granada
30
Comparaciones mltiples
Variable dependiente: carbono
HSD de Tukey
(I) metodo
1
2
3
(J) metodo
2
3
1
3
1
2
Diferencia de
medias (I-J)
Error tpico
-7,72000*
1,43546
8,10000*
1,43546
7,72000*
1,43546
15,82000*
1,43546
-8,10000*
1,43546
-15,82000*
1,43546
Sig.
,000
,000
,000
,000
,000
,000
Intervalo de confianza al
90%
Lmite
superior
Lmite inferior
-10,7960
-4,6440
5,0240
11,1760
4,6440
10,7960
12,7440
18,8960
-11,1760
-5,0240
-18,8960
-12,7440
Universidad de Granada
31
Ejercicio 5:
Se ha realizado un estudio sobre el efecto de las temporadas de caza del ciervo en los
hbitos de stos. Se seleccionan cuatro sendas que se sabe utilizan los ciervos. Antes de
comenzar la temporada de caza, durante la temporada y al terminar la temporada se
determin el promedio de huellas halladas por semana en un rea especfica de cada
senda. Las sendas se trataron como bloques y se obtuvieron los siguientes datos:
Senda
1
2
3
4
Antes
62.5
46.5
45
24
Durante
57
53.3
59.3
35.7
Despus
49
50
37
50
Universidad de Granada
32
Fuente
Modelo corregido
Interseccin
TEMPORAD
SENDA
Error
Total
Total corregida
Suma de
cuadrados
tipo III
700,631a
27008,541
98,482
602,149
611,198
28320,370
1311,829
gl
5
1
2
3
6
12
11
Media
cuadrtica
140,126
27008,541
49,241
200,716
101,866
F
1,376
265,137
,483
1,970
Significacin
,351
,000
,639
,220
Universidad de Granada
33
Ejercicio 6:
Una industria desea comprobar el efecto que tienen cinco productos qumicos sobre la
resistencia de un tipo particular de fibra. Como tambin puede influir la mquina
empleada en la fabricacin, decide utilizar un diseo en bloques aleatorizados,
considerando las distintas mquinas como bloques. La industria dispone de cuatro
mquinas a las que asigna los cinco productos qumicos en orden aleatorio. Los
resultados obtenidos se muestran en la tabla adjunta.
Producto qumico
1
2
3
4
5
A
87
85
90
89
99
Tipos de mquinas
B
C
86
88
87
95
92
95
97
98
96
91
D
83
85
90
88
90
Universidad de Granada
34
Comparaciones mltiples
Variable dependiente: RESIST
DMS
(I)
PRODUCT
1
(J)
PRODUCT
2
3
4
5
1
3
4
5
1
2
4
5
1
2
3
5
1
2
3
4
Diferencia
entre
medias (I-J)
-2,00
-5,75*
-7,00*
-8,00*
2,00
-3,75
-5,00
-6,00*
5,75*
3,75
-1,25
-2,25
7,00*
5,00
1,25
-1,00
8,00*
6,00*
2,25
1,00
Error tp.
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
2,336
Significacin
,409
,030
,011
,005
,409
,134
,054
,025
,030
,134
,602
,355
,011
,054
,602
,676
,005
,025
,355
,676
Intervalo de confianza al
95%.
Lmite
Lmite inferior
superior
-7,09
3,09
-10,84
-,66
-12,09
-1,91
-13,09
-2,91
-3,09
7,09
-8,84
1,34
-10,09
,09
-11,09
-,91
,66
10,84
-1,34
8,84
-6,34
3,84
-7,34
2,84
1,91
12,09
-,09
10,09
-3,84
6,34
-6,09
4,09
2,91
13,09
,91
11,09
-2,84
7,34
-4,09
6,09
Universidad de Granada
35
ANLISIS DE LA COVARIANZA
Ejercicio 1:
Un distribuidor de bebidas est estudiando la efectividad de los mtodos de descarga,
para lo cual se mide el tiempo de descarga de unas cajas en minutos. Las bebidas se
distribuyen en tres tipos distintos de furgonetas (atendiendo a su diferente capacidad de
carga y antigedad). Se conoce que el tiempo de descarga guarda una estrecha relacin
con el volumen de cajas descargadas. Se obtuvieron los siguientes datos:
1
y
12
19
15
21
11
19
x
20
23
22
30
15
22
Furgoneta
2
y
x
70
64
64
62
55
47
77
66
66
50
44
42
3
y
31
28
25
22
29
28
x
27
25
22
26
28
29
Universidad de Granada
36
Fuente
Modelo corregido
Interseccin
FURGONET
VOLUMEN
Error
Total
Total corregida
Suma de
cuadrados
tipo III
7679,373a
3,758
174,246
592,373
222,627
30374,000
7902,000
gl
3
1
2
1
14
18
17
Media
cuadrtica
2559,791
3,758
87,123
592,373
15,902
F
160,974
,236
5,479
37,252
Significacin
,000
,634
,017
,000027
Universidad de Granada
37
Ejercicio 2:
Se quiere analizar el efecto que tienen tres tipos distintos de terreno en el rendimiento
de una determinada plantacin de almendros. Se sospecha que el rendimiento del
cultivo (medido en kg.) est relacionado con la cantidad de kg. de abono recibidos. Los
datos observados se muestran en la tabla adjunta:
Terreno
B
A
Y
130,5
144,6
133,9
128,4
119,2
133,8
122,8
119,4
122,7
130,8
x
20,3
44,9
33,8
20,8
18,2
32,8
33,9
18,3
22,7
29,7
y
110,3
100,8
109,6
122,7
97,4
x
15,9
22
16,9
20,2
16,9
C
y
155,9
149,1
188,9
199,4
185,7
x
44,9
42,33
58,9
70,8
61,9
Se pide
a) Indicar el valor de la suma de cuadrados entre tratamientos ajustada.
Interpretacin
b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta
Universidad de Granada
38
Fuente
Modelo corregido
Interseccin
TERRENO
ABONO
Error
Total
Total corregida
Suma de
cuadrados
tipo III
14135,521a
10205,154
404,959
1804,347
1080,639
381321,724
15216,159
gl
3
1
2
1
16
20
19
Media
cuadrtica
4711,840
10205,154
202,479
1804,347
67,540
F
69,764
151,098
2,998
26,715
Significacin
,000
,000
,078
,000
Universidad de Granada
39
Ejercicio 3:
Una empresa pretende estudiar la resistencia a la ruptura de la fibra de la que est
compuesta una cuerda. Se realiza un estudio para determinar si existe diferencia
significativa en la resistencia de los tres tipos de cuerdas disponibles (atendiendo al tipo
de fibra disponible). Se cree que la temperatura a la que se realiza el experimento puede
influir en la resistencia, por lo que se utiliza un diseo en bloques aleatorizados
considerando la temperatura como bloque, con 4 niveles. La resistencia de la cuerda a la
ruptura (medida en libras) se ve afectada por su grosor (medido en 103 pulgadas).
Los datos se presentan en la siguiente tabla:
1
Temperatura
1
2
3
4
y
33
41
35
42
x
20
25
24
25
Cuerda
2
y
44
23
44
37
3
x
28
22
33
27
y
41
39
37
26
x
23
22
23
21
Se pide
a) Formular el diseo empleado
b) Analizar estos datos y extraer las conclusiones apropiadas
Universidad de Granada
40
Fuente
Modelo corregido
Interseccin
CUERDA
TEMP
X
Error
Total
Total corregida
Suma de
cuadrados
tipo III
423,966a
55,091
170,503
91,799
358,133
71,701
16776,000
495,667
gl
6
1
2
3
1
5
12
11
Media
cuadrtica
70,661
55,091
85,251
30,600
358,133
14,340
F
4,928
3,842
5,945
2,134
24,974
Significacin
,050
,107
,048
,215
,004
Universidad de Granada
41
Ejercicio 4:
Se pretende comparar la presin arterial sistlica de un grupo de fumadores segn su
nivel de estudios. Para ello se realiza un estudio en el que se controla el nmero de
cigarrillos consumidos al da por cada una de estas personas. El nivel de estudios se
clasifica en tres niveles: estudios bsicos, estudios de Secundaria y estudios
universitarios, codificados por 1, 2 y 3 respectivamente. Adems se cree que la presin
arterial que sufren estos individuos podra relacionarse en forma lineal con la edad de
los fumadores. Los datos se muestran en la tabla adjunta:
y
153,4
157,5
140,5
162,7
153,5
1
X
24,2
25,6
24,9
57,2
46,3
z
46
55
49
44
64
Nivel de estudios
2
y
x
z
141,3
18,3
22
133,9
28
51
128,7
12,1
36
144,2
27,4
51
137,4
33,5
35
y
135,5
137,9
140,4
126,9
130,1
3
x
20,3
22,9
33
20,3
11,2
z
35
17
40
39
29
Universidad de Granada
42
Fuente
Modelo corregido
Intercept
ESTUDIOS
N_CIGAR
EDAD
Error
Total
Total corregida
Suma de
cuadrados
tipo III
1294,773a
11452,003
410,072
203,031
24,663
336,176
302361,030
1630,949
gl
4
1
2
1
1
10
15
14
Media
cuadrtica
323,693
11452,003
205,036
203,031
24,663
33,618
F
9,629
340,655
6,099
6,039
,734
Significacin
,002
,000
,019
,034
,412
gl1
,973
gl2
2
12
Significacin
,406
Universidad de Granada
43
ANLISIS CLUSTER
Ejercicio 1:
Se analiza la leche de las hembras de 20 mamferos, obtenindose los porcentajes en
agua, protenas, grasa y lactosa siguientes:
Mamfero
CABALLO
BURRO
CEBRA
HAMSTER
RATA
OVEJA
RENO
MULA
CERDO
CAMELLO
BFALO
ZORRO
CONEJO
LLAMA
CIERVO
BISONTE
GATO
PERRO
FOCA
DELFN
Agua
90.1
90.3
86.2
81.9
72.5
82.0
64.8
90.0
82.8
87.7
82.1
81.6
71.3
86.5
65.9
86.9
81.6
76.3
46.4
44.9
Protenas
2.6
1.7
3.0
7.4
9.2
5.6
10.7
2.0
7.1
3.5
5.9
6.6
12.3
3.9
10.4
4.8
10.1
9.3
9.7
10.6
Grasa
1.0
1.4
4.8
7.2
12.6
6.4
20.3
1.8
5.1
3.4
7.9
5.9
13.1
3.2
19.7
1.7
6.3
9.5
42.0
34.9
Lactosa
6.9
6.2
5.3
2.7
3.3
4.7
2.5
5.5
3.7
4.8
4.7
4.9
1.9
5.6
2.6
5.7
4.4
3.0
0.0
0.9
Universidad de Granada
44
Universidad de Granada
45
Universidad de Granada
46
Historial de conglomeracin
Etapa
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Conglomerado que se
combina
Conglom
Conglom
erado 1
erado 2
2
8
6
12
1
2
7
15
10
14
6
11
10
16
3
10
6
9
4
6
1
3
4
17
5
18
5
13
1
4
1
5
19
20
1
7
1
19
Coeficientes
,911
1,204
1,225
1,292
1,510
1,533
1,797
1,884
1,942
2,512
3,254
3,329
3,969
4,389
5,227
6,352
7,367
8,765
24,733
Etapa en la que el
conglomerado
aparece por primera
vez
Conglom
Conglom
erado 1
erado 2
0
0
0
0
0
1
0
0
0
0
2
0
5
0
0
7
6
0
0
9
3
8
10
0
0
0
13
0
11
12
15
14
0
0
16
4
18
17
Prxima
etapa
3
6
11
18
7
9
8
11
10
12
15
15
14
16
16
18
19
19
0
Universidad de Granada
47
Conglomerado de pertenencia
Caso
1:caballo
2:burro
3:cebra
4:hamster
5:rata
6:oveja
7:reno
8:mula
9:cerdo
10:camello
11:bfalo
12:zorro
13:conejo
14:llama
15:ciervo
16:bisonte
17:gato
18:perro
19:foca
20:delfn
5
conglome
rados
1
1
1
1
2
1
3
1
1
1
1
1
2
1
3
1
1
2
4
5
4
conglome
rados
1
1
1
1
1
1
2
1
1
1
1
1
1
1
2
1
1
1
3
4
3
conglome
rados
1
1
1
1
1
1
2
1
1
1
1
1
1
1
2
1
1
1
3
3
2
conglome
rados
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
Universidad de Granada
C L U S T E R
48
A N A L Y S I S *
Num
0
5
10
15
20
25
+---------+---------+---------+---------+---------+
burro
mula
caballo
camello
10
llama
14
bisonte
16
cebra
oveja
zorro
12
bfalo
11
cerdo
hamster
gato
rata
17
5
perro
18
conejo
13
reno
19
delfn
20
2 grupos
15
foca
5 grupos
4 grupos
3 grupos
ciervo
Universidad de Granada
49
Universidad de Granada
50
Ejercicio 2:
Se pretende clasificar un conjunto de 26 animales mamferos en 4 grupos
homogneos atendiendo a su configuracin dental. La informacin de la que se dispone
es la del nmero de piezas dentales. Los datos de los que se dispone son los siguientes:
Mamfero
Incisivos
Sup.
Incisivos
Inf.
Caninos
Sup.
Caninos
Inf.
Premolares
Inf.
Premolares
Sup.
Molares
Sup.
Molares
Inf.
ALCE
ANTLOPE
ARDILLA
BISONTE
BUEY
CABRA
CASTOR
CIERVO
COMADREJA
HURN
JAGUAR
LEN
LINCE
LOBO
MARTA
MOFETA
MURCILAGO
NUTRIA
OCELOTE
OSO
OVEJA
RATN
RENO
TEJN
VISN
ZORRO
0
0
1
0
0
0
1
0
3
3
3
3
3
3
3
3
2
3
3
3
0
1
0
3
3
3
4
4
1
4
4
4
1
4
3
3
3
3
3
3
3
3
3
2
3
3
4
1
4
3
3
3
1
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
1
1
1
1
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
1
1
1
3
3
1
3
3
3
2
3
3
3
3
3
2
4
4
3
1
1
3
4
3
0
3
3
3
4
3
3
1
3
3
3
1
3
3
3
2
2
2
4
4
3
2
2
2
4
3
0
3
3
3
4
3
3
3
3
3
3
3
3
1
1
1
1
1
2
1
1
3
3
1
2
3
3
3
1
1
2
3
3
3
3
3
3
3
3
2
2
1
1
1
3
2
2
3
3
1
3
3
3
3
2
2
3
Clasificar estos mamferos utilizando el mtodo de las k-medias para agrupar a los
mamferos en 4 grupos.
Universidad de Granada
51
Universidad de Granada
52
Incisivos Superiores
Incisivos Inferiores
Caninos Superiores
Caninos Inferiores
Premolares Inferiores
Premolares Superiores
Molares Superiores
Molares Inferiores
Historial de iteraciones(a)
Cambio en los centros de los conglomerados
Iteracin
1
1
1,150
,000
2
,250
3
1,202
,000
,000
4
,354
,000
a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningn
cambio o ste es pequeo. El cambio mximo de coordenadas absolutas para cualquier centro es de
,000. La iteracin actual es 2. La distancia mnima entre los centros iniciales es de 3,606.
Pertenencia a los conglomerados
MAMIFERO
alce
Conglome
rado
2
Distancia
,750
antlope
,250
ardilla
,333
bisonte
,250
buey
,250
cabra
,250
castor
1,054
ciervo
,250
Nmero de caso
1
comadrej
,828
10
hurn
,828
11
jaguar
1,110
12
len
1,110
13
lince
1,150
14
lobo
,354
15
marta
1,061
16
mofeta
,828
17
murcila
2,739
18
nutria
2,739
19
ocelote
1,110
20
oso
,354
21
oveja
,250
22
ratn
1,202
23
reno
,750
24
tejn
,828
25
visn
,828
26
zorro
,354
Universidad de Granada
53
Incisivos Superiores
Incisivos Inferiores
Caninos Superiores
Caninos Inferiores
Premolares Inferiores
Premolares Superiores
Molares Superiores
Molares Inferiores
2
3,974
3,974
4,353
4,417
2,353
3,897
3
4,353
4
2,353
4,417
3,897
5,633
5,633
11,000
8,000
3,000
4
Vlidos
Perdidos
4,000
26,000
,000
Universidad de Granada
54
Universidad de Granada
55
Procedencia
Pblico
No Gubernamental
Total
Recuento
% de Opinin
Recuento
% de Opinin
Recuento
% de Opinin
Bueno
67
84,8%
12
15,2%
79
100,0%
Opinin
Aceptable
56
58,3%
40
41,7%
96
100,0%
Malo
35
41,2%
50
58,8%
85
100,0%
Total
158
60,8%
102
39,2%
260
100,0%
Universidad de Granada
56
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos
Valor
33,078a
35,395
2
2
Sig. asinttica
(bilateral)
,000
,000
,000
gl
32,401
260
Medidas simtricas
Nominal por
nominal
Phi
V de Cramer
Coeficiente de
contingencia
Valor
,357
,357
Sig.
aproximada
,000
,000
,336
,000
N de casos vlidos
a A
260
d l hi t
lt
ti
Medidas direccionales
Nominal
por nominal
Lambda
Tau de Goodman
y Kruskal
Simtrica
Procedencia dependiente
Opinin dependiente
Procedencia dependiente
Opinin dependiente
Valor
,135
,147
,128
,127
,060
Error tp.
a
asint.
,071
,083
,083
,037
,019
T aproximada
1,816
1,635
1,445
Sig.
aproximada
,069
,102
,149
,000c
,000c
Universidad de Granada
57
Ejercicio 2:
Se est llevando a cabo un estudio sobre la raza canina Boxer para investigar el
grado de agresividad que presentan los perros de dicha raza. Se supone en principio, que
los sntomas de agresividad dependen fundamentalmente del nivel de adiestramiento
que han tenido estos perros durante los dos primeros aos de su vida. Por este motivo,
se han investigado a 208 perros Boxer ofreciendo los siguientes resultados:
Nivel de adiestramiento
Grado de agresividad
Bajo
Medio
Alto
13
34
31
28
15
5
Universidad de Granada
58
Grado de
Agresividad
Bajo
Medio
Alto
Total
Recuento
% de Grado de
Adiestramiento
Recuento
% de Grado de
Adiestramiento
Recuento
% de Grado de
Adiestramiento
Recuento
% de Grado de
Adiestramiento
Grado de Adiestramiento
Bajo
Medio
Alto
12
13
28
Total
53
14,6%
16,7%
58,3%
25,5%
28
34
15
77
34,1%
43,6%
31,3%
37,0%
42
31
78
51,2%
39,7%
10,4%
37,5%
82
78
48
208
100,0%
100,0%
100,0%
100,0%
Universidad de Granada
59
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos
Valor
41,629a
40,522
4
4
Sig. asinttica
(bilateral)
,000
,000
,000
gl
31,093
208
Medidas direccionales
d de Somers
Simtrica
Grado de Agresividad
dependiente
Grado de Adiestramiento
dependiente
Valor
-,336
Error tp.
a
asint.
,058
T aproximada
-5,668
Sig.
aproximada
,000
-,338
,058
-5,668
,000
-,334
,058
-5,668
,000
Medidas simtricas
Tau-b de Kendall
Tau-c de Kendall
Gamma
N de casos vlidos
Valor
-,336
-,330
-,492
208
Error tp.
a
asint.
,058
,058
,078
T aproximada
-5,668
-5,668
-5,668
Sig.
aproximada
,000
,000
,000
Universidad de Granada
60
Ejercicio 3:
En la siguiente tabla se muestra la informacin de la Unidad de Paritorio de un
hospital granadino, donde aparecen las frecuencias observadas de utilizacin de
analgesia epidural y realizacin de episiotoma a las mujeres cuyo parto es asistido en
dicho centro. Los responsables de esta Unidad creen que la utilizacin de analgesia
epidural en el proceso del parto influye en la realizacin de episiotoma.
Analgesia Epidural No
Episitoma
No
S
405 243
239 235
Realizacin de
Episiotoma
NO
Si
Total
Utilizacin de
analgesia epidural
No
S
405
243
62,9%
50,8%
239
235
37,1%
49,2%
644
478
100,0%
100,0%
Total
648
57,8%
474
42,2%
1122
100,0%
Universidad de Granada
61
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
N de casos vlidos
Sig. asinttica
(bilateral)
,000
15,841
,000
16,316
,000
Valor
16,332b
gl
Sig. exacta
(bilateral)
Sig. exacta
(unilateral)
,000
,000
1122
Medidas simtricas
Nominal por
nominal
Phi
V de Cramer
Coeficiente de
contingencia
Valor
,121
,121
Sig.
aproximada
,000
,000
,120
,000
N de casos vlidos
1122
Medidas direccionales
Nominal
por nominal
Lambda
Tau de Goodman
Simtrica
Realizacin de
Episiotoma dependiente
Utilizacin Analgesi
Epidural dependiente
Realizacin de
Valor
,000
Error tp.
a
asint.
,000
T aproximada
.c
c
,000
,000
,000
,000
Sig.
aproximada
.c
c
Universidad de Granada
62
Bibliografa Recomendada:
Bibliografa General:
Universidad de Granada