Vous êtes sur la page 1sur 155

Bioestadstica

Problemas resueltos
Manuel Angel Barea Gmez

16 de febrero de 2013
Usted es libre de:

copiar, distribuir y comunicar pblicamente la obra


Remezclar transformar la obra

Bajo las siguientes condiciones:

b Reconocimiento Debe reconocer los crditos de la obra de la manera especificada


por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o
apoyan el uso que hace de su obra).
e No comercial No puede utilizar esta obra para fines comerciales.

a Compartir bajo la misma licencia Si altera o transforma esta obra, o genera una
obra derivada, slo puede distribuir la obra generada bajo una licencia idntica a sta.

Este obra est bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported.

Manuel Angel Barea Gmez 2


ndice general

Pgina

ndice general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Captulo 1 Estadstica Descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Captulo 2 Variables Bidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

Captulo 3 Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Captulo 4 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

Captulo 5 Intervalos de confianza y contrastes de hiptesis paramtricas de una poblacin. . . . . . . . . . . . . . . . . . . 97

Captulo 6 Intervalos de confianza y constrates de hiptesis paramtricos en dos o ms poblaciones. . . . . . . . . . . . . . 108

Captulo 7 Contrastes de hiptesis no paramtricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

3
C APTULO

1
Estadstica Descriptiva

Problema 1.1. En el siguiente conjunto de nmeros, se proporcionan los pesos (redondeados a la libra ms prxima) de los bebs
nacidos durante un cierto intervalo de tiempo en un hospital:

4 8 4 6 8 6 7 7 7 8
10 9 7 6 10 8 5 9 6 3
7 6 4 7 6 9 7 4 7 6
8 8 9 11 8 7 10 8 5 7
7 6 5 10 8 9 7 5 6 5

(a) Construir una distribucin de frecuencias de estos pesos.


(b) Encontrar las frecuencias relativas.
(c) Encontrar las frecuencias acumuladas.
(d) Encontrar las frecuencias relativas acumuladas.
(e) Dibujar un histograma con los datos.
(f) Calcular las medidas de tendencia central.
(g) Encontrar el percentil 24.

xi ni Ni fi Fi xi n i x2i ni
3 1 1 0,02 0,02 3 9
4 4 5 0,08 0,1 16 64
5 5 10 0,1 0,2 25 125
6 9 19 0,18 0,38 54 324
7 12 31 0,24 0,62 84 588
8 9 40 0,18 0,8 72 576
9 5 45 0,1 0,9 45 405
10 4 49 0,08 0,98 40 400
11 1 1 0,02 1 11 121
50 350 2612

Los apartados a,b,c y d se encuentran resueltos en la tabla proporcionada

4
CAPTULO 1. ESTADSTICA DESCRIPTIVA

12
10
8
Frecuencia

6
4
2
0

4 6 8 10

Peso

(xi ni ) 350
x= n = 50 =7

Mo = 7 y Me = 7

R = xmax xmin = 11 3 = 8

(xi x)ni ni x2i 2612


s2 = n = n x2 = 50 72 = 3, 24

s= 3, 24 = 1, 8
s 1,8
CV = x = 7 = 0, 257
nk 5024
Para el clculo del P24 100 = 100 = 12 que se corresponde con P24 = 6

Problema 1.2. A continuacin se dan los resultados obtenidos con una muestra de 50 universitarios. la caracterstica es el tiempo
de reaccin ante un estmulo auditivo:

0,110 0,110 0,110 0,112 0,117 0,113 0,135 0,107 0,122


0,113 0,098 0,098 0,105 0,103 0,119 0,100 0,117 0,113
0,124 0,118 0,118 0,108 0,115 0,120 0,107 0,123 0,109
0,117 0,111 0,111 0,101 0,112 0,111 0,119 0,103 0,100
0,108 0,120 0,120 0,102 0,129 0,115 0,121 0,130 0,134
0,118 0,106 0,106 0,094 0,1114

(a) Cul es la amplitud total de la distribucin de los datos?

(b) Obtenga la distribucin de frecuencias absolutas y relativas.


(c) Obtenga la distribucin de frecuencias acumuladas, absolutas y relativas.
(d) Calcular la media, varianza y coeficiente de variacin.
(e) Dibuje el polgono de frecuencias relativas.
(f) Dibuje el polgono de frecuencias relativas acumuladas.

Manuel Angel Barea Gmez 5


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Intervalo xi ni Ni fi Fi xi n i x2i ni
[0, 0900 0, 0950] 0,0925 1 1 0,02 0,02 0,0925 0,0086
[0, 0950 0, 1000] 0,0975 4 5 0,08 0,1 0,3900 0,0380
[0, 1000 0, 1050] 0,1025 5 10 0,1 0,2 0,5125 0,0525
[0, 1050 0, 1100] 0,1075 8 18 0,16 0,36 0,8600 0,0925
[0, 1100 0, 1150] 0,1125 11 29 0,22 0,58 1,2375 0,1392
[0, 1150 0, 1200] 0,1075 9 38 0,18 0,76 0,9675 0,1040
[0, 1200 0, 1250] 0,1225 5 43 0,1 0,86 0,6125 0,0750
[0, 1250 0, 1300] 0,1275 4 47 0,08 0,94 0,5100 0,0650
[0, 1300 0, 1350] 0,1325 3 50 0,06 1 0,3975 0,0527
50 5,58 0,63

R = xmax xmin = 0, 134 0, 094 = 0, 04


(xi ni ) 5,58
x= n = 50 = 0, 11

(xi x)ni ni x2i 0,63


s2 = n = n x2 = 50 0, 112 = 0, 0005

s= 0, 0005 = 0, 022
s 0,022
CV = x = 0,11 = 0, 203

Poligono de frecuencias relativas Poligono de frecuencias relativas acumulada


1.0
0.20

0.8
0.15

0.6
F
f

0.10

0.4
0.2
0.05

0.0

0.10 0.11 0.12 0.13 0.10 0.11 0.12 0.13

X X

Problema 1.3. Con el fin de observar la relacin entre la inteligencia y el nivel socioeconmico (medido por el salario mensual
familiar) se tomaron dos grupos, uno formado con sujetos de cociente intelectual inferior a 95 y otro formado por los dems; De
cada sujeto se anot el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla:

Nivel socioeconmico Sujetos con CI < 95 Sujetos con CI 95


Intervalos Frecuencia Frecuencia
10 o menos (4, 10] 75 19
10 16 35 26
16 22 20 25
22 28 30 30
28 34 25 54
ms de 34 (34, 40] 15 46

Manuel Angel Barea Gmez 6


CAPTULO 1. ESTADSTICA DESCRIPTIVA

(a) Dibuje un grfico que permita comparar ambos grupos.


(b) Calcule las medidas de tendencia central para aquellos sujetos con CI < 95.
(c) Calcular las medidas de dispersin para aquellos sujetos con CI 95.

70

CI + Inteligencia 60

50

40

30

20

10 15 20 25 30 35

Nivel

Nivel socioeconmico Marca de clase CI < 95 CI 95


Intervalos x1 ni Ni xi n i x2i ni ni Ni xi n i x2i ni
10 o menos (4, 10] 7 75 75 525 3675 19 19 133 931
10 16 13 35 110 455 5915 26 45 338 4394
16 22 19 20 130 380 7220 25 70 475 9025
22 28 25 30 160 750 18750 30 100 750 18750
28 34 31 25 185 775 24025 54 154 1674 51894
ms de 34 (34, 40] 37 15 200 555 20535 46 200 1702 62974
200 3440 80120 200 5072 147968

(xi ni ) 3440
xCI<95 = n = 200 = 17, 2
200
El intervalo mediano es n
2 = 2 = 100 [10 16]
nk
100 Ni1
Me = Lin f + ni ai = 10 + 10075
35 6 = 14, 28

(xi ni ) 5072
xCI95 = n = 200 = 25, 36

ni x2i
s2 = (xi x)ni
n = n x2 = 147968 2
200 25, 36 = 96, 71

s = 96, 71 = 9, 83
s 9,83
CV = x = 25,36 = 0, 387

Problema 1.4. Un estudio consisti en anotar el nmero de palabras ledas en 15 seg por un grupo de 120 sujetos dislxicos y 120
individuos normales. Teniendo en cuenta los resultados de la tabla:

Manuel Angel Barea Gmez 7


CAPTULO 1. ESTADSTICA DESCRIPTIVA

N de palabras leidas Dislxicos nd Normales nn


25 o menos 25 56 1
26 24 9
27 16 21
28 12 29
29 10 28
30 o ms 30 2 32

Calcule:
(a) Las medias aritmticas de ambos grupos.
(b) Las medianas de ambos grupos.
(c) El porcentaje de sujetos dislxicos que superaron la mediana de los normales.
(d) Compare la variabilidad relativa de ambos grupos.

N de palabras leidas nd Nd xi ndi x2i ndi nn Nn xi nni x2i nni


25 o menos 25 56 56 1400 35000 1 1 25 625
26 24 80 624 16224 9 10 234 6084
27 16 96 432 11664 21 31 567 15309
28 12 108 336 9408 29 60 812 22736
29 10 118 290 8410 28 88 812 23548
30 o ms 30 2 120 60 1800 32 120 960 28800
120 3142 82506 3410 97102

(xi ni ) 3142
xd = n = 120 = 26, 18

(xi ni ) 3410
xd = n = 120 = 28, 41

La mediana se encuentra en n2 = 120


2 = 60 para los dislxicos Me = 26 y para los normales Men = 28.
El grupo de dislxicos superaron la mediana son 16 + 12 + 10 + 2 = 40 El porcentaje de dislxicos que superan la mediana son es
40
120 = 0, 33

ni x2 i
s2d = (xi x)ni
n = n xd 2 = 82506 2
120 26, 18 = 1, 98

sd = 1, 98 = 1, 407
sd 1,406
CV = xd = 26,18 = 0, 05

ni x2i
s2n = (xi x)ni
n = n xn 2 = 97102 2
120 28, 41 = 1, 67

sd = 1, 67 = 1, 29
sd 129
CV = xd = 28,41 = 0, 045

Problema 1.5. La tabla siguiente muestra la composicin por edad, sexo y trabajo de un grupo de personas con tuberculosis
pulmonar en la provincia de Vizcaya en el ao 1979:

Manuel Angel Barea Gmez 8


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Trabajadores No trabajadores Totales


Edad
Varn Mujer Total Varn Mujer Total Varn Mujer Total
1419 2 1 3 25 40 65 27 41 68
1924 10 4 14 20 36 56 30 40 70
2429 32 10 42 15 50 65 47 60 107
2934 47 12 59 13 34 47 60 46 106
3439 38 8 46 10 25 35 48 33 81
3944 22 4 26 7 18 25 29 22 51

(a) Representar grficamente la distribucin de frecuencias de aquellas personas trabajadoras que padecen tuberculosis.
(b) Representar grficamente la distribucin de frecuencias de los varones no trabajadores que padecen tuberculosis.
(c) Representar grficamente la distribucin de frecuencias del nmero total de mujeres que padecen tuberculosis.
(d) Por debajo de qu edad est el 50 % de los varones?
(e) Por encima de qu edad se encuentra el 80 % de las mujeres?
(f) Obtener la media, mediana y desviacin tpica de la distribucin de las edades de la muestra total.

Trabajadores con tuberculsis

1 Mujer
2 Varn
40

2
30
Poblacin

2
20

1
10

2 1
1

1 1
2
1
0

20 25 30 35 40

Edad

No trabajadores varones con tuberclisis Total de mujeres con tuberculsis


25

60
50
20

Mujeres
Varn

40
15

30
10

20 25 30 35 40 20 25 30 35 40

Edad Edad

Manuel Angel Barea Gmez 9


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Edad Varn Ni
1419 27 27
1924 30 57
2429 47 104
2934 60 164
3439 48 212
3944 29 241

n 241
2 = 2 = 120, 5 Luego est en el intervalo [29 34]
nk
100 Ni1
Me = Lin f + ni ai = 29 + 120,5104
60 5 = 30, 375

Edad Mujer Ni
1419 41 41
1924 40 81
2429 60 141
2934 46 187
3439 33 220
3944 22 242

Las mujeres que se encuentran por encima el 80 % de las mujeres, es lo mimo que hallar P20, el intervalo para este percentil es
nk 24220
100 = 100 = 48, 4 Luego el intervalo es [19 24]

nk
100 Ni1
Me = Lin f + ni ai = 19 + 48,441
40 5 = 19, 925

Edad xi ni Ni xi n i x2i ni
1419 16,5 68 68 1122 18513
1924 21,5 70 138 1505 32358
2429 26,5 107 245 2836 75141
2934 31,5 106 351 3339 105179
3439 36,5 81 432 2957 107912
3944 41,5 51 483 2117 87835
483 13874,50 426936,75

(xi ni ) 13874,50
x= n = 483 = 28, 72

ni x2i
s2 = (xi x)ni
n = n x2 = 426936,75
483 28, 722 = 58, 76

s = 59, 76 = 7, 66.
n 483
2 = 2 = 241, 5 Luego est en el intervalo [24 29]
nk
100 Ni1
Me = Lin f + ni ai = 24 + 241,5138
107 5 = 28, 83

Problema 1.6. En una epidemia de escarlatina, se ha recogido el nmero de muertos en 40 ciudades de un pas, obtenindose la
siguiente tabla:

Manuel Angel Barea Gmez 10


CAPTULO 1. ESTADSTICA DESCRIPTIVA

N de muertos 0 1 2 3 4 5 6 7
Ciudades 7 11 10 7 1 2 1 1

(a) Representar grficamente estos datos.


(b) Obtener la distribucin acumulada y representarla.
(c) Calcular media, mediana y moda.
(d) Calcular la varianza y la desviacin tpica.
(e) Porcentaje de ciudades con al menos 2 muertos.
(f) Porcentaje de ciudades con ms de 3 muertos.
(g) Porcentaje de ciudades con a lo sumo 5 muertos.

N de muertos por ciudad


10
8
Ciudades

6
4
2

0 1 2 3 4 5 6 7

Muertes

Muertes ni Ni fi Fi xi n i x2i ni
0 7 7 0,18 0,18 0 0
1 11 18 0,28 0,45 11 11
2 10 28 0,25 0,70 20 40
3 7 35 0,18 0,88 21 63
4 1 36 0,03 0,90 4 16
5 2 38 0,05 0,95 10 50
6 1 39 0,03 0,98 6 36
7 1 40 0,03 1,00 7 49
40 79 265

Manuel Angel Barea Gmez 11


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Distribucion de frecuencia acumulada

1.0
0.8
0.6
Frecuencia

0.4
0.2
0.0

0 2 4 6 8

Edad

(xi ni ) 79
x= n = 40 = 1, 97, Me = 2 y M0 = 1

(xi x)ni ni x2i 265


s2 = n = n x2 = 40 1, 972 = 2, 72

s= 2, 72 = 1, 6

El porcentaje de ciudades con al menos 2 muertos es igual 1 P(X < 2) = 1 0, 45 = 0, 55.


El porcentaje de ciudades con al menos 2 muertos es igual 1 P(X 3) = 1 0, 88 = 0, 12. El porcentaje con a lo sumo 5 muertes
0, 95

Problema 1.7. Se le ha tomado la temperatura corporal a un grupo de pacientes afectados de gripe, con los resultados siguientes:

Temperatura C 37 37,2 37,5 38 38,1 38,5 39


N pacientes 1 5 15 6 10 5 2

Calcule:
(a) Media aritmtica.
(b) Moda y mediana.
(c) Coeficiente de variacin de Pearson.

xi ni Ni xi n i x2i ni
37,00 1 1 37 1369
37,20 5 6 186 6919
37,50 15 21 563 21094
38,00 6 27 228 8664
38,10 10 37 381 14516
38,50 5 42 193 7411
39,00 2 44 78 3042
44 1665 63015,30

(xi ni ) 1665
x= n = 44 = 37, 82

Manuel Angel Barea Gmez 12


CAPTULO 1. ESTADSTICA DESCRIPTIVA

n 44
M0 = 37, 5 y 2 = 2 = 22as que Me = 38

ni x2i
s2 = (xi x)ni
n = n x2 = 6305,305
44 37, 822 = 0, 2471

s = 0, 2471 = 0, 4971
s 0,2471
CV = x = 37,92 = 0, 013

Problema 1.8. Un eclogo est interesado en el tamao de la hoja de una determinada especie vegetal. Para ello recoge una muestra
con los siguientes resultados:

Longitud cm 2,5 3,2 4 5,5 5,8 6,1


N hojas 2 4 9 6 6 3

Determine los valores de:


(a) Primer y tercer cuartiles.
(b) Moda y mediana.
(c) Percentiles 42 y 86

xi ni Ni xi n i x2i ni
2,50 2 2 5 13
3,20 4 6 13 41
4,00 9 15 36 144
5,50 6 21 33 182
5,80 6 27 35 202
6,10 3 30 18 112
30 139,90 692,43

30
4 = 7, 5 as que Q1 = 4
303
4 = 22, 5 as que Q3 = 5, 80

M0 = 4 y Me = 4
3042 3086
100 = 12, 6 P42 = 6 y 100 = 25, 8 P86 = 5, 80

Problema 1.9. La siguiente distribucin de frecuencias se refiere a las edades de los empleados de una empresa:

Intervalos Frecuencia
16-22 11
22-28 15
28-34 32
34-40 28
40-46 16
46-52 25
52-58 14
58-64 10
64-70 6

Manuel Angel Barea Gmez 13


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Calcule:
(a) Media aritmtica, intervalo mediano, mediana, intervalo modal, cuartiles de primer y tercer orden, percentiles 32 y 81.
(b) Desviacin tpica, coeficiente de variacin de Pearson y recorrido semiintercuartlico.

Intervalos xi ni Ni xi n i x2i ni
16-22 19 11 11 209 3971
22-28 25 15 26 375 9375
28-34 31 32 58 992 30752
34-40 37 28 86 1036 38332
40-46 43 16 102 688 29584
46-52 49 25 127 1225 60025
52-58 55 14 141 770 42350
58-64 61 10 151 610 37210
64-70 67 6 157 402 26934
157 6307 278533

(xi ni ) 6307
x= n = 157 = 40, 17
n 157
El intervalo mediano 2 = 2 = 78, 5 ser [34 40]
nk
100 Ni1
Me = Lin f + ni ai = 34 + 78,558
37 6 = 37, 32

El intervalo modal es [28 34]


El primer cuartil 4n = 157
4 = 39, 25 luego se encuentra en el intervalo [28 34]

nk
100 Ni1
Q1 = Lin f + ni ai = 28 + 39,2526
32 6 = 30, 48

3n 3157
El tercer cuartil 4 = 4 = 117, 75 luego se encuentra en el intervalo [46 52]
nk
100 Ni1
Q3 = Lin f + ni ai = 46 + 117,75102
25 6 = 49, 78

kn 32157
El percentil 32 100 = 100 = 50, 24 luego se encuentra en el intervalo [28 34]
nk
100 Ni1
P32 = Lin f + ni ai = 28 + 50,2426
32 6 = 32, 54

81157
El percentil 81 kn
100 = 100 = 127, 17 luego se encuentra en el intervalo [52 58]
nk
100 Ni1
P81 = Lin f + ni ai = 52 + 127,17127
10 6 = 52, 10

ni x2i
s2 = (xi x)ni
n = n x2 = 278533 2
157 40, 17 = 160, 30

s = 160, 30 = 12, 66
s 12,66
CV = x = 40,17 = 0, 315

Q3 Q1 49,7830,48
Rsi = 2 = 2 = 0, 65

Manuel Angel Barea Gmez 14


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Problema 1.10. Dadas las observaciones siguientes:

11 23 26 20 20 27 15 26 21 31
15 13 20 24 10 33 29 25 16 27
19 25 27 22 28 29 29 20 18 20

(a) Agrupe los datos en cinco intervalos de longitud constante, comenzando por el valor 10.
(b) Utilizando los intervalos anteriores, calcule: media, intervalo mediano, mediana, intervalo modal,
(c) cuartiles de primer y tercer orden y el percentil 82.
(d) desviacin tpica, coeficiente de variacin y recorrido intercuartlico.

Intervalos xi ni Ni xi n i x2i ni
10-15 12,5 3 3 37,5 468,75
15-20 17,5 5 8 87,5 1531,25
20-25 22,5 9 17 202,5 4556,25
25-30 27,5 11 28 302,5 8318,75
30-35 32,5 2 30 65 2112,5
30 695 16987,5

(xi ni ) 695
x= n = 30 = 23, 2
n 30
El intervalo mediano 2 = 2 = 15 ser [20 25]
nk
100 Ni1
Me = Lin f + ni ai = 20 + 158
9 5 = 23, 8

El intervalo modal es [25 30]


El primer cuartil 4n = 15
4 = 3, 75 luego se encuentra en el intervalo [15 204]

nk
100 Ni1
Q1 = Lin f + ni ai = 14 + 3,7536
5 5 = 19, 5

3n 330
El tercer cuartil 4 = 4 = 11, 25 luego se encuentra en el intervalo [20 25]
nk
100 Ni1
Q3 = Lin f + ni ai = 20 + 11,259
5 5 = 27, 5

8230
El percentil 82 kn
100 = 100 = 24, 6 luego se encuentra en el intervalo [25 30]
nk
100 Ni1
P82 = Lin f + ni ai = 25 + 24,617
11 5 = 28, 5

ni x2i
s2 = (xi x)ni
n = n x2 = 16987,5 2
30 23, 2 = 29, 16

s = 29, 16 = 5, 4
s 5,4
CV = x = 23,2 = 0, 2346

RI = Q3 Q1 = 27, 5 19, 5 = 8

Problema 1.11. En un estudio acerca del comportamiento de la mosca del vinagre Drosophila melanogaster, un bilogo midi el
tiempo en segundos que una mosca pasaba asendose en un determinado periodo de 6 minutos de duracin. Los tiempos de aseo
observados para 20 moscas distintas fueron:

Manuel Angel Barea Gmez 15


CAPTULO 1. ESTADSTICA DESCRIPTIVA

34 24 10 16 52 76 33 31 46 24
18 26 57 32 25 48 22 48 29 19

(a) Construya un diagrama de tallo y hojas para este conjunto de datos.


(b) Calcule el valor del coeficiente de variacin de Pearson.

1 0689
2 244569
3 1234
4 688
5 27
6
7 6

(xi ni ) 34+24+..+29+19
x= n = 20 = 32, 55

(xi x)ni ni x2i 27141


s2 = n = n x2 = 20 32, 552 = 297, 54

s= 297, 54 = 17, 25
s 17,25
CV = x = 32,55 = 0, 53

Problema 1.12. Al examinar 158 casos de parlisis de Bell se anotaron las diferentes terapias seguidas por estos pacientes, resul-
tando el conjunto de datos:


C Corticoides
DQ Descomprension quirurgica


ET Electroterapia
NT Ninguntratamiento



OT Otras modalidades

Tratamiento C DQ ET NT OT
N de pacientes 73 36 19 21 9

(a) Obtenga la tabla de frecuencias e indique qu porcentaje de pacientes toma corticoides.


(b) Construya el diagrama de sectores.

xi ni Ni fi Fi
C 73 73 0,46 0,46
DQ 36 109 0,23 0,69
ET 19 128 0,12 0,81
NT 21 149 0,13 0,94
OT 9 158 0,06 1,00
158

Toman corticoides el 46 % de los pacientes.

Manuel Angel Barea Gmez 16


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Terapias

OT

NT

C
ET

DQ

Problema 1.13. Los siguientes datos representan el nmero de das de hospitalizacin por una apendicectoma:

N de das 3 4 5 6 7 8 ms de 8
N de casos 15 58 43 22 8 3 1

(a) Obtener la media y la varianza, as como los coeficientes de asimetra, curtosis y variacin.
(b) Representar el correspondiente diagrama de barras.

N de das xi ni Ni xi n i x2i ni (xi x)3 ni (xi x)4 ni


3 3 15 15 0,10 0,10 -80,85 141,76
4 4 58 73 0,39 0,49 -24,80 18,68
5 5 43 116 0,29 0,77 0,65 0,16
6 6 22 138 0,15 0,92 42,63 53,14
7 7 8 146 0,05 0,97 90,72 203,82
8 8 3 149 0,02 0,99 102,67 333,33
ms de 8 9 1 150 0,01 1,00 76,59 325,23
150 713 3595 207,60 1076,12

(xi ni ) 713
x= n = 150 = 4, 75

(xi x)ni ni x2i 3539


s2 = n = n x2 = 150 4, 752 = 1, 37

s= 1, 37 = 1, 17
s 1,17
CV = x = 4,75 = 0, 25

3
(xi x) ni 297,60
C.A. = ns3
= 1501,173
= 0, 864

4
(xi x) ni 1076,12
K= ns4
3 = 1501,174
3 = 0, 8085

Manuel Angel Barea Gmez 17


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Dias de hospitalizacion

50
40
30
n

20
10
0

3 4 5 6 7 8 9

Dias

Problema 1.14. La siguiente tabla muestra la distribucin de edades de 75 casos de una determinada enfermedad durante un ao y
en un hospital determinado:

Edad N de casos
5-15 5
15-25 10
25-35 20
35-45 22
45-55 13
55-65 5

(a) Calcular la media, mediana, varianza, desviacin tpica y coeficiente de variacin.

Edad xi ni Ni xi n i x2i ni
5-15 10 5 5 50 500
15-25 20 10 15 200 4000
25-35 30 20 35 600 18000
35-45 40 22 57 880 35200
45-55 50 13 70 650 32500
55-65 60 5 75 300 18000
75 2680 108200

(xi ni ) 2680
x= n = 75 = 35, 73

(xi x)ni ni x2i


s2 = n = n x2 = 108200 2
75 35, 735 = 165, 80

s = 165, 80 = 12, 887
s 12,88
CV = x = 35,73 = 0, 36
n 75
El intervalo mediano 2 = 2 = 37, 5 ser [35 45]
nk
100 Ni1
Me = Lin f + ni ai = 35 + 37,535
22 10 = 36, 14

Manuel Angel Barea Gmez 18


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Problema 1.15. Como parte de un proyecto de investigacin, cierto investigador obtuvo los siguientes niveles de SLP de una muestra
de 10 individuos adultos bajo tratamiento de Diabetes Mellitus:

5,85 6,17 6,09 7,70 3,17 3,83 5,17 4,31 3,09 5,24

(a) Calcular la media, mediana, varianza y desviacin tpica.


(b) Si el investigador se da cuenta de que el aparato utilizado para medir los niveles de SLP est defectuoso y ha medido sis-
temticamente 2 unidades por debajo de su valor real, tiene que volver a realizar las mediciones?. Cul es el valor de la
media y la desviacin tpica de los nuevos datos?

Nivel SLP xi ni Ni xi n i x2i ni


5,85 1 1 6 34
6,17 1 2 6 38
6,09 1 3 6 37
7,70 1 4 8 59
3,17 1 5 3 10
3,83 1 6 4 15
5,17 1 7 5 27
4,31 1 8 4 19
3,09 1 9 3 10
5,24 1 10 5 27
10 50,62 275,70

(xi ni ) 50,62
x= n = 10 = 5, 06

(xi x)ni ni x2i 275,70


s2 = n = n x2 = 10 5, 062 = 1, 95

s= 1, 95 = 1, 39
n 10
La mediana se encuentra en 2 = 2 = 5 que le corresponde Me = 3, 17

Teorema. Si a cada observacin de una distribucin X se le suma una constante k (traslacin), se tiene una nueva variable
Y = X + k con media igual a la de X ms la constante k.
Si se le suma una constante a una variable, la varianza de la nueva variable no cambia.

Por las anteriores propiedades de la media y la varianza, los nuevos estadsticos sern x = 7, 06 y s2 = 1, 95

Problema 1.16. Se ha realizado con 100 mujeres un estudio sobre la edad en la que comenzaron a utilizar anticonceptivos orales.
Los datos, agrupados en clases, estn en el siguiente cuadro:

Clases ni Ni fi
13-25 23
25-37 33
37-49 72
49-61 90
61-73 10

(a) Completar las columnas de frecuencias absolutas ni , frecuencias acumuladas Ni y frecuencias relativas fi .
(b) Calcular la media y desviacin tpica de la distribucin de frecuencias. Es la edad media un buen representante de los datos?

Manuel Angel Barea Gmez 19


CAPTULO 1. ESTADSTICA DESCRIPTIVA

(c) Calcular la mediana y el percentil 70.

Clases xi ni Ni fi xi n i x2i ni
13-25 19 23 23 0,23 437 8303
25-37 31 33 56 0,33 1023 31713
37-49 43 16 72 0,16 688 29584
49-61 55 18 90 0,18 990 54450
61-73 67 10 100 0,10 670 44890
100 3808 168940

(xi ni ) 3808
x= n = 100 = 38, 08

(xi x)ni ni x2i 168940


s2 = n = n x2 = 100 38, 082 = 239, 31

s= 239, 31 = 15, 47.
s 15,47
La media no es una buena representacin de los datos ya que CV = x = 38,05 = 0, 41 y no est prximo al cero.
El intervalo mediano 2n = 100
2 = 50 ser [25 37]

nk
100 Ni1
Me = Lin f + ni ai = 25 + 5023
33 12 = 34, 82

kn 70100
El percentil 70 100 = 100 = 70 luego se encuentra en el intervalo [37 49]
nk
100 Ni1
P70 = Lin f + ni ai = 37 + 7056
16 12 = 47, 5

Problema 1.17. Se ha realizado un estudio para valorar el efecto del alcohol sobre los niveles de colesterol en suero. Para ello, se
ha recogido la cantidad de alcohol consumido por semana (en gr.) de 100 sujetos, obtenindose la siguiente tabla de frecuencias
absolutas acumuladas:

Consumo [0, 50) [50 100) [100, 150) [150, 200) [200, 250)
Ni 25 60 90 98 100

(a) Calcular el porcentaje de sujetos que consumen entre 100 y 200 gr. de alcohol a la semana.
(b) Calcular el consumo medio.
(c) Calcular el nmero de sujetos que hay entre el percentil 15 y el cuartil tercero.
(d) Obtener la mediana de la distribucin de frecuencias.

Clases xi ni Ni fi xi n i x2i ni
[0, 50) 25 25 25 0,25 625 15625
[50 100) 75 35 60 0,35 2625 196875
[100, 150) 125 30 90 0,30 3750 468750
[150, 200) 175 8 98 0,08 1400 245000
[200, 250) 225 2 100 0,02 450 101250
100 8850 1027500

El porcentaje de sujetos que consumen [100, 200) = 0, 30 + 0, 08 = 0, 38


(xi ni ) 8850
x= n = 100 = 88, 5 gr

Manuel Angel Barea Gmez 20


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Como tenemos que n = 100 Q3 P15 = 0, 75 0, 15 = 0, 60 luego el nmero de individuos ser 60.
El intervalo mediano 2n = 100
2 = 50 ser [50 100]

nk
100 Ni1
Me = Lin f + ni ai = 50 + 5025
35 50 = 85, 71 gr

Problema 1.18. Se ha medido la tasa de glucosa en sangre a un grupo de 350 individuos. Los datos agrupados en 7 intervalos de
amplitud 10 mg/100 ml se presentan en la siguiente tabla:

Intervalos ni
65-75 14
75-85 42
85-95 63
95-105 84
105-115 70
115-125
125-135

(a) Calcular la desviacin tpica de los datos, sabiendo que la media es 101, 6 mg/100 ml.
(b) Qu valor de tasa de glucosa es superado por el 40 % de los datos?

Clases xi ni Ni xi n i x2i ni
65-75 70 14 14 980 68600
75-85 80 42 56 3360 268800
85-95 90 63 119 5670 510300
95-105 100 84 203 8400 840000
105-115 110 70 273 7700 847000
115-125 120 56 329 6720 806400
125-135 130 21 350 2730 354900
350 35560 3696000

(xi ni )
Llamamos a y b a los valores desconocidos ni de los intervalos [115 125] y [125 135] respectivamente. x = n = 101, 6 y
n = 350, por lo que podemos extraer un sistema de dos ecuaciones con dos incgnitas:

a + b = 77 a = 56
 
Resolviendo
120 a + 130 b = 9450 b = 21

(xi x)ni ni x2 i 3696000


s2 = n = n x2 = 350 101, 62 = 237, 441

s= 237, 44 = 15, 42 mg/100 ml.

Superan el 40 % de los datos aquellos que estn por encima del percentil 60.
kn
El percentil 60 100 = 60350
100 = 210 luego se encuentra en el intervalo [105 115]

nk
100 Ni1
P60 = Lin f + ni ai = 105 + 210203
70 10 = 106

Problema 1.19. Para realizar un estudio que pretende valorar el proceso de crecimiento en 250 nios de edad similar, se ha utilizado
el ndice de masa corporal (IMC) o ndice de Quetelet (Peso en kg/m2 ). Los datos agrupados en 6 intervalos junto con la mayora de
sus frecuencias relativas ( fi ), se presentan en la siguiente tabla:

Manuel Angel Barea Gmez 21


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Peso Intervalos fi
Bajo [15 18) 0,04
Normal-Bajo [18 20) 0,12
Normal [20 25) 0,40
Normal-Alto [25 27)
Sobrepeso [27 30) 0,16
Obesidad [30 35] 0,12

(a) Cul es el IMC que superan el 50 % de los nios de este estudio?


(b) Qu % de nios tienen un IMC superior a 22 kg/m2 ?

Peso Intervalos ni Ni fi Fi
Bajo [15 18) 10 10 0,04 0,04
Normal-Bajo [18 20) 30 40 0,12 0,16
Normal [20 25) 100 140 0,40 0,56
Normal-Alto [25 27) 40 180 0,16 0,72
Sobrepeso [27 30) 40 220 0,16 0,82
Obesidad [30 35] 30 250 0,12 1

Para hallar el IMC qu supera el 50 % debemos hallar la mediana.


El intervalo mediano 2n = 250
2 = 125 ser [20 25]

nk
100 Ni1
Me = Lin f + ni ai = 20 + 12540
100 5 = 24, 25 /dl
gr

Para conocer el IMC superior a 22 kg/m2 . Sabemos que el intervalo ser [20 25]
nk nk
100 Ni1 100 40
P = Lin f + ni ai = 20 + 100 5 = 22, despejando

nk (2220)100 80100
100 = 5 + 40 = 80 luego k = 250 = 0, 32

Como lo que nos piden son los que estn por encima de P32 = 1 0, 32 = 0, 68

Problema 1.20. Con el objetivo de determinar la presencia de anemia en mujeres embaraza- das, se midieron los valores de
hemoglobina (gr/dl) al final del primer trimestre en un grupo de 200 embarazadas que no seguan ningn tratamiento paralelo.
La siguiente tabla presenta los porcentajes de embarazadas que se incluyeron en cada una de las categoras:

Hemoglobina gr/dl fi
[9, 09, 8) 10 %
[9, 810, 6) 40 %
[10, 611, 4) 30 %
[11, 412, 2) 15 %
[12, 213, 0) 5%

A partir de estos datos:


(a) El porcentaje de mujeres que presentaban anemia es decir, que tenan valores de hemoglobina por debajo de 11 gr/dl
(b) Determinar la media, la mediana y la desviacin tpica de los datos. Es la media un buen representante de los datos?

Manuel Angel Barea Gmez 22


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Hemoglobina gr/dl xi ni Ni fi Fi xi n i x2i ni


[9, 09, 8) 9,4 20 20 0,10 0,10 188 1767
[9, 810, 6) 80 80 100 0,40 0,50 816 8323
[10, 611, 4) 90 60 160 0,30 0,80 660 7260
[11, 412, 2) 100 30 190 0,15 0,95 354 4177
[12, 213, 0) 110 10 200 0,05 1,00 126 1588
200 2144 23115,20

Para conocer el porcentaje de mujeres con anemia es decir inferior a 11 gr/dl. Sabemos que el intervalo ser [10, 6 11, 4]
nk nk
100 Ni1 100 100
P = Lin f + ni ai = 10, 6 + 60 0, 8 = 11, despejando

nk (10,611)60 130100
100 = 0,8 + 100 = 130 luego k = 200 = 0, 65

(xi ni ) 2144
x= n = 200 = 10, 72

ni x2i
s2 = (xi x)ni
n = n x2 = 23115,20 2
200 10, 72 = 0, 66

s = 0, 66 = 0, 81.
0,81
La media es una buena representacin de los datos ya que CV = s
x = 10,72 = 0, 08 y est prximo al cero.
El intervalo mediano 2n = 200
2 = 100 ser [9, 8 10, 6]

Me = 10, 6 ya que coincide con el limite superior.

Problema 1.21. La siguiente tabla nos muestra (en miles) el nmero de embarazos registrados en Espaa a lo largo del ao 1996,
segn los diferentes grupos de edad:

Edad <20 [2025) [2530) [3035) [3540) [4045)


ni 12 34 84 92 37 8

(a) Calcular la edad media de los embarazos as como los cuartiles.


(b) Que % qued embarazada con ms de 28 aos de edad?

Edad xi ni Ni fi Fi xi n i x2i ni
<20 17,5 12 12 0,04 0,04 210 3675
[2025) 22,5 34 46 0,13 0,17 765 17213
[2530) 27,5 84 130 0,31 0,49 2310 63525
[3035) 32,5 92 222 0,34 0,83 2990 97175
[3540) 37,5 37 259 0,14 0,97 1388 52031
[4045) 42,5 8 267 0,03 1,00 340 14450
267 8002,50 248068,75

(xi ni ) 8002,50
x= n = 267 = 29, 97
kn 25267
Para hallar Q1 100 = 100 = 66, 75 el intervalo que lo contiene es [2530)
nk
100 Ni1
Q1 = Lin f + ni ai = 25 + 66,7546
84 5 = 26, 23

75267
kn
Para hallar Q3 100 = 100 = 200, 25 el intervalo que lo contiene es [3035)

Manuel Angel Barea Gmez 23


CAPTULO 1. ESTADSTICA DESCRIPTIVA

nk
100 Ni1
Q3 = Lin f + ni ai = 30 + 200,25130
92 5 = 33, 82

n 267
El intervalo mediano 2 = 2 = 133, 5 ser [30 35]
nk
100 Ni1
Me = Lin f + ni ai = 30 + 133,5130
92 5 = 30, 19

Para conocer el porcentaje de mujeres mayores de 28 aos que se quedaron embarazadas. Sabemos que el intervalo ser [25 30]
nk nk
100 Ni1 100 46
P = Lin f + ni ai = 25 + 84 5 = 28, despejando

nk (2825)92 96100
100 = 5 + 46 = 96 luego k = 267 = 36, 10

Como lo que nos piden son los que estn por encima de P28 = 1 0, 361 = 0, 6398

Problema 1.22. En un reconocimiento mdico realizado a los 1000 trabajadores de una factora industrial, se ha medido la tensin
arterial sistlica (mm.Hg) obteniendo la siguiente distribucin de frecuencias. Completar la tabla sabiendo que la mediana de los
datos es 138 mm.Hg

Categora Intervalo ni
ptima [110 120]
Normal (120 130] 120
Normal-Elevada (130 140] 350
HTA-Leve (140 160] 260
HTA-Moderada (160 180] 120
HTA-Severa (180 220]

Llamamos a y b a las incgnitas del primer y ltimo intervalo y construimos nuestra tabla.

Categora Intervalo ni Ni
ptima [110 120] a a
Normal (120 130] 120 120+a
Normal-Elevada (130 140] 350 470+a
HTA-Leve (140 160] 260 730+a
HTA-Moderada (160 180] 120 850+a
HTA-Severa (180 220] b 850+a+b

Del enunciado 1000 = a + b + 850 150 = a + b.


nk
De la mediana Me = Lin f + 100 ni i1 ai = 130 + 500(470+a)
h i
N
350 10 = 138 luego 470 + a = (138130)350
10 500 a = 100 y susti-
tuyendo en la primera ecuacin b = 150 100 = 50

Problema 1.23. La siguiente tabla recoge la distribucin de frecuencias de triglicridos (en mg/dl) en el suero de un grupo de nios
con 6 aos. Completar la tabla sabiendo que el percentil 20 de esta distribucin es 32 mg/dl.

Nivel de triglicridos 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90
ni 10 15 24 18 12 4 2

Manuel Angel Barea Gmez 24


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Nivel de triglicridos ni Ni
10-20 a a
20-30 10 10+a
30-40 15 25+a
40-50 24 49+a
50-60 18 67+a
60-70 12 79+a
70-80 4 83+a
80-90 2 85+a
85+a

nk nk
100 Ni1 100 (10+a)
P20 = Lin f + ni ai = 10 + 10 10 = 32, despejando

nk (3210)10 (13+a)100
100 = 105 + 10 + a = 13 + a luego n = 20 = 85 + a resolviendo a = 5

Problema 1.24. Uno de los medicamentos antivirales que se utilizan para combatir el virus de la gripe es la Amantadina. En un
estudio sobre este medicamento se han administrado por va oral dosis nicas de 100 mg a 60 individuos adultos sanos. La variable
estudiada (Tmax ) es el tiempo requerido en minutos para alcanzar la concentracin mxima de plasma. La siguiente tabla recoge
frecuencia relativas acumuladas (Fi ) de los datos del estudio:

Tmax Fi
[100 120] 0,25
[120 140] 0,75
[140 160] 0,90
[160 180] 0,95
[180 200]

(a) Determinar media, mediana y desviacin tpica de esta distribucin.


(b) Qu transformacin lineal debemos realizar sobre estos datos para que los datos transformados tengan media 0 y desviacin
tpica 5?

Tmax xi ni Ni fi Fi xi n i x2i ni
[100 120] 110 15 15 0,25 0,25 1650 181500
[120 140] 130 30 45 0,50 0,75 3900 507000
[140 160] 150 9 54 0,15 0,90 1350 202500
[160 180] 170 3 57 0,05 0,95 510 86700
[180 200] 190 3 60 0,05 1,00 570 108300
60 7980 1086000

(xi ni ) 7980
x= n = 60 = 133

(xi x)ni ni x2i 1086000


s2 = n = n x2 = 60 1332 = 411

s= 411 = 20, 27.
n 60
El intervalo mediano 2 = 2 = 30 ser [120 140]
nk
100 Ni1
Me = Lin f + ni ai = 120 + 3015
30 20 = 130

Manuel Angel Barea Gmez 25


CAPTULO 1. ESTADSTICA DESCRIPTIVA

Teorema. Si a cada observacin de una distribucin X se le suma una constante k (traslacin), se tiene una nueva variable Y = X + k
con media igual a la de X ms la constante k.
Si se multiplica una variable X por una constante k (homotecia), la variable resultante Y = kX tendr media igual a k por la media de
X.
Si se le suma una constante a una variable, la varianza de la nueva variable no cambia.
Si se multiplica una variable por una constante, la varianza de la nueva variable es igual a la de la antigua multiplicada por la constante
al cuadrado.

0 = a 133 + b a = 0, 246
  
y = ax+b
A la vista de las propiedades anteriores Resolviendo
s2y = a2 s2 5 = a2 411 b = 32, 8

Problema 1.25. La ictericia neonatal es un fenmeno biolgico complejo, resultado de un desequilibrio transitorio entre la pro-
duccin y eliminacin de la bilirrubina. En el curso de una investigacin, se determinaron los niveles de bilirrubina a travs de
bilirrubinometra transcutnea (BTc) de una muestra de neonatos con ictericia, obtenindose los siguientes resultados:

BT c (md/dl) ni
<5 3
[5 6) 4
[6 7) 2
[7 8) 8
[8 9) 12
[9 10) 18
10 33

(a) Entre qu valores se encuentran el 30 % central de los datos de esta distribucin?


(b) Calcular el coeficiente de asimetra y el de apuntamiento

BT c (md/dl) xi ni Ni xi n i x2i ni (xi x)3 ni (xi x)4 ni


<5 4,5 3 3 14 61 -292,01 1343,24
[5 6) 5,5 4 7 22 121 -186,62 671,85
[6 7) 6,5 2 9 13 85 -35,15 91,40
[7 8) 7,5 8 17 60 450 -32,77 52,43
[8 9) 8,5 12 29 102 867 -2,59 1,56
[9 10) 9,5 18 47 171 1625 1,15 0,46
10 10,5 33 80 347 3638 90,55 126,77
80 728 6846 -457,44 2287,70

El 30 % del valor central se encuentra entre P35 P65.


kn
El percentil 35 100 = 3580
100 = 28 luego se encuentra en el intervalo [8 9]

nk
100 Ni1
P35 = Lin f + ni ai = 8 + 2817
12 1 = 8, 92

kn 6580
El percentil 65 100 = 100 = 52 luego se encuentra en el intervalo 10
nk
100 Ni1
P65 = Lin f + ni ai = 10 + 5247
33 1 = 10, 15

(xi ni ) 728
x= n = 80 = 9, 10

(xi x)ni ni x2i 6846


s2 = n = n x2 = 80 9, 102 = 2, 76

Manuel Angel Barea Gmez 26


CAPTULO 1. ESTADSTICA DESCRIPTIVA


s= 2, 76 = 1, 66
3
(xi x) ni 457,44
C.A. = ns3
= 801,663
= 1, 25

4
(xi x) ni 2287,70
K= ns4
3 = 801,664
3 = 0, 74

Problema 1.26. En 50 nios de 12 aos de edad se anot el nmero de dientes permanentes cariados u obturados, obtenindose que
8, 12, 10, 6, 4, 4, 4, 0 y 2 nios tenan 0, 1, 2, . . ., 7 y 8 dientes en esas condiciones. Calcular la media, mediana y desviacin tpica
de la distribucin.

Dientes sanos xi ni Ni xi n i x2i ni


0 0 8 8 0 0
1 1 12 20 12 12
2 2 10 30 20 40
3 3 6 36 18 54
4 4 4 40 16 64
5 5 4 44 20 100
6 6 4 48 24 144
7 7 0 48 0 0
8 8 2 50 16 128
50 126 542

(xi ni ) 126
x= n = 50 = 2, 52

(xi x)ni ni x2i 542


s2 = n = n x2 = 50 2, 522 = 4, 49

s= 4, 49 = 2, 12

Me = 2

Problema 1.27. Se determin 20 veces el contenido de glucosa en sangre de una misma muestra por medio de dos mtodos, A y B,
de determinacin rpida de la misma. Comparar la dispersin de ambos mtodos.

Mtodo A 140 141 142 127 138 136 135 142 126 148 139 142 141 151 144 146 145 148 147 136

Mtodo B 130 132 146 138 145 148 147 135 136 137 141 146 138 131 134 146 139 140 148 146

Para el mtodo A

Manuel Angel Barea Gmez 27


CAPTULO 1. ESTADSTICA DESCRIPTIVA

xi ni xi n i x2i ni
140 1 140 19600
141 1 141 19881
142 1 142 20164
127 1 127 16129
138 1 138 19044
136 1 136 18496
135 1 135 18225
142 1 142 20164
126 1 126 15876
148 1 148 21904
139 1 139 19321
142 1 142 20164
141 1 141 19881
151 1 151 22801
144 1 144 20736
146 1 146 21316
145 1 145 21025
148 1 148 21904
147 1 147 21609
136 1 136 18496
20 2814 396736

(xi ni ) 2814
x= n = 20 = 140, 70

(xi x)ni ni x2i


s2 = n = n x2 = 396736 2
20 140, 70 = 40, 31

s = 40, 31 = 6, 35
s 6,35
CV = x = 140,70 = 0, 05

Para el mtodo B

Manuel Angel Barea Gmez 28


CAPTULO 1. ESTADSTICA DESCRIPTIVA

xi ni xi n i x2i ni
130 1 132 17424
132 1 146 21316
146 1 138 19044
138 1 145 21025
145 1 148 21904
148 1 147 21609
147 1 135 18225
135 1 136 18496
136 1 137 18769
137 1 141 19881
141 1 146 21316
146 1 138 19044
138 1 131 17161
131 1 134 17956
134 1 146 21316
146 1 139 19321
139 1 140 19600
140 1 148 21904
148 1 146 21316
146 1 146 21316
20 2819 397943

(xi ni ) 2819
x= n = 20 = 140, 95

(xi x)ni ni x2i


s2 = n = n x2 = 397943 2
20 140, 95 = 30, 25

s = 30, 25 = 5, 50
s 5,50
CV = x = 140,95 = 0, 04

Por tanto estar ms dispersa el mtodo A.

Manuel Angel Barea Gmez 29


C APTULO

2
Variables Bidimensionales

Problema 2.1. Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la concentracin de estrona en
saliva(X) para predecir la concentracin del esteroide en plasma libre (Y ). Se extrajeron los siguientes datos de 14 varones sanos:

X 1,4 7,5 8,5 9 9 11 13 14 14,5 16 17 18 20 23


Y 30 25 31,5 27,5 39,5 38 43 49 55 48,5 51 64,5 63 68

(a) Estdiese la posible relacin lineal entre ambas variables.


(b) Obtener la ecuacin que se menciona en el enunciado del problema.
(c) Determinar la variacin de la concentracin de estrona en plasma por unidad de estrona en saliva.
60
50
y

40
30

5 10 15 20

A la vista de la grfica del diagrama de dispersin se puede comprobar que la distribucin es idnea para utilizar la regresin lineal.

30
CAPTULO 2. VARIABLES BIDIMENSIONALES

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
1,4 30 1 1,4 1,96 30 900 42
7,5 25 1 7,5 56,25 25 625 187,5
8,5 31,5 1 8,5 72,25 31,5 992,25 267,75
9 27,5 1 9 81 27,5 756,25 247,5
9 39,5 1 9 81 39,5 1560,25 355,5
11 38 1 11 121 38 1444 418
13 43 1 13 169 43 1849 559
14 49 1 14 196 49 2401 686
14,5 55 1 14,5 210,25 55 3025 797,5
16 48,5 1 16 256 48,5 2352,25 776
17 51 1 17 289 51 2601 867
18 64,5 1 18 324 64,5 4160,25 1161
20 63 1 20 400 63 3969 1260
23 68 1 23 529 68 4624 1564
14 181,9 2786,71 633,5 31259,25 9188,75

(xi ni ) 180,9
x= n = 14 = 13

(xi x)ni ni x2i 2786,71


s2x = n = n x2 = 14 132 = 30, 23

sx = 30, 23 = 5, 50
(yi ni ) 633,5
y= n = 14 = 45, 25

(yi y)ni ni y2i 31259,25


s2y = n = n y2 = 14 45, 252 = 185, 24

sy = 185, 24 = 13, 61
(xi x)(yi y)ni ni xi yi 9188,75
sxy = n = n (x y) = 14 (13 45, 25) = 68, 41

La recta de regresin es de la forma y = b x + a

b = sxy2 = 68,41
( s
x 5,50 = 2, 26 y = 15, 85 x + 2, 26.
a = y b x = 45, 25 2, 26 13 = 15, 85

Para conocer la variacin de la concentracin de estrona en plasma por unidad de estrona en saliva, sustimuimos en la anterior recta
x = 1 y obtenemos y = 15, 85 1 + 2, 26 = 18, 11

Problema 2.2. Los investigadores estn estudiando la correlacin entre obesidad y la respuesta individual al dolor. La obesidad se
mide como porcentaje sobre el peso ideal (X). La respuesta al dolor se mide utilizando el umbral de reflejo de flexin nociceptiva
(Y ), que es una medida de sensacin de punzada. Se obtienen los siguientes datos:

X 89 90 75 30 51 75 62 45 90 20
Y 2 3 4 4,5 5,5 7 9 13 15 14

(a) Qu porcentaje de la varianza del peso es explicada mediante un modelo de regresin lineal por la variacin del umbral de
reflejo?
(b) Estdiese la posible relacin lineal entre ambas variables, obteniendo su grado de ajuste.
(c) Qu porcentaje de sobrepeso podemos esperar para un umbral de reflejo de 10?

Manuel Angel Barea Gmez 31


CAPTULO 2. VARIABLES BIDIMENSIONALES

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
89 2 1 89 7921 2 4 178
90 3 1 90 8100 3 9 270
75 4 1 75 5625 4 16 300
30 4,5 1 30 900 4,5 20,25 135
51 5,5 1 51 2601 5,5 30,25 280,5
75 7 1 75 5625 7 49 525
62 9 1 62 3844 9 81 558
45 13 1 45 2025 13 169 585
90 15 1 90 8100 15 225 1350
20 14 1 20 400 14 196 280
10 627 45141 77 799,5 4461,5

(xi ni ) 627
x= n = 10 = 62, 7

(xi x)ni ni x2i 45141


s2x = n = n x2 = 10 62, 72 = 582, 81

sx = 582, 81 = 24, 14
(yi ni ) 77
y= n = 10 = 7, 7

(yi y)ni ni y2i 799,5


s2y = n = n y2 = 10 7, 72 = 20, 66

sy = 20, 664 = 4, 54

(xi x)(yi y)ni ni xi yi 4461,5


sxy = n = n (x y) = 10 (62, 7 7, 7) = 36, 64
sxy 36,64
r= sx sy = 62,77,7 = 0, 3339

R2 = r2 = 0, 3339 = 0, 1115

El porcentaje de la varianza del peso es explicada por un 11,15 %.


La recta de regresin x = b y + a
sxy
(
36,64
b= s2y
= 20,66 = 0, 0665
x = 0, 0665 y + 15, 85.
a = x b y = 62, 7 + 0, 0665 7, 7 = 15, 85

Para un valor y = 10

x = 0, 0665 10 + 15, 85 = 15, 185.

Problema 2.3. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para absorber hierro y
plomo. Participan en el estudio 10 sujetos. A cada uno se le da una dosis oral idntica de hierro y plomo. Despus de 12 das se
mide la cantidad de cada componente retenida en el sistema corporal y, a partir de sta, se determina el porcentaje absorbido por el
cuerpo. Se obtuvieron los siguientes datos:

Porcenta je de hierro X 17 22 35 43 80 85 91 92 96 100


Porcenta je de plomo Y 8 17 18 25 58 59 41 30 43 58

(a) Comprobar la idoneidad del modelo lineal de regresin.

Manuel Angel Barea Gmez 32


CAPTULO 2. VARIABLES BIDIMENSIONALES

(b) Obtener la recta de regresin, si el modelo lineal es adecuado.


(c) Predecir el porcentaje de hierro absorbido por un individuo cuyo sistema corporal absorbe el 15 % del plomo ingerido.

60
50
40
y

30
20
10

20 40 60 80 100

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
17 8 1 17 289 8 64 136
22 17 1 22 484 17 289 374
35 18 1 35 1225 18 324 630
43 25 1 43 1849 25 625 1075
80 58 1 80 6400 58 3364 4640
85 59 1 85 7225 59 3481 5015
91 41 1 91 8281 41 1681 3731
92 30 1 92 8464 30 900 2760
96 43 1 96 9216 43 1849 4128
100 58 1 100 10000 58 3364 5800
10 661 53433 357 15941 28289

(xi ni ) 661
x= n = 10 = 6, 61

(xi x)ni ni x2i 53433


s2x = n = n x2 = 10 6, 612 = 974, 09

sx = 974, 09 = 31, 21
(yi ni ) 357
y= n = 10 = 35, 7

(yi y)ni ni y2i 15941


s2y = n = n y2 = 10 35, 72 = 319, 61

sy = 319, 61 = 17, 87

(xi x)(yi y)ni ni xi yi 28289


sxy = n = n (x y) = 10 (6, 61 35, 7) = 469, 13

La recta de regresin x = b x + a

Manuel Angel Barea Gmez 33


CAPTULO 2. VARIABLES BIDIMENSIONALES

sxy 469,13
(
b= s2y
= 319,61 = 1, 467
x = 1, 467 y + 58, 98.
a = x b y = 6, 61 + 1, 467 35, 7 = 58, 98

Para un valor y = 15

x = 1, 467 15 + 58, 98 = 80, 98.

Problema 2.4. Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman medidas de
la concentracin de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo mtodo manual. Se idea un nuevo
mtodo automtico. Si se pone de manifiesto una alta correlacin positiva entre las medidas tomadas empleando los dos mtodos,
entonces se har uso habitual del mtodo automtico. Los datos obtenidos son los siguientes:

Manual X 25 40 120 75 150 300 270 400 450 575


Automatico Y 30 80 150 80 200 350 240 320 470 583

(a) Hallar el coeficiente de determinacin para ambas variables.


(b) Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es apropiado, hallar la recta de regresin de Y sobre X
y utilizarla para predecir la lectura que se obtendra empleando la tcnica automtica con una muestra de agua cuya lectura
manual es de 100.

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
25 30 1 25 625 30 900 750
40 80 1 40 1600 80 6400 3200
120 150 1 120 14400 150 22500 18000
75 80 1 75 5625 80 6400 6000
150 200 1 150 22500 200 40000 30000
300 350 1 300 90000 350 122500 105000
270 240 1 270 72900 240 57600 64800
400 320 1 400 160000 320 102400 128000
450 470 1 450 202500 470 220900 211500
575 583 1 575 330625 583 339889 335225
10 2405 900775 2503 919489 902475

(xi ni ) 2405
x= n = 10 = 240, 5

(xi x)ni ni x2i 900775


s2x = n = n x2 = 10 240, 52 = 32237, 25

sx = 32237, 25 = 179, 54
(yi ni ) 2503
y= n = 10 = 250, 3

(yi y)ni ni y2i 919489


s2y = n = n y2 = 10 250, 32 = 29298, 81

sy = 29298, 81 = 171, 17

(xi x)(yi y)ni ni xi yi 902475


sxy = n = n (x y) = 10 (240, 5 230, 4) = 30050, 35
sxy 30050,35
r= sx sy = 179,54171,17 = 0, 9778

R2 = r2 = 0, 9778 = 0, 9561

Manuel Angel Barea Gmez 34


CAPTULO 2. VARIABLES BIDIMENSIONALES

La recta de regresin y = b x + a
30050,35
( s
b = sxy2 = 32237,25 = 0, 9322
x y = 0, 9322 x + 26, 11.
a = y b x = 250, 3 0, 9322 240, 5 = 26, 11

con una muestra de agua cuya lectura manual x = 100 obtenemos y = 0, 9322 100 + 26, 11 = 119, 33

Problema 2.5. Se ha medido el aclaramiento de creatinina en pacientes tratados con Captopril tras la suspensin del tratamiento
con dilisis, resultando la siguiente tabla:

Dastras el analisis X 1 5 10 15 20 25 35
Creatinina mg/dl Y 5,7 5,2 4,8 4,5 4,2 4 3,8

(a) Hllese la expresin de la ecuacin lineal que mejor exprese la variacin de la creatinina, en funcin de los dias transcurridos
tras la dilisis, as como el grado de bondad de ajuste.
(b) En qu porcentaje la variacin de la creatinina es explicada por el tiempo transcurrido desde la dilisis?
(c) Si un individuo presenta 4, 1 mg/dl de creatinina, cunto tiempo es de esperar que haya transcurrido desde la suspensin de la
dilisis?

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
1 5,7 1 1 1 5,7 32,49 5,7
5 5,2 1 5 25 5,2 27,04 26
10 4,8 1 10 100 4,8 23,04 48
15 4,5 1 15 225 4,5 20,25 67,5
20 4,2 1 20 400 4,2 17,64 84
25 4 1 25 625 4 16 100
35 3,8 1 35 1225 3,8 14,44 133
7 111 2601 32,2 150,9 464,2

(xi ni ) 111
x= n = 7 = 15, 86

(xi x)ni ni x2i 2601


s2x = n = n x2 = 7 15, 812 = 120, 12

sx = 120, 12 = 10, 96
(yi ni ) 32,2
y= n = 7 = 4, 60

(yi y)ni ni y2i 150,9


s2y = n = n y2 = 7 4, 62 = 0, 39

sy = 0, 39 = 0, 6302

(xi x)(yi y)ni ni xi yi 464,2


sxy = n = n (x y) = 7 (15, 86 4, 60) = 6, 63
sxy 6,63
r= sx sy = 10,960,6302 = 0, 9597

R2 = r2 = 0, 9597 = 0, 9210

La recta de regresin y = b x + a

Manuel Angel Barea Gmez 35


CAPTULO 2. VARIABLES BIDIMENSIONALES

( s 6,63
b = sxy2 = 120,12 = 0, 0552
x Luego la recta de regresin es y = 0, 0552 x + 5, 475.
a = y b x = 4, 60 + 0, 0552 15, 86 = 5, 475

La recta de regresin x = b y + a
sxy
(
6,63
b= s2y
= 0,39 = 16, 96
y = 16, 96 x + 92, 63.
a = x b y = 15, 86 + 16, 96 4, 6 = 92, 63

Con un nivel de creatinina y = 4, 1 obtenemos y = 16, 96 4, 1 + 92, 63 = 23, 094

Problema 2.6. En un ensayo clnico realizado tras el posible efecto hipotensor de un frmaco, se evala la tensin arterial diastlica
(TAD) en condiciones basales (X), y tras 4 semanas de tratamiento (Y ), en un total de 14 pacientes hipertensos. Se obtienen los
siguiente valores de TAD:

X 25 40 120 75 150 300 270 400 450 575


Y 30 80 150 80 200 350 240 320 470 583

(a) Existe relacin lineal entre la TAD basal y la que se observa tras el tratamiento?
(b) Cul es el valor de TAD esperado tras el tratamiento, en un paciente que present una TAD basal de 95 mm.Hg?
100
95
90
y

85
80
75

95 100 105 110

Manuel Angel Barea Gmez 36


CAPTULO 2. VARIABLES BIDIMENSIONALES

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
95 85 1 95 9025 85 7225 8075
100 94 1 100 10000 94 8836 9400
102 84 1 102 10404 84 7056 8568
104 88 1 104 10816 88 7744 9152
100 85 1 100 10000 85 7225 8500
95 80 1 95 9025 80 6400 7600
95 80 1 95 9025 80 6400 7600
98 92 1 98 9604 92 8464 9016
102 90 1 102 10404 90 8100 9180
96 76 1 96 9216 76 5776 7296
100 90 1 100 10000 90 8100 9000
96 87 1 96 9216 87 7569 8352
110 102 1 110 12100 102 10404 11220
99 89 1 99 9801 89 7921 8811
14 1392 138636 1222 107220 121770

(xi ni ) 1392
x= n = 14 = 99, 42

(xi x)ni ni x2i


s2x = n = n x2 = 138636 2
14 99, 42 = 16, 53

sx = 16, 53 = 4, 06
(yi ni ) 1222
y= n = 14 = 87, 28

(yi y)ni ni y2i 107220


s2y = n = n y2 = 14 87, 282 = 39, 77

sy = 39, 77 = 6, 30

(xi x)(yi y)ni ni xi yi 121770


sxy = n = n (x y) = 14 (99, 42 87, 28) = 19, 16

La recta de regresin y = b x + a
19,16
( s
b = sxy2 = 16,53 = 1, 16
x y = 1, 16 x 27, 98.
a = y b x = 87, 28 1, 16 99, 42 = 27, 98

Para una x = 95 y = 1, 16 95 27, 98 = 82, 22

Problema 2.7. Se han realizado 9 tomas de presin intracraneal en animales de laboratorio, por un mtodo estndar directo y por
una nueva tcnica experimental indirecta, obtenindose los resultados siguientes en mm.Hg:

M etodo est andard X 9 12 28 72 30 38 76 26 52


M etodo experimental Y 6 10 27 67 25 35 75 27 53

(a) Hallar la ecuacin lineal que exprese la relacin existente entre las presiones intracraneales, determinadas por los dos mto-
dos.
(b) Qu tanto por ciento de la variabilidad de Y es explicada por la regresin? Hllese el grado de dependencia entre las dos
variables.

Manuel Angel Barea Gmez 37


CAPTULO 2. VARIABLES BIDIMENSIONALES

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
9 6 1 9 81 6 36 54
12 10 1 12 144 10 100 120
28 27 1 28 784 27 729 756
72 67 1 72 5184 67 4489 4824
30 25 1 30 900 25 625 750
38 35 1 38 1444 35 1225 1330
76 75 1 76 5776 75 5625 5700
26 27 1 26 676 27 729 702
52 53 1 52 2704 53 2809 2756
9 343 17693 325 16367 16992

(xi ni ) 343
x= n = 9 = 38, 11

(xi x)ni ni x2i


s2x = n = x2 = 17693
n
2
9 38, 11 = 513, 43

sx = 513, 43 = 22, 66
(yi ni ) 325
y= n = 9 = 36, 11

(yi y)ni ni y2i 16367


s2y = n = n y2 = 9 36, 112 = 514, 54

sy = 514, 54 = 22, 68

(xi x)(yi y)ni ni xi yi 16992


sxy = n = n (x y) = 14 (38, 11 36, 11) = 511, 76
sxy 511,76
r= sx sy = 22,6622,68 = 0, 9957

R2 = r2 = 0, 9957 = 0, 9914

Problema 2.8. Durante una hora se administra por perfusin endovenosa continua un medicamento. Al finalizar la perfusin se
determinan las concentraciones plasmticas de medicamento y los resultados son los siguientes:

Tiempo h 1 1,5 2 3 6 15
Concentracion g/ml 11,8 11,0 10,9 10,1 9,6 5,7

(a) Dibuje el diagrama de dispersin (nube de puntos) de los datos anteriores.


(b) Determine, a partir de la forma de la nube, si el modelo de regresin lineal es adecuado. En caso positivo, d la expresin
matemtica que relaciona la concentracin con el tiempo.
(c) Estime el valor de la concentracin a las 9 horas.
(d) Calcule el coeficiente de correlacin e interprtelo.

Manuel Angel Barea Gmez 38


CAPTULO 2. VARIABLES BIDIMENSIONALES

12
11
10
9
y

8
7
6

2 4 6 8 10 12 14

A la vista de la grfica la distribucin se ajusta una regresin lineal.

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
1 11,8 1 1,5 2,25 11 121 16,5
1,5 11 1 2 4 10,9 118,81 21,8
2 10,9 1 3 9 10,1 102,01 30,3
3 10,1 1 6 36 9,6 92,16 57,6
6 9,6 1 15 225 5,7 32,49 85,5
15 5,7 1 15 225 5,7 32,49 85,5
6 42,5 501,25 53 498,96 297,2

(xi ni ) 42,5
x= n = 6 = 7, 08

ni x2i
s2x = (xi x)ni
n = x2 = 501,25
n
2
6 7, 08 = 33, 36

sx = 33, 36 = 5, 77
(yi ni ) 53
y= n = 6 = 8, 83

(yi y)ni ni y2i 498,96


s2y = n = n y2 = 6 8, 832 = 5, 13

sy = 5, 13 = 2, 26

(xi x)(yi y)ni ni xi yi 297,2


sxy = n = n (x y) = 6 (7, 08 8, 83) = 13, 03

La recta de regresin y = b x + a
( s
b = sxy2 = 13,03
33,36 = 0, 39
x y = 0, 39 x + 11, 60.
a = y b x = 8, 83 + 0, 39 7, 08 = 11, 60

Para una x = 9 y = 0, 39 9 + 11, 60 = 8, 09


sxy 13,03
r= sx sy = 5,772,26 = 0, 9962

Manuel Angel Barea Gmez 39


CAPTULO 2. VARIABLES BIDIMENSIONALES

Este coeficiente indica una alta correlacin inversa entre las variables

Problema 2.9. Se quiere estudiar la asociacin entre el consumo de sal (gr) y la tensin arterial (mm. Hg). A una serie de voluntarios
se les administra distintas dosis de sal en su dieta y se mide su tensin arterial un tiempo despus.

X (sal) Y (tension)
1,8 100
2,2 98
3,5 110
4,0 110
4,3 112
5,0 120

(a) Compruebe la idoneidad del modelo lineal de regresin.


(b) Obtenga la recta de regresin que exprese la tensin arterial en funcin de la cantidad de sal ingerida.
(c) Prediga la tensin arterial de un individuo cuya dieta contiene 2,7 g de sal.
120
115
110
y

105
100

2.0 2.5 3.0 3.5 4.0 4.5 5.0

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
1,8 100 1 1,8 3,24 100 10000 180
2,2 98 1 2,2 4,84 98 9604 215,6
3,5 110 1 3,5 12,25 110 12100 385
4 110 1 4 16 110 12100 440
4,3 112 1 4,3 18,49 112 12544 481,6
5 120 1 5 25 120 14400 600
6 20,8 79,82 650 70748 2302,2

(xi ni ) 20,8
x= n = 6 = 3, 47

(xi x)ni ni x2i 79,82


s2x = n = n x2 = 6 3, 422 = 1, 28

sx = 1, 28 = 1, 13

Manuel Angel Barea Gmez 40


CAPTULO 2. VARIABLES BIDIMENSIONALES

(yi ni ) 650
y= n = 6 = 108, 33

(yi y)ni ni y2i 70748


s2y = n = n y2 = 6 108, 332 = 55, 22

sy = 55, 22 = 7, 43

(xi x)(yi y)ni ni xi yi 2302,2


sxy = n = n (x y) = 6 (3, 47 108, 33) = 8, 14

La recta de regresin y = b x + a
8,14
( s
b = sxy2 = 1,28 = 0, 9666
x y = 0, 966 x + 86, 37.
a = y b x = 108, 33 0, 9666 3, 47 = 86, 37

Para una x = 2, 7 y = 0, 966 2, 7 + 86, 37 = 88, 97

Problema 2.10. Se ha medido a un grupo de 15 pacientes el nivel de carboxihemoglobina en sangre antes y despus de respirar un
ambiente cargado de humo, obteniendo los siguientes resultados:

X 5,70 4,40 4,90 0,70 1,60 2,10 1,50 2,90 3,80 5,20 3,20 1,30 1,00 6,80 0,50
Y 6,10 4,80 5,30 2,20 3,10 4,00 3,20 5,20 3,80 5,40 3,00 3,10 2,60 6,90 2,40

(a) Construir el diagrama de dispersin y calcular el coeficiente de correlacin de Pearson.


(b) Obtener la recta de regresin de X sobre Y.
7
6
5
y

4
3

1 2 3 4 5 6 7

Manuel Angel Barea Gmez 41


CAPTULO 2. VARIABLES BIDIMENSIONALES

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
5,7 6,1 1 4,4 19,36 4,8 23,04 21,12
4,4 4,8 1 4,9 24,01 5,3 28,09 25,97
4,9 5,3 1 0,7 0,49 2,2 4,84 1,54
0,7 2,2 1 1,6 2,56 3,1 9,61 4,96
1,6 3,1 1 2,1 4,41 4 16 8,4
2,1 4 1 1,5 2,25 3,2 10,24 4,8
1,5 3,2 1 2,9 8,41 5,2 27,04 15,08
2,9 5,2 1 3,8 14,44 3,8 14,44 14,44
3,8 3,8 1 5,2 27,04 5,4 29,16 28,08
5,2 5,4 1 3,2 10,24 3 9 9,6
3,2 3 1 1,3 1,69 3,1 9,61 4,03
1,3 3,1 1 1 1 2,6 6,76 2,6
1 2,6 1 6,8 46,24 6,9 47,61 46,92
6,8 6,9 1 0,5 0,25 2,4 5,76 1,2
0,5 2,4 1 0,5 0,25 2,4 5,76 1,2
15 40,4 162,64 57,4 246,96 189,94

(xi ni ) 40,4
x= n = 15 = 2, 69

ni x2i
s2x = (xi x)ni
n = n x2 = 162,64 2
15 2, 69 = 3, 588

sx = 3, 58 = 1, 89
(yi ni ) 57,4
y= n = 15 = 3, 83

(yi y)ni ni y2i 246,96


s2y = n = n y2 = 15 3, 832 = 1, 82

sy = 1, 82 = 1, 35
(xi x)(yi y)ni ni xi yi 189,94
sxy = n = n (x y) = 15 (2, 69 3, 83) = 2, 35
sxy 2,35
r= sx sy = 1,891,35 = 0, 9218

La recta de regresin x = b y + a
sxy 2,35
(
b= s2y
= 1,82 = 1, 29
y = 1, 29 x 2, 25.
a = x b y = 2, 69 1, 29 3, 83 = 2, 25

Problema 2.11. Se ha medido el peso y la talla a un grupo de individuos obteniendo la siguiente clasificacin

Peso/Talla 1,50-1,55 1,55-1,60 1,60-1,65 1,65-1,70 1,70-1,75 1,75-1,80


50-55 6 7 4 1 0 0
55-60 2 7 6 3 0 0
60-65 1 3 9 12 5 0
65-70 0 0 2 8 10 4
70-75 0 0 1 3 15 10
75-80 0 0 1 5 9 16

(a) Obtener las distribuciones marginales del peso y la talla.


(b) Obtener la distribucin del peso de los individuos que miden entre 1,75 y 1,80 m.

Manuel Angel Barea Gmez 42


CAPTULO 2. VARIABLES BIDIMENSIONALES

(c) Estudiar la independencia de las variables.

Peso/Talla 1,50-1,55 1,55-1,60 1,60-1,65 1,65-1,70 1,70-1,75 1,75-1,80 Total


50-55 6 7 4 1 0 0 18
55-60 2 7 6 3 0 0 18
60-65 1 3 9 12 5 0 30
65-70 0 0 2 8 10 4 24
70-75 0 0 1 3 15 10 29
75-80 0 0 1 5 9 16 41
Total 9 17 23 32 39 30 150

Peso Talla Peso Talla 1,75-1,80


50-55 18/150 1,50-1,55 9/150 50-55 0/150
55-60 18/150 1,55-1,60 17/150 55-60 0/150
60-65 30/150 1,60-1,65 23/150 60-65 0/150
65-70 24/150 1,65-1,70 32/150 65-70 4/150
70-75 29/150 1,70-1,75 39/150 70-75 10/150
75-80 41/150 1,75-1,80 30/150 75-80 16/150

Para que sean independientes se debe cumplir que P (A B) = P (A)P (B), en nuestro caso nos basta con evaluar fi, j = fi f j6/1506=9/15018/150
hemos tomado la celda de la primera fila-primera columna, por tanto no son independientes.

Problema 2.12. Consideremos la variable aleatoria bidimensional dada por la tabla siguiente:

Y
0 1 2
X
-1 1/10 1/20 3/20
0 1/5 1/50 4/50
0,5 1/10 1/20 1/50
1 2/25 1/10 1/20

(a) Determinar las distribuciones marginales de X e Y.


(b) Calcular las medias y varianzas marginales.
(c) Obtener el valor de la covarianza entre X e Y. Son independientes?.

X
Y
-1 3/10
0 12/25
0 3/10
1 11/50
0,5 17/100
2 3/10
1 23/100

De las tablas anteriores observamons que el denominador mayor es 100, luego esa ser nuestra n

xi ni xi n i x2i ni
yi ni yi n i y2i ni
-1 30 -30 30
-1 48 0 0
0 30 0 0
0 22 22 22
0,5 17 9 4
0,5 30 60 120
1 23 23 23
100 82 142
100 1,50 57,25

Manuel Angel Barea Gmez 43


CAPTULO 2. VARIABLES BIDIMENSIONALES

(xi ni ) 1,50
x= n = 100 = 0, 015

(xi x)ni ni x2i 57,25


s2x = n = n x2 = 100 0, 0152 = 0, 5723

(yi ni ) 82
y= n = 100 = 0, 82

(yi y)ni ni y2i 142


s2y = n = n y2 = 100 0, 822 = 0, 75

Para que sean independientes se debe cumplir que P (A B) = P (A)P (B), en nuestro caso nos basta con evaluar fi, j = fi f j1/10=
6 3/10012/25
hemos tomado la celda de la primera fila-primera columna, por tanto no son independientes.

Problema 2.13. Los siguientes datos representan lecturas de la presin sistlica, en mm.Hg., de 12 mujeres, en las edades que se
indican:

Edad 22 27 29 32 35 40 48 50 51 57 67 71
Presion 131 106 123 122 121 147 115 163 138 141 176 172

(a) Calcular el coeficiente de correlacin lineal y la recta de regresin mnimo cuadrtica de la presin sobre la edad. Qu
porcentaje de variabilidad es explicada por el modelo?

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
22 131 1 22 484 131 17161 2882
27 106 1 27 729 106 11236 2862
29 123 1 29 841 123 15129 3567
32 122 1 32 1024 122 14884 3904
35 121 1 35 1225 121 14641 4235
40 147 1 40 1600 147 21609 5880
48 115 1 48 2304 115 13225 5520
50 163 1 50 2500 163 26569 8150
51 138 1 51 2601 138 19044 7038
57 141 1 57 3249 141 19881 8037
67 176 1 67 4489 176 30976 11792
71 172 1 71 5041 172 29584 12212
12 529 26087 1655 233939 76079

(xi ni ) 529
x= n = 12 = 44, 08

ni x2i
s2x = (xi x)ni
n = x2 = 26087
n
2
12 44, 08 = 230, 57

sx = 230, 57 = 15, 18
(yi ni ) 1655
y= n = 12 = 137, 91

(yi y)ni ni y2i 233939


s2y = n = n y2 = 12 137, 912 = 473, 90

sy = 473, 90 = 21, 77

(xi x)(yi y)ni ni xi yi 75079


sxy = n = n (x y) = 12 (44, 09 137, 91) = 260, 09
sxy 260,09
r= sx sy = 15,1821,77 = 0, 7868

Manuel Angel Barea Gmez 44


CAPTULO 2. VARIABLES BIDIMENSIONALES

La recta de regresin y = b x + a

b = sxy2 = 260,09
( s
x 230,57 = 1, 12 y = 1, 12 x + 88, 19.
a = y b x = 44, 08 1, 12 137, 91 = 88, 19

R2 = r2 = 0, 78682 = 0, 6190

Problema 2.14. Los siguientes datos representan las calificaciones de 10 alumnos elegidos al azar en las asignaturas de Matemticas
y Fsica:

Matematicas (X) 5 8 7 3 4 4 9 8 2 7
F sica (Y ) 6 8 6 5 5 4 9 6 5 6

(a) Dibujar un diagrama de dispersin.


(b) Hallar el coeficiente de correlacin.
(c) Obtener las rectas de regresin mnimo cuadrticas de la calificacin en Matemticas sobre la calificacin en Fsica, y recp-
rocamente.
(d) Predecir la nota en Fsica de un alumno que haya obtenido una calificacin de 6 en Matemticas.
9
8
7
y

6
5
4

2 3 4 5 6 7 8 9

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
5 6 1 5 25 6 36 30
8 8 1 8 64 8 64 64
7 6 1 7 49 6 36 42
3 5 1 3 9 5 25 15
4 5 1 4 16 5 25 20
4 4 1 4 16 4 16 16
9 9 1 9 81 9 81 81
8 6 1 8 64 6 36 48
2 5 1 2 4 5 25 10
7 6 1 7 49 6 36 42
10 57 377 60 380 368

Manuel Angel Barea Gmez 45


CAPTULO 2. VARIABLES BIDIMENSIONALES

(xi ni ) 57
x= n = 10 = 5, 7
(xi x)ni ni x2i 377
s2x = n = n x2 = 10 5, 72 = 5, 21

sx = 5, 21 = 2, 28
(yi ni ) 60
y= n = 10 =6
(yi y)ni ni y2i 380
s2y = n = n y2 = 10 62 = 2

sy = 2 = 1, 41
(xi x)(yi y)ni ni xi yi 368
sxy = n = n (x y) = 10 (5, 7 6) = 2, 60
sxy 2,60
r= sx sy = 2,281,41 = 0, 8055

La recta de regresin y = b x + a
2,69
( s
b = sxy2 = 5,21 = 0, 5
x y = 0, 5 x + 3, 15.
a = y b x = 6 0, 5 5, 7 = 3, 15

La recta de regresin x = b y + a
sxy 2,69
(
b= s2y
= 2 = 1, 30
y = 1, 30 x 2, 10
a = x b y = 6 1, 30 5, 70 = 2, 10

Para un x = 6 y = 0, 5 6 + 3, 15 = 6, 15

Problema 2.15. Los siguientes datos representan la edad y concentracin de colesterol en suero sanguneo en 15 mujeres:

Edad (X) 46 52 38 65 54 33 49 76 71 41 57 18 44 33 78
Colesterol (Y ) 181 228 182 249 259 201 121 339 225 110 188 137 170 173 243

(a) Obtener el coeficiente de correlacin lineal y la recta de regresin mnimos cuadrados de Y sobre X.
(b) Qu porcentaje de variabilidad queda explicada por el modelo?.
(c) A la vista del estudio anterior, cul debe ser la concentracin de colesterol en suero sanguneo en una mujer de 50 aos?.

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
46 181 1 46 2116 181 32761 8326
52 228 1 52 2704 228 51984 11856
38 182 1 38 1444 182 33124 6916
65 249 1 65 4225 249 62001 16185
54 259 1 54 2916 259 67081 13986
33 201 1 33 1089 201 40401 6633
49 121 1 49 2401 121 14641 5929
76 339 1 76 5776 339 114921 25764
71 225 1 71 5041 225 50625 15975
41 110 1 41 1681 110 12100 4510
57 188 1 57 3249 188 35344 10716
18 137 1 18 324 137 18769 2466
44 170 1 44 1936 170 28900 7480
33 173 1 33 1089 173 29929 5709
78 243 1 78 6084 243 59049 18954
15 755 42075 3006 651630 161405

Manuel Angel Barea Gmez 46


CAPTULO 2. VARIABLES BIDIMENSIONALES

(xi ni ) 775
x= n = 15 = 50, 33

(xi x)ni ni x2i


s2x = n = x2 = 42075
n
2
15 50, 33 = 271, 55

sx = 271, 55 = 16, 48
(yi ni ) 3006
y= n = 15 = 200, 40

(yi y)ni ni y2i 651630


s2y = n = n y2 = 15 200, 402 = 3281, 84

sy = 3281, 84 = 57, 28

(xi x)(yi y)ni ni xi yi 161405


sxy = n = n (x y) = 15 (50, 33 200, 40) = 673, 53
sxy 673,53
r= sx sy = 16,4857,28 = 0, 7135

R2 = r2 = 0, 71352 = 0, 5090

La recta de regresin y = b x + a

b = sxy2 = 673,53
( s
x 271,55 = 2, 48 y = 2, 48 x + 75, 56.
a = y b x = 200, 40 2, 48 50, 33 = 75, 56

Para un x = 50 y = 2, 48 50 + 75, 56 = 199, 56

Problema 2.16. Los siguientes datos representan las puntuaciones en un test de capacidad memorstica y un test de inteligencia
obtenida por 10 individuos estudiados:

Memoria (X) 17 23 25 36 38 40 42 46 55 62
Inteligencia (Y ) 37 58 14 43 27 60 25 33 19 49

(a) Representar el diagrama de dispersin correspondiente. A la vista de ste, puede sacarse alguna conclusin?.
(b) Obtener el coeficiente de correlacin lineal.
60
50
40
y

30
20

20 30 40 50 60

Manuel Angel Barea Gmez 47


CAPTULO 2. VARIABLES BIDIMENSIONALES

A la vista de la grfica se observa que la distribucin no es candidata a una regresin lineal.

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
17 37 1 17 289 37 1369 629
23 58 1 23 529 58 3364 1334
25 14 1 25 625 14 196 350
36 43 1 36 1296 43 1849 1548
38 27 1 38 1444 27 729 1026
40 60 1 40 1600 60 3600 2400
42 25 1 42 1764 25 625 1050
46 33 1 46 2116 33 1089 1518
55 19 1 55 3025 19 361 1045
62 49 1 62 3844 49 2401 3038
10 384 16532 365 15583 13938

(xi ni ) 384
x= n = 10 = 38, 43

(xi x)ni ni x2i


s2x = n = x2 = 16532
n
2
10 38, 43 = 178, 64

sx = 178, 64 = 13, 56
(yi ni ) 365
y= n = 10 = 36, 5

(yi y)ni ni y2i 15583


s2y = n = n y2 = 10 36, 52 = 226, 05

sy = 226, 05 = 15, 03

(xi x)(yi y)ni ni xi yi 13938


sxy = n = n (x y) = 10 (38, 43 36, 5) = 7, 8
sxy 7,8
r= sx sy = 13,5515,038 = 0, 0388

Problema 2.17. Los datos siguientes son las medidas de las concentraciones de Calcio, en mg/100 ml, y de la hormona paratiroides
en plasma de 12 individuos sanos, medida esta ltima en m g/ml.

Calcio (X) 11 11 10,6 10,5 10,6 10,4 10,2 9,5 8,2 7,5 6 5
PT H (Y ) 0,3 0,5 1,12 1,23 1,24 1,31 1,33 2,1 2,15 2,43 3,7 4,27

(a) Existe relacin lineal entre ambas variables?


(b) Calcular el nivel de PTH que le correspondera a un nivel de 10 mg/100 ml de Ca.
(c) Calcular el nivel de Ca que correspondera a una PTH de 1, 5 m g/ml

Manuel Angel Barea Gmez 48


CAPTULO 2. VARIABLES BIDIMENSIONALES

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
11 0,3 1 11 121 0,3 0,09 3,3
11 0,5 1 11 121 0,5 0,25 5,5
10,6 1,12 1 10,6 112,36 1,12 1,2544 11,872
10,5 1,23 1 10,5 110,25 1,23 1,5129 12,915
10,6 1,24 1 10,6 112,36 1,24 1,5376 13,144
10,4 1,31 1 10,4 108,16 1,31 1,7161 13,624
10,2 1,33 1 10,2 104,04 1,33 1,7689 13,566
9,5 2,1 1 9,5 90,25 2,1 4,41 19,95
8,2 2,15 1 8,2 67,24 2,15 4,6225 17,63
7,5 2,43 1 7,5 56,25 2,43 5,9049 18,225
6 3,7 1 6 36 3,7 13,69 22,2
5 4,27 1 5 25 4,27 18,2329 21,35
12 110,5 1063,91 21,68 54,99 173,27

(xi ni ) 1063,91
x= n = 12 = 9, 20

ni x2i
s2x = (xi x)ni
n = x2 = 16532
n
2
12 9, 20 = 3, 86

sx = 3, 86 = 1, 96
(yi ni ) 21,68
y= n = 12 = 1, 80

(yi y)ni ni y2i 54,99


s2y = n = n y2 = 12 1, 802 = 1, 32

sy = 1, 32 = 1, 15

(xi x)(yi y)ni ni xi yi 173,27


sxy = n = n (x y) = 12 (9, 20 1, 80) = 2, 19
sxy 2,19
r= sx sy = 1,961,15 = 0, 9037

La recta de regresin y = b x + a
( s
b = sxy2 = 2,19
3,86 = 0, 5683
x y = 0, 5683 x + 7, 04.
a = y b x = 1, 80 + 0, 5683 9, 20 = 7, 04

Para una x = 10 y = 0, 5683 10 + 7, 04 = 1, 34 m g/ml


La recta de regresin x = b y + a
sxy
(
2,19
b= s2y
= 1,32 = 1, 66
x = 1, 66 y + 12, 22
a = x b y = 9, 20 + 1, 66 1, 80 = 12, 22

Para una y = 1, 5 x = 1, 66 1, 80 + 12, 22 = 9, 715

Problema 2.18. Queremos estudiar la relacin entre los niveles de hematocrito de recin nacidos de madres diabticas y su peso
obteniendo los siguientes resultados:

Madres diabeticas % (X) 63 60 58 61 65 60 57 58 55 56


Peso kg(Y ) 3,2 3,1 2,8 2,9 3,2 2,8 2,7 2,9 2,6 2,5

Manuel Angel Barea Gmez 49


CAPTULO 2. VARIABLES BIDIMENSIONALES

(a) Qu nivel de hematocrito podemos esperar para un recin nacido de madre diabtica con un peso de 3 kg?

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
63 3,2 1 63 3969 3,2 10,24 201,6
60 3,1 1 60 3600 3,1 9,61 186
58 2,8 1 58 3364 2,8 7,84 162,4
61 2,9 1 61 3721 2,9 8,41 176,9
65 3,2 1 65 4225 3,2 10,24 208
60 2,8 1 60 3600 2,8 7,84 168
57 2,7 1 57 3249 2,7 7,29 153,9
58 2,9 1 58 3364 2,9 8,41 168,2
55 2,6 1 55 3025 2,6 6,76 143
56 2,5 1 56 3136 2,5 6,25 140
10 593 35253 28,7 82,89 1708

(xi ni ) 593
x= n = 10 = 59, 3

(xi x)ni ni x2i


s2x = n = n x2 = 35253 2
10 59, 3 = 8, 81

sx = 8, 81 = 2, 97
(yi ni ) 28,7
y= n = 10 = 2, 87

(yi y)ni ni y2i 82,89


s2y = n = n y2 = 10 2, 872 = 0, 052

sy = 0, 052 = 1, 15

(xi x)(yi y)ni ni xi yi 1708


sxy = n = n (x y) = 10 (59, 30 2, 87) = 0, 61

La recta de regresin x = b y + a
sxy 0,61
(
b= s2y
= 0,052 = 11, 69
x = 11, 69 y + 25, 75
a = x b y = 59, 30 11, 69 2, 87 = 25, 75

Para una y = 3 x = 11, 69 2, 87 + 25, 75 = 60, 82

Problema 2.19. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para absorber hierro.
Participan en el estudio 10 sujetos. A cada uno se le da una dosis oral idntica de hierro. Transcurridos 6 y 12 das se mide la cantidad
de hierro retenida en el sistema corporal y, a partir de sta, se determina el porcentaje absorbido por el cuerpo. Se obtuvieron los
siguientes datos:

6 das (X) 8 17 18 25 58 59 41 30 43 58
12 das (Y ) 17 22 35 43 80 85 91 92 96 100

(a) Obtener el coeficiente de correlacin lineal.


(b) Qu % de hierro se estima que absorbe un individuo a los 12 das si la absorcin a los 6 das fue del 50 %?

Manuel Angel Barea Gmez 50


CAPTULO 2. VARIABLES BIDIMENSIONALES

X Y ni xi n i x2i ni yi n i y2i ni xi yi n i
8 17 1 8 64 17 289 136
17 22 1 17 289 22 484 374
18 35 1 18 324 35 1225 630
25 43 1 25 625 43 1849 1075
58 80 1 58 3364 80 6400 4640
59 85 1 59 3481 85 7225 5015
41 91 1 41 1681 91 8281 3731
30 92 1 30 900 92 8464 2760
43 96 1 43 1849 96 9216 4128
58 100 1 58 3364 100 10000 5800
10 357 15941 661 53433 28289

(xi ni ) 357
x= n = 10 = 35, 7

(xi x)ni ni x2i 15941


s2x = n = n x2 = 10 35, 72 = 319, 61

sx = 319, 61 = 17, 87
(yi ni ) 661
y= n = 10 = 66, 1

(yi y)ni ni y2i 53433


s2y = n = n y2 = 10 66, 12 = 974, 09

sy = 974, 09 = 31, 21

(xi x)(yi y)ni ni xi yi 28289


sxy = n = n (x y) = 10 (35, 7 6, 61) = 469, 13
sxy 469,13
r= sx sy = 35,76,61 = 0, 8408

La recta de regresin y = b x + a
469,13
( s
b = sxy2 = 319,61 = 1, 47
x y = 1, 47 x + 13, 7.
a = y b x = 66, 1 1, 47 35, 7 = 13, 7

Para una x = 50 y = 1, 47 50 + 13, 7 = 87, 21

Problema 2.20. Se est investigando la relacin entre la hipertensin intraocular y el sexo de los individuos. Entre los hombres
sometidos al estudio encontramos 35 normales, 34 sospechosos y 32 con hipertensin intraocular. Entre las mujeres se encontraron
60 normales, 16 sospechosas y 27 con hipertensin intraocular. Calcular el coeficiente de contingencia asociado.

Normales Sospechosos Hipetensin Total


35 34 32
Hombre 95101 50101 59101 101
204 = 47, 03 204 = 24, 75 204 = 29, 21
60 16 27
Mujer 95103 50103 59103 103
204 = 47, 96 204 = 25, 24 204 = 29, 78
Total 95 50 59 204

2
q
C= 2 +n

2
(OE) (3547,03)2 2 2 2 2 2
2 = E = 47,03 + (3424,75)
24,75 + (3229,21)
29,21 + (6047,96)
47,96 + (1625,24)
25,24 + (2729,78)
29,78 = 13, 46

Manuel Angel Barea Gmez 51


CAPTULO 2. VARIABLES BIDIMENSIONALES

2
q q
13,46
C= 2 +n
= 13,46+204 = 0, 248

Problema 2.21. Se est investigando la relacin que hay entre dos escalas para medir la presencia de Burnout (Sndrome de estar
quemado en espaol). Para ello, a 10 individuos se les pasan ambos test obteniendo los siguientes resultados:

test 1 154 170 165 160 163 159 168 167 162 158
test 2 67 80 73 70 78 71 82 74 77 68

(a) Estudiar dicha relacin con el coeficiente de correlacin por rangos de Spearman.

X Y xi yi D D2
154 67 1 1 0 0
170 80 10 9 1 1
165 73 7 5 2 4
160 70 4 3 1 1
163 78 6 8 -2 4
159 71 3 4 -1 1
168 82 9 10 -1 1
167 74 7 6 1 1
162 77 5 7 -2 4
158 68 2 2 0 0
17

2
= 1 N6N2D1 = 1 10 617 = 0, 896
( ) (102 1)

Problema 2.22. Se desea saber el grado de asociacin entre el valor del test de Apgar realizado a los recin nacidos al minuto de
vida y la utilizacin de anestesia epidural. Para ello se recogieron los siguientes datos:

test
7 8 9
epidural
Si 5 374 275
No 1 43 33

(a) Estudiar dicha asociacin a travs del coeficiente de contingencia.

test
7 8 9 Total
epidural
5 374 275
Si 654
5,36 373,07 275,55
1 43 33
No 77
0,63 43,92 32,44
Total 6 417 308 731

2
q
C= 2 +n

2
(OE) (55,36)2 2 2 2 2 2
2 = E = 5,36 + (374373,07)
373,07 + (27529,21)
29,21 + (10,63)
0,63 + (4343,92)
43,92 + (3332,44)
32,44 = 0, 272

2
q q
0,272
C= 2 +n
= 0,272+731 = 0, 01928

Manuel Angel Barea Gmez 52


CAPTULO 2. VARIABLES BIDIMENSIONALES

Problema 2.23. Se desea saber la relacin que hay entre la nota de selectividad y el nmero de asignaturas aprobadas el primer
ao de carrera. Para ello, se seleccionan 10 individuos aleatoriamente obteniendo los siguientes resultados:

test 1 154 170 165 160 163 159 168 167 162 158
test 2 67 80 73 70 78 71 82 74 77 68

(a) Estudiar dicha relacin con el coeficiente de correlacin por rangos de Spearman.

X Y xi yi D D2
9 6 1 1,5 -0,5 0,25
10,5 8 2 8,5 -6,5 42,25
11,2 7 5 5 0 0
12,4 7 9 5 4 16
13,1 7 10 5 5 25
10,7 7 4 5 -1 1
12,2 8 8 8,5 -0,5 0,25
11,5 9 6 10 -4 16
12 7 7 5 2 4
10,6 6 3 1,5 1,5 2,25
107

2
= 1 N6N2D1 = 1 10 6107 = 0, 3515
( ) (102 1)

Manuel Angel Barea Gmez 53


C APTULO

3
Probabilidad

Problema 3.1. El 60 % de los individuos de una poblacin estn vacunados contra una cierta enfermedad. Durante una epidemia
se sabe que el 20 % la ha contrado y que 2 de cada 100 individuos estn vacunados y son enfermos.

(a) Calcular el porcentaje de vacunados que enferma y el de vacunados entre los que estn enfermos.

P(V ) = 0, 6

P(V E) 0,02
(
P (E/V ) = P(V )
= 0,6 = 0, 033
P(E) = 0, 2 P(V E) 0,02

P(V E) = 0, 02 P (V/E ) = P(E) = 0,2 = 0, 1

Problema 3.2. La proporcin de alcohlicos que existe en la poblacin de Mlaga es, aproximadamente, un 10 %; no obstante, en
las bajas que dan los mdicos de la Seguridad Social difcilmente se encuentra el diagnstico de alcoholismo. Aparecen sin embargo
diagnosticados de hepatopatas, lumbalgias, etc., que pueden hacer sospechar alcoholismo subyacente. Se realiz un estudio que
puso de manifiesto que el 85 % de los individuos alcohlicos y el 7 % de los no alcohlicos sufran tales patologas. Se desea saber:

(a) Cul es la probabilidad de que un individuo con esas patologas sea realmente alcohlico.

E Tener patologa
A Ser alcoholico P(A) = 0, 1


P(E/A) = 0, 85
P(E/A) = 0, 07

P(E/A) = 0, 85
P (A) = 0, 1
P(E/A) = 0, 15

P(E/A) = 0, 07
P A = 0, 9


P(E/A) = 0, 93
P(A)P(E/A) 0,10,85
P (A/E ) = P(A)P(E/A)+P(A)P(E/A)
= 0,10,85+0,90,07 = 0, 5743

54
CAPTULO 3. PROBABILIDAD

Problema 3.3. Dos tratamientos A y B curan una determinada enfermedad en el 20 % y 30 % de los casos, respectivamente.
Suponiendo que ambos actan de modo independiente, cul de las dos siguientes estrategias utilizara para curar a un individ-
uo con tal enfermedad:

(a) Aplicar ambos tratamientos a la vez.


(b) Aplicar primero el tratamiento B y, si no surte efecto, aplicar el A.

A Tratamiento A P (A) = 0, 2

B Tratamiento B P(b) = 0, 3

Cmo son sucesos independientes

P (A B) = P (A) + P(B) = 0, 2 + 0, 3 = 0, 5

P (A B) P(A) P(B) = 0, 2 0, 3 = 0, 06

Luego P (A B) = 0, 06

P A B = P (A) P(A B) = 0, 2 0, 06 = 0, 14

P(AB) 0,14
P (A/B) = P B = 0,7 = 0, 2
( )

Problema 3.4. Se eligen al azar 3 deportistas de un equipo de 10 integrantes para realizar un control antidopaje; Se sabe que 2
de los jugadores del equipo han tomado sustancias prohibidas. Cul es la probabilidad de elegir para el anlisis a alguno de los
infractores?


A Notomar!sustancias prohbidas
8




3
P (A) = ! = 56 = 0, 46


10 120

3

La probabilidad de elegir uno de los infractores es el suceso contrario P A = 1 0, 46 = 0, 54




Problema 3.5. Estamos interesados en saber cul de dos anlisis A y B es mejor para el diagnstico de una determinada enfermedad,
de la cual sabemos que la presentan un 10 % de individuos de la poblacin. El porcentaje de resultados falsos positivos del anlisis
A es del 15 % y el de B es del 22 %. El porcentaje de falsos negativos de A es del 7 % y de B es del 3 . Cul es la probabilidad de
acertar en el diagnstico con cada mtodo?

Para el tratamiento A
P(T +/E ) = 0, 93
P (E) = 0, 1
P(T /E ) = 0, 07

P(T +/E ) = 0, 15
P E = 0, 9


P(T /E ) = 0, 85

Manuel Angel Barea Gmez 55


CAPTULO 3. PROBABILIDAD

P (T +/E ) P (E) + P(T /E ) P E = 0, 93 0, 1 + 0, 9 0, 85 = 0, 858




Para el tratamiento B
P(T +/E ) = 0, 97
P (E) = 0, 1
P(T /E ) = 0, 03

P(T +/E ) = 0, 22
P E = 0, 9


P(T /E ) = 0, 78

P (T +/E ) P (E) + P(T /E ) P E = 0, 97 0, 1 + 0, 9 0, 78 = 0, 799




Problema 3.6. Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal tcnica tiene una sensibilidad del 91 % y una
especificidad del 98 %. En la poblacin que nos ocupa la probabilidad de colelitiasis es del 20 %.

(a) Si a un individuo de tal poblacin se le aplican los ultrasonidos y dan positivos, cul es la probabilidad de que sufra la
colelitiasis?
(b) Si el resultado fuese negativo, cul es la probabilidad de que no tenga la enfermedad?

Lema.
Sensibilidad, es la probabilidad de el test de positivo sobre una persona que sabemos que padece la enfermedad P (T +/E ).
Especificidad, es la probabilidad que el test de negativo sobre una persona que no la padece, P(T /E )

P(T +/E ) = 0, 91
P (E) = 0, 2
P(T /E ) = 0, 09

P(T +/E ) = 0, 02
P E = 0, 8


P(T /E ) = 0, 98

P(E)P(T +/E ) 0,20,91


P (E/T + ) = P(E)P(T +/E )+P(E )P(T +/E )
= 0,20,91+0,80,02 = 0, 9191

P(E )P(T /E ) 0,80,98


P (E/T ) = P(E)P(T /E )+P(E )P(T /E )
= 0,20,09+0,80,98 = 0, 9775

Problema 3.7. Entre los estudiantes de una Facultad de Filosofa y Letras se dan las siguientes proporciones: el 40 % son hombres.
El 70 % de los varones fuman, mientras que entre las mujeres slo fuman el 20 %. Escogido un estudiante al azar, calclese la
probabilidad de que fume.

H Hombre P (H) = 0, 4



F Fumador

(F/H ) = 0, 7
P
P (F/H ) = 0, 2

Manuel Angel Barea Gmez 56


CAPTULO 3. PROBABILIDAD

P(F/H ) = 0, 7
P (H) = 0, 4
P(F/H ) = 0, 3

P(F/H ) = 0, 2
P H = 0, 6


P(F/H ) = 0, 8

P (F) = P (H) P(F/H ) + P H P(F/H ) = 0, 4 0, 7 + 0, 6 0, 2 = 0, 4




Problema 3.8. Los estudios epidemiolgicos indican que el 20 % de los ancianos sufren un deterioro neuropsicolgico. Sabemos
que la tomografa axial computerizada (TAC) es capaz de detectar este trastorno en el 80 % de los que lo sufren, pero que tambin
da un 3 % de falsos positivos entre personas sanas. Si tomamos un anciano al azar y da positivo en el TAC, cul es la probabilidad
de que est realmente enfermo?

P(T +/E ) = 0, 8
P (E) = 0, 2
P(T /E ) = 0, 2

P(T +/E ) = 0, 03
P E = 0, 8


P(T /E ) = 0, 97

P(E)P(T +/E ) 0,20,8


P (E/T + ) = P(E)P(T +/E )+P(E )P(T +/E )
= 0,20,8+0,80,03 = 0, 8695

Problema 3.9. Sabemos que tiene estudios superiores el 15 % de la poblacin espaola, estudios medios el 40 %, estudios primarios
el 35 % y no tiene estudios el 10 %. Los desempleados no se distribuyen proporcionalmente entre esas categoras, dado que de entre
los de estudios superiores estn sin trabajo el 10 %, entre los de estudios medios el 35 %, entre los de estudios primarios el 18 %, y
entre los que no tienen estudios el 37 %. Obtenga las probabilidades de que extrado uno al azar, ste sea:

(a) Titulado superior, sabiendo que est parado.


(b) Un sujeto sin estudios que est en paro.
(c) Un sujeto con estudios primarios o que est trabajando.

S Titulado Superior P (S) = 0, 15 P (D/S) = 0, 10




M Estudios Medios P (M) = 0, 40 P (D/M ) = 0, 35


P Estudios Primarios P (P) = 0, 35 P (D/P) = 0, 18
N Sin Estudios P (N) = 0, 10 P (D/N ) = 0, 37

Manuel Angel Barea Gmez 57


CAPTULO 3. PROBABILIDAD

P(D/S) = 0, 10
P (S) = 0, 15
P(D/S) = 0, 90

P(D/M) = 0, 35
P (M) = 0, 40
P(D/M) = 0, 65

P(D/P) = 0, 18
P (P) = 0, 35
P(D/P) = 0, 82

P(D/N ) = 0, 37
P (N) = 0, 10
P(D/N ) = 0, 63
P(S)P(D/S) 0,150,10
P (S/D) = P(S)P(D/S)+P(M)P(D/M)+P(P)P(D/P)+P(N)P(D/N ) = 0,150,10+0,40,35+0,350,18+0,10,37 = 0, 06

P(N)P(D/S) 0,100,37
P (N/D) = P(S)P(D/S)+P(M)P(D/M)+P(P)P(D/P)+P(N)P(D/N ) = 0,150,10+0,40,35+0,350,18+0,10,37 = 0, 145

Para poder resolver el tercer apartado debemos desarrollar unos clculos previos:
P D = P (S) P (D/S) + P (M) P (D/M) + P (P) P (D/P) + P (N) P (D/N ) = 0, 15 0, 9 + 0, 40 0, 65 + 0, 35 0, 82 + 0, 10 0, 63 = 0, 745


P P D = P (D/P) P(P) = 0, 82 0, 35 = 0, 287




P (P D) = P (P) + P D P P D = 0, 35 + 0, 745 0, 287 = 0, 808


 

Problema 3.10. Una enfermedad puede estar producida por tres virus A, B, y C. En el laboratorio hay 3 tubos de ensayo con el
virus A, 2 tubos con el virus B y 5 tubos con el virus C. La probabilidad de que el virus A produzca la enfermedad es de 1/3, que la
produzca B es de2/3 y que la produzca el virus C es de 1/7. Se inocula un virus a un animal y contrae la enfermedad. Cul es la
probabilidad de que el virus que se inocule sea el C?

A Virus A P (A) = 0, 3 P (V/A) = 1/3


B Virus B P (B) = 0, 2 P (V/B) = 2/3


C VirusC P (C) = 0, 5 P (V/C) = 1/7

P(V/A) = 1/3
P (A) = 0, 3
P(V/A) = 2/3

P(V/B) = 2/3
P (B) = 0, 2
P(V/B) = 1/3

P(V/C) = 1/7
P (C) = 0, 5
P(V/C) = 6/7

Manuel Angel Barea Gmez 58


CAPTULO 3. PROBABILIDAD

P(C)P(V/C) 0,51/7
P (C/V ) = P(A)P(V/A)+P(B)P(V/B)+P(C)P(V/C) = 0,31/3+0,22/3+0,51/7 = 0, 231

Problema 3.11. El 70 % de los estudiantes aprueba una asignatura A y un 60 % aprueba otra asignatura B. Sabemos, adems, que
un 35 % del total aprueba ambas. Elegido un estudiante al azar, calcular las probabilidades de las siguientes situaciones:

(a) Haya aprobado la asignatura B, sabiendo que ha aprobado la A.


(b) Haya aprobado la asignatura B, sabiendo que no ha aprobado la A.
(c) No haya aprobado la asignatura B, sabiendo que ha aprobado la A.
(d) No haya aprobado la asignatura B, sabiendo que no ha aprobado la A.

P(AB) 0,35
P (B/A) = P(A) = 0,7 = 0, 5

Para el segundo apartado debemos calcular previamente

P A B = P (B A) = P (B) P(A B) = 0, 6 0, 35 = 0, 25


P(AB) 0,25
P (B/A) = P(A)
= 0,3 = 0, 833

Para el tercer apartado debemos calcular previamente

P B A = P (A B) = P (A) P(A B) = 0, 7 0, 35 = 0, 35


P(BA) 0,35
P (B/A) = P(A) = 0,7 = 0, 5

Para el cuarto apartado debemos calcular previamente

P B A = P A B = 1 0, 95 = 0, 05
  

P (A B) = P (A) + P(B) P(A B) = 0, 7 + 0, 6 0, 35 = 0, 95

P(BA) 0,05
P (B/A) = P(A)
= 0,3 = 0, 167

Problema 3.12. La cuarta parte de los conductores de coche son mujeres. La probabilidad de que una mujer sufra un accidente en
un ao es de 5/10000, y para los hombres es de 1/10000. Calclese la probabilidad de que si acaece un accidente, el accidentado sea
hombre.

P(A/H ) = 0, 0001
P (H) = 0, 75
P(A/H ) = 0, 9999

P(A/M ) = 0, 0005
P M = 0, 6


P(A/M ) = 0, 9995
P(H)P(A/H ) 0,751/10000
P (H/A) = P(H)P(A/H )+P(M)P(A/M) = 0,751/100001/3+0,255/10000 = 0, 375

Manuel Angel Barea Gmez 59


CAPTULO 3. PROBABILIDAD

Problema 3.13. En un campus universitario existen 3 carreras sanitarias. Se sabe que el 50 % cursan estudios de Enfermera, el
30 % Medicina y el 20 % Veterinaria. Los que finalizaron sus estudios son el 20, 10 y 5 % respectivamente. Elegido un estudiante al
azar, hllese la probabilidad de que haya acabado la carrera.

P(F/E ) = 0, 20
P (E) = 0, 5
P(F/E ) = 0, 8

P(F/M ) = 0, 10
P(M) = 0, 3
P(F/M ) = 0, 90

P(F/V ) = 0, 05
P (V ) = 0, 2
P(F/V ) = 0, 95

P (F) = P (E) P (F/E ) + P(M) P(F/M) + P(V ) P(F/V ) = 0, 5 0, 2 + 0, 3 0, 1 + 0, 2 0, 05 = 0, 135

Problema 3.14. La probabilidad de que una mujer viva dentro de 30 aos es 0,25 y la probabilidad de que viva su hijo es 0,9.
Calcule la probabilidad de que al cabo de ese tiempo:

(a) Ambos vivan.


(b) Slo viva la madre.
(c) Slo viva el hijo.
(d) Al menos viva uno de los dos.

M Mu jer vivir 30 anos P (M) = 0, 25



H Hi jo vivir 30 anos P(H) = 0, 9

Cmo ambos sucesos son independientes:

P (M H) = P (M) P(H) = 0, 25 0, 8 = 0, 2

P M H = P (M H) = P(M) P(M H) = 0, 25 0, 2 = 0, 05


P M H = P (H M) = P (H) P(M H) = 0, 9 0, 2 = 0, 7


P (M H) = P (M) + P(H) P(M H) = 0, 25 + 0, 9 0, 2 = 0, 95

Problema 3.15. Los quinientos individuos de una muestra se distribuyen en vacunados y no vacunados, y enfermos y no enfermos,
de acuerdo con la tabla:

Enfermos No enfermos Total


Vacunados 42 243 285
No Vacunados 96 119 215
Total 138 362 500

Si se elige un individuo de la muestra al azar

Manuel Angel Barea Gmez 60


CAPTULO 3. PROBABILIDAD

(a) Cul es la probabilidad de que est enfermo o haya sido vacunado?


(b) Si el individuo elegido est enfermo, cul es la probabilidad de que no haya sido vacunado?

E En f ermo
V Vacunado

P (E) = 138

500
P (V ) = 285


500
42
P (E V ) = 500
138
+ 285 42

P (E V ) = P (E) + P(V ) P(E V ) = 500 500 = 0, 762

500

P (E) = 138

500 P(EV ) 96/500
96 P (V/E ) = P(E)
= 138/500 = 0, 695
P E V = 500

Problema 3.16. De un grupo de nios considerados de alto riesgo, el 60 % tiene bronquitis, el 70 % tiene infeccin de garganta y el
40 % tiene ambas dolencias.

Se escoge un nio al azar:


(a) Cul es la probabilidad de que tenga bronquitis o infeccin de garganta?
(b) Cul es la probabilidad de que no tenga bronquitis y no tenga infeccin de garganta?
(c) Si tiene los bronquitis, Cul es la probabilidad de que tenga infeccin de garganta?
(d) Si tiene infeccin de garganta, Cul es la probabilidad de que no tenga bronquitis?

I In f eccion garganta P (I) = 0, 7


B Bronquitis P (B) = 0, 6
P (I B) = 0, 4

P (B I) = P (B) + P(I) P(B I) = 0, 6 + 0, 7 0, 4 = 0, 9

P B I = P B I = 1 0, 9 = 0, 1
 

P(BI) 0,4
P (I/B) = P(B)
= 0,6 = 0, 66

P B I = P (I B) = P (I) P(B I) = 0, 7 0, 4 = 0, 3
 

P(BI ) 0,4
P (B/I ) = P(I) = 0,7 = 0, 57

Problema 3.17. Los resultados de un estudio realizado en mil mujeres se recogen en la tabla siguiente:

Menopausia
Clasificacin OMS Total
Si No
Normal 189 280 469
Osteopenia 108 359 467
Osteoporosis 6 58 64
Total 303 697 1000

Se elige una mujer al azar. Calcule la probabilidad de que:

Manuel Angel Barea Gmez 61


CAPTULO 3. PROBABILIDAD

(a) Tenga osteopenia o tenga osteoporosis.


(b) Tenga osteoporosis o menopausia.
(c) Pueda clasificarse como normal.
(d) Siendo menopusica, tenga osteoporosis.
(e) Son independientes los sucesos tener menopausia y tener osteoporosis?


N Normal
M Menopausica


Os Osteoporosis
O Osteopenia

467

P (O) = 1000
64

P (Os) = 1000

P (O Os) Suceso incompatible
467 64

P (O Os) = P (O) + P(Os) = 1000 + 1000 = 0, 531

64

P (Os) = 1000
303

P (M) = 1000

6
P (M Os) = 1000
303 64 6

P (M Os) = P (M) + P(Os) P(M Os) = + 1000 1000 = 0, 361

1000

469
P (N) = 1000 = 0, 469

303

P (M) = 1000

6
P (M Os) = 1000
P(MOs) 6/1000
P (Os/M) =
P(M) = = 0, 0198

303/1000

No son independientes porque P (M Os) 6= P (M) P (Os)

Problema 3.18. En un estudio sobre alcohlicos se informa de que el 40 % de los mismos tiene padre alcohlico y el 6 %, madre
alcohlica. El 42 % tiene al menos uno de los padres alcohlicos. Cul es la probabilidad de que elegido uno al azar:

(a) Tenga el padre y la madre alcohlicos.


(b) Tenga madre alcohlica si lo es el padre.
(c) Tenga la madre alcohlica pero no el padre alcohlico.
(d) Tenga la madre alcohlica si el padre no es alcohlico.

P Padre alcoholico P (P) = 0, 4


M Madre alcoholico P(M) = 0, 06


P (P M) = 0, 42

P (P M) = P (P) + P(M) P(P M) = 0, 4 + 0, 06 0, 42 = 0, 04


P(PM) 0,04
P(M/P) = P(P) = 0,4 = 0, 1

P M P = P (M) P(M P) = 0, 06 0, 04 = 0, 02


Manuel Angel Barea Gmez 62


CAPTULO 3. PROBABILIDAD

P(PM) 0,02
P (M/P) = P(P)
= 0,6 = 0, 033

Problema 3.19. De los sucesos dependientes A y B, se sabe que:

P (A B) = 0, 2

P (B/A) = 0, 5
P (A/B) = 0, 54

Calcule:
(a) P(A), P(B) y P(A B).
(b) P(A B)y P(A B).

P(AB) 0,2

P (A) = P(B/A) = 0,5 = 0, 4

0,2
P (B) = P(AB)
P(A/B) = 0,54 = 0, 37
P (A B) = P (A) + P(B) P(A B) = 0, 4 + 0, 37 0, 2 = 0, 57

P A B = P (A) P(A  B) = 0, 4
 0, 2 = 0, 2
 

P A B = P (A) + P B P A B = 0, 4 + 0, 63 0, 2 = 0, 83

Problema 3.20. Un laboratorio farmacutico proyecta fabricar un frmaco, del cual ya existen en el mercado dos marcas A y B. Se
sabe que a la hora de comprar ese frmaco la marca A es elegida por el 30 % de los consumidores, la marca B por el 50 % y el 10 %
compran A y B. Para decidir si compensa el nuevo proyecto el laboratorio necesita conocer, para un comprador elegido al azar, la
probabilidad de que:

(a) Compre al menos una de las dos marcas, A o B.


(b) No compre ni A ni B.
(c) Compre A, supuesto que tambin compra B.
(d) No compre A, supuesto que tampoco compra B.

P (A B) = P (A) + P(B) P(A B) = 0, 3 + 0, 5 0, 1 = 0, 7


P(AB) 0,1
P A B = P A B = 1 0, 7 = 0, 3P (A/B) = = 0, 2
 
P(B)
= 0,5

 P(AB) 0,3
P A/B = = 0,5 = 0, 6
P(B)

Problema 3.21. El 1 % de los individuos de una determinada poblacin padece cierta enfermedad. Una prueba para diagnosticarla
da positiva en el 90 % de los que la padecen y en el 5 % de los que no la padecen. Se elige al azar un individuo de la poblacin:

(a) Si se le somete a la prueba de diagnstico, calcule la probabilidad de que sta sea positiva.
(b) Supuesto que la prueba ha sido positiva, halle la probabilidad de que el individuo tenga la enfermedad.

Manuel Angel Barea Gmez 63


CAPTULO 3. PROBABILIDAD

P(T +/E ) = 0, 9
P (E) = 0, 01
P(T /E ) = 0, 1

P(T +/E ) = 0, 05
P E = 0, 99


P(T /E ) = 0, 95

P (T + ) = P (E) P (T +/E ) + P E P(T +/E ) = 0, 01 0, 9 + 0, 99 0, 05 = 0, 1395




P(E)P(T +/E ) 0,010,9


P (E/T + ) = P(E)P(T +/E )+P(E )P(T +/E )
= 0,010,9+0,990,05 = 0, 0796

Problema 3.22. El 20 % de los frmacos depositados en el almacn de un laboratorio estn en el lmite de su caducidad. La
probabilidad de que un frmaco de este tipo produzca los efectos deseados es del 40 %, y la de que los produzca un frmaco que no
est en dicho lmite es del 80 %.

(a) Se toma al azar un frmaco del almacn. Calcule la probabilidad de que produzca los efectos deseados.
(b) Si un frmaco elegido al azar no produce los efectos deseados, cul es la probabilidad de que no se encuentre en el lmite de
su caducidad?

L Lmite caducidad
D E f ectos deseados

P(D/L) = 0, 4
P (L) = 0, 2
P(D/L) = 0, 6

P(D/L) = 0, 8
P L = 0, 8


P(D/L) = 0, 2
P (L) = P (L) P (D/L) + P L P(D/L) = 0, 2 0, 4 + 0, 8 0, 8 = 0, 72


P(L)P(D/L) 0,20,4
P (L/D) = P(L)P(D/L)+P(L)P(D/L)
= 0,20,4+0,80,8 = 0, 22

Problema 3.23. Dados dos sucesos aleatorios A y B se sabe que:

P B = 34
 
1
P (A) = P (A/B) = 3

(a) Razonar si los sucesos A y B son independientes.


(b) Razonar si los sucesos A y B son incompatibles.
(c) Calcular la P(A B)
(d) Calcular las siguientes probabilidades:P(A B), P(A B) y P(A B).

Manuel Angel Barea Gmez 64


CAPTULO 3. PROBABILIDAD

Para saber si son independientes debe cumplirse P (A B) = P (A) P (B)

P (B) = 1 P B = 1 43 = 14


P (A B) = P (A/B) P(B) = 13 41 = 12
1
Por tanto son independientes
1 1 1
P (A B) = P (A) P(B) = 3 4 = 12

Para saber si son incompatibles debe cumplirse P (A B) = 0, luego no son incompatibles.

P (A B) = P (A) + P(B) P(A B) = 31 + 14 31 = 1


2

1
P(A B) = P (A B) = P (A) P(A B) = 31 12 = 1
4

P(A B) = P (B A) = P (B) P(A B) = 41 12


1
= 1
6

P(A B) = P A B = 1 12 = 1

2

Problema 3.24. En una Universidad de determinada poblacin se pueden estudiar dos titulaciones, Medicina y Enfermera. Se ha
realizado una encuesta sobre las preferencias de los estudiantes de segundo de bachillerato de la ciudad, que ha dado los siguientes
resultados: al 30 % les gustara estudiar nicamente Medicina; al 10 % nicamente Enfermera y al 20 % ninguna de las dos. Elegido
al azar un estudiante de esta ciudad, determinar razonadamente:

(a) La probabilidad de que le guste estudiar ambas carreras.


(b) La probabilidad de que, sabiendo que siente preferencia por Medicina, tambin le guste Enfermera.
(c) La probabilidad de que, sabiendo que no le gusta Medicina, si le guste Enfermera.

E En f ermera
M Medicina

Por el diagrama se llega a la conclusin

P (M E) = 1 P (M) + P(E) + P M E = 1 (0, 3 + 0, 1 + 0, 2) = 0, 4


 


P M E = P (E) (M E) = 0, 5 0, 4 = 0, 1

P(ME) 0,4 4
P (E/M ) = P(M) = 0,7 = 7 P(ME ) 1/10
P (E/M ) = P M = 3/10 = 31
( )

Problema 3.25. Se ha realizado un examen mdico a los trabajadores de tres empresas (E1 ,E2 y E3 ) y han sido declarados no aptos
5 de los 125 trabajadores de E1 , 18 de los 180 trabajadores de E2 y 19 de los 95 trabajadores de E3 .

Manuel Angel Barea Gmez 65


CAPTULO 3. PROBABILIDAD

(a) Si un trabajador elegido al azar ha sido declarado apto para el trabajo, Cul es la probabilidad de que no pertenezca a E1 ?
(b) Cul es la probabilidad de que un trabajador elegido al azar pertenezca a E2 y halla sido declarado apto para el trabajo?

125 5
= 0, 3125 P A/E1  = 125 = 0, 04

P (E1 ) = 400
180 18
P (E2 ) = 400 = 0, 45 P A/E2 = 180 = 0, 14
95
P (E3 ) = = 0, 2375 P A/E3 = 19 95 = 0, 2

400

P(A/E1 ) = 0, 96
P (E1 ) = 0, 3125
P(A/E1 ) = 0, 04

P(A/E2 ) = 0, 86
P (E2 ) = 0, 45
P(A/E2 ) = 0, 14

P(A/E3 ) = 0, 80
P (E3 ) = 0, 2375
P(A/E3 ) = 0, 20

Para resolver el primer apartado hallamos P (E1/A)para posteriormente hallar el suceso contrario que es en realidad lo que nos piden.
P(E1 )P(A/E1 ) 0,31250,96
P (E1/A) = P(E1 )P(A/E1 )+P(E2 )P(A/E2 )+P(E3 )P(A/E3 ) = 0,31250,96+0,450,86+0,23750,8 = 0, 3598

El suceso contrario es 1 0, 3598 = 0, 6401


P(E2 )P(A/E2 ) 0,450,86
P (E2/A) = P(E1 )P(A/E1 )+P(E2 )P(A/E2 )+P(E3 )P(A/E3 ) = 0,31250,96+0,450,86+0,23750,8 = 0, 405

Problema 3.26. En la revista Journal of Tropical Pediatrics de enero de 2006 se presenta un test serolgico rpido para el diagnstico
de infeccin por Helicobacter Pylori. Se ha probado en 81 nios, a los que se hacen tambin las pruebas microbiolgicas habituales
para saber si estn o no infectados. He aqu los resultados:

Test rpido
Infeccin

+ -
+ 24 1
- 3 53

(a) Calcular los siguientes ndices de valoracin de una prueba diagnstica : sensibilidad, especificidad y valor predictivo de
resultados positivos y negativos.

24

Sensibilidad = 25
Especi f icidad = 53


56
24
V PP = 27
V PN = 53


54

Problema 3.27. La prevalencia del carcinoma de pulmn y bronquios en fumadores de ms de 50 aos es de un 5 %. Una de las
pruebas diagnsticas preliminares para la deteccin de esta enfermedad es la citologa de esputo, que tiene una probabilidad 0,03
de falso positivo y una probabilidad 0,16 de falso negativo. Cul es la probabilidad de que una persona fumadora con ms de 50
aos que ha dado positivo en el test, presente algn carcinoma de este tipo?

Manuel Angel Barea Gmez 66


CAPTULO 3. PROBABILIDAD

P(T +/E ) = 0, 84
P (E) = 0, 05
P(T /E ) = 0, 16

P(T +/E ) = 0, 03
P E = 0, 95


P(T /E ) = 0, 97

P(E)P(T +/E ) 0,050,84


P (E/T + ) = = 0,050,849+0,950,03 = 0, 5957
P(E)P(T +/E )+P(E )P(T +/E )

Problema 3.28. Un mtodo simple y econmico para el diagnstico de la infeccin urinaria es la tincin directa de la orina con
azul de metileno que permite distinguir bacterias de leucocitos. Hemos utilizado esta prueba con 1125 pacientes dando positivo en
100 de ellos. Sabiendo que este mtodo tiene una sensibilidad del 64 % y una especificidad del 98 % calcular:

(a) El nmero de pacientes que padecen bacteriuria.


(b) De los 100 pacientes que han dado positivo en la prueba, cuntos no padecen bacteriuria?

P(T +/E ) = 0, 64
P (E)
P(T /E ) = 0, 36

P(T +/E ) = 0, 02

P E
P(T /E ) = 0, 98
100
P (T + ) = P (E) P (T +/E ) + P E P (T +/E ) = P (E) 0, 64 + [1 P(E)] 0, 02 =

1125

0,068
P (E) (0, 64 0, 02) = 0, 088 0, 02 P (E) = 0,62 = 0, 11

n = 1125 0, 11 = 125

Nuestro rbol completo ser ahora

P(T +/E ) = 0, 64
P (E) = 0, 11
P(T /E ) = 0, 36

P(T +/E ) = 0, 02
P E = 0, 89


P(T /E ) = 0, 98

P(E )P(T +/E ) 0,890,02


P (E/T + ) = P(E)P(T +/E )+P(E )P(T +/E )
= 0,110,64+0,890,02 = 0, 20

n = 100 0, 20 = 20

Manuel Angel Barea Gmez 67


CAPTULO 3. PROBABILIDAD

Problema 3.29. Para el tratamiento de una determinada enfermedad existen tres frmacos (F1 , F2 , F3 ), y sabemos que el porcentaje
de enfermos que utilizan F1 es el mismo porcentaje que utilizan F2 , y este ltimo porcentaje es el doble del que utilizan F3 . Estudios
previos realizados en diversos laboratorios han detectado que F1 produce un 3 % de reacciones adversas, F2 un 5 % y F3 un 12 %.

(a) Si un paciente ha tenido una reaccin adversa, cul es el frmaco que ha tomado con mayor probabilidad?
(b) Si un paciente no ha tenido una reaccin adversa, cul es la probabilidad de que no haya tomado F1 ?

2

F1 = F2 F1 = 5
2
F2 = 2 F3 Resolviendo F =
2 5
1
1 = F1 + F2 + F3 F3 =

5

P(A/F1 ) = 0, 03
P (F1 ) = 0, 4
P(A/E1 ) = 0, 97

P(A/F2 ) = 0, 05
P (F2 ) = 0, 4
P(A/E2 ) = 0, 97

P(A/F3 ) = 0, 12
P (F3 ) = 0, 2
P(A/F3 ) = 0, 82

P(F1 )P(A/F1 ) 0,40,03


P (F1/A) = P(F1 )P(A/F1 )+P(F2 )P(A/F2 )+P(F3 )P(A/F3 ) = 0,40,03+0,40,05+0,20,12 = 0, 214

P(F2 )P(A/F2 ) 0,40,05


P (F2/A) = P(F1 )P(A/F1 )+P(F2 )P(A/F2 )+P(F3 )P(A/F3 ) = 0,40,03+0,40,05+0,20,12 = 0, 357

P(F3 )P(A/F3 ) 0,20,12


P (F3/A) = P(F1 )P(A/F1 )+P(F2 )P(A/F2 )+P(F3 )P(A/F3 ) = 0,40,03+0,40,05+0,20,12 = 0, 428

P(F1 )P(A/F1 ) 0,40,97


P (F1/A) = P(F1 )P(A/F1 )+P(F2 )P(A/F2 )+P(F3 )P(A/F3 )
= 0,40,97+0,40,95+0,20,88 = 0, 411

Sin embargo nos solicitan los que no han tomado F1 luego es el suceso inverso con valor 1 0, 411 = 0, 588

Problema 3.30. Una determinada enfermedad es siempre tratada con uno de estos dos frmacos (F1 y F2 ). Uno de los efectos
secundarios caractersticos de estos medicamentos es el insomnio, que se produce en el 20 % de los pacientes tratados con F1 y en
el 8 % de los tratados con F2 . Se sabe, por otra parte, que entre los pacientes que manifiestan padecer insomnio, el consumo de F1
triplica al de F2 . A partir de estos datos:

(a) Calcular el porcentaje de pacientes tratados con F1 y el porcentaje de pacientes tratados con F2 .
(b) Que porcentaje de pacientes padece insomnio en general?

Manuel Angel Barea Gmez 68


CAPTULO 3. PROBABILIDAD

P(I/F1 ) = 0, 2
P (F1 )
P(I/E1 ) = 0, 8

P(I/F2 ) = 0, 08
P (F2 )
P(I/E2 ) = 0, 92

P(IF1 ) P(IF1 )
( (
P (I/F1 ) = P(F1 ) P (F1/I ) = P(I)
2) 2)
P (I/F2 ) = P(IF
P(F2 )
P (F2/I ) = P(IF
P(I)

P(I/F1 )P(F1 ) P(I/F2 )P(F2 )


P(I) = 3 P(I) P (I/F1 ) P(F1 ) = 3 P(I/F2 ) P (F2 )

P (I/F1 ) P (F1 ) = 3 P(I/F2 ) [1 P(F1 )] 0, 2 P(F1 ) = 3 0, 08 [1 P(F1 )]

P (F1 ) = 0, 5455

0, 44 P(F1 ) = 0, 24
P (F2 ) = 0, 4545

P(I/F1 ) = 0, 2
P (F1 ) = 0, 5455
P(I/E1 ) = 0, 8

P(I/F2 ) = 0, 08
P (F2 ) = 0, 4545
P(I/E2 ) = 0, 92

P (I) = P (F1 ) P(I/F1 ) + P(F2 ) P(I/F2 ) = 0, 5455 0, 2 + 0, 4555 0, 08 = 0, 1454

Problema 3.31. La ecografa abdominal es la prueba diagnstica que suele utilizarse durante la infancia para la deteccin de
apendicitis aguda. Se sabe que entre los pacientes sospechosos de padecer esta patologa, dicha prueba genera un 4 % de falsos
positivos y un 8 % de falsos negativos. Para el diagnstico de apendicitis aguda, el servicio de pediatra de un determinado hospital
realiz a lo largo del ltimo ao ecografa abdominal a un total de 400 pacientes, resultando la prueba positiva en el 37 % de los
casos.

(a) De entre los 400 pacientes examinados cuntos no padecan apendicitis aguda?
(b) Entre los pacientes que dieron positivo en esta prueba, cuntos de ellos realmente padecan apendicitis aguda?

P(T +/E ) = 0, 92
P (E)
P(T /E ) = 0, 08

P(T +/E ) = 0, 04

P E
P(T /E ) = 0, 96

Manuel Angel Barea Gmez 69


CAPTULO 3. PROBABILIDAD

P (T + ) = P (E) P(T +/E ) + P E P (T +/E ) = 1 P E 0, 92 + P E 0, 04 = 0, 37


   

0,55
P (E) (0, 04 0, 92) = 0, 37 0, 92 P (E) = 0,88 = 0, 625

P E = 0, 625 n = 400 0, 625 = 250




P(T +/E ) = 0, 92
P (E) = 0, 375
P(T /E ) = 0, 08

P(T +/E ) = 0, 04
P E = 0, 625


P(T /E ) = 0, 96

P(E)P(T +/E ) 0,3750,92


P (E/T + ) = P(E)P(T +/E )+P(E )P(T +/E )
= 0,3750,92+0,6250,04 = 0, 932

n = 150 0, 932 139

Problema 3.32. Tenemos cinco frascos con pldoras sedantes. Las de un frasco A son gravemente txicas. Las de los cuatro restantes
son ligeramente txicas. Antes de dormir tomamos una pastilla, eligiendo aleatoriamente el frasco, pues creemos que las pldoras de
los cinco frascos son del mismo tipo. Al cabo de un rato sentimos gran malestar y caemos en la cuenta de que el frasco A contiene
pldoras gravemente txicas. Segn un manual de Medicina que consultamos, las pldoras de A causan el malestar que sentimos
en un 90 % de los casos, mientras que las pldoras de los otros cuatro slo lo causan en un 15 %. Con qu probabilidad podemos
afirmar que la pldora tomada perteneca al frasco A? Y de que perteneca a uno de los otros cuatro?.

P(M/A) = 0, 9
P (A) = 0, 2
P(M/A) = 0, 1

P(M/A) = 0, 15
P A = 0, 8


P(M/A) = 0, 85

P(A)P(M/A) 0,20,9
P (A/M ) = P(A)P(M/A)+P(A)P(M/A)
= 0,20,9+0,80,15 = 0, 6

Para la segunda cuestin se trata del suceso contrario anterior, por tanto, 0, 4

Problema 3.33. En una cierta poblacin, se sabe que el ao pasado acudi al menos una vez al mdico de cabecera el 80 %. Adems,
el 40 % de los que acudieron lo hizo porque estaban resfriados, mientras que el 30 % de los que no acudieron se curaron el resfriado
en casa.

(a) Calcular la probabilidad de que un individuo se resfriara.


(b) Calcular la probabilidad de que un individuo que se resfri, acudiera al mdico por lo menos una vez.
(c) Calcular la probabilidad de que un individuo que no se resfri no acudiera al mdico por lo menos una vez.

Manuel Angel Barea Gmez 70


CAPTULO 3. PROBABILIDAD

P(R/M ) = 0, 4
P (M) = 0, 8
P(R/M ) = 0, 6

P(R/M ) = 0, 3
P M = 0, 2


P(R/M ) = 0, 7

P (R) = P (M) P(R/M) + P M P (R/M ) = 0, 8 0, 4 + 0, 2 0, 3 = 0, 38




P(M)P(R/M) 0,80,4
P (M/R) = P(R) = 0,38 = 0, 84

P(M)P(R/M) 0,70,2
P (M/R) = P(R)
= 0,62 = 0, 225

Problema 3.34. El porcentaje de personas de una poblacin que manifiestan un sntoma clsico de una cierta enfermedad es del
20 %, y el porcentaje de enfermos es del 23 %. Se sabe que el 70 % de las personas que tienen el sntoma, no estn enfermas.

(a) Un individuo elegido al azar no tiene el sntoma, cul es la probabilidad de que tenga la enfermedad?
(b) Un individuo elegido al azar no est enfermo, qu es ms probable, que tenga el sntoma o que no lo tenga?

P(E/S) = 0, 3
P (S) = 0, 2
P(E/S) = 0, 7

P(E/S)
P S = 0, 8


P(E/S)


P (E) = P (S) P(E/S) + P S P(E/S)

P(E)P(S)P(E/S) 0,23(0,20,3)
P (E/S) = = 0,8 = 0, 2125
P(S)

P(E/S) = 0, 3
P (S) = 0, 2
P(E/S) = 0, 7
P (E/S) = 1 0, 2125 = 0, 7875
P(E/S) = 0, 2125
P S = 0, 8


P(E/S) = 0, 7875

P(S)P(E/S) 0,207
P (S/E ) = P(S)P(E/S)+P(S)P(E/S)
= 0,207+0,807875 = 0, 1818

Manuel Angel Barea Gmez 71


CAPTULO 3. PROBABILIDAD

Problema 3.35. La prueba de cribado del segundo trimestre de embarazo, tambin conocida como triple screening, se realiza
habitualmente entre las semanas 15 y 20 de la gestacin y trata de evaluar el riesgo de diversas alteraciones fetales. Esta prueba
presenta un 3 % de positivos, de los cules slo el 10 % se corresponden con bebs que tendrn realmente problemas. Si suponemos
que en la poblacin este grupo de patologas afecta al 1 % de los bebs:

(a) Determina la sensibilidad y especificidad de esta prueba.


(b) De todos los resultados negativos de esta prueba, qu porcentaje se confirman posteriormente como bebs sin ningn tipo de
problemas?

P (E T + ) = P (E/T + ) P(T + ) = 0, 1 0, 03 = 0, 003

P(ET + ) 0,003
P (T +/E ) = P(E) = 0,01 = 0, 3

P(T + )P(E)P(T +/E ) 0,03(0,010,3)


P (T + ) = P (E) P (T +/E ) + P E P (T +/E ) P (T +/E ) = = 0, 0272

P(E )
= 0,99

P (T /E ) = 1 P(T +/E ) = 1 0, 0272 = 0, 9727

P(T +/E ) = 0, 3
P (E) = 0, 01
P(T /E ) = 0, 97

P(T +/E ) = 0, 0272


P E = 0, 99


P(T /E ) = 0, 9727

P(E )P(T /E ) 0,990,9727


P (E/T ) = P(E)P(T /E )+P(E )P(T /E )
= 0,010,3+0,990,9727 = 0, 9968

Problema 3.36. Se ha realizado recientemente un ensayo clnico tipo dosis-respuesta para evaluar la eficacia de un determinado
tratamiento farmacolgico. Para ello se han seleccionado aleatoriamente 90 pacientes que se han dividido en 4 grupos (A, B, C y D)
siguiendo el siguiente criterio: el grupo A, formado por 18 pacientes, recibi el tratamiento a dosis de 50 mg/24h; el grupo B con el
30 % de los pacientes recibi el tratamiento a dosis de 75 mg/24h; el grupo C, formado por 20 pacientes, recibi el tratamiento a dosis
de 150 mg/24h; el resto de los pacientes form el grupo D, recibiendo el tratamiento a dosis de 200 mg/24h. La respuesta al tratamiento
fue eficaz para el 35 % de los pacientes del grupo A, el 55 % de los pacientes del grupo B, el 60 % de los pacientes del grupo C y el
75 % de los pacientes del grupo D.

(a) Si seleccionarnos aleatoriamente un paciente para el que no ha sido eficaz el tratamiento, cul es la probabilidad de que la
dosis recibida haya sido inferior a 100 mg/24h?
(b) Si seleccionarnos aleatoriamente un paciente para el que s ha sido eficaz el tratamiento, ordenar de mayor a menor las
probabilidades de que el paciente haya recibido las 4 dosis prescritas.

Manuel Angel Barea Gmez 72


CAPTULO 3. PROBABILIDAD

P(E/A) = 0, 35
P (A) = 0, 2
P(E/A) = 0, 65

P(E/B) = 0, 55
P (B) = 0, 3
P(E/B) = 0, 45

P(E/C) = 0, 60
P (C) = 0, 22
P(E/C) = 0, 40

P(E/D) = 0, 75
P (D) = 0, 28
P(E/D) = 0, 25

P(A)P(E/A) 0,20,65
P (A/E ) = P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D)
= 0,20,65+0,30,45+0,220,40+0,280,25 = 0, 3073

P(B)P(E/B) 0,30,45
P (B/E ) = P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D)
= 0,20,65+0,30,45+0,220,40+0,280,25 = 0, 3193

La probabilidad pedida es la suma de ambas 0, 626

P(A)P(E/A) 0,20,35
P (A/E ) = P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D) = 0,20,35+0,30,55+0,220,60+0,280,75 = 0, 1213

P(B)P(E/B) 0,30,55
P (B/E ) = P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D) = 0,20,35+0,30,55+0,220,60+0,280,75 = 0, 2859

P(C)P(E/C) 0,220,60
P (C/E ) = P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D) = 0,20,35+0,30,55+0,220,60+0,280,75 = 0, 2287

P(D)P(E/D) 0,280,75
P (D/E ) = P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D) = 0,20,35+0,30,55+0,220,60+0,280,75 = 0, 3639

Problema 3.37. Un centro de salud recibe pacientes de tres distritos de una gran ciudad (D1 ; D2 ; D3 ). El nmero de residentes
en D2 y D3 es el mismo, en cambio D1 tiene tantos residentes como D2 y D3 juntos. El centro de salud comenz hace 3 meses un
programa de vacunacin voluntaria para prevenir el virus de la gripe y hasta el momento se han vacunado el 30 % de los residentes
en D1 , el 20 % de los residentes en D2 y el 60 % de los residentes en D3 .

(a) Sabiendo que una persona no reside en D1 , cul es la probabilidad de que est vacunada?
(b) Sabiendo que una persona no se ha vacunado, cul es la probabilidad de que no sea residente en D2 ?

P(D1 ) = 0, 50


D2 = D3
P(D2 ) = 0, 25
D1 = D2 + D3
P(D3 ) = 0, 25

Manuel Angel Barea Gmez 73


CAPTULO 3. PROBABILIDAD

P(V/D1 ) = 0, 30
P (D1 ) = 0, 25
P(V/D1 ) = 0, 70

P(V/D2 ) = 0, 20
P (D2 ) = 0, 25
P(V/D2 ) = 0, 80

P(V/D3 ) = 0, 60
P (D3 ) = 0, 50
P(V/D3 ) = 0, 40

P (D2 V ) + P(D3 V ) = P(D2 ) P (V/D2 ) + P(D3 ) P(V/D3 ) = 0, 25 0, 2 + 0, 25 0, 6 = 0, 2

P(D2 )P(V/D2 ) 0,250,7


P (D2/V ) = P(D1 )P(V/D1 )+P(D2 )P(V/D2 )+P(D3 )P(V/D3 )
= 0,50,7+0,250,8+0,250,4 = 0, 28

La probabilidad solicitada es el suceso contrario al anterior por tanto ser 0, 69.

Problema 3.38. El sndrome de Burnout o sndrome de desgaste o de agotamiento personal es un resultante especfico del estrs
laboral crnico que se suele producir entre profesionales que mantienen una relacin de ayuda constante y directa con otras personas
(profesionales sanitarios, trabajadores sociales, profesores, etc.). Se ha realizado un estudio de este sndrome entre los mdicos de
una ciudad, encontrando una prevalencia del 33 % en los mdicos de Atencin Hospitalaria (AH) y del 44 % en los mdicos de
Atencin Primaria (AP). Por otro lado se sabe que, existen 3 veces ms mdicos de AH que de AP entre todos los que presentan este
sndrome. Con estos datos, determina los porcentajes de mdicos de AP y AH de esta ciudad.

AH = AP + 3 AP = 4 AP

P (E/AH ) = P(EAH) P (AH/E ) = P(EAH)
( (
P(AH) P(E)
P (E/AH ) = 0, 33
P (E/AP) = P(EAP) P (AP/E ) = P(EAP)
P (E/AP) = 0, 44

P(AP) P(E)

P(E/AH )P(AH) E/AH )P(AH)


P(E) = 4 P( P(E) P (E/AH ) P(AH) = 4 P(E/AP) P(AP)

P (E/AH ) P(AH) = 4 P(E/AP) [1 P(AH)] 0, 33 P(AH) = 4 0, 44 [1 P(AH)]

P(AH) = 0, 84

2, 09 P(AH) = 1, 76
P(AP) = 0, 16

Problema 3.39. Se denominan algias vertebrales a todos aquellos dolores de origen mecnico, no traumticos, que afectan a
cualquiera de las estructuras del aparato locomotor de la columna vertebral. Se ha podido demostrar que la higiene postural tiene
importantes repercusiones sobre la predisposicin, desencadenamiento y agudizacin de las algias vertebrales. Estudios recientes
han confirmado que no tienen una buena higiene postural el 85 % de los pacientes con algia vertebral y el 20 % de los pacientes que
no presentan algia vertebral. Sabiendo que la prevalencia de esta dolencia el del 10 %:

(a) Cul es la probabilidad de que una persona elegida al azar no tenga una buena higiene postural?
(b) Si observamos que una persona no tiene buena higiene postural, cul es la probabilidad de que presente algias vertebrales?

Manuel Angel Barea Gmez 74


CAPTULO 3. PROBABILIDAD

P(H/A) = 0, 3
P (A) = 0, 1
P(H/A) = 0, 7

P(H/A) = 0, 8
P A = 0, 9


P(H/A) = 0, 2

P H = P (A) P(H/A) + P A P (H/A) = 0, 1 0, 85 + 0, 9 0, 2 = 0, 265


 

P(A)P(H/A) 0,10,85
P (A/H ) = P(H )
= 0,265 = 0, 321

Manuel Angel Barea Gmez 75


C APTULO

4
Variables aleatorias

Problema 4.1. La variable aleatoria X se define como el nmero de trasplantes de rin que se realizan en un gran hospital cada
mes. La funcin de probabilidad de X viene dada por la tabla:

xi 0 1 2 3 4 5
pi a a b b 0,3 0,1

(a) Calcular a y b sabiendo que E(X) = 2, 8.


(b) Obtener y representar grficamente la Funcin de distribucin acumulativa.
(c) Calcular la moda, la mediana y la varianza de X.

2 a + 2 b + 0, 3 + 0, 1 = 1 2 a + 2 b = 0, 6 a = 0, 1
  
= =
E (X) = xi pi 2, 8 = a + 5 b + 4 0, 3 + 5 0, 1 a + 5 b = 1, 1 b = 0, 2

0 x<0


0, 1 0 x<1




0, 2 1 x < 2



F (x) = 0, 4 2 x < 3
0, 6 3 x < 4



0, 9 4 x < 5



1 x5

76
CAPTULO 4. VARIABLES ALEATORIAS

Funcin de distribucion

1.0
0.8
0.6
y

0.4
0.2
0.0

1 0 1 2 3 4 5 6

xi pi Pi xi p i (xi E (X))2 pi
0 0,1 0,1 0 0,78
1 0,1 0,2 0,2 0,32
2 0,2 0,4 0,4 0,13
3 0,2 0,6 0,6 0,01
4 0,3 0,9 1,2 0,43
5 0,1 1 0,5 0,48
2,8 2,16

Mo = 4

Me = 3
V (X)) = 2, 16

Problema 4.2. La variable aleatoria X representa el nmero de casos nuevos de SIDA diagnosticados en un hospital durante un da.
Su funcin de distribucin es:

0 x<0


0, 1 0 x<1




0, 2 1 x<2




0, 3 2 x < 3


F (x) =
0, 6 3 x < 4
0, 8 4 x < 5




0, 9 5 x < 6




1 x6

(a) Hallar la probabilidad de que en un da cualquiera sean diagnosticados por lo menos tres casos nuevos.
(b) Hallar la media de casos diagnosticados al da.
(c) HallarP[X>1/X<5].

La probabilidad de que diagnostiquen menos de 3 casos es del 0,3 segn la tabla de distribucin, por tanto, para al menos tres casos
nuevos ser P [X 3] = 1 0, 3 = 0, 7.

Manuel Angel Barea Gmez 77


CAPTULO 4. VARIABLES ALEATORIAS

E (X) = xi pi = 0 0, 1 + 1 0, 1 + 2 0, 1 + 3 0, 3 + 4 0, 2 + 5 0, 1 + 6 0, 1 = 3, 1
P[X>1/X<5] =

Problema 4.3. Un centro de salud dispone de 8 aparatos para la medicin de la glucosa en sangre de los cuales 3 estn defectuosos.

(a) Si un enfermero va probando los aparatos hasta que encuentra uno que funciona bien, Cul es el nmero medio de aparatos
que debe probar?
(b) Si otro enfermero selecciona aleatoriamente 4 de los aparatos, cul es la probabilidad de que funcionen bien al menos 3 de
ellos?

El primer apartado se resuelve con una distribucin geomtrica donde E (X) = 1p = 5/18 = 58 = 1, 6

4 4
   
B (4; 0, 625) P [X 3] = P [X = 3] + P[X = 4] = 3 1
0, 625 0, 375 + 0, 6254 0, 3750 = 0, 5
3 3

Problema 4.4. La variable aleatoria X mide el nmero de das que necesita un paciente para recibir el alta hospitalaria, despus
de realizarle una colecistectomia (extirpacin quirrgica de la vescula biliar) mediante abordaje lamparoscpico. La funcin de
probabilidad de X (incompleta) se muestra en la siguiente tabla:

xi 2 3 4 5 6 7
pi 0,34 0,46 0,06 0,04

Sabiendo que el valor medio de X es de 3,66 das:

(a) Determina y representa grficamente la funcin de distribucin de X.


(b) Sabemos que tras la operacin un paciente lleva ya hospitalizado 3 das, cul es la probabilidad de que reciba el alta antes
del 6 da.

xi 2 3 4 5 6 7
pi a 0,34 0,46 0,06 0,04 b

a + 0, 34 + 0, 46 + 0, 01 + 0, 05 + b = 1 a + b = 0, 1 a = 0, 088
  
= = La variable
E (X) = xi pi 3, 66 = 2 a + 3 0, 34 + 4 0, 46 + 5 0, 06 + 7 b 2 a + 7 b = 0, 26 b = 0, 012
aleatoria X representa el nmero de cesreas de urgencia que se realizan en un centro hospitalario a lo largo de un mes. Su funcin
de distribucin vienen dada por:

Funcin de distribucin
1.0
0.8
0.6
Y

0.4
0.2
0.0

1 2 3 4 5 6 7 8

Manuel Angel Barea Gmez 78


CAPTULO 4. VARIABLES ALEATORIAS

P [3 < X 6] = P [X 6] P[3 < X] = 0, 988 0, 088 = 0, 9

Problema 4.5. En los seres humanos, se producen mutaciones por la enfermedad de Huntington en aproximadamente 3 de cada
106 gametos.

(a) Cul es la probabilidad de que en 2 millones de gametos haya al menos una mutacin?.
(b) Y la probabilidad de que en un milln de gametos haya entre 2 y 5 mutaciones, inclusives?.

Podemos usar una distribucin de Poisson X P (6).

e6 60 6 61
P (X 1) = P (X = 0) + P(X = 1) = 0! +e 1! = 0, 9975

Podemos usar una distribucin de Poisson X P (3).

e3 32 3 33 3 34 3 35
P (2 X 5) = P (X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 2! +e 3! +e 4! +e 5! = 0, 7169

Problema 4.6. El nmero de visitas que recibe cada da un paciente enfermo que permanece ingresado en planta en un centro
hospitalario, se ajusta a una distribucin de Poisson, cuya media es 4 visitas/da los lunes, martes, mircoles y jueves, y de 2 visitas/da
los viernes, sbados y domingos.

(a) Si elegimos un da al azar, cul es la probabilidad de que dicho enfermo reciba al menos 3 visitas?
(b) Si suponemos independencia entre un da y otro, cul es la probabilidad de que dicho enfermo reciba durante el fin de semana
(sbado y domingo) ms de 3 visitas?

Para los das laborales, X P (4)

P (X 3) = 1 [P (X = 0) + P(X = 1) + P(X = 2)] = 1 (0, 01832 + 0, 07326 + 0, 14653) = 0, 76189

Para los fines de semana

X P (2) P (X 3) = 1 [P (X = 0) + P(X = 1) + P(X = 2)] = 1 (0, 13534 + 027067 + 0, 27067) = 0, 32339

Como todos los das tienen la misma oportunidad

P (X 3) = 74 0, 76189 + 37 0, 32339 = 0, 5739



L laboral
el segundo apartado es una probabilidad condicional, como son independientes, llamamos
F Fin de semana

P(L) 0,32339
P(X3) = 0,5739 = 0, 5665

Problema 4.7. En cierto centro hospitalario, el nmero de das que permanecen ingresados los pacientes tras una intervencin
quirrgica se ajusta a una distribucin de Poisson de media 2, 5 das . La siguiente tabla recoge el coste de hospitalizacin de los
pacientes en funcin del nmero de das de ingreso:

das 0 1 2 3 4 o ms
C 100 175 235 275 300

(a) Determinar el coste medio de la estancia postquirgica en este hospital.

Manuel Angel Barea Gmez 79


CAPTULO 4. VARIABLES ALEATORIAS

(b) Qu porcentaje de pacientes gastan 300?

= 0) = 0, 08208

P (X
= 1) = 0, 20521

P (X



= 2) = 0, 25651

P (X



= 3) = 0, 21376

P (X



= 4) = 0, 13360

P (X



= 5) = 0, 06680

P (X



Construimos nuestra funcin de distribucin X P (2, 5) P (X = 6) = 0, 02783
P (X = 7) = 0, 00994



= 8) = 0, 00310

P (X



= 9) = 0, 00862

P (X



= 10) = 0, 00022

P (X



= 11) = 0, 00005

P (X



= 12) = 0, 00001

P (X

Para hallar el coste medio Coste = 0 0, 08208 + 1 0, 20521 + ... + 11 0, 00005 + 12 0, 00001 = 235, 91

P (X 4) = 1 [P (X = 0) + P(X = 1) + P(X = 2) + P(X = 3)] = 1 (0, 08208 + 0, 20521 + 0, 25651 + 0, 21376) = 0, 2424

Problema 4.8. El Servicio de Vigilancia Epidemiolgica (SVE) registra anualmente los nuevos casos de aquellas enfermedades
que requieren control epidemiolgico, denominadas Enfermedades de Declaracin Obligatoria. Segn datos del SVE, los casos de
Legionelosis en Andaluca se ajustan a una distribucin de Poisson de media 8 casos al mes. A partir de estos datos responder a las
siguientes cuestiones:

(a) Cul es la probabilidad de que durante los prximos 10 meses encontremos que en ms de 2 meses el nmero de casos de
legionelosis sea inferior a 5?
(b) Cul es la probabilidad de que en el cmputo global de los prximos 5 aos encontremos que el nmero de casos de le-
gionelosis es superior a 450 e inferior a 500?

X P (8)

P (X < 5) = P (X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) = 0, 00268 + 0, 01073 + 0, 02862 + 0, 05725 + 0, 09160 =
0, 19088

Aproximamos a una distribucin Normal, con = 5 12 8 = 480

= 480

=
= = 480 = 21, 9
0.015
0.010

 
450480 500480
P (450 < X < 500) = P <Z<
y

21,9 21,9
0.005

P (1, 37 < Z < 0, 91) = P (Z < 0, 91) P(1, 37 < Z) = 0, 8186 0, 0853 = 0, 7333
0.000

400 450 500 550

Problema 4.9. La variable aleatoria X representa el nmero de cesreas de urgencia que se realizan en un centro hospitalario a lo
largo de un mes. Su funcin de distribucin vienen dada por:

Manuel Angel Barea Gmez 80


CAPTULO 4. VARIABLES ALEATORIAS

0 t<0


0, 1 0t <1




0, 4 1t <2



Fx (t) = 0, 65 2t <3
0, 85 3t <4



0, 94 4t <5




1 t5

(a) Determinar la moda, media y varianza de X. Interpreta los resultados obtenidos.


(b) Cul es la probabilidad de que a lo largo de los prximos 10 aos, transcurran al menos 20 meses sin necesidad de realizar
ninguna cesrea de urgencia?

xi pi Pi xi p i (xi E (X))2 pi
0 0,1 0,1 0 0,42
1 0,3 0,4 0,3 0,34
2 0,25 0,65 0,5 0,00
3 0,2 0,85 0,6 0,18
4 0,09 0,94 0,36 0,34
5 0,06 1 0,3 0,52
2,06 1,80

Mo = 1

E (X) = 2, 06
V (X)) = 1, 80

Para la segunda parte del problema aproximamos a una normal

= n p = 120
0, 1 = 12


0.12

= n p q = 120 0, 1 0, 9 = 3, 28

0.10
0.08
 
2012
P (X > 20) = P Z > 3,28 = P (Z > 2, 44) = 1 P(2, 44 < Z) = 1 0, 99266 = 0, 00734 y

0.06
0.04
0.02
0.00

0 5 10 15 20

Problema 4.10. Se sabe que la citastina sigue una N(0, 8; 0, 3) en los sanos y una N(2; 0, 4) en los individuos con insuficiencia renal.
Si consideramos 1, 4 como punto de corte para diagnosticar la insuficiencia renal:

(a) A qu percentil de cada distribucin corresponde este punto de corte? Es el test ms sensible que especfico?
(b) En una poblacin que tiene un 3 % de individuos con insuficiencia renal, obtener el valor predictivo positivo del test diagnstico
que considera enfermos a los individuos que tienen citastina por encima de 1,4.
 
1,40,8
Para los individuos sanos P(X < 1, 4) = P Z < 0,3 = P (Z < 2) = 0, 9772
 
Para los individuos con insuficiencia renal P (X < 1, 4) = P Z < 1,42
0,4 = P (Z < 1, 5) = 0, 0668.
Por los resultados anteriores es ms especfico.

Manuel Angel Barea Gmez 81


CAPTULO 4. VARIABLES ALEATORIAS

P(T +/E ) = 0, 93
P (E) = 0, 03
P(T /E ) = 0, 07

P(T +/E ) = 0, 02
P E = 0, 97


P(T /E ) = 0, 98

P(E)P(T +/E ) 0,030,93


P(E/T + ) = P(E)P(T +/E )+P(E )P(T +/E )
= 0,030,93+0,970,02 = 0, 5898

Problema 4.11. La concentracin de urea en sangre en una determinada enfermedad sigue una distribucin normal de media
24 mg/100cc y desviacin tpica desconocida. En un grupo de 100 enfermos se seleccionan aqullos cuya concentracin de urea est
comprendida entre 24 mg/100cc y 28 mg/100cc , resultando rechazados 66.

(a) Calcular el valor de la desviacin tpica de la distribucin.


(b) Si establecemos como nuevos lmites de seleccin las concentraciones de 22 mg/100cc y 30 mg/100cc, calcule ahora el porcentaje
de enfermos rechazados.

66
Del enunciado se establece que P(24 < X < 28) = 1 100 = 0, 44.

P 2424 < Z < 2824 = P Z < 4 P(0 < Z) = P Z < 4 = 0, 34 + P(Z < 0) = 0, 84
  

Dicha probabilidad se corresponde con una Z 1, por tanto = 4


2224
< Z < 3024 = P (Z < 1, 5) P(0, 5 < Z) = 0, 9332 0, 3085 = 0, 6247

P 4 4

Dicha probabilidad no es la de los rechazados, est ser 1-0,6247=0,3753

Problema 4.12. Una empresa ha realizado un estudio para valorar la calidad del agua que abastece a una poblacin. En el citado
estudio ha encontrado un promedio de 2 microorganismos por ml. de agua. Si extraemos al azar una muestra de agua en esta
poblacin:

(a) cul es la probabilidad de que al tomar 3 ml de agua, encontremos al menos 4 microorganismos?


(b) cul es la probabilidad de que al tomar 100 ml de agua, encontremos ms de 190 y menos de 220 microorganismos?

Utilizamos una distribucin de Poisson X P (6)

P (X 4) = 1 [P (X = 0) + P(X = 1) + P(X = 2) + P(X = 3)] = 1 (0, 0025 + 0, 0149 + 0, 0446 + 0, 0892) = 0, 8488

= n = 100
2 = 200

Aproximamos a una distribucin normal con
= n = 200 = 14, 14
 
190200 220200
P 14,14 <Z< 14,14 = P (0, 7 < Z < 1, 41) = P (Z < 1, 41) P(0, 7 < Z) = 0, 9207 0, 242 = 06787

Problema 4.13. La diuresis (flujo de orina) sigue una distribucin normal de media 105 cl/da en los hombres y de media 125 cl/daen
las mujeres, teniendo en ambos casos la misma desviacin tpica . Sabiendo que el percentil 90 de la distribucin de los hombres
coincide con el percentil 23 de la distribucin de las mujeres, puedes encontrar el valor de y el del percentil en el que coinciden
ambas distribuciones?

Manuel Angel Barea Gmez 82


CAPTULO 4. VARIABLES ALEATORIAS

Para la distribucin de los hombres P90 se corresponde con una z = 1, 28


Para las mujeres P23 se corresponde con una z = 0, 74

1, 28 = x105 x = 1, 28 + 105
 
= Resolviendo 10
0, 74 = x125

x = 0, 74 + 125

El percentil donde coinciden son los dos anteriores.

Problema 4.14. La albmina es la protena que tiene mayor concentracin en el plasma. Dado que se produce en el hgado, la
disminucin de la albmina srica puede ser producto de alguna enfermedad heptica. Sabiendo que la determinacin de albmina
en plasma (medida en g/dl) sigue en individuos sanos una distribucin N(4,4; 1 ) y en los pacientes con patologa heptica una
distribucin N(2,8;2), hemos construido una prueba diagnostica con el siguiente criterio: Considerar como positivas las determi-
naciones de albmina inferiores a 3, 4 gr/dl . Teniendo en cuenta que el 2 % de la poblacin presenta alguna patologa heptica y que
nuestra prueba diagnstica tiene una sensibilidad del 80 % y una especificidad del 90 % determinar:

(a) Los valores1 y 2 que aparecen en el enunciado.

(b) La probabilidad de que un individuo seleccionado al azar tenga una determinacin de albmina inferior a 4 gr/dl
(c) El nmero ms probable de enfermos que encontraremos dentro de un grupo de 8 individuos, seleccionados al azar entre todos
los que han dado positivo en esta prueba.

P(T +/E ) = 0, 8
P (E) = 0, 02
P(T /E ) = 0, 2

P(T +/E ) = 0, 01
P E = 0, 98


P(T /E ) = 0, 9

Las personas sanas presentan un porcentaje de padecer la enfermedad del 10 %.


 
0, 1 = P 3,44,4
2 < Z , por las tablas le corresponde una Z = 1, 28

3,44,4
2 = 1,28 = 0, 78125 gr/dl

De igual modo, para los enfermos, presentan la enfermedad el 80 %.


 
0, 8 = P 3,42,8
1 < Z , por las tablas le corresponde una Z = 0, 84

3,42,8
1 = 0,84 = 0, 714 gr/dl

Si cambiamos el criterio de determinacin:


Para los sanos
 
44,4
P (X < 4) = P Z < 0,781 = P (Z < 0, 512) = 0, 3050

Para los enfermos


 
42,8
P (X < 4) = P Z < 0,714 = P (Z < 1, 68) = 0, 9535, esta ser su sensibilidad.

Manuel Angel Barea Gmez 83


CAPTULO 4. VARIABLES ALEATORIAS

P(T +/E ) = 0, 9535


P (E) = 0, 02
P(T /E ) = 0, 0465

P(T +/E ) = 0, 3050


P E = 0, 98


P(T /E ) = 0, 6950

P (T + ) = P (E) P(T +/E ) + P E P (T +/E ) = 0, 02 0, 9535 + 0, 98 0, 3050 = 0, 31797




Para el tercer apartado:

P(E)P(T +/E ) 0,020,8


P (E/T + ) = P(E)P(T +/E )+P(E )P(T +/E )
= 0,020,8+0,980,1 = 0, 14

n = 8 0, 14 1

Problema 4.15. Casi la mitad del magnesio corporal est presente en el hueso, donde juega un papel estructural (al igual que el
calcio, el fosfato y varias protenas). Sabemos que en poblacin general la concentracin de magnesio srico (medida en mg/dl) se
distribuye segn una ley Normal, donde el 80 % central de los valores se encuentran en el intervalo (2, 08 mg/dl; 2, 72 mg/dl).

(a) Determinar el valor de los parmetros y de la citada distribucin normal.


(b) Si seleccionamos aleatoriamente 10 individuos, cul es la probabilidad de que como mnimo 3 de ellos tengan una concen-
tracin de magnesio inferior a 2, 3 mg/dl?
(c) Si seleccionamos aleatoriamente 1200 individuos todos con una concentracin de potasio dentro del intervalo (2, 08 mg/dl
;2, 72 mg/dl), cul es la probabilidad de que ms de 350 tengan un nivel de magnesio superior a 2, 5 mg/dl?

Como la probabilidad est distribuida centralmente, quiere decir que tanto por encima como por debajo tenemos un 10 %, segn las
tablas esto les corresponde los siguientes valores de Z.
(
1, 28 = 2,08
= 2, 4 mg/dl

Resolviendo
2,72 = 0, 25 mg/dl
1, 28 =

La probabilidad
 
2,32,4
P (X < 2, 3) = P Z < 0,25 = P (Z < 0, 4) = 0, 3446

Para 10 individuos que presentan al menos 3

X B(10; 0, 3446)

P (X 3) = 1 [P (X = 0) + P(X = 1) + P(X = 2)]

10 10 10
      
1 0, 34460 0, 65544 + 0, 34461 0, 65543 + 0, 34462 0, 65542 = 0, 7266
0 1 0

La probabilidad de tener ms de 2, 5 mg/dl es


 
2,52,4
P (X > 2, 5) = P Z > 0,25 = P (Z > 0, 4) = 0, 3446

Manuel Angel Barea Gmez 84


CAPTULO 4. VARIABLES ALEATORIAS

= n p = 1200
0, 3446 = 413, 52

Para 1200 individuos
= n p q = 1200 0, 3446 0, 6554 = 16, 44
 
350413,52
P (X > 350) = P Z > 16,44 = P (Z > 3, 86) = 0, 9994

Problema 4.16. La longitud del fmur del feto hacia la semana 20 del embarazo, obtenida mediante ecografa abdominal, sigue una
distribucin Normal de media 32 mm. Sabiendo que el percentil 67 dicha distribucin se encuentra en el valor 33, 5 mm:

(a) Entre qu valores se encuentra el 80 % central de la distribucin?


(b) Si se programan 20 ecografas de este tipo, en cuntas de ellas cabe esperar que la longitud del fmur del feto se encuentre
entre 28 mm. y 38 mm.?

X 33,532
P60 Z = 0, 25 0, 25 = = 0,25 = 3, 41

El 80 % central se encuentra en valores |Z| = 1, 28


(
1, 28 = X32
3,41 X = 27, 62
1, 28 = X32
3,41 X = 36, 37

 
2832 3832
P (28 < X < 38) = P 3,41 <Z< 3,41 = P (1, 17 < Z < 1, 75) = 0, 8389

n p = 20 0, 8389 = 16, 7

Problema 4.17. La tensin arterial sistlica (TAS) de los pacientes ingresados en UCI se ajusta a una distribucin Normal de media
= 130 mmHg y sabemos que el 95 % de estos pacientes mantiene unas cifras de TAS entre 110 mmHg y 150 mmHg.

(a) Qu porcentaje de pacientes presentan una cifra de TAS superiores a 120 mmHg?
(b) Si seleccionamos aleatoriamente 20 pacientes, cul es la probabilidad de que todos presenten una TAS por debajo de
150 mmHg?

Como la probabilidad est distribuida centralmente, quiere decir que tanto por encima como por debajo tenemos un 2,5 %, segn las
tablas esto les corresponde los siguientes valores de Z.

1, 96 = 110130

= 10, 2 mmHg

Resolviendo
1, 96 = 150130

   
120130 150130
P (X > 120) = P Z > 10,2 = P (Z > 0, 98) = 0, 8365 P (X < 150) = P Z < 10,2 = P (Z < 1, 96) = 0, 975

Para todos los pacientes, 20 en nuestro caso, ser dicha probabilidad multiplicada 20 veces, es decir 0, 97520 = 0, 6026

Problema 4.18. Una determinada enfermedad suele generar en los pacientes 2 sntomas que denominaremos S1 y S2 . Sabemos que
el 20 % de los pacientes presentan nicamente S1 , el 10 % presentan nicamenteS2 y el 40 % presentan ambos sntomas al mismo
tiempo.

(a) Cul es la probabilidad de que un paciente elegido al azar presente al menos uno de los 2 sntomas?

Manuel Angel Barea Gmez 85


CAPTULO 4. VARIABLES ALEATORIAS

(b) Si elegimos aleatoriamente 5 pacientes Cul es la probabilidad de que alguno de ellos presente uno y slo uno de los 2
sntomas?

P (S1 S2 ) = P (S1 ) + P(S2 ) P(S1 S2 ) = 0, 6 + 0, 5 0, 4 = 0, 7

Para que se produzca tan slo uno de los sintomas tenemos 0, 2 + 0, 1 = 0, 3, usando una binomial X B (5; 0, 3)

P (X > 0) = 1 P(X = 0) = 1 0, 16807 = 0, 8319

Problema 4.19. El tiempo de vida, T (en das) de una bacteria tiene la funcin de densidad

1 t
e k

10 st > 0
f (t) =
0 en el resto
dondek es una constante positiva. Calclense:

(a) el valor de k
(b) la esperanza de vida de dicha bacteria.

Como es una distribucin exponencial k = 10.


1
E (X) = = 10

Problema 4.20. El 75 % de los alumnos matriculados en la asignatura de Bioestadstica suele entregar ficha. De los que entregan
ficha, aprueba habitualmente el 80 % y de los que no, el 40 %. Se supone que cada uno estudia por su cuenta y que no consulta a
nadie a la hora de entregar ficha. Adems, todos se suelen presentar al examen.

(a) Cul es la probabilidad de que una persona, elegida al azar entre las matriculadas en la asignatura, apruebe el examen?
(b) Habiendo 150 alumnos matriculados, calcular el nmero esperado de aprobados entre ellos.
(c) Hallar la probabilidad de que, entre los 150 matriculados, aprueben el examen ms de 110. Cul es la probabilidad de que
aprueben entre 100 y 110 alumnos?

P(A/F ) = 0, 8
P (F) = 0, 75
P(A/F ) = 0, 2

P(A/F ) = 0, 4
P F = 0, 25


P(A/F ) = 0, 6

Manuel Angel Barea Gmez 86


CAPTULO 4. VARIABLES ALEATORIAS

P (A) = P (F) P (A/F ) + P F P(A/F ) = 0, 75 0, 8 + 0, 25 0, 4 = 0, 65




= n p = 150
0, 65 = 97, 5

De 150 alumnos aprueban 150 0, 65 = 97, 5.
= n p q = 150 0, 65 0, 35 = 5, 84
Aproximamos a una normal X N (97, 5; 5, 84)
 
11097,5
P (X > 110) = P Z > 5,84 = P (Z > 2, 14) = 0, 0162
 
10097,5 11097,5
P (100 < X < 110) = P 5,84 <Z< 5,84 = P(0, 42 < Z < 2, 14) = 0, 321

Problema 4.21. Suponiendo que la probabilidad de que un nio que nace sea varn es 0, 51, hallar la probabilidad de que una
familia de 6 hijos tenga

(a) por lo menos una nia.


(b) por lo menos un nio.

B (6; 0, 49)
X

6
  
P (X 1) = 1 P(X = 0) = 1 0, 490 0, 516 = 0, 9824
0

B (6; 0, 51)
X

6
  
P (X 1) = 1 P(X = 0) = 1 0 6
0, 51 0, 49 = 0, 9861
0

Problema 4.22. La anchura en mm de una poblacin de colepteros sigue una distribucin N( , ). Se estima que el 77 % de la
poblacin mide menos de 12 mm. y que el 84 % mide ms de 7 mm.

(a) Cul es la anchura media de la poblacin?


(b) Hallar .

Por las tablas se establece que el 77 % por debajo le corresponde una Z = 0, 74 por encima del 84 % Z = 1, podemos plantear un
sistema de ecuaciones:
(
0, 74 = 12
= 9, 87

Resolviendo
1 = 7 = 2, 87

Problema 4.23. En una gran ciudad, el 60 % de la poblacin fuma, el 6 % tiene bronquitis crnica, y el 4 % fuma y padece bronquitis
crnica.

(a) Hallar la probabilidad de que un fumador tenga bronquitis crnica.


(b) Hallar la probabilidad de que un no fumador tenga bronquitis crnica.
(c) Elegimos al azar 120 personas de la ciudad. Hallar la probabilidad de que ms de 80 de ellas sean fumadores.

P(BF) 0,04
P (B/F ) = P(F) = 0,6 = 0, 066

Manuel Angel Barea Gmez 87


CAPTULO 4. VARIABLES ALEATORIAS

P(B)[P(F)P(B/F )] 0,06(0,60,066)
= 0, 051

P (B) = P (F) P(B/F ) + P F P (B/F ) P (B/F ) = P(F )
= 0,4

Aproximamos a una normal X N (72; 5, 36)


 
8072,5
P (X > 80) = P Z > 5,36 = P (Z > 1, 4) = 0, 0808

Problema 4.24. La probabilidad de que un individuo sufra una reaccin por una inyeccin de un determinado suero es de 0,001.
Determine la probabilidad de que de un total de 2000 individuos tengan reaccin:

(a) Exactamente tres.


(b) Ms de dos individuos.

Aproximamos a una distribucin de Poisson X P(2), ya que = 0, 001 2000 = 2.

e2 23
P (X = 3) = 3! = 0, 1804

P (X > 2) = 1 [P (X = 0) + P(X = 1) + P(X = 2)] = 1 (0, 1353 + 0, 2707 + 0, 2707) = 0, 3233

Problema 4.25. Una asociacin de cardiologa afirma que solo el 10 % de los adultos mayores de 30 aos logran completar una
prueba de esfuerzo fsico especialmente diseada para ellos. Se toman al azar cuatro personas mayores de 30 aos y se someten a
la prueba de esfuerzo. Calcule la probabilidad de que:

(a) Dos personas pasen la prueba.


(b) Ninguna persona pase la prueba.
(c) Una sola persona no pase la prueba.
(d) Ms de una pero menos de cuatro personas pasen la prueba.
(e) Una o ms pero tres o menos, no pasen la prueba.
(f) Si se toma una muestra de 50 personas, cul es la probabilidad de que al menos dos personas pasen la prueba.

Se trata de una distribucin binomial X B (4; 0, 1)

4
 
P (X = 2) = 0, 12 0, 92 = 0, 0486
2

4
 
P (X = 0) = 0, 10 0, 94 = 0, 6561
0

4
 
P (X = 3) = 0, 13 0, 91 = 0, 0036
3

4 4
   
P (1 < X < 4) = P (X = 2) + P(X = 3) = 0, 12 0, 92 + 0, 13 0, 91 = 0, 0522
2 3

En el apartado e, la distribucin ser X B (4; 0, 9)

4 4 4
     
1 3 2 2
P (1 X 3) = P (X = 1) + P(X = 2) + P(X = 3) = 0, 9 0, 1 + 0, 9 0, 1 + 0, 93 0, 11 = 0, 6512
1 2 3

Manuel Angel Barea Gmez 88


CAPTULO 4. VARIABLES ALEATORIAS

El ltimo apartado se puede aproximar a una normal X N (5; 2, 12)


 
15
P (X > 1) = P Z > 2,12 = P (Z > 1, 88) = 0, 9699

Problema 4.26. La diabetes mellitus tipo 1 y la enfermedad celaca (EC) son alteraciones crnicas que comparten susceptibilidad
gentica, presencia de anticuerpos rgano especficos e influencia de factores ambientales. Un estudio sobre este tipo de pacientes
dio como resultado que el 6,4 % de los diabticos tienen EC. Se desea saber:

(a) Si se eligen ocho diabticos al azar, cul es la probabilidad de que ms de uno de ellos sea celaco?
(b) Si se eligen cinco diabticos al azar, cul es la probabilidad de que exactamente el primero y el ltimo sean celacos y los
dems no?

Es una distribucin binomial X B (8; 0, 064)

8 8
    
P(X > 1) = 1 [P (X = 0) + P(X = 1)] = 1 0, 0640 0, 9368 + 0, 0641 0, 9367 = 0, 089
0 1

El apartado b su probabilidad ser 0, 064 0, 936 0, 936 0, 936 0, 064 = 0, 00336

Problema 4.27. Al secuenciar una protena sintetizada in vitro se encuentra que est compuesta de alanina y leucina. Sabiendo
que la alanina supone el 60 % de los aminocidos que la componen, cul es la probabilidad de que:

(a) Al menos cuatro de los cinco primeros aminocidos de la cadena sean leucina.
(b) Exactamente tres de los cinco primeros aminocidos de la cadena sean alanina.

Es una distribucin binomial X B (5; 0, 6)

5 5
   
P (X 4) = P (X = 4) + P(X = 5) = 0, 64 0, 41 + 0, 65 0, 40 = 0, 087
4 5

P (A A A L L) = 0, 63 0, 42 = 0, 03456

Problema 4.28. Se supone que la probabilidad de tener un hijo albino en matrimonios normales portadores del gen para el albinismo
es 1/4. Calcule la probabilidad de que en una de estas familias, compuesta por cinco hijo:

(a) Ninguno sea albino.


(b) Al menos uno sea albino.
(c) Exactamente el primero y el tercero sean albinos y los dems no.
(d) No ms de dos sean albinos.

X B (5; 0, 25)

5
 
P (X = 0) = 0, 250 0, 755 = 0, 2373
0

5
 
P (X 0) = 1 P(X = 0) = 1 0, 250 0, 755 = 0, 7627
0

Manuel Angel Barea Gmez 89


CAPTULO 4. VARIABLES ALEATORIAS

P A A A A A = 0, 252 0, 753 = 0, 02636




5 5 5
     
P (X < 3) = P (X = 0) + P(X = 1) + P(X = 2) = 0 5
0, 25 0, 75 + 1 4
0, 25 0, 75 + 0, 252 0, 753 = 0, 8965
0 1 2

Problema 4.29. Una determinada planta nuclear desprende una cantidad detectable de gases radiactivos, un promedio de dos veces
al mes.

(a) Halle la probabilidad de que no se produzcan tales emisiones durante un perodo de tres meses.
(b) Halle la probabilidad de que haya, como mximo, cuatro de tales emisiones durante ese perodo.
(c) Cul es el nmero esperado de emisiones durante tres meses? Si han sido detectadas 12 o ms emisiones, puede pensarse
que habra que dudar del promedio de dos al mes?

X P (6)

e6 60
P (X = 0) = 0! = 0, 00247

P (X 4) = P (X = 0) + P (X = 1) + P(X = 2) + P (X = 3) + P (X = 4) = 0, 0025 + 0, 0149 + 0, 0446 + 0, 0892 + 0, 1339 = 0, 2851

E (X) = = 6

P (X 12) = 0, 020092

Al ser una probabilidad pequea es razonable dudar del promedio.

Problema 4.30. Tras una serie de anlisis se determin que el nmero medio por cm3 de una cierta especie de bacterias contenidas
en el agua de un embalse es de 4.

(a) Cul es la distribucin de probabilidad del nmero de bacterias de esa especie en una gota de agua que mide 1/10 cm3 ?
(b) Cul es la probabilidad de no encontrar ninguna bacteria de esa especie en una gota de agua?
(c) Y la de encontrar al menos 2 bacterias?

X P (0, 4)
0,4 0
P (X = 0) = e 0!0,4 = 0, 6703
h 0,4 0 0,4 1
i
P (X 2) = 1 [P (X = 0) + P(X = 1)] = 1 e 0!0,4 + e 1!0,4 = 1 [0, 6703 + 0, 2681] = 0, 0616

Problema 4.31. Un agente de seguros vende plizas individuales contra cierto tipo de accidentes. Una encuesta estima que a lo
largo de un ao cada persona tiene una posibilidad de cada mil de ser vctima de un accidente del tipo que cubre la pliza y que el
agente podr vender una media de cuatro mil plizas de seguros de este tipo al ao. Se pide:

(a) Probabilidad de que el nmero de accidentes no pase de cuatro.


(b) Nmero de accidentes esperados por ao.
(c) Probabilidad de que ocurran ms de dos accidentes por ao.
(d) Probabilidad de que ocurran doce accidentes por ao.

Manuel Angel Barea Gmez 90


CAPTULO 4. VARIABLES ALEATORIAS

X P (4)

E (X) = = n p = 4000 0, 001 = 4

P (X 4) = P (X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) = (0, 0183 + 0, 0733 + 0, 1465 + 0, 1954 + 0, 1954) =
0, 6289

P (X > 2) = 1 [P (X = 0) + P(X = 1) + P(X = 2)] = 1 [0, 0183 + 0, 0733 + 0, 1465] = 0, 7619

e12 412
P(X = 12) = 12! = 0, 00064

Problema 4.32. Una especie de ranas pone entre 0 y 100 huevos en cada puesta. Se tiene una poblacin de 380 ranas hembras y
se sabe que la puesta de huevos sigue una distribucin normal de media 55 y desviacin tpica 10.

(a) Calcule la probabilidad de que una rana ponga ms de 50 huevos.


(b) Cuntas ranas de las 380 cabe esperar que pongan entre 65 y 80 huevos?
(c) Si se decide seleccionar al 5 % de las ranas ms ponedoras para la investigacin, cul es el mnimo nmero de huevos que
debe poner una rana para ser seleccionada?

X N (55; 10)
0.04
0.03

5055
P (X > 50) = P Z > = P (Z > 0, 5) = 0, 6915

10
0.02
y

0.01
0.00

30 40 50 60 70 80

x
0.04
0.03

6555 8055
P (65 < X < 80) = P = P (1 < Z < 2, 5) = 0, 1525

10 <Z< 10
0.02
y

0.01
0.00

30 40 50 60 70 80

x
El 5 % de las ranas ms ponedores le corresponde una Z = 1, 645 por tanto 1, 645 = x = 1, 645 10 + 55 71 huevos

Problema 4.33. En la observacin del nmero de glbulos rojos (en millones) de los habitantes de una gran ciudad se observ que
seguan aproximadamente una distribucin normal de media 4,5 y desviacin tpica 0,5. Se pide:

(a) Probabilidad de que un habitante tomado al azar tenga ms de cinco millones de glbulos rojos.
(b) Tanto por ciento de habitantes con menos de 3,75 millones.
(c) Nmero mnimo de glbulos rojos del 20 % ms alto de la ciudad.

Manuel Angel Barea Gmez 91


CAPTULO 4. VARIABLES ALEATORIAS

(d) Nmero mximo de glbulos rojos del 10 % ms bajo de la ciudad.

X N (4, 5; 0, 5)
0.8
0.6

 
54,5
P (X > 5) = P Z > 0,5 = P (Z > 1) = 0, 1587
0.4
y

0.2
0.0

3.0 3.5 4.0 4.5 5.0 5.5 6.0

x
0.8
0.6

 
3,754,5
P (X < 3, 75) = P 0,5 < Z = P (1, 5 < Z) = 0, 0668
0.4
y

0.2
0.0

3.0 3.5 4.0 4.5 5.0 5.5 6.0

x
0.8
0.6

Se trata de una Z = 0, 84
0, 84 = x4,5
0,5 x = 4, 92
0.4
y

0.2
0.0

3.0 3.5 4.0 4.5 5.0 5.5 6.0

x
0.8
0.6

Se trata de una Z = 1, 28
1, 28 = x4,5
0,5 x = 3, 86
0.4
y

0.2
0.0

3.0 3.5 4.0 4.5 5.0 5.5 6.0

Problema 4.34. Un bilogo comprob que la probabilidad de que al inyectar a una rata un determinado producto sobreviviera
despus de una semana era de 0,5. Si el bilogo inyecta el producto a un lote de cien ratas, se pide calcular la probabilidad de que
vivan:

(a) Ms de sesenta y cinco.


(b) Entre cuarenta y sesenta.
(c) Menos de treinta.
(d) Ms de cuarenta y cinco.

Manuel Angel Barea Gmez 92


CAPTULO 4. VARIABLES ALEATORIAS

= n p = 0, 5
100 = 50

Aproximamos a una normal con X N (50; 5)
= n p q = 0, 5 100 0, 5 = 5
0.08
0.06

6550
P (X > 65) = P Z > = P (Z > 3) = 0, 00135

5
0.04
y

0.02
0.00

30 40 50 60 70

x
0.08
0.06

4050 6050
P (40 < X < 60) = P = P (2 < Z < 2) = 0, 9544

5 <Z< 5
0.04
y

0.02
0.00

30 40 50 60 70

x
0.08
0.06

3050
P (X < 30) = P < Z = P (4 < Z) = 0, 00003

5
0.04
y

0.02
0.00

30 40 50 60 70

x
0.8
0.6

4550
P (X > 45) = P Z > = P (Z > 1) = 0, 8413

5
0.4
y

0.2
0.0

3.0 3.5 4.0 4.5 5.0 5.5 6.0

Problema 4.35. En una cierta prueba, el 35 % de la poblacin examinada obtuvo una nota superior a 6; el 25 %, entre 4 y 6, y
el 40 %, inferior a 4. Suponiendo que las notas siguen una distribucin normal, halle la nota media y la desviacin tpica. Qu
porcentaje de la poblacin tiene una nota que se diferencie de la media en menos de dos unidades?

Para X = 6 Z = 0, 385 y X = 4 Z = 0, 255


(
0, 385 = 6 = 4, 796

Resolviendo X N (4, 796; 3, 125)
0, 255 = 4 = 3, 125

Manuel Angel Barea Gmez 93


CAPTULO 4. VARIABLES ALEATORIAS
0.12
0.10

 
2,7964,796 6,7964,796
P (2, 796 < X < 6, 796) = P 3,125 <Z< 3,1255 = P (0, 64 < Z < 0, 64) = 0, 4778
0.08
y

0.06
0.04

0 2 4 6 8 10

Problema 4.36. Cul sera la probabilidad de que en 1000 tiradas de un dado salga el nmero 5, ms de 150 veces y menos de
200?

= n p = 61 1000
q = 166, 67
(
Aproximamos a una normal con X N (166, 67; 11, 78)
= n p q = 16 1000 65 = 11, 78
0.035
0.030
0.025

 
150166,67 200166,67
0.020

P (150 < X < 200) = P 11,78 <Z< 11,78 = P (1, 41 < Z < 2, 83) = 0, 9184
y

0.015
0.010
0.005
0.000

120 140 160 180 200

Problema 4.37. El dimetro de una vlvula cardaca en una especie animal se distribuye normalmente con media de 3, 5 mm y una
desviacin tpica de 0, 04 mm.

(a) Cul es la proporcin de vlvulas con un dimetro mayor de 3,425?


(b) Cul es la probabilidad de que una vlvula tenga un dimetro entre 3,4 y 3,6 mm?
(c) Cul es el valor del dimetro mnimo por debajo del cual se encuentra el 20 % de las vlvulas?

X N (3, 5; 0, 04)

Manuel Angel Barea Gmez 94


CAPTULO 4. VARIABLES ALEATORIAS
10
8

 
3,4253,5
P (X > 3, 425) = P Z > = P (Z > 1, 875) = 0, 9696
6

0,04
y

4
2
0

3.3 3.4 3.5 3.6 3.7

x
10
8

 
3,43,5 3,63,5
P (3, 4 < X < 3, 6) = P = P (2, 5 < Z < 2, 5) = 0, 9876
6

0,04 <Z< 0,04


y

4
2
0

3.3 3.4 3.5 3.6 3.7

x
10
8

Se trata de una Z = 0, 2
6

0, 2 = x3,5
0,04 x = 3, 47
y

4
2
0

3.3 3.4 3.5 3.6 3.7

Problema 4.38. Durante cierta epidemia de gripe, enferma el 30 % de la poblacin. En un aula con 120 estudiantes, cul es la
probabilidad de que:

(a) Al menos 40 estudiantes padezcan la enfermedad.


(b) Haya exactamente 50 estudiantes con gripe.

= n p = 0, 3
120 = 36

Aproximamos a una normal con X N (36; 5, 02)
= n p q = 0, 3 120 0, 7 = 5, 02
0.08
0.06

 
4036
P (X 40) = P Z > 5,02 = P (Z 0, 69) = 0, 2451
0.04
y

0.02
0.00

20 30 40 50 60

120
 
P (X = 50) = 0, 350 0, 770 = 0, 0018
50

Manuel Angel Barea Gmez 95


CAPTULO 4. VARIABLES ALEATORIAS

Problema 4.39. Se fumiga una plantacin de zanahorias con un producto txico. Se sabe que la cantidad de producto que absorbe
una zanahoria (en mg) es una variable aleatoria con distribucin normal de media 4 y desviacin tpica 1,5. Se considera que una
zanahoria est contaminada si ha absorbido ms de 6 mg del producto txico.

(a) Calcule la probabilidad de que una zanahoria seleccionada al azar haya sido contaminada en el proceso de fumigacin.
(b) Si se seleccionan al azar 5 zanahorias, cul es la probabilidad de que al menos dos de ellas estn contaminadas?

La probabilidad de que una zanahoria est contaminada es:


0.25
0.20

 
64
P (X > 6) = P Z > = P (Z > 1, 33) = 0, 0918
0.15

1,5
y

0.10
0.05
0.00

0 2 4 6 8

5 5
    
P (X 2) = 1 [P (X = 0) + P(X = 1)] = 1 0, 09180 0, 90825 + 0, 09181 0, 90824 = 0, 0698
0 1

Manuel Angel Barea Gmez 96


C APTULO

5
Intervalos de confianza y contrastes de hiptesis
paramtricas de una poblacin.

Problema 5.1. Los valores de LH, obtenidos en una muestra aleatoria, de mujeres en estado de gestacin son los siguientes: 154,
220, 206, 187, 182, 173, 169, 207, 215, 211, 165, 194, 199, 184, 177, 213, 189, 180, 191, 146. Los valores estn expresados en
mlU/ml. y se consideran distribuidos Normalmente.

(a) Construir un intervalo de confianza para el valor medio de LH, para unos niveles de confianza del 95 % y 99 % respectivamente.
(b) Para los mismos niveles de confianza, obtener un intervalo de confianza para la varianza poblacional de los valores de LH.

xi 154+220+...+191+146

x= n = 20 = 188, 10
2
(152188,10) +(220188,10)2 +...+(191188,10)2 +(146188,10)2
2

Para la poblacin dada tenemos (xi x)
s2 = (n1) = (201) = 422, 73

s = 20, 56

h i
IC95 % ( ) = x tn1;/2 sn = 188, 10 2, 093 20,56

20
= 188, 10 9, 62 IC95 % = [178, 41; 197, 72]
h i
IC99 % ( ) = x tn1;/2 sn = 188, 10 2, 861 20,56

20
= 188, 10 13, 15 IC99 % = [174, 95; 201, 25]

 
(n1)s2 2
h i
19422,72 19422,72
IC95 % 2 = ; 2(n1)s 32,85 ; 8,91 = 2 [244, 50; 901, 44]

2
(n1);
=
/2 (n1);(1/2)

 
(n1)s2 2
h i
19422,72 19422,72
IC99 % 2 = ; 2(n1)s 38,58 ; 6,84 = 2 [208, 18; 1172, 42]

2
(n1);
=
/2 (n1);(1/2)

Problema 5.2. La presin arterial diastlica para mujeres de 18 a 74 aos de edad sigue una distribucin normal, donde conocemos
que el percentil 5 es 57 mmHg y que el percentil 95 es 97 mmHg.

(a) Si tomamos al azar un sujeto de esta poblacin, cul es la probabilidad de que tenga una presin arterial diastlica superior
a 70 mmHg?
(b) Si tomamos al azar una muestra de 25 sujetos en esta poblacin, cul es la probabilidad de que su media muestral sea inferior
a 80 mmHg?

Para P5 Z = 1, 645 y P95 Z = 1, 645

97
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.

1, 645 = 97
(

= 83, 55

57 Resolviendo N (77, 01; 12, 15)
X
1, 645 = = 8, 20
0.030
0.025

 
7077,01
0.020

P (X > 70) = P Z > 12,15 = P (Z > 0, 57) = 0, 7157


y

0.015
0.010
0.005
0.000

40 60 80 100 120

Al ser para una media muestral:


   
x 8077,01
P (X < 80) = P Z <
/ n =P
12,15/ 25 = P (Z < 1, 23) = 0, 8907

Problema 5.3. Los siguientes datos representan los porcentajes de mejoras en el nmero de lesiones por acn despus de 16
semanas de tratamiento, de 10 individuos con este problema:

48,6 49,4 50,1 49,8 50,6 50,8 47,1 52,5 49,0 46,7

(a) Calcular un intervalo de confianza del 90 % para el porcentaje medio.


(b) Calcular un intervalo de confianza del 99 % para la desviacin tpica de los porcentajes.

48,6+49,4+...+49,0+46,7

xi
x= n = 10 = 49, 46
2
(48,649,46) +(49,449,46)2 +...+(49,0188,10)2 +(46,7188,10)2
2

(xi x)
s2 = (n1)
= (101)
=3

s = 1, 73

h i
1,73
IC90 % ( ) = x tn1;/2 sn = 49, 46 1, 833 10
= 49, 46 1 IC90 % ( ) = [48, 46; 50, 46]
 
(n1)s2 (n1)s2
h i
93 93
IC99 % 2 = ; 2 23,59 ; 1,73 = 2 [1, 14; 15, 6]

2
(n1);
=
/2 (n1);(1/2)

IC99 % ( ) = [1, 06; 3, 94]

Problema 5.4. Se desea precisar el porcentaje de individuos que sufren incontinencia urinaria de entre los internados en un hospital
y, para ello, se tom una muestra de 120 pacientes de los cuales 28 presentaron ese problema.

(a) Entre qu valores est tal porcentaje (95 %)?.


(b) Se ha conseguido una precisin del 2 % en la estimacin?.
(c) Si no se ha conseguido, cuntos individuos se necesitan para ello?.

28
= 0, 23

p = 120
q = 0, 77

 q  q
0,230,77
IC95 % ( ) = p z/2 p(1p)
n = 0, 23 1, 96 120 = 0, 23 0, 07 = [0, 16; 0, 30]

Manuel Angel Barea Gmez 98


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.

No se ha conseguido una precisin del 2 % sino del 7 %.

q 2 p(1p)
z
p(1p) /2 1,962 0,230,77
= z/2 n n= 2
= 0,022
1701

Problema 5.5. Se ha realizado un estudio sobre nios que padecen dolor de pecho. Se ha hallado que de 137 nios que tenan dolor
de pecho, 100 daban radiografas de trax Normales.

(a) Obtener un intervalo de confianza del 95 % de la proporcin de nios con dolor de pecho que dan radiografas Normales.
(b) Obtener el tamao muestral que se debe emplear para estimar la verdadera proporcin de nios con radiografas Normales
con un error de 0,03 dentro de un intervalo de confianza del 99 %.

p = 100
137 = 0, 729


q = 0, 271

 q  q
p(1p) 0,7290,271
IC95 % ( ) = p z/2 n = 0, 729 1, 96 137 = 0, 729 0, 074 = [0, 654; 0, 803]

q 2 p(1p)
z
p(1p) /2 2,5752 0,7290,271
= z/2 n n= 2
= 0,032
1456

Problema 5.6. En un estudio para establecer un patrn de lectura "Normal"de Ca en personas adultas aparentemente sanas, se ha
obtenido una primera muestra de 25 individuos en la que se ha medido los miligramos de calcio por decilitro de sangre, obteniendo
un intervalo de confianza del 95 % para la media de [9, 294; 9, 706]

(a) Cul sera el intervalo de confianza para la media al 99 %?


(b) Cul sera un intervalo de confianza para la desviacin tpica al 95 %?
(
9, 294 = x tn1,/2 sn = x 2, 064 s25 x = 9, 5

Resolviendo
9, 706 = x + tn1,/2 sn = x + 2, 064 s25 s = 0, 5

h i
IC99 % ( ) = x tn1;/2 sn = 9, 5 2, 797 0,5
25
= 9, 5 0, 279 IC99 % ( ) = [9, 221; 9, 779]
 
(n1)s2 2
h i
240,25 240,25
IC95 % 2 = ; 2(n1)s 39,36 ; 12,40 = 2 [0, 152; 0, 483]

2
(n1);
=
/2 (n1);(1/2)

IC95 % ( ) = [0, 39; 0, 69]

Problema 5.7. Para estudiar el nmero de pulsaciones por minuto despus de realizar un esfuerzo fsico concreto, se toma una
muestra de 240 individuos, que dieron una media de 90 con una desviacin tpica de 16 pulsaciones. Suponiendo normalidad en los
datos:

(a) Con qu nivel de confianza puede asegurarse que la media poblacional est dentro del intervalo [90 1, 7]?
(b) Construya el intervalo de confianza de con un nivel de confianza del 98 %. Calcule el error de estimacin. Obtenga el valor
de n para que el error de estimacin sea inferior a 2

Manuel Angel Barea Gmez 99


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.


1,7 240
1, 7 = tn1;/2 sn t239;/2 = 16 = 1, 64 Por las tablas = 0, 90

h i
IC98 % ( ) = x tn1;/2 sn = 90 2, 326 16
240
= 90 2, 40 IC98 % ( ) = [87, 60; 92, 40]

= 2, 4

2 2
n1;/2 s
t 
2,32616
= tn1;/2 sn n = = 2 347

Problema 5.8. La concentracin de cido rico en sangre mg/dl sigue una distribucin normal. Se ha estudiado una muestra de 150
individuos y hemos obtenido como intervalo de confianza para la media al 95 %: [5, 52; 6, 48].

(a) Qu tamao muestral sera necesario para que el error de estimacin sea inferior a 0, 1 mg/dl?
(b) Podemos afirmar con un 2 % de significacin, que la concentracin media en sangre de cido rico es superior a 5, 5 mg/dl?

(
5, 52 = x tn1,/2 sn = x 1, 96 150
s
x=6

Resolviendo
s
6, 48 = x + tn1,/2 sn = x + 1, 96 150 s=3

2 2
n1;/2 s
t 
1,963
= tn1;/2 sn n = = 0,1 3458

El apartado b es un contraste de hiptesis:

= 5, 5

H0
H1 > 5, 5

El valor crtico es t149;0,01 = 2, 326, el criterio de rechazo ser t > 2, 396

|xx| 65,5
t=
s/ n =
3/ 150 = 2, 04

Por tanto pertenece no pertenece a la regin de rechazo y no podemos validar H1

Problema 5.9. Se cree que ms del 85 % de todos los nios con dolor torcico presentar, a pesar del dolor, un ecocardiograma
normal. Una muestra de 139 de estos nios ha dado 123 con ecocardiogramas normales.

(a) Hallar un intervalo de confianza al 99 % para la proporcin de nios con dolor torcico que presentan ecocardiogramas
normales.
(b) Realizar un contraste de hiptesis para aceptar o rechazar la hiptesis del enunciado con = 0, 1

123
= 0, 885

p = 139
q = 0, 115

= 0, 85
 q  
H0
q
p(1p) 0,8850,115
IC99 % ( ) = p z/2 = 0, 885 2, 575 139 = 0, 885 0, 069 = [0, 816; 0, 954]
n H1 > 0, 85

El valor crtico es z/2 = 1, 64, el criterio de rechazo ser z/2 > 1, 64

Manuel Angel Barea Gmez 100


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.

q|pp| 0,8850,8
z/2 = p(1p)
= q
0,8850,115
= 3, 14
n 139

Por tanto pertenece a la regin de rechazo y podemos rechazar H0 y si dar por vlida H1 aceptando la hiptesis

Problema 5.10. Para determinar el aumento de peso que produce en las ratas hembras una dieta con alto contenido en protenas,
se toman 12 ratas y se determina el aumento de peso (medido en grs.) entre los das 28 y 84 . Sabiendo que la suma de estos datos
es 1440, que la suma de sus cuadrados es 177832 y que los datos siguen una ley Normal, encontrar un intervalo de confianza para
.

x = nxi = 1440
12 = 120 


s2
= n
n1 = 12
2
11 177832 2
12 120 = 457, 45
s = 21, 38

  h
2 2
i
2 = (n1)s ; 2(n1)s = 11457,45 11457,45
21,92 ; 3,82 = 2 [229, 56; 1317, 26]

IC95 % 2
(n1);/2 (n1);(1/2)

IC95 % ( ) = [15, 15; 36, 29]

Problema 5.11. El servicio pblico de salud recomienda la vacunacin contra la gripe para personas de ms de sesenta aos. Se ha
tomado una muestra aleatoria de 100 personas que pertenecen a este grupo de edad, para estimar el porcentaje de individuos que
tienen intencin de vacunarse.

(a) Con qu nivel de confianza puede asegurarse que la proporcin de individuos que se vacunarn se encuentra en el intervalo
[0, 725; 0, 875]
(b) Se han previsto vacunas para el 75 % de la poblacin formada por este grupo de edad, sern suficientes?

xin f +xsup 0,725+0,875


Como el intervalo de confianza se distribuye sobre la media p = 2 = 2 = 0, 8

= 0, 75

H0
q
0,80,2
0, 875 = 0, 8 + z/2 100 z/2=1,875 z = 1, 54 = 0, 9386
H1 > 0, 75

El valor crtico para una = 95 % es z/2 = 1, 96, el criterio de rechazo ser z > 1, 54

q pp 0,80,75
z= p(1p)
= q
0,80,2
= 1, 25
n 100

Por tanto H0 es cierta.

Problema 5.12. Para conocer la eficacia de un programa de entrenamiento deportivo se evala la frecuencia cardaca de 40 sujetos
antes y despus del mismo. Con estos datos se obtiene que la diferencia de frecuencia cardaca media (antes - despus) se encuentra
en el intervalo [5 3, 5] con un 95 % de confianza. Suponiendo normalidad en los datos y sabiendo que una mejora de la forma
fsica implicara un descenso de la frecuencia cardaca, podemos asegurar la eficacia del tratamiento?

d D0 = 5

H0
H1 d D0 < 5

El valor crtico es tn1;/2 = t39;0,975 = 2, 022, el criterio de rechazo ser t < 2, 022

Manuel Angel Barea Gmez 101


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.


3,51 40
= t sn s = 2,022 = 10, 94

50
t=
10,94/ 40 = 2, 89

Por tanto se rechaza H0 y aceptamos H1 y la eficacia del tratamiento

Problema 5.13. Se determinaron los porcentajes de peso corporal ideal de 18 diabticos insulinodependientes elegidos al azar. Un
porcentaje de 120 % significa que un individuo pesa 20 % ms que su peso ideal; un porcentaje de 95 % significa que el individuo
pesa 5 % menos que su peso ideal. Suponiendo normalidad en la distribucin poblacional de la variable y a partir de los datos
obtenidos:

107 119 99 114 120 104 88 114 124 116 101 121 152 100 125 114 95 117

(a) Podemos afirmar en promedio, que la poblacin de diabticos insulinodependientes tiene sobrepeso?
(b) Construir un intervalo de confianza al 99 % para la desviacin tpica poblacional de la variable porcentaje de peso corporal
ideal.

xi 107+119+...+95+117

x= n = 18 = 112, 78
= 120

2
(107112,78) +(119112,78)2 +...+(95112,78)2 +(117112,78)2
2 H0

(xi x)
s2 = (n1)
= (181)
= 208 H1 > 120

s = 14, 42

El valor crtico es t17;0,05 = 1, 740, el criterio de rechazo ser t > 1, 740


120112,78
t=
14,42/ 18 = 2, 124

Por tanto se rechaza H0 y se confirma que s que tienen sobrepeso.


 
(n1)s2 2
h i
17208 17208
2 ; 2(n1)s 35,72 ; 5,70 = 2 [98, 99; 620, 35]

IC99 % = 2
(n1);
=
/2 (n1);(1/2)

IC99 % ( ) = [9, 94; 24, 94]

Problema 5.14. El nmero medio de das de clnica requeridos por determinados pacientes mayores de edad era de 17 das. Se ha
puesto en marcha un nuevo programa de cuidados que se espera que reduzca esta cifra. Los datos recogidos para 16 pacientes que
han seguido el programa son:

3 18 5 9 12 8 7 20
22 15 6 3 2 36 38 43

(a) Prueban los datos anteriores la hiptesis esperada?


(b) Calcular un intervalo de confianza al 99 % para la proporcin de pacientes que necesitan ms de 17 das de clnica despus
de seguir el programa.

3+18+...+38+43

xi
x= n = 16 = 15, 44
2
(315,44)2 +(1815,44)2 +...+(3815,44)2 +(4315,44)2

(xi x)
s2 = (n1) = (161) = 175, 3

s = 13, 24

Manuel Angel Barea Gmez 102


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.

= 17

H0
H1 < 17

El valor crtico es t15;0,025 = 2, 326, el criterio de rechazo ser t < 2, 131

xx 15,4417
t=
s/ n =
13,24/ 16 = 0, 47

Pertenece a la regin de rechazo y podemos rechazar H0 y aceptar H1


6
La proporcin de los que necesitan ms de 17 das es p = 16 = 0, 375
 q  q
0,3750,625
IC99 % ( ) = p z/2 p(1p)
n = 0, 375 2, 575 16 = 0, 375 0, 312 = [0, 0628; 0, 687]

Problema 5.15. Los neutrfilos son leucocitos cuya funcin es la de eliminar agentes infecciosos de la sangre, de forma que en
un individuo normal el porcentaje de neutrfilos entre los leucocitos debe ser de al menos el 60 %. Al realizar un recuento de 200
leucocitos de un individuo hemos visto que 107 son neutrfilos:

(a) A partir de qu nivel de significacin puede afirmarse que este individuo tiene un porcentaje de neutrfilos por debajo de lo
normal?
(b) Cuntos leucocitos deberamos contar como mnimo en este individuo para obtener un intervalo de confianza al 99 del
porcentaje de neutrfilos con una precisin del 5 %?

p = 107
200 = 0, 535


q = 0, 465

 q  q
p(1p) 0,5350,465 0,60,535
IC ( ) = p + z n 0, 6 = 0, 535 z 200 = q
0,5350,465
= 1, 84 = 0, 03
200

q 2 p(1p)
z
p(1p) /2 2,582 0,5350,465
= z/2 n n= 2
= 0,052
675

Problema 5.16. En una determinada marca de cigarrillos se efecta un experimento para comprobar el contenido en alquitrn; a tal
fin se prueban veinte cigarrillos elegidos al azar de lotes diferentes. Se encuentran los siguientes datos muestrales para el contenido
de alquitrn:

x = 22 mg

s = 4 mg

(a) Encuentre un intervalo de confianza del 90 % para el contenido medio de alquitrn en un cigarrillo de la citada marca.
h i
IC90 % ( ) = x tn1;/2 sn = 22 1, 729 420 = 22 1, 546 IC90 % ( ) = [20, 45; 23, 546]

Problema 5.17. Se quiere conocer la permanencia media de pacientes en un hospital, con el fin de estudiar una posible ampliacin
del mismo. Se tienen datos referidos a la estancia expresada en das de ochocientos pacientes, obtenindose los siguientes resultados:

x = 8, 1 das

s = 9 das

Manuel Angel Barea Gmez 103


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.

(a) Halle un intervalo de confianza del 95 % para la estancia media.


h i
9
IC95 % ( ) = x tn1;/2 sn = 8, 1 1, 96 800 = 8, 1 0, 623 IC95 % ( ) = [7, 47; 8, 723]

Problema 5.18. El porcentaje de calcio observado en dientes sanos de 10 individuos de una especie animal es:

36,6 35,9 35,6 35,4 34,9 36,5 35,6 35,2 35,6 35,4

(a) Halle el intervalo de confianza del 95 % para el porcentaje medio de calcio.


(b) Se podra aceptar que el porcentaje medio de calcio es igual a 36?
(c) Intervalo de confianza del 95 % para la varianza de dicho porcentaje.

(d) Se podra aceptar que la varianza de dicho porcentaje es igual a 1,5?

xi 36,6+35,9+...+35,6+35,4

x= n = 10 = 35, 67
2
(36,635,67) +(35,935,67)2 +...+(35,635,67)2 +(35,435,67)2
2

(xi x)
s2 = (n1) = (101) = 0, 28

s = 0, 53

h i
0,53
IC95 % ( ) = x tn1;/2 sn = 35, 67 2, 262 10
= 35, 67 0, 38 IC95 % ( ) = [35, 29; 36, 05]

S se puede aceptar un porcentaje medio de 36 por estar incluido en el intervalo.


 
(n1)s2 (n1)s2
h i
2 90,28 90,28
; 2 19,02 ; 2,70 = 2 [0, 1325; 0, 933]

IC95 % = 2
(n1);
=
/2 (n1);(1/2)

No est incluido en el intervalo.

Problema 5.19. En una muestra de 28 virus se ha medido, mediante tcnicas de microscopa electrnica, el dimetro de la cpside,
o o
resultando, de media, 12500 A con una desviacin tpica de 2100 A. El dimetro se distribuye normalmente con media y desviacin
tpica desconocidas.

(a) D una estimacin puntual para la media y la varianza poblacionales.


(b) Construya un intervalo de confianza del 95 % para el tamao medio del dimetro de la cpside y otro para la desviacin tipica.

x = 12500
(
q q
s = n1n
= 28
27 2100 = 2138, 5

h i
IC95 % ( ) = x tn1;/2 sn = 12500 2, 052 2138,5

28
= 12500 829, 3 IC95 % ( ) = [11670, 7; 13329, 3]

 
(n1)s2 2
272138,52 272138,52
h i
IC95 % 2 = ; 2(n1)s 43,19 ; 14,57 = 2 [2858635, 9; 84729224, 0]

2
(n1);
=
/2 (n1);(1/2)

IC95 % ( ) = [690, 8; 2910, 8]

Manuel Angel Barea Gmez 104


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.

Problema 5.20. En el estudio del cncer de pulmn se considera que su tamao es una variable aleatoria con distribucin aproxi-
madamente normal. Una muestra de ocho pacientes afectados ha dado, en centmetros, los resultados siguientes:

7,5 2,5 9,0 6,5 3,3 6,5 1,5 6,5

(a) Determine un intervalo de confianza del 95 % para el tamao medio de este tipo de cncer.
(b) Calcule un intervalo de confianza del 90 % para la desviacin tipica del tamao.

xi 7,5+2,5+...+1,5+6,5

x= n = 8 = 5, 41
2
(7,55,41) +(2,55,41)2 +...+(1,55,41)2 +(6,55,41)2
2

(xi x)
s2 = (n1) = (81) =7

s = 2, 65

h i
IC95 % ( ) = x tn1;/2 sn = 5, 41 2, 365 2,65
= 5, 41 2, 207 IC95 % ( ) = [3, 20; 7, 617]
8

 
(n1)s2 2
h i
2 ; 2(n1)s 77 77
14,07 ; 2,17 = 2 [3, 48; 22, 58]

IC90 % = 2
(n1);
=
/2 (n1);(1/2)

IC90 % ( ) = [1, 86; 4, 75]

Problema 5.21. Se desea estimar la proporcin de jvenes que fuman regularmente. De 1000 jvenes entrevistados, 200 fumaban
regularmente.

(a) Calcule una estimacin puntual para p.


(b) Obtenga un intervalo de confianza del 99 % para la proporcin de jvenes que fuman regularmente. Le sorprendera leer en
un artculo que esta proporcin es de 0,23? Justifquelo.

200
p = 1000 = 0, 2
 q  q
p(1p) 0,20,8
IC ( ) = p + z n = 0, 2 2, 575 1000 = 0, 2 0, 0325 IC ( ) = [0, 1674; 0, 2325]

No sorprende que la proporcin pueda ser 0,23 ya que pertenece al intervalo de confianza

Problema 5.22. Un avance en el tratamiento del acn es el frmaco cido cis-13-retinoico. En un reciente estudio, se prob este
frmaco en 70 pacientes afectados de un acn bastante grave. En 60 de estos pacientes se produjo una limpieza radical de sus
lesiones activas. Se pide:

(a) Construya un intervalo de confianza del 99 % para la proporcin de pacientes sobre los que el frmaco sera eficaz.
(b) Se podra aceptar que el frmaco sera eficaz en el 98 % de los pacientes sobre los que se aplique?
(c) Qu tamao debera tener la muestra para que la proporcin resultante de ella est dentro de una distancia de 0,04 de la
verdadera proporcin, p, con una confianza del 99 %?

60
p = 70 = 0, 857

Manuel Angel Barea Gmez 105


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.

 q  q
p(1p) 0,8570,143
IC ( ) = p + z n = 0, 857 2, 575 70 = 0, 857 0, 107 IC ( ) = [0, 750; 0, 964]

No se puede aceptar porque no forma parte del intervalo de confianza.

q 2 p(1p)
p(1p) z/2 2,5752 0,8570,143
= z/2 n n= 2
= 0,042
508

Problema 5.23. Un fabricante garantiza a un laboratorio farmacutico que sus mquinas producen comprimidos con un dimetro
medio de 13 mm y una desviacin tpica de 0, 6 mm. Una muestra de 100 unidades dio como media de los dimetros 13, 12 mm.
Cabe esperar, a partir de este dato, que el fabricante dice la verdad, a un nivel de significacin del 5 %?

0 = 13

H0
H1 0 6= 13

El valor crtico es z/2 = 1, 96, el criterio de rechazo de H0 ser |z| > 1, 96

0 13,1213
z=

= 0,6
=2
n 100

Al estar en la regin de rechazo, no se puede afirmar con un 95 % de probabilidad que el fabricante tiene razn.

Problema 5.24. Normalmente las hojas de la mimosa pdica son horizontales. Si se toca ligeramente una de ellas, las hojas se
pliegan. Se afirma que el tiempo medio de contacto hasta el cierre completo es de 2,5 segundos. Se realiza un experimento midiendo
el tiempo transcurrido, en segundos, entre el contacto y el cierre completo con los siguientes resultados:

3,0 2,9 2,8 2,7 2,6 2,4 2,5 2,4 2,6 2,7

(a) Puede aceptarse la hiptesis del enunciado con un nivel de significacin de 0,10?

x = nxi = 3,0+2,9+...+2,6+2,7

10 = 2, 66
2
(3,02,66)2 +(2,92,66)2 +...+(2,62,66)2 +(2,72,66)2

(xi x)
s2 = (n1) = (101) = 0, 04

s = 0, 20

0 = 2, 5

H0
H1 0 6= 2, 5

El valor crtico es t9;0,05 = 2, 262, el criterio de rechazo de H0 ser |t| > 1, 8332

0 2,662,5
t=
0,2

= 2, 52
n 10

Al estar en la regin de rechazo, no se puede afirmar con un 90 % de probabilidad que el tiempo de cierre completo sea de 2,5 seg.

Problema 5.25. Un frmaco alivia cierta dolencia en el 60 % de los casos. Se toma una muestra de 144 personas que sufren esa
dolencia y se les hace tomar un nuevo frmaco, encontrando alivio 100 de ellas.

(a) Se puede afirmar al nivel del 5 % que el nuevo medicamento es ms efectivo que el antiguo?

100
= 144 = 0, 694

Manuel Angel Barea Gmez 106


CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.

0 = 0, 6

H0
H1 0 > 0, 6

El valor crtico es z0,95 = 1, 645, el criterio de rechazo de H0 ser z > 1, 645

q 0 0,6940,6
z= (1 )
= q
0,6940,305
= 2, 45
n 144

Por tanto, aceptamos H1 que certifica que el nuevo medicamento es ms efectivo con un 95 % de fiabilidad.

Problema 5.26. Un microbilogo quiere obtener placas para preparaciones microscpicas de espesor uniforme. Un proveedor
afirma que sus placas tienen una varianza menor de 0, 0158 micron2 . Utilizando un micrmetro sensible, el laboratorio toma al azar
una muestra de 30 placas con una cuasivarianza muestral resultante de s2 = 0, 0213 micron2.

(a) Es compatible con dicho resultado la pretensin del proveedor a un nivel de significacin del 5 %?

02 = 0, 0158

H0
H1 02 < 0, 0158

2
El valor crtico es 29;0,95 = 17, 71, el criterio de rechazo de H0 ser 2 < 17, 71

(n1)s2 290,0213
2 = 02
= 0,0158 = 39, 09

Por tanto se acepta H0 y no puede aceptarse lo que indica el proveedor en H1

Problema 5.27. En la leucemia mieloblstica, usualmente se trata al paciente intensamente con quimioterapia en el momento del
diagnstico. Esto ha producido una tasa de remisin del 70 %. Probando un nuevo mtodo de tratamiento se utilizaron 50 voluntarios.

(a) Cuntos de los pacientes deberan haber remitido para que los investigadores pudiesen afirmar al nivel de significacin 0,025
que el nuevo mtodo produce remisiones ms altas que el antiguo?

0 = 0, 7

H0
H1 0 > 0, 7

El valor crtico es z0,975 = 1, 96, el criterio de rechazo de H0 ser z > 1, 96

Para poder aceptar H1


n 0,7
1, 96 < q 0 = 50
q n (1, 96 0, 065 + 0, 7) 50 42
(1 ) 0,70,3
n 50

Manuel Angel Barea Gmez 107


C APTULO

6
Intervalos de confianza y constrates de hiptesis
paramtricos en dos o ms poblaciones.

Problema 6.1. Se ha analizado el contenido de fibra diettica en dos grupos de vegetarianos, uno con enfermedad diverticular y
otro sin ella. Los resultados obtenidos aparecen en la siguiente tabla:

Sin enfermedad Con enfermedad


n1 = 18 n2 = 18
x1 = 42, 7 gr. x2 = 27, 7 gr.
s1 = 9, 9 gr. s2 = 9, 5 gr.

Suponiendo normalidad en los datos:

(a) Decidir si puede afirmarse ( = 0, 05) que la media de contenido de fibra diettica en las dietas de los que no tienen la
enfermedad es ms alta que en la de aquellos que la tienen.
(b) Evaluar la diferencia de contenidos medios mediante un intervalo de confianza al 99 %.

Hay que contrastar primero si las varianzas poblacionales son iguales:



H0 1 = 2
H1 1 6= 2

s21 9,92
F= s22
= 9,52
= 1, 08

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;17;17 = 2, 673

Para una = 0, 05 1
F0,025;17;17 = 2,673 = 0, 374

como 1, 08 (0, 374; 2, 673), no se rechaza H0 y por tanto 1 = 2


H0 1 = 2
H1 1 > 2

108
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
El valor crtico es t34;0,05 = 1, 690, el criterio de rechazo de H0 ser t > 1, 690

t= rx1 x2 = q42,727,7 = 15
= 4, 63
s21 s22 9,92 9,52 3,23
n1 + n2 18 + 18

Por tanto se rechaza H0 y se acepta que la media de contenido de fibra diettica en las dietas de los que no tienen la enfermedad es
ms alta que en la de aquellos que la tienen.

r
(n1 1)s21 +(n2 1)s22
q
179,92 +179,52
s= (n1 +n2 2) = 34 = 9, 7

q q
2 9,72
h i
2 2
IC99 % (1 2 ) = (x1 x2 ) tn1;/2 ns 1 + ns 2 = 15 2, 724 9,7
18 + 18 = 15 8, 80 IC99 % ( 1 2 ) = ( 1 2 )
[6, 20; 23, 80]

Problema 6.2. Se tiene un grupo control y otro experimental, cada uno con 100 individuos, para contrastar el efecto de una vacuna
contra determinado tipo de alergia. Del grupo experimental 8 sufrieron alergia, mientras que del control la sufrieron 25.

(a) Contrastar si existe diferencia entre ambos grupos ( = 0, 05)


(b) Evaluar la diferencia existente entre ambos grupos mediante un intervalo de confianza al 99 %.

8
= 0, 08

p1 = 100
25
p2 = 100 = 0, 25


H0 1 = 2
H1 1 6= 2

El valor crtico es z0,025 = 1, 96 el criterio de rechazo de H0 ser |z| > 1, 96

n1 p1 +n2 p2 1000,08+1000,25
p= n1 +n2 = 100+100 = 0, 165

p1 p2 0,080,25 0,17
z= r = q
0,1650,835 0,1650,835
= 0,05 = 3, 4
p(1p) p(1p) +
n1 + n2 100 100

Como |3, 4| > 1, 96 se rechaza H0 y por tanto existen diferencias entre ambos grupos.

 q  q
01650,835
IC99 % (1 2) = (p1 p2 ) z/2 p(1p)
n1 + p(1p)
n2 = 0, 17 2, 575 100 + 0,1650,835
100 = 0, 17 0, 12

IC99 % (1 2 ) = (1 2 ) [0, 29; 0, 05]

Problema 6.3. Dos investigadores de dos ciudades distintas, A y B, se conocen en un congreso mdico porque han presentado
dos trabajos sobre el mismo tema, la diabetes infantil. El investigador de la ciudad A, partiendo de una muestra de tamao 13, ha
presentado como intervalo de confianza al 95 % para la media de azcar en sangre (medida en mg/100ml) el siguiente: (89, 1; 90, 9).
El investigador de la ciudad B, partiendo de otra muestra de tamao 16, ha presentado como intervalo de confianza al 99 % para la
media de azcar en sangre el siguiente: (93, 2; 98, 8).

Manuel Angel Barea Gmez 109


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(a) Podemos afirmar con un nivel de significacin del 1 % que el nivel medio de azcar en la poblacin infantil de la ciudad A es
inferior al de la ciudad B?

x1 = 89,1+90,9 x2 = 93,2+98,8
( (
2 = 90 2 = 96
Ciudad A n 0,9 13 Ciudad B n 2,8 16
= t12;0,025 s1n s1 = t12;0,025 = 2,179 = 1, 49 = t15;0,005 s2n s2 = t15;0,005 = 2,861 = 3, 91

Hay que contrastar primero si las varianzas poblacionales son iguales:



H0 1 = 2
H1 1 6= 2

s21 1,492
F= s22
= 3,912
= 0, 14

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;12;15 = 2, 963

Para una = 0, 05 1
F0,025;12;15 = 3,177 = 0, 314

como 0, 14
/ (0, 314; 2, 963), se rechaza H0 y por tanto 1 6= 2

H0 1 = 2
H1 1 < 2

Por ser las varianzas distintas el grado de libertad de nuestro estadstico sera:

2 2
(s21 n1 +s22 n2 ) (1,492 13+3,91216) 273,472
v= 2 2 2 2 = 2 2 = 69,41+3988,92 18
(s1 n1 ) + (s2 n2 ) (1,492 13) + (3,912 16)
n1 1 n2 1 131 161

El valor crtico es t18;0,01 = 2, 522, el criterio de rechazo de H0 ser t < 2, 522

t= rx1 x2 = q 9096 = 6
= 5, 65
s2 s2 1,492 3,912 1,06
1 2
n1 + n2 13 + 16

Como 5, 65 < 2, 467 se rechaza H0 y se acepta H1 que indica que el nivel medio de azcar en la poblacin infantil de la ciudad A es
inferior al de la ciudad B

Problema 6.4. Se ha realizado un estudio para cerciorarse de si las diferencias inmunolgicas entre hemoflicos e individuos sanos
podan detectarse fcilmente. Los resultados de una prueba inmunolgicas realizada sobre 13 hemoflicos y otros 13 controles sanos
son:

Hemoflicos 11 9,8 61,2 63,4 11,1 8 40,9 47,7 19,3 18 24,6 24,4 11,3
Sanos 13,5 16,9 38,3 23,2 27,6 22,1 33,4 55 66,9 78,6 66,6 53 49,7

Suponiendo normalidad en los datos y a partir de ellos:

(a) Existen en promedio diferencias inmunolgicas entre hemoflicos e individuos sanos?

Manuel Angel Barea Gmez 110


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(b) Realizar una estimacin de esta diferencia por medio de un intervalo de confianza.
(c) Estimar mediante un intervalo la probabilidad de que un hemoflico tenga un nivel de inmunidad superior a 30.

x1 = 26, 97 x2 = 41, 90

Hemo f licos s1 = 19, 75 Sanos s2 = 21, 21


n1 = 13 n2 = 13

Contrastamos primero si las varianzas poblacionales son iguales:



H0 1 = 2
H1 1 6= 2

s21 19,752
F= s22
= 21,212
= 0, 86

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;12;12 = 3, 277

Para una = 0, 05 1
F0,025;12;12 = 3,277 = 0, 305

como 0, 86 (0, 305; 3, 277), se acepta H0 y por tanto 1 = 2


H0 1 = 2
H1 1 6= 2

Por tener las varianzas poblacionales iguales v = n1 + n2 2


El valor crtico es t24;0,025 = 2, 060, el criterio de rechazo de H0 ser |t| > 2, 064

r
(n1 1)s21 +(n2 1)s22
q
1219,752 +1221,212
s= (n1 +n2 2) = 24 = 20, 5

rx1 x2 26,9741,90 14,93


t= = = 8,038 = 1, 85
20,52 20,52
q
s2 s2
1 2
n1 + n2 13 + 13

|1, 85| < 2, 064 por tanto se acepta la H0 que indica que no existen diferencias entre hemoflicos e individuos sanos.

r
(n1 1)s21 +(n2 1)s22
q
1219,752 +1221,212
s= (n1 +n2 2)
= 24 = 20, 5

q q
2 20,52
h 2 2
i
IC95 % (1 2 ) = (x1 x2 ) tn1;/2 ns 1 + ns 2 = 14, 93 2, 064 20,5
13 + 13 = 14, 93 16, 59

IC95 % (1 2 ) = (1 2 ) [31, 52; 1, 66]

4
p= 13 = 0, 307
 q  q
p(1p) 0,3070,693
IC95 % ( ) = p + z n = 0, 307 1, 96 13 = 0, 307 0, 25 IC95 % ( ) = [0, 056; 0, 557]

Manuel Angel Barea Gmez 111


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Problema 6.5. Tras la inyeccin intravenosa de digoxina en 10 varones adultos sanos, se realizaron mediciones en el suero a las
cuatro y ocho horas.

Sujeto 1 2 3 4 5 6 7 8 9 10
4 horas 1,0 1,3 0,9 1,0 1,0 0,9 1,3 1,1 1,0 1,3
8 horas 1,0 1,2 0,7 1,0 0,9 0,9 1,2 1,0 1,0 1,2

Suponiendo normalidad en los datos:

(a) Existe diferencia estadsticamente significativa entre las concentraciones de digoxina a las 4 y 8 horas?
(b) Estimar mediante un intervalo de confianza, la diferencia media real de la concentracin de digoxina entre las 4 y 8 horas.
(c) Qu tamao muestral es necesario para que el error de estimacin sea inferior a 0,01?

Como se tratan de datos pareados, creamos nuestra tabla para analizar nuestro estadstico:

Sujeto 1 2 3 4 5 6 7 8 9 10
4 horas Y 1,0 1,3 0,9 1,0 1,0 0,9 1,3 1,1 1,0 1,3
8 horas X 1,0 1,2 0,7 1,0 0,9 0,9 1,2 1,0 1,0 1,2
di = Yi Xi 0 0,1 0,2 0 0,1 0 0,1 0,1 0 0,1

D = 0, 07

sD = 0, 07
n = 10


H0 1 = 2
H1 1 6= 2

El valor crtico es t9;0,025 = 2, 262, el criterio de rechazo de H0 ser |t| > 2, 262

D 0,07 0,07
t= s
D
= 0,07

= 0,02 = 3, 5
n 10

|3, 5| > 2, 261 por tanto se rechaza la H0 lo que indica que existen diferencias.
h i
sD 0,07
IC95 % (1 2 ) = D tn1;/2 n
= 0, 07 2, 262 10
= 0, 07 0, 05

IC95 % (1 2 ) = (1 2 ) [0, 02; 0, 12]

2 2
sD (tn1;/2 ) sD 1,962 0,072
= tn1;/2 n
n= 2
= 0,012
189

Problema 6.6. En un estudio realizado para determinar el desarrollo de recin nacidos de madres fumadoras, se ha determinado el
peso al nacer (en Kgs) de una muestra de 15 bebs:

2,6 2,8 2,5 3,2 3,5 2,6 2,9 3 3,1 2,8 3,6 2,5 2,4 2,8 3,2

Suponiendo normalidad en los datos:

Manuel Angel Barea Gmez 112


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(a) Estimar mediante intervalos de confianza la media y la desviacin tpica de la distribucin del peso de los recin nacidos de
madres fumadoras.
(b) Podemos admitir que ms del 50 % de los recin nacidos de madres fumadoras no alcanzan los 3 kg al nacer?
(c) Los bebs de la muestra han sido incluidos en un programa de recuperacin de peso, de modo que a los tres meses han pesado
respectivamente:

5,1 5,5 5,3 5,2 6,2 5,6 5,5 6,1 5,1 4,8 5,9 5,5 5,2 5,9 6,6

Podemos afirmar que el programa de recuperacin de peso permite incrementar el peso medio en ms de 2 kgs?

x = 2, 9

s = 0, 36
n = 15

h i
0,36
IC95 % ( ) = x tn1;/2 sn = 2, 9 2, 145 15
= 2, 9 0, 2 IC95 % ( ) = [2, 7; 3, 1]

 
(n1)s2 2
140,362 140,362
h i
2 ; 2(n1)s 26,12 ; 5,63 = 2 [0, 069; 0, 32]

IC95 % = 2
(n1);
=
/2 (n1);(1/2)

IC95 % ( ) = [0, 26; 0, 56]

La proporcin de nios con menos de 3 kg es:

0 = 0, 5

9 H0
p= 15 = 0, 6
H1 0 > 0, 5

El valor crtico es z0,95 = 1, 645, el criterio de rechazo de H0 ser z > 1, 645

q 0 0,60,5
z= (1 )
= q
0,60,4
= 0, 78
n 15

Como 0, 78 < 1, 645 no podemos admitir la hiptesis H1

Pesos al nacer X 2,6 2,8 2,5 3,2 3,5 2,6 2,9 3 3,1 2,8 3,6 2,5 2,4 2,8 3,2
Pesos a los 3 meses Y 5,1 5,5 5,3 5,2 6,2 5,6 5,5 6,1 5,1 4,8 5,9 5,5 5,2 5,9 6,6
di = Yi Xi 2,5 2,7 2,8 2 2,7 3 2,6 3,1 2 2 2,3 3 2,8 3,1 3,4

D = 2, 66

sD = 0, 47
n = 15

1 2 = 2

H0
H1 1 2 > 2

El valor crtico es t14;0,05 = 1, 761, el criterio de rechazo de H0 ser t > 1, 761

Manuel Angel Barea Gmez 113


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Dd 2,662 0,66
t= s
D
= 0,47

= 0,04 = 5, 43
n 15

Al ser 5, 43 > 1, 761 rechazamos la hiptesis nula y admitimos H1 que indica un incremento de peso por encima de los 2 kg

Problema 6.7. Se piensa que un programa regular de ejercicios moderados puede beneficiar a los pacientes que han sufrido un
infarto de miocardio. En un estudio han intervenido 11 pacientes a los que se midi antes de comenzar el programa de ejercicios el
tiempo (en min.) que tardaban en alcanzar 160 pulsaciones/min. en una prueba de esfuerzo, obtenindose los resultados:

Individuo 1 2 3 4 5 6 7 8 9 10 11
Tiempo 7,6 9,9 8,6 9,5 8,4 9,2 6,4 9,9 8,7 10,3 8,3

Despus de 25 semanas de ejercicios controlados, volvi a medirse dicho tiempo con la misma prueba de esfuerzo, obtenindose los
siguientes resultados:

Individuo 1 2 3 4 5 6 7 8 9 10 11
Tiempo 14,7 14,1 11,8 16,1 14,7 14,1 13,2 14,9 12,2 13,4 14,0

Suponiendo normalidad en los datos:

(a) Avalan estos datos ( = 0, 01) la hiptesis de que el programa regular de ejercicios beneficia a estos pacientes?.
(b) Obtener un intervalo de confianza al 95 % para la media y otro para la desviacin tpica del tiempo que tardan en alcanzar
las 160 pulsaciones/min despus del programa de ejercicios.

x1 = 8, 8 x2 = 13, 93

Primera medicion s1 = 1, 14 25 semanas despues s2 = 1, 23


n1 = 11 n2 = 11

Como son datos pareados realizamos nuestra tabla:

Individuo 1 2 3 4 5 6 7 8 9 10 11
Tiempo 1 X 7,6 9,9 8,6 9,5 8,4 9,2 6,4 9,9 8,7 10,3 8,3
Tiempo2 Y 14,7 14,1 11,8 16,1 14,7 14,1 13,2 14,9 12,2 13,4 14,0
di = Yi Xi 7,1 4,2 3,2 6,6 6,3 4,9 6,8 5 3,5 3,1 5,7

D = 5, 13

sD = 1, 48
n = 11


H0 1 = 2
H1 1 6= 2

El valor crtico es t10;0,025 = 2, 228, el criterio de rechazo de H0 ser |t| > 2, 228

0D 5,13
t= s
D
= 1,48

= 11, 49
n 11

Como |11, 49| > 2, 228 se rechaza H0 y se admite que el programa regular de ejercicios beneficia a estos pacientes.

Manuel Angel Barea Gmez 114


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
h i
1,23
IC95 % ( ) = x tn1;/2 sn = 13, 93 2, 228 11
= 13, 93 0, 83 IC95 % ( ) = [13, 1; 14, 76]

 
(n1)s2 2
101,232 101,232
h i
IC95 % 2 = ; 2(n1)s 20,48 ; 3,25 = 2 [0, 738; 4, 65]

2
(n1);
=
/2 (n1);(1/2)

IC95 % ( ) = [0, 859; 2, 15]

Problema 6.8. Para comprobar si la tolerancia a la glucosa en sujetos sanos tiende a decrecer con la edad se realiz un test oral
de glucosa a dos muestras de pacientes sanos, unos jvenes y otros adultos. El test consisti en medir el nivel de glucosa en sangre
antes de la ingestin (nivel basal) de 100 grs. de glucosa y a los 60 minutos de la toma. Los resultados fueron los siguientes:

Basal 81 89 80 75 74 97 76 89 83 77
Jovenes
60 minutos 136 150 149 141 138 154 141 155 145 147
Basal 98 94 93 88 79 90 86 89 81 90
Adultos
60 minutos 196 190 191 189 159 185 182 190 170 197

(a) Se detecta una variacin significativa del nivel de glucosa en sangre en cada grupo?
(b) Es mayor la concentracin de glucosa en sangre a los 60 minutos, en adultos que en jvenes?
(c) El contenido basal de glucosa en sangre, es menor en jvenes que en adultos?
(d) Pueden considerarse iguales en ambos grupos (jvenes y adultos) las variaciones que provocan la ingestin de glucosa?

Como son datos pareados realizamos nuestras tablas:

Basal X 81 89 80 75 74 97 76 89 83 77
Jvenes 60 minutos Y 136 150 149 141 138 154 141 155 145 147
di = Yi Xi 55 61 69 66 64 57 65 66 62 70

Basal X 98 94 93 88 79 90 86 89 81 90
Adultos 60 minutos Y 196 190 191 189 159 185 182 190 170 197
di = Yi Xi 98 96 98 101 80 95 96 101 89 107

D = 63, 5 D = 96, 1

J ovenes sD = 4, 84 Adultos sD = 7, 34
n = 10 n = 10

Para los datos de los jvenes:



H0 1 = 2
H1 1 6= 2

El valor crtico es t9;0,025 = 2, 263, el criterio de rechazo de H0 ser |t| > 2, 262

0D 63,5
t= s
D
= 4,84

= 41, 48
n 10

Manuel Angel Barea Gmez 115


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Como |41, 48| > 2, 262 se rechaza H0 y se admite H1 que indica la variacin del nivel de glucosa en los jvenes.
Para los datos de los adultos:

H0 1 = 2
H1 1 6= 2

El valor crtico es t9;0,025 = 2, 263, el criterio de rechazo de H0 ser |t| > 2, 262

0D 96,1
t= s
D
= 7,34

= 41, 40
n 10

Como |41, 40| > 2, 262 se rechaza H0 y se admite H1 que indica la variacin del nivel de glucosa en los adultos.
Para comprobar s la concentracin de glucosa a los 60 minutos es mayor en adultos,

x1 = 88, 8 x2 = 184, 9

J ovenes 60 min s1 = 6, 54 Adultos 60 min s2 = 11, 91


n1 = 10 n2 = 10


H0 1 = 2
H1 1 < 2

Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.

H0 1 = 2
H1 1 6= 2

s21 6,542
F= s22
= 11,912
= 0, 30

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;9;9 = 4, 026

Para una = 0, 05 1
F0,025;9;9 = 4,026 = 0, 248

como 0, 30 (0, 248; 4, 026), se acepta H0 y por tanto 1 = 2


Por tener las varianzas poblacionales iguales v = n1 + n2 2 = 10 + 10 2 = 18
El valor crtico es t18;0,95 = 1, 734, el criterio de rechazo de H0 ser t < 1, 734

r
(n1 1)s21 +(n2 1)s22
q
96,542 +911,912
s= (n1 +n2 2) = 18 = 9, 60

rx1 x2 145,6184,9 39,3


t= = = 4,29 = 9, 15
9,602 9,602
q
s2 s2
n +n
1 2 10 + 10

9, 15 < 1, 734 por tanto se rechaza H0 y se acepta H1 que indica que la concentracin de glucosa en sangre a los 60 minutos, es
mayor en adultos que en jvenes
Para el apartado (c)

Manuel Angel Barea Gmez 116


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
x1 = 82, 1 x2 = 88, 8

J ovenes basal s1 = 7, 48 Adultos basal s2 = 5, 74


n1 = 10 n2 = 10


H0 1 = 2
H1 1 < 2

Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.

H0 1 = 2
H1 1 6= 2

s21 7,482
F= s22
= 5,742
= 1, 69

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;10;10 = 3, 717

Para una = 0, 05 1
F0,025;10;10 = 3,115 = 0, 269

como 1, 69 (0, 269; 3, 717), se acepta H0 y por tanto 1 = 2


Por tener las varianzas poblacionales iguales v = n1 + n2 2 = 10 + 10 2 = 18
El valor crtico es t18;0,95 = 1, 734, el criterio de rechazo de H0 ser t < 1, 734

r
(n1 1)s21 +(n2 1)s22
q
97,482 +95,742
s= (n1 +n2 2) = 18 = 6, 66

t= rx1 x2 = q82,188,8 = 6,7


= 2, 25
s2 s2 6,662 6,662 2,97
n +n
1 2 10 + 10

2, 25 < 1, 734 por tanto se rechaza H0 y se acepta H1 que indica que la concentracin de glucosa en sangre a los 60 minutos, es
menor en jvenes que en adultos.
Para el apartado (d)

x1 = 63, 5 x2 = 96, 1

J ovenes s1 = 4, 84 Adultos s2 = 7, 34
n1 = 10 n2 = 10


H0 1 = 2
H1 1 6= 2

Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.

H0 1 = 2
H1 1 6= 2

Manuel Angel Barea Gmez 117


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
s21 4,842
F= s22
= 7,342
= 0, 43

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;9;9 = 4, 026

Para una = 0, 05 1
F0,025;9;9 = 4,026 = 0, 248

como 0, 43 (0, 248; 4, 026), se acepta H0 y por tanto 1 = 2


Por tener las varianzas poblacionales iguales v = n1 + n2 2 = 10 + 10 2 = 18
El valor crtico es t18;0,975 = 2, 101, el criterio de rechazo de H0 ser |t| > 2, 101

r
(n1 1)s21 +(n2 1)s22
q
94,842 +97,342
s= (n1 +n2 2)
= 18 = 6, 21

rx1 x2
63,5(96,1) 32,6
t= = = 2,77 = 11, 73
6,212 6,212
q
s2 s2
n +n
1 2 10 + 10

11, 73 > 2, 101 por tanto se rechaza H0 y se acepta H1 que indica que no son iguales la concentracin de glucosa en sangre de jvenes
y adultos.

Problema 6.9. Se ha realizado un estudio para analizar el efecto del ejercicio fsico en el nivel de colesterol en plasma, en el que
participaron 16 sujetos (7 hombres y 9 mujeres). Antes del ejercicio, se tomaron muestras de sangre para determinar el nivel de
colesterol de cada participante. Despus, los individuos fueron sometidos a un programa de ejercicios, al final del cual se tomaron
nuevas muestras de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma. Los datos recogidos aparecen en la
tabla:

Sexo M M M M M M M M M H H H H H H H
Nivel previo 182 232 191 200 148 249 276 213 241 480 262 256 300 190 225 330
Nivel posterior 198 210 194 220 138 220 219 161 210 313 226 200 194 210 190 250

Suponiendo normalidad en los datos:

(a) Se puede concluir que en general el nivel medio de colesterol se reduce haciendo ejercicio fsico?
(b) Estimar por medio de un intervalo de confianza, la proporcin de sujetos donde el nivel de colesterol se reduce.
(c) Se puede concluir que la variacin del nivel de colesterol al realizar ejercicio fsico, es la misma en hombres y mujeres?

Nivel previo X 182 232 191 200 148 249 276 213 241 480 262 256 300 190 225 330
Nivel posterior Y 198 210 194 220 138 220 219 161 210 313 226 200 194 210 190 250
di = Xi Yi -16 22 -3 -20 10 29 57 52 31 167 36 56 106 -20 35 80

D = 38, 875

sD = 49, 265
n = 16


H0 1 = 2
H1 1 > 2

Manuel Angel Barea Gmez 118


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
El valor crtico es t15;0,05 = 1, 753, el criterio de rechazo de H0 ser t > 1, 753

D 38,875
t= s
D
= 49,265

= 3, 13
n 16

Como 3, 13 > 1, 753 se rechaza H0 y se admite H1 que indica que en general el nivel medio de colesterol se reduce haciendo ejercicio
fsico
La proporcin donde se reduce es:

12
p= 16 = 0, 75
 q  q
p(1p) 0,750,25
IC95 % ( ) = p + z n = 0, 75 1, 96 16 = 0, 75 0, 21 IC95 % ( ) = [0, 54; 0, 96]

Para comparar la variacin entre hombre y mujeres da las tablas se obtienen los siguientes resultados:

x1 = 18 x2 = 65, 71

Hombres s1 = 27, 58 Mu jeres s2 = 59, 65


n=9 n=7


H0 1 = 2
H1 1 6= 2

Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.

H0 1 = 2
H1 1 6= 2

s21 27,582
F= s22
= 59,652
= 0, 21

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;8;7 = 4, 899

Para una = 0, 05 1
F0,025;8;7 = 4,995 = 0, 200

como 0, 21 (0, 200; 4, 899), se acepta H0 y por tanto 1 = 2


Por tener las varianzas poblacionales iguales v = n1 + n2 2 = 9 + 7 2 = 14
El valor crtico es t14;0,975 = 2, 145, el criterio de rechazo de H0 ser |t| > 2, 145

r
(n1 1)s21 +(n2 1)s22
q
927,582 +759,652
s= (n1 +n2 2) = 14 = 47, 62

t= rx1 x2 = q 1865,71 = 47,71


= 1, 98
s2 s2 47,622 47,622 24
n +n 9 + 7
1 2

|1, 98| < 2, 145 por tanto se acepta H0 y se rechaza H1

Manuel Angel Barea Gmez 119


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Problema 6.10. En un estudio sobre los factores de riesgo que influyen en la aparicin de tuberculosis entre usuarios de drogas
administradas por va intravenosa, se tom un grupo de 97 individuos que compartan jeringa, obteniendo un 27,4 % de resultados
positivos a la prueba de la tuberculina, mientras que de los 161 individuos que negaron compartirlas, el 17,4 % obtuvo resultado
positivo en la prueba.

(a) Puede admitirse que hay diferencias entre ambos grupos ( = 0, 01)?.
(b) Construir un intervalo de confianza al 98 % para la proporcin de usuarios de drogas administradas por va intravenosa que
dan resultados positivos a la prueba de la tuberculina (compartiendo o no la jeringa).

p1 = 0, 274 p2 = 0, 174
 
n1 = 97 n2 = 161


H0 1 = 2
H1 1 6= 2

El valor crtico es z0,005 = 1, 96 el criterio de rechazo de H0 ser |z| > 2, 575

n1 p1 +n2 p2 970,274+1610,174
p= n1 +n2 = 97+161 = 0, 211

p1 p2 0,2740,174 0,1
z= r = q
0,2740,726 0,1740,876
= 0,055 = 1, 82
p(1p) p(1p) +
n1 + n2 97 161

Como |1, 82| < 2, 575 se acepta H0 y por tanto no existen diferencias entre ambos grupos.
Para el apartado (b)
n1 p1 +n2 p2 970,274+1610,174
p= n1 +n2 = 97+161 = 0, 211
 q  q
p(1p) 0,2110,789
IC98 % ( ) = (p1 p2 ) z/2 n = 0, 211 2, 33 258 = 0, 211 0, 059

IC98 % ( ) = ( ) [0, 152; 0, 27]

Problema 6.11. A la hora de probar si dos medicamentos actan de la misma forma contra una enfermedad grave, se sabe que al
tratar 10 animales de laboratorio con el primero de ellos se ha obtenido un intervalo de confianza al 80 % de [1165, 89; 1234, 11]
del nmero medio de horas que sobreviven. Por otra parte, al tratar a 16 animales de laboratorio con el segundo medicamento, el
nmero medio de horas que sobreviven es 1400, con una cuasivarianza de 4356.

(a) Puede aceptarse la igualdad de las varianzas poblacionales( = 0, 10)?.


(b) Es ms efectivo el segundo medicamento?.
(c) Construir un Intervalo de Confianza al 99 % para la diferencia del nmero medio de horas que sobreviven.
(
xin f = x tn1,/2 sn 1165, 89 = x 2, 262 s10 x = 1200

Resolviendo
xsup = x + tn1,/2 sn 1234, 11 = x + 2, 262 s10 s = 60, 26

Por tanto tenemos dos muestras con los siguientes estadsticos:

Manuel Angel Barea Gmez 120


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
x1 = 1200 x2 = 1400

s1 = 60, 26 s2 = 66
n1 = 10 n2 = 16


H0 1 = 2
H1 1 6= 2

s21 60,262
F= s22
= 662
= 0, 83

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,95;9;15 = 2, 544

Para una = 0, 10 1
F0,15;9;15 = 3,006 = 0, 332

como 0, 83 (0, 332; 2, 544), se acepta H0 y por tanto 1 = 2


Para comprobar si es ms efectivo el medicamento, formulamos la hiptesis y calculamos para una = 0, 05

H0 1 = 2
H1 1 < 2

Por tener las varianzas poblacionales iguales v = n1 + n2 2 = 10 + 16 2 = 24


El valor crtico es t24;0,975 = 2, 064, el criterio de rechazo de H0 ser t < 2, 0, 64

r
(n1 1)s21 +(n2 1)s22
q
960,262 +15662
s= (n1 +n2 2) = 24 = 63, 90

t= rx1 x2 = q 12001400 = 200


= 1, 98
s2 s2 63,902 63,902 25,75
n +n 10 + 16
1 2

|1, 98| < 2, 145 por tanto se acepta H0 y se rechaza H1

q q
s2 2 63,902 2
IC99 % (2 1 ) = (x2 x1 ) t24;0,995 n1 + ns 2 = 200 2, 797 10 + 63,90
16 = 200 72, 04

IC99 % (2 1) [127, 96; 272, 04]

Problema 6.12. Se quiere averiguar si tres tipos de complejos vitamnicos (V1 ,V2 ,V3 ) producen los mismos efectos en el aumento
de peso de los conejos. Tomamos 15 conejos y le asignamos al azar un complejo vitamnico a cada uno. Despus de un tiempo, el
aumento de peso (grs.) ha sido:

Conejo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Complejo Vitamnico V1 V2 V3 V1 V2 V3 V3 V2 V1 V1 V2 V1 V3 V3 V1
Aumento en grs. 81 91 75 75 92 83 80 97 69 77 88 71 72 60 71

(a) Suponiendo normalidad en los datos, podemos afirmar que los 3 complejos vitamnicos influyen del mismo modo en el
aumento de peso? ( = 0, 05)

Manuel Angel Barea Gmez 121


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Problema 6.13. En el curso de un estudio para determinar los efectos de poner fin a un bloqueo renal en pacientes cuya funcin
renal est deteriorada a causa de una metstasis maligna avanzada, se midi la tensin arterial de cada paciente antes y despus de
la operacin. Los resultados son los siguientes (considere que la distribucin de la tensin arterial es Normal):

Paciente 1 2 3 4 5 6 7 8 9 10
Antes de la intervencin 150 132 130 116 107 100 101 96 90 78
Despus de la intervencin 90 102 80 82 90 94 84 98 89 85

(a) Puede concluirse que la operacin quirrgica tiende a disminuir la tensin arterial?
(b) Estimar mediante un IC la diferencia de medias de tensiones arteriales.
(c) Estimar mediante un IC del 99 % la varianza de la tensin despus de la intervencin.

Paciente 1 2 3 4 5 6 7 8 9 10
Antes de la intervencin X 150 132 130 116 107 100 101 96 90 78
Despus de la intervencin Y 90 102 80 82 90 94 84 98 89 85
di = Xi Yi 60 30 50 34 17 6 17 -2 1 -7

Con una = 0, 05 tenemos:

D = 20, 6

sD = 22, 56
n = 10


H0 1 = 2
H1 1 < 2

El valor crtico es t9;0,05 = 1, 383, el criterio de rechazo de H0 ser t < 1, 383

D 20,6
t= s
D
= 22,56

= 0, 28
n 10

Como 0, 28 > 1, 383 se rechaza H0 y se admite H1 que indica que la operacin quirrgica tiende a disminuir la tensin arterial
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.

x1 = 110 x2 = 89, 40

Antes s1 = 21, 93 Despues s2 = 7, 04


n1 = 10 n2 = 10


H0 1 = 2
H1 1 6= 2

s21 21,932
F= s22
= 7,042
= 9, 70

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

Manuel Angel Barea Gmez 122


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
F0,975;9;9 = 4, 026

Para una = 0, 05 1
F0,025;9;9 = 3,717 = 0, 248

como 9, 70
/ (0, 248; 4, 026), se rechaza H0 y por tanto 1 6= 2
2
(n1 s21 +n2 s22 ) (1021,932+107,042) 28141592,67
Por tener las varianzas poblacionales distintas v = 2 2 2 2
= 2 )2 (107,042 )2
= 2597167,91 = 10, 8 11
( 1 1) + ( 2 2)
n s n s (1021,93
+
n1 1 n2 1 9 9

r
s21 s2
q
21,932 2
IC95 % = ( 1 2 ) tv;/2 n1 + n22 = (110 89, 40) 2, 201 10 + 7,04
10 = 20, 6 16, 03

IC95 % ( 1 2 ) [4, 57; 36, 63]

 
(n1)s2 2
97,042 97,042
h i
IC99 % 2 = ; 2(n1)s 23,59 ; 1,73 = IC99 % 2 [18, 90; 257, 83]
 
2
(n1);
=
/2 (n1);(1/2)

Problema 6.14. Una compaa farmacutica investiga los efectos producidos por tres compuestos. La investigacin consiste en
aplicar los compuestos a 26 ratones de caractersticas similares y anotar los tiempos de reaccin. Los animales se clasifican aleato-
riamente en 3 grupos de 8, 6 y 12 ratones respectivamente. A cada grupo se le administra un compuesto diferente, obtenindose los
siguientes resultados:

Tiempo de reaccin medido en min.


Grupo 1 6 7 5 6 5 8 4 7
Grupo 2 10 9 9 10 10 6
Grupo 3 3 4 8 3 7 6 3 6 4 7 6 3

(a) Suponiendo normalidad en los datos, podemos afirmar que los tres compuestos producen los mismos efectos( = 0, 05)?

Para evaluar el ejercicio se realizar un ANOVA para ello en primer lugar se obtienen los datos estadsticos de los distintos grupos:

x1 = 6 x2 = 9 x2 = 5

Grupo 1 s1 = 1, 309 Grupo 2 s2 = 1, 549 Grupo 3 s2 = 1, 859


n1 = 8 n2 = 6 n2 = 12

Nuestra hiptesis es:



H0 1 = 2 = 3
H1 6= a las demas

Llamando K al nmero de grupos,en nuestro caso 3 y N al nmero total de muestras, es decir, N = 8 + 6 + 12 = 26, nuestro estadstico
se hallar con la F de Snedecor, donde es F ;K1:NK
El valor crtico es F0,05;2,23 = 3, 439, el criterio de rechazo de H0 ser F > 3, 439
En primer lugar hallamos la media de los grupos

xi 6+9+5
xT = K = 3 = 6, 67

Llamamos SCE ,Suma de los cuadrados entre grupos, a la expresin

SCE = (xi xT )2 ni = (6 6, 67)2 8 + (9 6, 67)2 6 + (5 6, 67)2 12 = 69, 63

Manuel Angel Barea Gmez 123


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Llamamos SCD ,Suma de los cuadrados dentro de los grupos o intragrupos, a la expresin

SCD = (ni 1) s2i = 7 1, 3092 + 5 1, 5492 + 11 1, 8592 = 62

Por ltimo, hallamos nuestro estadstico

SCE 69,83
F= K1
SCD = 2
62 = 12, 9
NK 23

Como 12, 9 > 3, 439 se rechaza H0 y se puede afirmar que los tres compuestos no producen los mismos efectos.

Problema 6.15. En un hospital de la ciudad es relativamente frecuente que los pacientes no acudan el da en el que fueron citados.
Para comprobar si una llamada telefnica el da anterior a la cita incrementa el cumplimiento, de los 45 pacientes citados un da se
telefone a 25 pacientes, de los cuales cumplieron con su cita 20. Por otra parte, de los 20 que no fueron telefoneados, acudieron
slo 8 a su cita.

(a) Puede afirmarse el efecto de la llamada telefnica?


(b) Calcule un intervalo de confianza al 98 % de la diferencia de porcentajes de cumplimiento.

p1 = 0, 8 p1 = 0, 4
 
Llamada da anterior Sin llamada da anterior
n1 = 25 n1 = 20

n1 p1 +n2 p2 250,8+200,4
p= n1 +n2 = 25+20 = 0, 622


H0 1 = 2
H1 1 6= 2

El valor crtico es z0,975 = 1, 96, el criterio de rechazo de H0 ser |z| > 1, 96

p1 p2 0,80,4 0,4
z= r = q
0,6220,378 0,6220,378
= 0,14 = 2, 75
p(1p) p(1p) +
n1 + n2 25 20

Se rechaza de H0 porque 2, 75 > 1, 96, por tanto existen efectos de la llamada telefnica.

q
p(1p) p(1p)
IC99 % (1 2 ) = (p1 p2) z0,99 n1 + n2 = 0, 4 2, 33 0, 14 = 0, 4 0, 32

IC99 % (1 2 ) [0, 08; 0, 78]

Problema 6.16. Una de las variables que se utiliza para comparar las caractersticas fsicas de las nadadoras olmpicas con las de
las corredoras es la circunferencia de la parte superior del brazo, en cm., mientras estn relajadas. Un investigador obtuvo con una
muestra de 10 nadadoras para esta variable un intervalo de confianza al 99 % para la media de (25, 35; 29, 25), mientras que con
una muestra de 12 corredoras obtuvo una media de 23, 5 cm y una desviacin tpica de 1, 7 cm. Suponiendo normalidad en los datos:

Manuel Angel Barea Gmez 124


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(a) Obtener un intervalo de confianza al 90 % para la desviacin tpica de esta variable en la poblacin de nadadoras.
(b) Decidir si puede afirmarse que la media de la circunferencia de la parte superior del brazo es mayor en las nadadoras que en
las corredoras.
(
xin f = x tn1,/2 sn 25, 35 = x 3, 250 s10 x1 = 27, 3

Resolviendo
xsup = x + tn1,/2 sn 29, 25 = x + 3, 250 s10 s1 = 1, 89

 
(n1)s2 2
91,892 91,892
h i
IC90 % 2 = ; 2(n1)s 16,92 ; 3,33 = IC90 % 2 [1, 9; 9, 65]
 
2
(n1);
=
/2 (n1);(1/2)

IC90 % ( ) [1, 378; 3, 107]


H0 1 = 2
H1 1 6= 2

s21 1,892
F= s22
= 1,72
= 1, 23

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;9;11 = 3, 588

Para una = 0, 05 1
F0,025;9;11 = 3,912 = 0, 255

como 1, 23 (0, 255; 3, 588), se acepta H0 y por tanto 1 = 2


H0 1 = 2
H1 1 > 2

Por tener las varianzas poblacionales iguales v = n1 + n2 2 = 10 + 12 2 = 20


El valor crtico es t20;0,05 = 1, 725, el criterio de rechazo de H0 ser t > 1, 725

(n1 1)s21 +(n2 1)s22 91,892 +111,72


s= n1 +n2 2 = 20 = 3, 19

t= rx1 x2 = q27,323,5 = 3,8


= 2, 79
s2 s2 3,192 3,192 1,36
n +n
1 2 10 + 12

Por tanto, como 2, 79 > 1, 720 se rechaza H0 y se acepta H1 que indica que la media de la circunferencia de la parte superior del brazo
es mayor en las nadadoras que en las corredoras.

Problema 6.17. En un tratamiento contra la hipertensin se seleccionaron 21 enfermos de caractersticas similares. A cada enfermo
se le administr uno de los frmacos P, A, B, al azar, formando 3 grupos. El grupo P tom placebo (frmaco inocuo) y los otros dos
tomaron A y B respectivamente. Para valorar la eficacia de los tratamientos, se registr el descenso de la presin diastlica desde el
estado basal (inicio del tratamiento) hasta el estado al cabo de una semana de tratamiento. Los resultados fueron:

Manuel Angel Barea Gmez 125


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
P 10 0 15 -20 0 -5
A 20 25 33 25 30 18 0
B 15 10 25 30 15 35 25 22

Para un nivel de significacin del 5 % y suponiendo normalidad, se pide:

(a) Estudiar si existen diferencias significativas entre los tres tratamientos.


(b) Estudiar si existen diferencias significativas entre los tratamientos A y B.

x1 = 0 x2 = 21, 571 x2 = 22, 125


Grupo 1 s1 = 12, 247 Grupo 2 s2 = 10, 845 Grupo 3 s2 = 8, 391


n1 = 6 n2 = 7 n2 = 8

Nuestra hiptesis es:



H0 1 = 2 = 3
H1 6= a las demas

Llamando K al nmero de grupos,en nuestro caso 3 y N al nmero total de muestras, es decir, N = 6 + 7 + 8 = 21, nuestro estadstico
se hallar con la F de Snedecor, donde es F ;K1:NK
El valor crtico es F0,05;2,18 = 3, 555, el criterio de rechazo de H0 ser F > 3, 555
En primer lugar hallamos la media de los grupos

xi 0+21,571+6,25
xT = K = 3 = 9, 27

Llamamos SCE ,Suma de los cuadrados entre grupos, a la expresin

SCE = (xi xT )2 ni = (0 9, 27)2 6 + (21, 571 9, 27)2 7 + (22, 125 9, 27)2 8 = 2370

Llamamos SCD ,Suma de los cuadrados dentro de los grupos o intragrupos, a la expresin

SCD = (ni 1) s2i = 5 12, 2472 + 6 10, 8452 + 7 8, 3912 = 1948, 5

Por ltimo, hallamos nuestro estadstico

SCE 2370
F= K1
SCD = 2
1948,5 = 10, 94
NK 18

Como 10, 94 > 3, 439 se rechaza H0 y se puede afirmar que los tres frmacos no tienen la misma eficacia.
El segundo apartado compara los tratamientos A y B. En primer lugar comparamos las varianzas poblacionales

H0 2 = 3
H1 2 6= 3

s22 10,8452
F= s23
= 8,3912
= 1, 67

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

Manuel Angel Barea Gmez 126


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
F0,975;6;7 = 5, 119

Para una = 0, 05 1
F0,025;6;7 = 5,119 = 0, 195

como 1, 63 (0, 195; 5, 119), se acepta H0 y por tanto 2 = 3


Para comprobar si es ms efectivo el medicamento, formulamos la hiptesis y calculamos para una = 0, 05

H0 1 = 2
H1 1 6= 2

Por tener las varianzas poblacionales iguales v = n1 + n2 2 = 7 + 8 2 = 13


El valor crtico es t13;0,975 = 2, 160, el criterio de rechazo de H0 ser |t| > 2, 160

r
(n1 1)s21 +(n2 1)s22
q
610,8452 +78,3912
s= (n1 +n2 2) = 13 = 7, 66

rx1 x2 21,75122,125 0,375


t= = = 3,96 = 0, 09
7,662 7,662
q
s2 s2
n +n
1 2 7 + 8

|0, 09| < 2, 160 por tanto se acepta H0 que afirma que no existen diferencias entre los tratamientos A y B.

Problema 6.18. Es conocido que la falta de oxgeno que se respira en alta montaa es la causa de todos los males de los escaladores.
Se ha realizado un estudio para analizar la saturacin de oxgeno en sangre de los alpinistas, recogiendo para ello una muestra
formada por 9 mujeres y 8 hombres alpinistas en la que se ha obtenido el nivel de saturacin de oxgeno en sangre, medido en una
escala de porcentaje de 0 % a 100 %:

Sexo M M M M M M M M M H H H H H H H H
Nivel O2 61 73 67 70 70 75 69 69 71 63 67 62 79 65 68 68 61

Suponiendo normalidad en los datos:

(a) Estimar mediante un intervalo de confianza con un nivel de significacin de 0,02 la media de saturacin en el grupo de las
mujeres alpinistas.
(b) Niveles de oxgeno inferiores o iguales al 67 % provocan mareos y desorientacin, puede afirmarse, con un nivel de signifi-
cacin de 0,05, que ms del 50 % de los alpinistas sufren mareos o desorientacin?
(c) Puede afirmarse que los niveles medios de oxgeno son distintos para ambos sexos?

Datos estadsticos por sexo:

x1 = 68, 58 x2 = 69, 44

Mu jeres s1 = 4, 67 Hombre s2 = 3, 94
n1 = 9 n2 = 8

IC98 % ( ) = x1 tn1 1;/2 ns11 = 68, 58 2, 306 4,67


= 68, 58 3, 59 IC98 % ( ) [64, 99; 72, 17]
9

El apartado (b) es un contraste de hiptesis de proporciones

7
p= 17 = 0, 41

Manuel Angel Barea Gmez 127


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
H0 = 0, 5

H1 > 0, 5

El valor crtico para una = 5 % es z/2 = 1, 96, el criterio de rechazo ser z > 1, 54

q p 0,410,5
z= (1 )
= q
0,50,5
= 0, 742
n 17

Por tanto H0 y no ms del 50 % de los alpinistas sufren mareos o desorientacin.

El apartado (c) es un contraste de hiptesis de diferencias de medias


En primer lugar comparamos las varianzas poblacionales

H0 1 = 2
H1 1 6= 2

s21 4,672
F= s22
= 3,952
= 1, 39

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;8;7 = 4, 899

Para una = 0, 05 1
F0,025;8;7 = 4,357 = 0, 204

como 1, 39 (0, 204; 4, 899), se acepta H0 y por tanto 1 = 2


Para comprobar si es ms efectivo el medicamento, formulamos la hiptesis y calculamos para una = 0, 05

H0 1 = 2
H1 1 6= 2

Por tener las varianzas poblacionales iguales v = n1 + n2 2 = 9 + 8 2 = 15


El valor crtico es t15;0,975 = 2, 131, el criterio de rechazo de H0 ser |t| > 2, 131

r
(n1 1)s21 +(n2 1)s22
q
84,672 +73,952
s= (n1 +n2 2) = 15 = 4, 34

rx1 x2 68,5869,44 0,86


t= = = 2,10 = 0, 409
4,342 4,342
q
s2 s2
n +n 9 + 8
1 2

|0, 409| < 2, 133 por tanto se acepta H0 que afirma que no existen diferencias entre ambos sexos

Problema 6.19. Un equipo mdico asegura que la metformina rebaja los niveles de glucosa en sangre. Para comprobarlo, selec-
cionan un grupo de 10 pacientes con diabetes Mellitus II, a los que se le mide la cantidad de azcar en sangre en ayunas, antes del
tratamiento y despus de un mes de tratamiento obteniendo los siguientes resultados:

Nivel glucosa antes 125 160 110,00 135 125 129 148 140 169 145
Nivel glucosa despus 100 129 89 105 116 105 122 113 125 99

Manuel Angel Barea Gmez 128


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Suponiendo que los datos son normales:

(a) Podemos admitir con un nivel de significacin de ( = 0, 02) la afirmacin del equipo mdico.
(b) Calcule un intervalo al 95 % de confianza para la media del nivel de glucosa despus del tratamiento.

Nivel glucosa antes X 125 160 110,00 135 125 129 148 140 169 145
Nivel glucosa despus Y 100 129 89 105 116 105 122 113 125 99
di = Xi Yi 25 31 21 30 9 24 26 27 44 46

D = 28, 30

sD = 10, 71
n = 10


H0 1 = 2
H1 1 > 2

El valor crtico es z0,98 = 2, 055, el criterio de rechazo de H0 ser t > 2, 055

|D| 28,30
z= s
D
= 10,71

= 8, 35
n 10

Al ser 8, 35 > 2, 055 admite H1 que indica que el nivel de glucosa disminuye despus del tratamiento.

Para el apartado (b) los datos son:

x1 = 110, 30

s = 12, 85
1
n = 10

IC95 % ( ) = x1 tn11;/2 ns11 = 110, 30 2, 262 12,85



10
= 110, 30 9, 19 IC95 % ( ) [101, 10; 119, 49]

Problema 6.20. Un dietista toma dos muestras formadas por 50 y 60 personas, respectivamente. Propone a los primeros seguir la
dieta A y a los segundos las dieta B. En ambos casos, el nmero de personas que consiguen reducir el peso de forma significativa es
40. Se pide:

(a) Calcular el intervalo de confianza del 95 % para la diferencia de las correspondientes proporciones.
(b) Se podra concluir que la proporcin de personas que consiguen reducir el peso de forma significativa es mayor con la dieta
A?

p1 = 40
50 = 0, 8 B p2 = 40
60 = 0, 67
 
A
n1 = 50 n2 = 60

Manuel Angel Barea Gmez 129


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
q q
IC95 % (1 2) = (p1 p2 ) z/2 p1 (1p
n1
1)
+ p2 (1p
n2
2)
= (0, 8 0, 67) 1, 96 0,80,2
50 +
0,670,23
60 = 0, 13 0, 148

IC95 % (1 2) [0, 018; 0, 278]

n1 p1 +n2 p2 500,8+600,67
p= n1 +n2 = 50+60 = 0, 727


H0 1 = 2
H1 1 > 2

El valor crtico es z0,95 = 1, 645, el criterio de rechazo de H0 ser z > 1, 645

p1 p2 0,80,677 0,123
z= r = q
0,7270,273 0,7270,273
= 0,085 = 1, 44
p(1p) p(1p) +
n1 + n2 50 60

Se acepta H0 porque 1, 44 < 1, 645, por tanto no se puede concluir la hiptesis formulada respecto a la dieta A.

Problema 6.21. En un estudio de angina de pecho en ratas, se dividi aleatoriamente a 18 animales afectados, en dos grupos de
9 individuos cada uno. A un grupo se le suministr un placebo y al otro el frmaco experimental FL113. Despus de un ejercicio
controlado sobre una rueda de andar, se determin el tiempo de recuperacin de cada rata. Se piensa que el FL113 reducir el
tiempo medio de recuperacin. Se dispone de la siguiente informacin:

x1 = 329 seg. x2 = 238 seg.


Placebo s1 = 45 seg. FL113 s2 = 43 seg.


n1 = 9 n2 = 9

(a) Construya un intervalo de confianza del 95 % para la diferencia de los tiempos medios de recuperacin de las ratas que
recibieron placebo y las que recibieron el FL113.
(b) Es cierta la suposicin de que el FL113 reducir el tiempo medio de recuperacin? .

En primer lugar debemos averiguar si las varianzas poblacionales son iguales:



H0 1 = 2
H1 1 6= 2

s21 452
F= s22
= 432
= 1, 09

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;8;8 = 4, 433

Para una = 0, 05 1
F0,025;8;8 = 4,433 = 0, 225

como 1, 09 (0, 225; 4, 433), se acepta H0 y por tanto 1 = 2 Por tener las varianzas poblacionales iguales v = n1 + n2 2 =
9 + 9 2 = 16

Manuel Angel Barea Gmez 130


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
r
s2 s2
q
2 2
IC95 % (1 2 ) tv;/2 n11 + n22 = (329 238) 2, 120 459 + 439 = 90 43, 9

IC95 % (1 2 ) [46, 71; 133, 29]

Formulamos la hiptesis y calculamos para una = 0, 05



H0 1 = 2
H1 1 > 2

El valor crtico es t16;0,95 = 2, 120, el criterio de rechazo de H0 ser t > 2, 120

r
(n1 1)s21 +(n2 1)s22
q
8452 +8432
s= (n1 +n2 2) = 16 = 44, 01

t= rx1 x2 = q329238 = 90
= 4, 33
s2 s2 442 + 442 20,74
n +n 1 2
9 9

44, 201 > 2, 120 por tanto se rechaza H0 y se contrasta que el frmaco FL113 reduce el tiempo de recuperacin.

Problema 6.22. Se inoculan dos organismos aislados durante dos epidemias distintas, a dos muestras diferentes obtenidas de la
misma poblacin. A las dos semanas enferma el 68,5 % de las 200 pruebas realizadas con el primer organismo, y el 65,3 % de
las 150 pruebas efectuadas para el segundo caso. Halle un intervalo de confianza del 95 % de esta diferencia de proporciones
encontradas.

p1 = 68, 5 p2 = 65, 3
 
A B
n1 = 200 n2 = 150

q q
0,6850,315
IC95 % (1 2 ) = (p1 p2) z/2 p1 (1p1 )
n1 + p2 (1p2 )
n2 = (0, 685 0, 653) 1, 96 200 + 0,6530,347
150 = 0, 032 0, 1

IC95 % (1 2) [0, 068; 0, 132]

Problema 6.23. Se est haciendo un estudio sobre hipertensin. De una ciudad se toma una muestra de trece pacientes y de otra
ciudad se toma otra muestra de diecisis pacientes. Los datos obtenidos son los siguientes:

x1 = 166 mm x2 = 164, 7 mm

s1 = 28 mm FL113 s2 = 7 mm
n1 = 13 n2 = 16

(a) Determine un intervalo de confianza del 95 % para la diferencia de medias, bajo la hiptesis de normalidad de los datos.

En primer lugar debemos averiguar si las varianzas poblacionales son iguales:



H0 1 = 2
H1 1 6= 2

Manuel Angel Barea Gmez 131


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
s21 282
F= s22
= 72
= 16

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;12;15 = 2, 963

Para una = 0, 05 1
F0,025;12;15 = 3,177 = 0, 314

2
(n1 s21 +n2 s22 )
como 16
/ (0, 314; 2, 963), se rechaza H0 y por tanto 1 6= 2 Por tener las varianzas poblacionales distintas v = 2 2 =
(n1 s21 ) + (n2 s22 )
n1 1 n2 1

(13282 +1672 ) 10976


2 2 = 898,33 = 12, 26 13
(13282 ) + (1672 )
12 15

r
s21 s2
q
282 2
IC95 % ( 1 2 ) tv;/2 n1 + n22 = (166 164, 7) 2, 16 13 + 716 = 1, 3 17, 12

IC95 % ( 1 2 ) [15, 89; 18, 42]

Problema 6.24. Se supone que en una determinada raza de ganado vacuno los terneros aumentan 12 kg de peso por cada dos
semanas, en los primeros meses de vida. Para comprobarlo se midi el peso de ocho terneros al cumplir las cuatro semanas, y
posteriormente dos semanas ms tarde, con el siguiente resultado:

Ternero 1 2 3 4 5 6 7 8
Peso (4 semanas) 130 125 128 127 129 123 131 130
Peso (6 semanas) 138 140 139 141 137 137 142 142

(a) Compruebe si la suposicin es cierta calculando un intervalo de confianza del 95 % para la diferencia media de peso. Se
considera que el peso se distribuye de forma aproximadamente normal.

Ternero 1 2 3 4 5 6 7 8
Peso (4 semanas) X 130 125 128 127 129 123 131 130
Peso (6 semanas) Y 138 140 139 141 137 137 142 142
d1 = Yi Xi 8 15 11 14 8 14 11 12

D = 11, 625

sD = 2, 67
n=8

IC95 % (2 1) = D tn1;/2 Sdn = 11, 625 2, 365 2,67


= 11, 625 2, 232 IC95 % (2 1 ) [9, 393; 13, 857]
8

Problema 6.25. El tratamiento anticoagulante por va oral se realiza con dicumarnicos. Se midi el porcentaje de nivel de protrom-
bina (que determina el grado de coagulacin) a nueve pacientes, antes y despus del tratamiento con dicho frmaco y se obtuvieron
los siguientes resultados:

Antes 95 85 77 100 92 67 81 94 99
Despus 40 37 28 49 37 21 45 52 37

Manuel Angel Barea Gmez 132


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(a) Calcule un intervalo del 95 % para la diferencia entre los porcentajes medios de actividad de protrombina antes y despus del
tratamiento.
(b) Se puede afirmar que con este tratamiento el porcentaje medio puede llegar a disminuir en 53 puntos?
(c) Cuntos pacientes deben ser estudiados para que la amplitud del intervalo de confianza se reduzca a la tercera parte?

Antes X 95 85 77 100 92 67 81 94 99
Despus Y 40 37 28 49 37 21 45 52 37
d1 = Xi Yi 55 48 49 51 55 46 36 42 62

D = 49, 33

sD = 7, 68
n=9

IC95 % (2 1) = D tn1;/2 Sdn = 49, 33 2, 306 7,68


= 49, 33 5, 90 IC95 % (2 1 ) [43, 43; 55, 23]
9

Si se puede afirmar ya que 53 [43, 43; 55, 23]


Para reducir al amplitud del intervalo a la tercera parte:

11,8
l = 55, 23 43, 43 = 11, 8 l
3 = 3 = 3, 93
 2
sD 21,96
3, 93 = 2 z/2 n
n= 3,93 59

Problema 6.26. Se sospecha que la concentracin de sulfonato de perfluorooctano (PFOS) en la sangre de las personas de una
cierta regin est aumentando con el tiempo. A ocho personas del lugar, elegidas aleatoriamente, se les midi la concentracin de
PFOS en el plasma en 1979 y en 1986, con los siguientes resultados:

Sujeto 1 2 3 4 5 6 7 8
PFOS ng/ml 1979 28,2 31,6 30,1 27,9 28,8 30,1 32,1 30,9
PFOS ng/ml 1986 30,6 31,9 32,8 30,8 33,7 29,8 33,6 30,4

(a) Calcule un intervalo de confianza del 95 % para la diferencia entre las concentraciones medias de PFOS en sangre entre 1986
y 1979.
(b) Sera admisible afirmar, al nivel de confianza anterior, que la concentracin de PFOS en sangre ha aumentado en el perodo
de tiempo estudiado?

Sujeto 1 2 3 4 5 6 7 8
PFOS ng/ml 1979 X 28,2 31,6 30,1 27,9 28,8 30,1 32,1 30,9
PFOS ng/ml 1986 Y 30,6 31,9 32,8 30,8 33,7 29,8 33,6 30,4
d1 = Yi Xi 2,4 0,3 2,7 2,9 4,9 -0,3 1,5 -0,5

D = 1, 74

sD = 1, 85
n=8

Manuel Angel Barea Gmez 133


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
IC95 % (2 1) = D tn1;/2 Sdn = 1, 74 2, 365 1,85
= 1, 74 1, 54 IC95 % (2 1 ) [0, 20; 3, 28]
8

Si se puede afirmar ya que el intervalo es positivo lo cul quiere decir que el nivel medio en 1986 es mayor que en 1979.

Problema 6.27. Se hizo un muestreo en dos municipios para averiguar su opinin sobre la fluoracin del agua potable antes de
iniciar la campaa. Los resultados de estas encuestas (siendo p la proporcin favorable) fueron

p1 = 0, 52 p2 = 0, 55
 
Municipio 1 Municipio 2
n1 = 110 n2 = 75

(a) Podra afirmarse que los dos municipios tienen iguales proporciones de partidarios de la fluoracin?

n1 p1 +n2 p2 1100,52+750,55
p= n1 +n2 = 110+75 = 0, 532


H0 1 = 2
H1 1 6= 2

El valor crtico es z0,975 = 1, 96, el criterio de rechazo de H0 ser |z| > 1, 96

p1 p2 0,520,55 0,03
z= r = q
0,5320,468 0,5320,468
= 0,07 = 0, 42
p(1p) p(1p) +
n1 + n2 110 75

Se acepta H0 porque |0, 42| < 1, 96

Problema 6.28. Se desea averiguar si la aspirina y un producto de comparacin son igualmente eficaces para el alivio de los
sntomas de influenza. Se registran los tiempos, en minutos, desde la toma de la medicina hasta cuando el paciente declara sentirse
mejor, y los resultados son:

x1 = 15, 2 x2 = 13, 4

Aspirina s1 = 8, 7 Producto de comparacion s2 = 6, 9


n1 = 10 n2 = 20

(a) Contraste la hiptesis al nivel del 5 %

En primer lugar debemos averiguar si las varianzas poblacionales son iguales:



H0 1 = 2
H1 1 6= 2

s21 8,72
F= s22
= 6,92
= 1, 59

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

Manuel Angel Barea Gmez 134


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
F0,975;9;19 = 2, 880

Para una = 0, 05 1
F0,025;9;19 = 3,68 = 0, 271

como 1, 59 (0, 271; 2, 880), se acepta H0 y por tanto 1 = 2

v = n1 + n2 2 = 10 + 20 2 = 18

Formulamos la hiptesis y calculamos para una = 0, 05



H0 1 = 2
H1 1 6= 2

El valor crtico es t18;0,975 = 2, 101, el criterio de rechazo de H0 ser |t| > 2, 101

r
(n1 1)s21 +(n2 1)s22
q
98,72 +196,92
s= (n1 +n2 2)
= 28 = 7, 53

t= rx1 x2 = q15,213,4 = 0, 6176


s2 s2 7,532 7,532
n +n 10 + 20
1 2

0, 6176 < 2, 101 por tanto se acepta H0 y se contrasta que ambos frmacos son igualmente de eficaces.

Problema 6.29. Las velocidades de difusin del bixido de carbono a travs de suelos de porosidades diferentes son:

Suelo fino 20 27 22 23 23 28 23 26 22 26 20 19 22
Suelo poroso 19 30 32 28 15 26 35 18 25 35

(a) Compruebe si puede afirmarse que son diferentes al nivel de significacin del 5 % (Se supone que la distribucin es normal).

x1 = 23, 15 x2 = 26, 30

Suelo f ino s1 = 2, 82 Suelo poroso s2 = 7, 08


n1 = 13 n2 = 10


H0 1 = 2
H1 1 6= 2

s21 2,822
F= s22
= 7,082
= 0, 16

Se rechaza H0 si F no pertenece al intervalo de nuestro estadstico.

F0,975;12;9 = 3, 868

Para una = 0, 05 1
F0,025;12;9 = 3,436 = 0, 291

como 0, 16
/ (0, 291; 3, 868), se rechaza H0 y por tanto 1 6= 2

v = n1 + n2 2 = 10 + 20 2 = 18

Manuel Angel Barea Gmez 135


CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Formulamos la hiptesis y calculamos para una = 0, 05

H0 1 = 2
H1 1 6= 2

2
(n1 s21 +n2 s22 ) (132,822 +107,082)
Por tener las varianzas poblacionales distintas v = 2 2 = 2 2 11
(n1 s21 ) + (n2 s22 ) (13282 ) + (1072 )
n1 1 n2 1 12 19

El valor crtico es t11;0,975 = 2, 201, el criterio de rechazo de H0 ser |t| > 2, 201

rx1 x2 23,1526,30
t= = = 1, 32
2,822 7,082
q
s21 s22
n1 + n2 13 + 10

|1, 32| < 2, 201 por tanto se acepta H0 y se contrasta que las velocidades de difusin del bixido de carbono en suelos diferentes
son iguales.

Problema 6.30. En un reciente estudio de lesiones de rodilla entre jugadores de ftbol que juegan sobre csped, se compararon dos
tipos de calzados. En 266 jugadores que calzaban zapatos de ftbol multiabrazados, se presentaron 14 lesiones de rodilla. De 2055
jugadores que calzaban botas de ftbol convencionales, se encontraron 162 de tales lesiones.

(a) Se puede afirmar al nivel del 0,05 que la probabilidad de sufrir una lesin de rodilla cuando se calzan botas convencionales
es ms alta que la de sufrirla con zapatos multiabrazados?
(b) Y al nivel de 0,01?

14 162
= 0, 052 = 0, 078
 
p1 = 266 p2 = 2055
Multiabrazados Convencionales
n1 = 266 n2 = 2055

(a) Podra afirmarse que los dos municipios tienen iguales proporciones de partidarios de la fluoracin?
n1 p1 +n2 p2 2660,052+20550,078
p= n1 +n2 = 266+2055 = 0, 075


H0 1 = 2
H1 1 < 2

El valor crtico es z0,95 = 1, 645, el criterio de rechazo de H0 ser z > 1, 645

p2 p1 0,0780,052
z= r = q
0,0750,925 0,0750,925
= 1, 7552
p(1p) p(1p) + 2055
n1 + n2 266

Se rechaza H0 porque 1, 755 > 1, 645, por tanto, la probabilidad de sufrir una lesin de rodilla cuando se calzan botas convencionales
es ms alta que la de sufrirla con zapatos multiabrazados.
Para una = 0, 01
El valor crtico es z0,99 = 2, 32, el criterio de rechazo de H0 ser z > 2, 32

p2 p1 0,0780,052
z= r = q
0,0750,925 0,0750,925
= 1, 7552
p(1p) p(1p) + 2055
n1 + n2 266

Se acepta H0 porque 1, 755 < 2, 32.

Manuel Angel Barea Gmez 136


C APTULO

7
Contrastes de hiptesis no paramtricos

Problema 7.1. Queremos saber si las causas de muerte se distribuyen de la misma forma en los pases desarrollados y en los subde-
sarrollados. Del primer grupo de pases tomamos aleatoriamente una muestra de tamao 200, encontrando las siguientes causas de
muerte: Enfermedades cardiovasculares (90), Cncer (36), Enfermedades infecciosas (10), Accidentes (12), Resto de enfermedades
(52). Del segundo grupo de pases tomamos aleatoriamente otra muestra de tamao 200, encontrando las siguientes causas de
muerte: Enfermedades cardiovasculares (35), Cncer (15), Enfermedades infecciosas (80), Accidentes (6), Resto de enfermedades
(64).

(a) Podemos afirmar con un 1 % de significacin que las causas de muerte se distribuyen de la misma forma en ambos grupos de
pases?

Frecuencias Enfermedades Enfermedades Resto


Cncer Accidentes Total
observadas Cardiovasculares Infecciosas Enfermedades
Primer Grupo 90 36 10 12 52 200
Segundo Grupo 35 15 80 6 64 200
Total 125 51 90 18 116 400

Completamos nuestra tabla con las frecuencias esperadas

(a)

Frecuencias Enfermedades Enfermedades Resto


Cncer Accidentes
esperadas Cardiovasculares Infecciosas Enfermedades
Primer Grupo 62,5 25,5 45 9 58
Segundo Grupo 62,5 25,5 45 9 68

2 = c2

H0
H1 2 6= c2

Sigue una distribucin 2 con v = (2 1) (5 1) = 4 grados de libertad


2
Nuestro estadstico es 4;0,005 2
; 4;0,995 = [0, 21; 14, 86] dicho intervalo ser nuestra regin de aceptacin

137
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2
(OE) (9062,5)2 2
2 = E = 62,5 + ... + (649)
9 = 90, 53

Por tanto, se rechaza H0 y se acepta H1 que indica que no se distribuyen de la misma forma ambas poblaciones.

Problema 7.2. En una campaa preventiva de deteccin precoz del glaucoma realizada en una poblacin se pretende estudiar si
el grado de tal enfermedad est o no condicionado por el sexo de los sujetos explorados. Entre los varones sometidos a la prueba
resultaron 4724 normales, 193 sospechosos de la enfermedad y 39 glaucomatosos, mientras que entre las mujeres resultaron 2979
normales, 55 sospechosas y 12 glaucomatosas.

(a) Que podemos deducir del test?

Frecuencias
Normales Sospechosos Glaucomatosos Total
observadas
Hombres 4724 193 39 4956
Mujeres 2979 55 12 3046
Total 7703 248 51 8002

Completamos nuestra tabla con las frecuencias esperadas

(a)

Frecuencias
Normales Sospechosos Glaucomatosos
esperadas
Hombres 4770,81 153,59 31,57
Mujeres 2932,18 94,40 19,41

2 = c2

H0
H1 2 6= c2

Sigue una distribucin 2 con v = (2 1) (3 1) = 2 grados de libertad para una = 0, 05


2 2
Nuestro estadstico es 2;0,025 ; 2;0,975 = [0, 22; 7, 38] dicho intervalo ser nuestra regin de aceptacin

2
(OE) (47244770,81)2 2
c2 = E = 4770,81 + ... + (1219,41)
19,41 = 32, 33

Por tanto, se rechaza H0 y se acepta H1 que indica que no se distribuyen de la misma los hombres y mujeres con respecto al test.

Problema 7.3. En general, se sabe que de los pacientes con leucemia mieloblstica aguda con los que se logra una remisin
completa, a partir de un tratamiento convencional, el 50 % sobreviven ms de 21 meses. Se est estudiando un nuevo procedimiento
con el que se espera que aumente este nmero de meses de supervivencia. Este tiempo para 10 pacientes con el nuevo tratamiento
ha sido:

25,8 20,5 20,9 27,3 21,5 20,1 28,9 19,2 26,3 24,1

(a) Mediante el contraste de los signos, decidir si el nuevo procedimiento ha aumentado la mediana del tiempo de supervivencia.
(b) Mediante el contraste de DAgostino, estudiar si los datos son normales.

Manuel Angel Barea Gmez 138


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

Contamos los valores por encima de 21 Texp = 6 no existe en nuestra muestra ningn valor 21, por tanto, n = 10, aproximamos
T B(10; 0, 05), por lo que para un nivel de significacin = 0, 05 hay que encontrar P (X = k) 0, 05.
Nuestra regin de convergencia es Rc : Texp n k


Las probabilidades B (10; 0, 05) que tienen valores menores de 0,05, es para para k = 1, por tanto Rc : Texp 9 como 6 9 la


hiptesis de que aumentado la mediana el tiempo de supervivencia, no es significativa


El apartado (b)


H0 La poblacion es normal
H1 La poblacion no es normal

Rechazamos H0 si el valor de Dexp est fuera del intervalo de la tabla de los puntos crticos del test de DAgostino.

Los puntos crticos son [0, 2513; 0, 2849]

En primer lugar para calcular nuestro estadstico ordenamos los datos de menor a mayor.

xi = 234, 6

i xi = 1382, 3
Xi2 = 5610, 6

iX n+1
2 Xi
Dexp = s i = r1382,35,5234,6 = 92
= 0, 2814
326,9
( X )2 10 10 5610,6 234,6
2
 n o
n n Xi2 ni 10

Como 0, 2814 [0, 2513; 0, 2849] H0 es aceptada y la poblacin sigue una distribucin normal.

Problema 7.4. Se ha realizado un recuento acerca del nmero de ingresos hospitalarios que han tenido un grupo de 200 pacientes
que padecen insuficiencia cardaca. Ajustar los datos recogidos en la siguiente tabla a una distribucin binomial y estudiar la bondad
del ajuste.

Ingresos 0 1 2 3 4 5 6
Frecuencia 10 30 65 58 28 8 1


H0 Los datos se a justan a una distribucion binomial
H1 Los datos no se a justan a una distribucion binomial

 
n
Para obtener los valores esperados se tiene que utilizar la formula de la distribucin binomial pm (1 p)nm , en nuestro
m
caso n = 6. Sabemos que = n p = 6 p.

f i xi 010+130+265+358+428+58+61 492
Tambin podemos hallar = f1
= 200 = 200 = 2, 46

Manuel Angel Barea Gmez 139


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2,46
2, 46 = 6 p p = 6 = 0, 41

As pues, la distribucin binomial ajustada viene dada por B (6; 0, 41). Sus probabilidades son:

X P[k = X]
0 0,04218
1 0,17587
2 0,30553
3 0,28309
4 0,14754
5 0,04101
6 0,00475

Obtenemos la frecuencia esperada y rellenamos nuestra tabla

Ingresos 0 1 2 3 4 5 6
Frecuencia 10 30 65 58 28 8 1
Esperada 8,40 35,16 61,11 56,60 29,50 8,20 0,94

Para los grados de libertad el valor de m ser 1, ya que se tuvo que estimar la media de la poblacin para poder obtener el valor de p
y as poder calcular los valores esperados.

v : k1m= 711= 5

2 c2

H0
H1 2 < c2

2
5;0,05 = 11, 07 Este ser nuestro punto critico. Aceptaremos H0 si 2 c2

2
(OE) (108,40)2 2 2 2 2 2 2
c2 = E = 8,40 + (3035,16)
35,16 + (6561,11)
61,11 + (5856,60)
56,60 + (2829,50)
29,50 + (88,20)
8,20 + (10,94)
0,94 = 1, 43

Como 1, 47 < 11, 7 se acepta H0

Problema 7.5. Realizamos un juego de azar que consiste en lanzar un par de dados y anotar la suma obtenida. Las tabla de recuentos
obtenida tras 200 lanzamientos es:

Resultado 2 3 4 5 6 7 8 9 10 11 12
Recuentos 2 8 16 28 32 34 30 24 14 8 4

(a) Se ajustan las frecuencias empricas a la distribucin que les corresponde en teora?

Manuel Angel Barea Gmez 140


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

Teniendo en cuenta frecuencia emprica es un sinnimo de frecuencia observada. Podemos ajustarla a una distribucin de Poisson,
por ser n grande.

H0 Los datos se a justan a una distribucion de Poisson
H1 Los datos no se a justan a una distribucion de Poisson

e k
Para obtener los valores esperados se tiene que utilizar la formula de la distribucin binomial P (k = X) = k! , sabemos = .

f i xi 22+...+124 13962
Tambin podemos hallar = f1
= 200 = 200 7

=7

As pues, la distribucin de Poisson ajustada viene dada por P (7). Sus probabilidades son:

X P[k = X]
2 0,02234
3 0,05212
4 0,09122
5 0,12771
6 0,14900
7 0,14900
8 0,13037
9 0,10140
10 0,07098
11 0,04517
12 0,02634

Obtenemos la frecuencia esperada y rellenamos nuestra tabla

Ingresos 0 1 2 3 4 5 6
Frecuencia 10 30 65 58 28 8 1


H0 Los datos se a justan a una distribucion binomial
H1 Los datos no se a justan a una distribucion binomial

 
n
Para obtener los valores esperados se tiene que utilizar la formula de la distribucin binomial pm (1 p)nm , en nuestro
m
caso n = 6. Sabemos que = n p = 6 p.

f i xi 010+130+265+358+428+58+61 492
Tambin podemos hallar = f1
= 200 = 200 = 2, 46

Manuel Angel Barea Gmez 141


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2,46
2, 46 = 6 p p = 6 = 0, 41

As pues, la distribucin binomial ajustada viene dada por B (6; 0, 41). Sus probabilidades son:

X P[k = X]
0 0,04218
1 0,17587
2 0,30553
3 0,28309
4 0,14754
5 0,04101
6 0,00475

Obtenemos la frecuencia esperada y rellenamos nuestra tabla

Ingresos 0 1 2 3 4 5 6
Frecuencia 10 30 65 58 28 8 1
Esperada 8,40 35,16 61,11 56,60 29,50 8,20 0,94

Para los grados de libertad el valor de m ser 1, ya que se tuvo que estimar la media de la poblacin para poder obtener el valor de p
y as poder calcular los valores esperados.

v : k1m= 711= 5

2 c2

H0
H1 2 < c2

2
5;0,05 = 11, 07 Este ser nuestro punto critico. Aceptaremos H0 si 2 c2

2
(OE) (108,40)2 2 2 2 2 2 2
c2 = E = 8,40 + (3035,16)
35,16 + (6561,11)
61,11 + (5856,60)
56,60 + (2829,50)
29,50 + (88,20)
8,20 + (10,94)
0,94 = 1, 43

Como 1, 47 < 11, 7 se acepta H0

Resultado 2 3 4 5 6 7 8 9 10 11 12
Observada 2 8 16 28 32 34 30 24 14 8 4
Esperada 4,47 10,42 18,24 25,54 29,80 29,80 26,07 20,28 14,19 9,03 5,27

Utilizaremos como grados de libertad v = 11 1 1 = 9, por haber usado la media de la distribucin estimada a partir de los datos.

2 c2

H0
H1 2 < c2

2
9;0,05 = 16, 92 Este ser nuestro punto critico. Aceptaremos H0 si 2 c2

Manuel Angel Barea Gmez 142


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2
(OE) (24,47)2 2
c2 = E = 4,47 + ... + (4,5,27)
5,27 = 4, 89

Como 4, 89 < 16, 92 se acepta H0

Problema 7.6. Los datos referentes al nmero de partos asistidos por da en un centro hospitalario, vienen recogidos en la siguiente
tabla:

N de partos por da 0 1 2 3 4 5 o ms
Frecuencia 6 15 20 12 8 4

(a) Ajustar a la distribucin de Poisson adecuada y estudiar la bondad del ajuste. (Nota: Tomar como marca de la ltima clase el
valor 5)

H0 Los datos se a justan a una distribucion de Poisson
H1 Los datos no se a justan a una distribucion de Poisson

e k
Para obtener los valores esperados se tiene que utilizar la formula de la distribucin binomial P (k = X) = k! , sabemos = .

f i xi 06+115+220+312+48+54 143
Tambin podemos hallar = f1
= 65 = 65 = 2, 2

= 2, 2

As pues, la distribucin de Poisson ajustada viene dada por P (2, 2). Sus probabilidades son:

X P[k = X]
0 0,11080
1 0,24376
2 0,26814
3 0,19663
4 0,10815
5 0,07202

N de partos por da 0 1 2 3 4 5 o ms
Frecuencia observada 6 15 20 12 8 4
Frecuencia esperada 7,20 15,84 17,43 12,78 7,03 4,68

Utilizaremos como grados de libertad v = 6 1 1 = 4, por haber usado la media de la distribucin estimada a partir de los datos.

2 c2

H0
H1 2 < c2

2
4;0,05 = 9, 49 Este ser nuestro punto critico. Aceptaremos H0 si 2 c2

Manuel Angel Barea Gmez 143


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2
(OE) (67,20)2 2
c2 = E = 7,20 + ... + (87,03)
7,03 = 0, 90

Como 0, 90 < 9, 49 se acepta H0

Problema 7.7. Cierta enfermedad puede presentarse en 5 estadios diferentes, segn la gravedad. Las probabilidades de que un
individuo con la enfermedad se encuentre en cada uno de los 4 primeros estadios son, respectivamente, 0,01; 0,12; 0,3 y 0,17. Segn
el estadio, el individuo sobrevive 10, 8, 6, 4 y 1 aos, respectivamente.

(a) Hallar la probabilidad de que un individuo que tenga esta enfermedad se encuentre en el 5 estadio.
(b) En una muestra de 100 individuos con la enfermedad, el nmero de enfermos encontrados en cada estadio ha sido, respecti-
vamente, 3, 10, 25, 24 y 38. Se ajustan estos datos a la distribucin anterior?.

Como tenemos los datos de 4 de los cinco estadios, el quinto tendr una probabilidad

P (X) = 1 [0, 01 + 0, 12 + 0, 3 + 0, 17] = 0, 4

Estadios 1 2 3 4 5
Frecuencia Observada 3 10 25 24 38


H0 Los datos se a justan a una distribucion binomial
H1 Los datos no se a justan a una distribucion binomial

Obtenemos la frecuencia esperada y rellenamos nuestra tabla con los 100 pacientes y la distribucin aportada en el enunciad0

Estadios 1 2 3 4 5
Frecuencia 3 10 25 24 38
Esperada 1 12 30 17 40

Para los grados de libertad el valor de m ser 0.

v : k1m= 510= 4

2 c2

H0
H1 2 < c2

2
4;0,05 = 9, 49 Este ser nuestro punto critico. Aceptaremos H0 si 2 c2

2
(OE) (31)2 2 2 2 2
c2 = E = 1 + (1012)
12 + (2530)
30 + (2417)
17 + (3840)
40 = 8, 15

Como 8, 15 < 9, 49 se acepta H0

Manuel Angel Barea Gmez 144


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

Problema 7.8. Para comprobar empricamente la teora sobre la herencia gentica de Mendel, se han clasificado guisantes de una
determinada variedad, atendiendo a su color y forma, en cuatro clases: E1 : lisos y amarillos, E2 : lisos y verdes, E3 : rugosos y
amarillos y E4 : rugosos y verdes. Seleccionados al azar 556 guisantes de la variedad en estudio, se obtienen 315 de E1 , 108 de E2
, 101 de E3 y 32 de E4 . Segn el modelo terico de Mendel, los datos deberan estar en la proporcin 9:3:3:1.

(a) Los datos confirman la teora sobre la herencia gentica de Mendel?



H0 Lateoria de Mendel es acertada
H1 Lateoria de Mendel no es acertada

El nmero total de guisantes n = 315 + 108 + 101 + 32 = 556


El total de la proporcin p = 9 + 3 + 3 + 1 = 16 podemos calcular los valores esperados para cada clase:

Clase E1 E2 E3 E4
5569 5563 5563 5561
Valor Esperado 16 = 312, 75 16 = 104, 25 16 = 104, 25 16 = 34, 75

Construimos nuestra tabla:

Clase E1 E2 E3 E4
Valor observado 315 108 101 32
Valor Esperado 312,75 104,25 104,25 34,75

Para los grados de libertad el valor de m ser 0.

v : k1m= 410= 3

2 c2

H0
H1 2 < c2

2
3;0,05 = 7, 81 Este ser nuestro punto critico. Aceptaremos H0 si 2 c2

2
(OE) (315312,75)2 2 2 2
c2 = E = 312,75 + (108104,25)
104,25 + (101104,25)
104,25 + (3234,75)
34,75 = 0, 470

Como 0, 470 < 7, 81 se acepta H0

Problema 7.9. Se ha realizado un estudio sobre nutricin en pacientes con insuficiencia respiratoria que requieren ventilacin
asistida. Una variable considerada es el ndice de creatinina, que es una medida del nivel proteico del paciente. El hecho de que el
ndice tenga un valor inferior a 6 es indicativo de un grave dficit proteico. Si la mediana de los valores del ndice en este tipo de
pacientes est por debajo de 6 se pondr en funcionamiento un nuevo programa diettico para corregir el problema. A partir de una
muestra aleatoria de 15 pacientes se obtuvieron los siguientes valores:

5,7 4,2 4,7 4,6 5,3 5,4 6,8 4,9 4,9 5,8 4,1 5,5 6,4 5,1 4,7

(a) Mediante el contraste de los signos, hay pruebas de que la mediana de los ndices est por debajo de 6?
(b) Mediante el contraste de DAgostino, estudiar si los datos pueden considerarse de una poblacin Normal.

Manuel Angel Barea Gmez 145


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

Contamos los valores por debajo de 6 Texp = 13 no existe en nuestra muestra ningn valor 6, por tanto, n = 15, aproximamos
T B(15; 0, 05), por lo que para un nivel de significacin = 0, 05 hay que encontrar valores P (X = k) 0, 05.
Nuestra regin de convergencia es Rc : Texp n k


Las probabilidades B (15; 0, 05) que tienen valores menores de 0,05, es para para k = 5, por tanto Rc : Texp 10 como 10 6 la


hiptesis de que disminuido la mediana de los ndices, no es significativa


El apartado (b)


H0 La poblacion es normal
H1 La poblacion no es normal

Rechazamos H0 si el valor de Dexp est fuera del intervalo de la tabla de los puntos crticos del test de DAgostino.

Los puntos crticos son [0, 2568; 0, 2858]

En primer lugar para calcular nuestro estadstico ordenamos los datos de menor a mayor.

xi = 78, 1

x = 5, 20

i xi = 670, 7
s = 0, 75
Xi2 = 414, 65

x = 670, 7 15145,20
(
T = i xi n(n+1)
2 2 = 124, 7
124,7
T
Dexp = n2 s = 152 0,75 = 0, 738

Como 0, 738
/ [0, 2568; 0, 2858] H0 es rechazada y la poblacin no sigue una distribucin normal.

Problema 7.10. Los das de estancia en dos hospitales, de dos muestras de tamao 5 y 10, respectivamente, de pacientes intervenidos
quirrgicamente por el mismo tipo de operacin, son los siguientes:

Hospital Datos
Hospital A 10 15 12 23 17
Hospital B 14 16 23 25 17 23 20 17 26 30

(a) Suponiendo que los datos no son normales, puede considerarse que la duracin de la estancia es distinta en ambos hospi-
tales?.

H0 0 = 1
H1 0 6= 1

Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos:

Manuel Angel Barea Gmez 146


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

Ordinal 1 4 2 11 7
Hospital A 10 15 12 23 17
Hospital B 14 16 23 25 17 23 20 17 26 30
Ordinal 3 5 11 13 7 11 9 7 14 15

Nuestros valores estadsticos R1 y R2 son respectivamente:

R1 = 1 + 4 + 2 + 11 + 7 = 25

R2 = 3 + 5 + 11 + 13 + 7 + 11 + 9 + 7 + 14 + 15 = 95

Tomamos el valor mnimo de los estadsticos hallados, en este caso R1 y observamos en la tabla que el intervalo para una = 0, 05
es 23; 57 Por tanto no pueden considerarse distintas.

Problema 7.11. La ictericia neonatal es un fenmeno biolgico complejo, resultado de un desequilibrio transitorio entre la pro-
duccin y eliminacin de la bilirrubina. En el curso de una investigacin, se determinaron los niveles de bilirrubina a travs de
bilirrubinometra transcutnea (BTc) de una muestra de neonatos con ictericia, obtenindose los siguientes resultados:

BTc (mg/dl) ni
<5 3
[5 6) 4
[6 7) 2
[7 8) 8
[8 9) 12
[9 10) 18
10 33

(a) Entre qu valores se encuentran el 30 % central de los datos de esta distribucin?


(b) Podemos afirmar que la concentracin media poblacional de bilirrubina es superior a 9 mg/dl?
(c) Puede afirmarse que la concentracin de bilirrubina en neonatos con ictericia se ajusta a una distribucin normal?

BTc (mg/dl) xi ni Ni xi n i x2i ni


<5 4,5 3 3 14 61
[5 6) 5,5 4 7 22 121
[6 7) 6,5 2 9 13 87
[7 8) 7,5 8 17 60 450
[8 9) 8,5 12 29 102 867
[9 10) 9,5 18 47 171 1625
10 10,5 33 80 347 3638
80 728 6848,62

x = 9, 10


s = 1, 66

Debemos hallar los percentiles P35 y P65

Manuel Angel Barea Gmez 147


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

8035
Para P35 el intervalo ser [8 9) ya que 100 = 28

nk
100 Ni1
P35 = Lin f + ni ai = 8 + 2817
12 1 = 8, 75

8065
Para P65 el intervalo ser 10 ya que 100 = 52

nk
100 Ni1
P65 = Lin f + ni ai = 10 + 5247
33 1 = 10, 15

Luego el 30 % se encuentra en el intervalo [8, 75; 10, 15]


Para el apartado (b) con una significacin de = 0, 05

H0 = 0
H1 > 0

Nuestro estadstico es z0,95 = 1, 645 rechazaremos H0 s zexp > z

9,19
zexp = 1,66

= 0, 53
80

Por tanto no podemos rechazar H0



H0 La poblacion es normal
H1 La poblacion no es normal

Rechazamos H0 si el valor de Dexp est fuera del intervalo de la tabla de los puntos crticos del test de DAgostino, para una = 0, 05

Los puntos crticos son [0, 2734; 0, 2863]

En primer lugar para calcular nuestro estadstico ordenamos los datos de menor a mayor.

x = 9, 10

s = 1, 66

x = 32294, 2 80819,10
(
T = i xi n(n+1)
2 2 = 2810, 2
T 2810,2
Dexp = n2 s = 802 1,66 = 0, 2645

Como 0, 2645
/ [0, 2734; 0, 2863] H0 es rechazada y la poblacin sigue no una distribucin normal.

Manuel Angel Barea Gmez 148


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

Problema 7.12. Aplquese el test de Kruskal y Wallis al siguiente problema: La ureasa es una enzima productora de amonaco en
el tracto gastrointestinal. Es conocido que el amonaco es perjudicial en pacientes con enfermedades hepticas. Se ha realizado un
estudio cuyo objeto es comparar la concentracin de ureasa en los jugos gstricos en tres poblaciones :
I) grupo control
II) pacientes con obstruccin en la vena porta extraheptica;
III) pacientes con hepatitis viral.
Los datos obtenidos, en miligramos por mililitro son los siguientes:

I 261,1 186,2 239,1 243,3 296,8 270,5 222,5 267,3 230,6 244,8
II 221,9 188,7 167,6 224,9 178,8 147,9 175,3 214,3 159,5 230,0
III 600,9 301,2 607,0 283,3 193,3 159,4 540,3 355,1 265,3 512,4

Valor 147,9 159,4 159,5 167,6 175,3 178,8 186,2 188,7 193,3 214,3 221,9 222,5 224,9 230,0 230,6
Ordinal 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Valor 239,1 243,3 244,8 261,1 265,3 267,3 270,5 283,3 296,8 301,2 355,1 512,4 540,3 600,9 607,0
Ordinal 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Rehacemos nuestra tabla para poder sumar los rangos de cada grupo

I Rangos II Rangos II Rangos


261,1 19 221,9 11 600,9 29
186,2 7 188,7 8 301,2 25
239,1 16 167,6 4 607 30
243,3 17 224,9 13 283,3 23
296,8 24 178,8 6 193,3 9
270,5 22 147,9 1 159,4 2
222,5 12 175,3 5 540,3 28
267,3 21 214,3 10 355,1 26
230,6 15 159,5 3 265,3 20
244,8 18 230 14 512,4 27
Rc 171 75 219
Rc2 29241 5625 47961

H0 Las di f erencias observadas en los grupos se deben al azar.
H1 Las di f erencias observadas en los grupos no se deben al azar.

Nuestro estadstico es comparado con una = 0, 05 . Los grados de libertad son v = 3 1 = 2. Luego los valores crticos en una
2
2,0,05 = 5, 99, esta ser nuestra Ha


H0 H Ha
H1 H > Ha

R2

12 c
N(N+1) ni
H= 3 (N + 1) Donde L son el valor de nmero de empates de un rango

L i
(L3i Li )
L = 1

N 3 N

12 29241 5625 47961


3031 ( 10 + 10 + 10 ) 1282827
H= 1 3 (30 + 1) = 303110 93 = 106, 87 93 = 13, 87

Como 13, 87 > 5, 99 se acepta H1 con una p < 0, 001

Manuel Angel Barea Gmez 149


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

Problema 7.13. Se administr un cierto frmaco a una muestra representativa de enfermos de hepatitis alcohlica. Para estudiar
sus consecuencias, se valoraron ciertos parmetros fisiolgicos inicialmente y al cabo de un mes de tratamiento. Para el parmetro
SGOT se obtuvo:

Paciente 1 2 3 4 5 6 7 8 9 10
Inicial 56 56 147 58 121 57 49 118 63 75
Al mes 47 63 125 26 99 36 34 90 50 59

(a) Indique qu procedimiento(s) estadstico(s) podra emplear para analizar tal variacin en el caso de que no pudiera suponer
Normalidad en los datos.

Al ser dos muestras dependientes, puede utilizarse el test de los signos para dos muestras dependientes o el de Wilcoxon de los rangos
signados para las diferencias.

Inicial Al mes D Rango


56 47 9 2
56 63 -7 -1
147 125 22 7,5
58 26 32 10
121 99 22 7,5
57 36 21 6
49 34 14 4
118 90 28 9
63 50 13 3
75 59 16 5
W (+) 54

H0 La poblacion es normal
H1 La poblacion no es normal

En nuestra tablas W10;0,05 = [8 47] Como 54 > 47 y aceptamos H1

Problema 7.14. Se ha realizado una encuesta a 125 individuos que son usuarios al mismo tiempo de Centros de Salud y Ambulatorios
donde se ha recogido su opinin favorable (SI) o desfavorable (NO) a dichos sistemas de asistencia. Los datos recogidos aparecen
en la siguiente tabla:

Centro de salud
Ambulatorio Si No
Si 27 35
No 43 20

Frecuencias Observadas Centro de salud


Ambulatorio Si No Total
Si 27 35 62
No 43 20 63
Total 70 55 125

Frecuencias Esperadas Centro de salud


Ambulatorio Si No
Si 34,72 27,28
No 35,28 27,72

Manuel Angel Barea Gmez 150


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2 = c2

H0
H1 2 6= c2

Sigue una distribucin 2 con v = (2 1) (2 1) = 1 grados de libertad para una = 0, 05


2
Nuestro estadstico es 1;0,025 2
; 1;0,975 = [0, 001; 5, 02] dicho intervalo ser nuestra regin de aceptacin

2
(OE) (2734,72)2 2 2 2
c2 = E = 34,72 + (3527,28)
27,28 + (7035,28)
35,28 + (5527,72)
27,72 = 7, 74

Por tanto, se rechaza H0 y se acepta H1 que indica que no se distribuyen de la misma forma.

Problema 7.15. Utilizar el mtodo no paramtrico ms apropiado para ver si hay diferencias entre los niveles de protoporfirina en
las tres poblaciones compuestas por:
(I) individuos sanos
(II) alcohlicos con anillos sideroblsticos en mdula sea
(III) alcohlicos sin dichos anillos
de las que se han extrado las muestras:

Poblacin I 22 27 47 30 38 78 28 58 72 56 30 39 53 50 36
Poblacin II 78 172 286 82 453 513 174 915 84 153 780
Poblacin III 37 28 38 45 47 29 34 20 68 12 37 8 76 148 11

Aplicamos el test de Kruskal y Wallis, primer lugar ordenamos nuestra tabla:

Problema 7.16.
Poblacin I Rango I Poblacin II Rango II Poblacin III Rango III
22 5 78 29,5 37 14,5
27 6 172 35 28 7,5
47 20,5 286 37 38 15,5
30 10,5 82 31 45 19
38 15,5 453 38 47 20,5
78 29,5 513 39 29 9
28 7,5 174 36 34 12
58 25 915 41 20 4
72 27 84 32 68 26
56 24 153 34 12 3
30 10,5 780 40 37 14,5
39 18 8 1
53 23 76 28
50 22 148 33
36 13 11 2
Rc 257 392,5 209,5
R2c 66049 154056,25 43890,25

Los nmero de empates son 6 de 2 elementos cada uno:



H0 Las di f erencias observadas en los grupos se deben al azar.
H1 Las di f erencias observadas en los grupos no se deben al azar.

Manuel Angel Barea Gmez 151


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

Nuestro estadstico es comparado con una = 0, 05 . Los grados de libertad son v = 3 1 = 2. Luego los valores crticos en una
2
2,0,05 = 5, 99, esta ser nuestra Ha


H0 H Ha
H1 H > Ha

R2

12 c
N(N+1) ni
3 (N + 1) Donde L son el valor de nmero de empates de un rango

H= L i
(L3i Li )
L = 1

N 3 N

(23 2)+(23 2)+(23 2)+(23 2)+(23 2)+(23 2)


L = 1 413 41
= 0, 99

12 66049 154056,25 43890,25


4142 ( 15 + + 15 ) 148,67
H= 11
0,99 3 (41 + 1) = 0,99 126 == 24, 17

Como 24, 17 > 5, 99 se acepta H1 con una = 0, 005

Problema 7.17. En un estudio sobre el hbito de fumar y sus efectos sobre las pautas del sueo, una de las variables importantes es
el tiempo que se tarda en quedarse dormido. Se extrae una muestra de tamao 12 de la poblacin de fumadores, y otra independiente
de tamao 15 de la poblacin de no fumadores, obtenindose los siguientes datos:

Fumadores 69,3 56,0 22,1 47,6 53,2 48,1 23,2 13,8 52,7 34,4 60,2 43,8
No Fumadores 28,6 25,1 26,4 34,9 29,8 28,4 38,5 30,2 30,6 31,8 41,6 21,1 36.0 37,9 13,9

(a) Indican estos datos que los fumadores tienden a tardar ms tiempo en quedarse dormido que los no fumadores?

H0 0 = 1
H1 0 > 1

Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos:

Fumadores 69,3 56 22,1 47,6 53,2 48,1 23,2 13,8 52,7 34,4 60,2 43,8
Rango S 27 25 4 21 24 22 5 1 23 14 26 20
No Fumadores 28,6 25,1 26,4 34,9 29,8 28,4 38,5 30,2 30,6 31,8 41,6 21,1 36,0 37,9 13,9
Rango N 9 6 7 15 10 8 18 11 12 13 19 3 16 17 2

Nuestros valores estadsticos R1 y R2 son respectivamente:

R1 = 27 + 25 + 4 + 21 + 24 + 22 + 5 + 1 + 23 + 14 + 26 + 20 = 212

R2 = 9 + 6 + 7 + 15 + 10 + 8 + 18 + 11 + 12 + 13 + 19 + 3 + 16 + 17 + 2 = 166

Tomamos el valor estadsticos hallado, en este caso R1 y observamos en la tabla que el intervalo para una = 0, 05 es [127; 209] Por
tanto, al no pertenecer al intervalo se acepta H1 que afirma que los fumadores tienden a tardar ms tiempo en quedarse dormido que
los no fumadores.

Problema 7.18. En un tratamiento contra la hipertensin se seleccionaron 21 enfermos de caractersticas similares. A cada enfermo
se le administr uno de los frmacos P, A, B, al azar, formando 3 grupos. El grupo P tom placebo (frmaco inocuo) y los otros dos
tomaron A y B respectivamente. Para valorar la eficacia de los tratamientos, se registr el descenso de la presin diastlica desde el
estado basal (inicio del tratamiento) hasta el estado al cabo de una semana de tratamiento. Los resultados fueron:

Manuel Angel Barea Gmez 152


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

P 10 0 15 -20 0 -5
A 20 25 33 25 30 18 0
B 15 10 25 30 15 35 25 22

Aplicamos el test de Kruskal y Wallis, primer lugar ordenamos nuestra tabla:

Problema 7.19.
Poblacin I Rango I Poblacin II Rango II Poblacin III Rango III
10 6,5 20 12 15 8,5
0 4 25 15,5 10 6,5
15 8,5 33 20 25 15,5
-20 1 25 15,5 30 18,5
0 4 30 18,5 15 8,5
-5 2 18 11 35 21
0 4 25 15,5
22 13
Rc 26 96,5 107
R2c 676 9312,25 11449

Los nmero de empates son 5 elementos:

Nuestro estadstico es comparado con una = 0, 05 . Los grados de libertad son v = 3 1 = 2. Luego los valores crticos en una
2 2
2,0,025 = 0, 05, 2,0,975 = 7, 38, esta ser nuestra Ha


H0 H = Ha
H1 H 6= Ha

R2

12 c
N(N+1) ni
3 (N + 1) Donde L son el valor de nmero de empates de un rango

H= L i
(L3i Li )
L = 1

N 3 N

(33 3)+(23 2)+(33 3)+(43 4)+(23 2)


L = 1 213 21
= 0, 987

12 676 9312,25 11449


2122 ( 6 + + 8 ) 74,65
H= 7
0,987 3 (21 + 1) = 0,987 126 == 9, 63

Como 9, 63
/ [0, 05; 7, 38] se acepta H1 con una = 0, 05 que indica que los tres frmacos no tienen la misma eficacia

Problema 7.20. la falta de oxgeno que se respira en alta montaa es la causa de todos los males de los escaladores. Se ha realizado
un estudio para analizar la saturacin de oxgeno en sangre de los alpinistas, recogindose para ello una muestra formada por
9 mujeres y 8 hombres alpinistas en la que se ha obtenido el nivel de saturacin de oxgeno en sangre, medido en una escala de
porcentaje de 0 % a 100 %:

Sexo M M M M M M M M M H H H H H H H H
Nivel O2 61 73 67 70 70 75 69 69 71 63 67 62 79 65 68 68 61

Manuel Angel Barea Gmez 153


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

(a) Suponiendo que los datos anteriores no son normales, Puede afirmarse que los niveles de oxgeno son distintos para ambos
sexos?


H0 0 = 1
H1 0 6= 1

Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos:

Mujeres 61 73 67 70 70 75 69 69 71
Rango M 1,5 15 6,5 12,5 12,5 16 10,5 10,5 14
Hombre 63 67 62 79 65 68 68 61
Rango H 4 6,5 3 17 5 8,5 8,5 1,5

Nuestros valores estadsticos R1 y R2 son respectivamente:

R1 = 1, 5 + 15 + 6, 5 + 12, 5 + 12, 5 + 16 + 10, 5 + 10, 5 + 14 = 99



R2 = 4 + 6, 5 + 3 + 17 + 5 + 8, 5 + 8, 5 + 1, 5 = 54

Tomamos el valor estadsticos hallado ms pequeos, en este caso R2 y observamos en la tabla que el intervalo para una = 0, 01 es
[45; 99] Por tanto, al pertenecer al intervalo se acepta H0 que indica que los niveles de oxigeno no son distintos para ambos sexos.

Problema 7.21. Un equipo mdico asegura que la metformina rebaja los niveles de glucosa en sangre. Para comprobarlo, selec-
cionan un grupo de 10 pacientes con diabetes Mellitus II, a los que se le mide la cantidad de azcar en sangre en ayunas, antes del
tratamiento y despus de un mes de tratamiento obteniendo los siguientes resultados:

Nivel glucosa antes 125 160 110 135 125 129 148 140 169 145
Nivel glucosa despus 100 129 89 105 116 105 122 113 125 99

(a) Suponiendo que los datos anteriores no son normales, y utilizando el contraste de los rangos con signos Puede afirmarse que
los niveles de oxgeno son distintos antes y despus del tratamiento?

Antes Despus D Rango


125 100 25 4
160 129 31 8
110 89 21 2
135 105 30 7
125 116 9 1
129 105 24 3
148 122 26 5
140 113 27 6
169 125 44 9
145 99 46 10
W (+) 55

=0

H0
H1 6= 0

Manuel Angel Barea Gmez 154


CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

En nuestra tablas W10;0,01 = [3 52] Como 55 > 52 y aceptamos H1 con una = 0, 01

Problema 7.22. Para comprobar si un tratamiento con cidos grasos es eficaz en pacientes con eczema atpico, se tomaron 10
pacientes con eczema de ms de 9 meses y se les someti durante 3 semanas a un tratamiento ficticio (placebo) y durante las tres
siguientes a un tratamiento con cidos grasos. Tras cada periodo, un mdico ajeno al proyecto evalu la importancia del eczema en
una escala de 0 (no eczema) a 10 (tamao mximo de eczema). Los datos fueron los siguientes:

Placebo 6 8 4 8 5 6 5 6 4 5
Tratamiento 5 6 4 5 3 6 6 2 2 6

Placebo Tratamiento D Rango


6 5 1 4
8 6 2 7
4 4 0 -
8 5 3 9
5 3 2 7
6 6 0 -
5 6 -1 -4
6 2 4 10
4 2 2 7
5 6 -1 -4
W (+) 36

=0

H0
H1 6= 0

En nuestra tablas W10;0,05 = [8 47] Como 36 < 47 aceptamos H0 con una = 0, 05, por tanto, ambos son iguales lo que quiere decir
que el tratamiento no es eficaz

Manuel Angel Barea Gmez 155