Académique Documents
Professionnel Documents
Culture Documents
(67$'67,&$'(6&5,37,9$
ESTADSTICA DESCRIPTIVA
N 1.- Hallar: Media, moda, mediana, 1er cuartil, 6 decil, 52 percentil de la siguiente
distribucin:
Xi
ni
1
2
2
15
3
9
4
6
5
3
6
1
Solucin
Xi
ni
; Q
Ni
1
2
2
2
15
30
3
9
27
4
6
24
5
3
15
6
1
6
17
26
32
35
36
; Q
104
= 2,89
36
MEDIA
MODA
104
MEDIANA
Me = Valor de la variable que deja por debajo suya el 50% de los
valores, valor central de la distribucin
36
1
=
= 18 Valor de la variable cuya frecuencia acumulada sea 18, en este caso
2
2
Me = 3
T
1
4
36
= 9 Valor de la variable que deja el 25% de los valores debajo suya, el valor
4
60
100
Percentil 52
T
52
100
1
4
=2
60
36 = 21,6 El valor de la variable que ocupa el
100
52
36 = 18,72
100
6 decil es = al percentil 60
lugar 22
60
100
=3
T
60
100
=3
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 2.- De las 283 personas encuestadas en 1993 sobre si se encontraban afiliados a algn
sindicato, 86 contestaron afirmativamente. Con los resultados afirmativos y clasificados
segn la edad obtenemos la siguiente tabla:
Edad
N personas
Marca de clase
; Q
25-35
45
30
1350
35-45
23
40
920
45-55
15
50
750
55-65
3
60
180
Ni
45
68
83
86
86
3200
; Q
1
3200
= 37,21
86
Mediana = Me
86
= 43
2
el intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y
44, es decir el intervalo (25 - 35)
Intervalo mediano es el intervalo que contiene a la mediana, como N/2 es
Me =
1
2
1
1
1 1
86 0
1
2
2
= / 1 +
& = 25 +
10 = 34,55
Q
45
Moda = Mo
Intervalo modal es aquel que contiene la moda, la moda se encuentra en el intervalo
que presenta mayor densidad de frecuencia, en este caso como los intervalos son de
igual amplitud, el de mayor densidad de frecuencia coincide con el de mayor
frecuencia, es decir el intervalo (25 - 35), y dentro de l consideramos como la
moda, la marca de clase, es decir
Moda = Mo = 30.
Tambin podemos aplicar la formula:
Q
0
/ 1
F 1
Q 1
F
Q 1
F
1
nos queda:
0
= / 1 +
Q
Q
+1
+1
+ Q 1
= 25 +
23
10 = 35 . es la moda
23 + 0
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
ni
60
n2
30
n4
n5
fi
f1
0,4
f3
0,1
f5
Ni
60
N2
170
N4
200
Solucin
N = 200
N2 = N3 - n3 = 170 - 30 = 140
N2 = N2 - n1 = 140 - 60 = 80
f4 =
n4 = f4 N = (0,1) 200 = 20
N4 = N3 + n4 = 170 + 20 = 190
n5 = N5 - N4 = 200 - 190 = 10
f1 =
f3 =
f5 =
60
= 0,3
200
30
= 0,15
200
10
= 0,05
200
ni
60
80
30
20
10
fi
0,30
0,40
0,15
0,10
0,05
Ni
60
140
170
190
200
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 4.- Se desea conocer la media de edad de los tres grupos de teatro infantil que funcionan
en un barrio.
Grupo A:
Aos
N nios
2
6
3
7
4
8
5
9
Grupo B:
Aos N nios
5
1
7
2
2
1
3
1
Grupo C:
Aos N nios
7
2
9
3
2
9
13
1
Solucin
N nios
6
7
8
9
30
Xini
12
21
32
45
110
N nios
1
2
1
1
5
Xini
5
14
2
3
24
N nios
2
3
9
1
15
Xini
14
27
18
13
72
= 30
;
;LQL
1
110
= 3,66 aos
30
GRUPO B
aos
5
7
2
3
= 5
=
;LQL
1
24
= 4,8 aos
5
GRUPO C
aos
7
9
2
13
1
204
=
50
1
1 1
1
1
C = 15
;
;LQL
1
72
= 4,8 aos
15
DxRV
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Nivel cultural
Solucin
Nivel cultural
1
2
3
4
5
ni
7
5
8
15
30
65
Ni
7
12
20
35
65
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 6.- Se desea estudiar las alturas de un grupo de 20 alumnos, a travs de sus promedios.
Realizar el estudio:1) Con los datos sin agrupar.
2)Con los datos agrupados en intervalos de amplitud 10 cm.
Las alturas fueron expresadas en cm.: 162-166-168-170-172-174-180-164-166-168168-172-178-182-164-166-168-170-176-188.
Solucin
X = altura de los alumnos
1 Sin agrupar:
Xi
162
164
166
168
170
172
174
176
178
180
182
188
ni
1
2
3
4
2
2
1
1
1
1
1
1
20
Ni
1
3
6
10
12
14
15
16
17
18
19
20
Xini
162
328
498
672
340
344
174
176
178
180
182
188
3422
N = 20
N/2 = 10
; Q
0HGLD
;
i Q
3.422
20
FP
Xi
ni
Ni
Xini
165
175
185
10
7
3
20
10
17
20
1650
1225
555
3.430
= 3.430
X n = 3.430
=
; Q
N
20
= 171,5 cm.
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
0
F
1
Q
F
Q
1
F
1
nos queda:
0
/
1
Q
Q
1 Q 1
F
160
7
70
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
NMERO DE TUBOS
50
150
275
25
500
3.-
1
50+150+ 275 = 337,5 tubos
2
U
100
= 900
100
= 700 + 100
500 200
275
400 = 900
(900 700)275
100
=
+ 200
= 67,5%
400
500
67,5% de 500 = 0,675 (500) = 337,5 tubos. El nmero mnimo de tubos con una
duracin inferior a 900 horas sern 338 tubos.
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 8.- Calcular: Media, moda, mediana, 1er y 3er cuartil. Varianza, desviacin tpica y
coeficiente de variacin. De los siguientes datos obtenidos de una investigacin en un
establecimiento benfico que tiene acogidos a 112 personas de diversas edades:
Edad
N Personas
40-50
13
50-60
24
60-70
29
70-80
35
80-90
11
Solucin
X = edad de los personas del establecimiento benfico
Edad
40-50
45
50-60
55
60-70
65
70-80
75
80-90
85
24
29
35
11
37
66
101
112
585
1320
1885
2625
935
26325
72600
N Personas ( Q ) 13
13
1
; Q
Q
; Q
1
112
7350
497800
7350
65,625 aos
112
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (70.- 80) y dentro del
intervalo podemos considerar la moda igual a la marca de clase o tambin aplicar la
formula:
Q #
/ " 1
0 !
F # 1
Q # 1
F #
Me =
1
4
1
2
= T2
4
Q " 1
70 +
11
10 = 72,75 aos
11 + 29
F "
1
1
1
1 1$
112 37
1
2
2
= /$ 1 +
& $ = 60 +
10 = 66,55 aos
Q
29
$
1
1
1 1%
112 13
1
4
4
= /% 1 +
& % = 50 +
10 = 56,25 aos
Q
24
%
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
6(
3
4
3
3
1 1&
112 66
1
4
= /& 1 + 4
& & = 70 +
10 = 75,14 aos
Q
35
&
'
Q'
6)
&9
( )=
;
6)
;
497800
65,625 2 = 138
112
6*
;
11,75
= 0,18
65,625
10
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
0-2
30
2-5
52
5-7
38
7-9
25
9-10
5
Solucin
X = calificaciones de los alumnos en una asignatura
Calificaciones
;
N Alumnos
; , Q,
;
Q-
1,
60
; . Q.
Q/
61
&9
( )=
;
61
0-2
1
2-5
3,5
5-7
6
7-9
8
9-10
9,5
30
30
52
182
38
228
25
200
5
47,5
687,5
30
637
1368
1600
451,25
4086,25
30
82
120
145
150
687,5
4,58
150
;
4086,25
4,58 2 = 6,23
150
= 6,23 = 2,497
62
;
2,497
= 0,5451
4,58
11
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 10.- Dada la siguiente distribucin relativa a una muestra de 100 personas que emigran
de una zona rural a una urbana clasificada segn la edad.
a).- Calcular: media, mediana y moda.
b).- Calcular el recorrido intercuartlico.
c).- Calcular el coeficiente de variacin.
Edades
N Personas
11-20
40
21-30
30
31-50
20
51-70
10
Solucin
X = edad de las personas que emigran
Edades
3
N Personas
densidad
; 4 Q4
Q5
14
; 6 Q6
1
11 - 20
15,5
20 - 30
25
30 - 50
40
50 70
60
40
4,44
620
30
3
750
20
2
800
10
3
600
100
9610
18750
32000
36000
96360
40
70
90
100
2770
2770
27,70 aos
100
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos no tienen la misma amplitud, el intervalo modal es (11.- 20) TXH WLHQH
PD\RU GHQVLGDG GH IUHFXHQFLD y dentro del intervalo podemos considerar la moda
igual a la marca de clase o tambin aplicar la formula:
Q7 :
/7 9 1
0 8
F7 : 1
Q7 : 1
F7 :
Q7 9 1
F7 9
1
30
10 9 = 20 aos
11 +
30
+0
10
Mediana:
1
100
= 50 Ser el valor de la variable que ocupa el lugar 75, y est en el intervalo
2
2
mediano (20 30)
=
Me =
1
2
= T2
4
1
1
1 1;
100 40
1
2
= /; 1 + 2
& ; = 20 +
10 = 23,33 aos
Q
30
;
12
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
4
1
1
1 1<
100 0
1
4
= /< 1 + 4
& < = 11 +
9 = 16,625 aos
Q
40
<
3
4
3
3
1 1=
100 70
1
4
= /= 1 + 4
& = = 30 +
20 = 35 aos
Q
20
=
Re =
6?
3
4
T1
4
>
6@
&9
( )=
;
3
4
Q>
6@
;
96360
27,7 2 = 196,31
100
= 196,31 = 14 aos
6A
;
14
= 0,50
27,7
13
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
2
5
3
9
4
10
5
6
Solucin
2
3
4
5
QC
; D QD
5
9
10
6
30
10
27
40
30
107
6L
La varianza ser:
6T
=+
= P QP
1
6S
0
=0
30
6U
QE
6N
=
;
; J QJ
1
=+
; =
6M
= H QH
= I QI
6F
-1,5834
-0,5726
0,4380
1,4488
QK
=G
20
81
160
150
411
La media ser:
-7,918
-5,154
4,380
8,692
0
12,537
2,951
1,919
12,593
30
107
= 3,56667
30
411
3,56667 2 = 0,978888
30
6O
6R
=+ 1= 1
14
= + 0,97888 = 0,98938
= Q QQ
1
; =
30
02 = 1
30
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
;1
;
125
70
;1
120
65
90
70
75
90
945
= 94,5P 2
10
100
85
90
140
65
65
; 2
110
70
80
80
90
90
92
100
945
1017
1017
= 84,75P 2
12
V WXV Y[Z
+ 12 ; 2
10(94,5) + 12(84,75) 1962
=
=
= 89,18 P 2
1 + 1
10
+
12
22
1
2
1;1
15
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 13.- Dada la siguiente distribucin del nmero de hijos de 100 familias, calcular
sus cuartiles:
Xi
ni
Ni
0
14
14
1
10
24
2
15
39
3
26
65
4
20
85
5
15
100
total
100
Solucin
X = nmero de hijos en una familia
1
100 = 25
4
2
100 = 50
4
3
100 = 75
4
1
4
1
4
1
4
16
1
4
2
4
3
4
=2
=3
=4
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 14.- El paro registrado en Navarra en el mes de Junio, por sexos y grupos de edad, fue:
VARONES
Li-1- Li
ni
< 20 842
20-24 1439
25-29 1412
30-34 872
35-39 628
40-44 516
45-49 453
50-54 456
55-59 666
> 59 319
MUJERES
Li-1-Li
ni
< 20 1493
20-24 3140
25-29 3381
30-34 2841
35-39 1919
40-44 1516
45-49
944
50-54
487
55-59
318
>59
101
Solucin
1.- Calcular razonadamente Media, varianza, desviacin tpica, mediana, moda
2.- Calcular razonadamente 1er cuartil, 60 percentil.
EDAD
\
/\
1 /
16-20
20-25
25-30
30-35
35-40
40-45
45-50
50-55
55-60
60-65
VARONES
;
18
22,5
27,5
32,5
37,5
42,5
47,5
52,5
57,5
62,5
Q^
1^
842
1439
1412
872
628
516
453
456
666
319
7603
842
2281
3696
4565
5193
5709
6162
6618
7284
7603
; _ Q_
15156
32377,5
38830
28340
23550
21930
21517,5
23940
38295
19937,5
263.873,5
MUJERES
;
Q`
272808
728493,75
1067825
921050
883125
932025
1022081,3
1256850
220162,5
1246093,8
10.532.314
Qa
1493
3140
3381
2841
1919
1516
944
487
318
101
16140
1b
1493
4633
8014
10855
12774
14290
15234
15721
16039
16140
<c Q c
<d
26874
70650
92977,5
92332,5
71962,5
64430
44840
25567,5
18285
6312,5
514.231,5
483732
1589625
2556881,3
3000806,3
2698593,8
2738275
2129900
1342293,8
1051387,5
394531,25
17.986.026
Qd
; e Qe
1
263.873,5
34,7 aos
7.603
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (20-25) y dentro del
intervalo podemos considerar la moda igual a la marca de clase o tambin aplicar
la formula:
17
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/f h
1
0 g
Qf i
Ff i
Qf i
Ff i
Qf h
1
20 +
1412
5 = 23,13aos
1412 + 842
Ff h
1
1
7603 = 3801,5 Intervalo mediano = (30 35)
2
Me =
= T2
1
2
1
1
1 1j
7603 3693
1
2
= /j 1 + 2
& j = 30 +
5 = 30,62aos
Q
872
j
1
7603 = 1900,75 Intervalo = (20 25)
4
1
4
1
1
1 1k
7603 842
1
4
= /k 1 + 4
& k = 20 +
5 = 23,68aos
Q
1439
k
60
7603 = 4561,8 Intervalo = (30 35)
100
60
60
1 1l
7603 3693
1
100
100
T
& l = 30 +
5 = 34,98 aos
60 = /l 1 +
Q
872
l
100
6n
Qm
6o
&9
( )=
6o
;
10.532.314
34,7 2 = 180,78
7603
6p
13,44
= 0,387
34,7
<q
514.231,5
31,86 aos
16140
18
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (25-30) y dentro del
intervalo podemos considerar la moda igual a la marca de clase o tambin aplicar
la formula:
Qr u
/r t 1
0 s
Fr u 1
Qr u 1
Fr u
Qr t 1
20 +
1412
5 = 23,13aos
1412 + 842
Fr t
1
1
16140 = 8070 Intervalo mediano = (30 35)
2
Me =
= T2
1
2
1
1
1 1v
16140 8014
1
2
2
= /v 1 +
& v = 30 +
5 = 30,01aos
Q
2841
v
1
16140 = 4035 Intervalo = (20 25)
4
1
4
1
1
1 1w
16140 1493
1
4
= /w 1 + 4
& w = 20 +
5 = 20,81aos
Q
3140
w
60
16140 = 9684 Intervalo = (30 35)
100
60
60
1 1x
16140 8014
1
100
100
T
=
/x
+
& x = 30 +
5 = 32,94 aos
1
60
Q
2841
x
100
6{
6|
=
=
6|
( )=
&9 <
<z
Qy
< =
17.986.026
31,86 2 = 99,2724
16140
6}
<
9,96
= 0,310
31,86
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 15.- Calcular la mediana del salario de una determinada empresa con 34 empleados.
~
;
Q
20000
30000
40000
50000
60000
15
70000 80000
2
Solucin
X = Salarios de los empleados de una empresa
20000
30000
40000
50000
60000
Q
15
1
22
28
30
34
70000 80000
1
34 = 17 Me = 50.000 Valor de la variable que ocupa el lugar central. Valor que
2
deja el 50% de los valores por debajo suya.
20
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
14-19
10
20-26
8
27-32
6
33-40
4
41-50
4
51-60
10
61-69
3
51-61
10
42
61-69
3
45
Solucin
Primeramente ponemos los lmites de los intervalos.
X = edad de las personas que asisten a conciertos
Aos
N Personas
1
14-20
10
10
20-27
8
18
27-33
6
24
33-41
4
28
41-51
4
32
1
45 = 22,5 Me = Valor de la variable que ocupa el lugar central. Valor que deja el
2
50% de los valores por debajo suya.
Intervalo mediano = aquel en el que se encuentra la mediana (27 33)
Aplicando la formula:
Me =
1
2
= T2
4
1
1
1 1
45 18
1
2
2
= / 1 +
& = 27 +
6 = 31,5 aos
Q
6
El 50% de las personas que asisten a conciertos tienen menos de 31,5 aos
21
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 17.-El nmero de varones jvenes clasificados segn la edad en el censo de 1987 era el
siguiente. Calcular la desviacin tpica.
;
Q
19
20
21
22
23
127
120
112
130
120
Solucin
X = edad de los varones jvenes.
19
20
21
22
23
Q
127
120
112
130
120
609
; Q
2.413
2.400
2.351
2.860
2.760
12.785
62.920
63.480
269.639
; Q
&9
( )=
;
12.785
20,99 21 aos
609
;
269.639
212 = 2,06
609
6
;
1,435
= 0,068
21
22
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 18.-Los ingresos mensuales de 4 personas son: 60.000, 75.000, 65.000 y 150.000 ptas.
La media aritmtica de estos valores, puede ser representativa? dgalo en %.
Solucin
;
60
65
75
150
1
1
1
1
4
;
; Q
&9
( )=
;
; Q
1
2
3
4
60
65
70
75
350
3.600
4.225
5.625
22.500
35.950
350
87,5 miles
4
;
35.950
87,5 2 = 1.331,25
4
6
;
36,48
= 0,417 41,7%
87,5
23
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
10-20
40
20-30
30
30-50
20
50-70
10
10-20
15
20-30
25
30-50
40
50-70
60
40
30
20
10
0,5
40
70
90
100
; Q
600
750
800
600
2.750
9.000
18.750
32.000
36.000
95.750
N Empleados =
1.-
100
2.-
; Q
1
2.750
27,5 miles
100
1
1
1 1
100 40
1
2
& = 20 +
10 = 23,33 miles
Me = T 1 = T 2 = / 1 + 2
Q
30
2
4
El 50% de los asalariados de esta oficina, cobran menos de 23,33 miles
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como
todos los intervalos no tienen la misma amplitud, el intervalo modal es el
que presenta mayor densidad de frecuencia, (10-20) y dentro del intervalo
podemos considerar la moda igual a la marca de clase o tambin aplicar
la formula:
24
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/
1
3.-
Q
1
F
1
30
10 10 = 20 miles
10 +
30
+0
10
&9
( )=
;
;
95.750
27,5 2 = 201,25
100
6
;
14,186
= 0,51
27,5
25
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 20.- Se han seleccionado una muestra de 176 personas que han respondido mejor a la
pregunta: Cree Vd. que dentro de un ao la situacin poltica ser mejor, igual o peor que
ahora? Se ha clasificado la respuesta segn la edad del entrevistado.
1.- Desarrollar la distribucin.
2.- Calcular medidas de tendencia central, de variabilidad o dispersin.
3.- Calcular las unidades Z para los siguientes valores: (18, 23, 29, 35, 44, 69)
15-18
19-21
22-25
26-35
36-45
46-60
61-70
10
19
27
42
42
27
Solucin
= edad de las personas que han respondido a la pregunta = marca de clase del
intervalo i-esimo
/
1 / = Intervalo i-esimo
Q
1
I
&
Q
&
= densidad de frecuencia
%
= 100
5,7
5,1
10,8
15,3
23,9
23,9
15,7
100
I
15-19
19-22
22-26
26-36
36-46
46-61
61-71
17
20,5
24
31
41
53,5
66
Media =
10
19
38
65
107
149
176
0,057
0,051
0,108
0,153
0,239
0,239
0,157
1
0,057
0,108
0,216
0,369
0,608
0,847
1
&
5,7
10,8
21,6
36,9
60,8
84,7
100
4
4
4
10
10
15
10
2,5
2,25
4,75
2,7
4,2
2,8
2,7
; Q
170
184,5
456
837
1722
2247
1782
7.398,5
2890
3782,25
10944
25947
70602
120214,5
117642
351.991,75
Moda
10
9
19
27
42
42
27
176
%acumulado
( ) 100)
; Q
1
7398,5
42 aos
176
Mo
Valor de la variable que ms veces se repite
Intervalo Modal, es el intervalo en el que se encuentra la moda, en este caso como
todos los intervalos no tienen la misma amplitud, el intervalo modal es el que
presenta mayor densidad de frecuencia, (22 - 26) y dentro del intervalo podemos
considerar la moda igual a la marca de clase o tambin aplicar la formula:
26
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/
1
Q
1
22 +
2,7
4 = 24,18aos
2,7 + 2,25
F
1
24,18 aos es la edad que ms veces se repite, es decir la ms comn entre los
entrevistados.
Mediana = Me
1
176 = 88 La mediana es el valor de la variable que ocupa el lugar central,
2
en nuestro caso el lugar 88.
Intervalo mediano = Es aquel en el que se encuentra la mediana (36-46)
1
1
1 1
176 65
1
2
2
& = 36 +
10 = 41,60 aos
Me = T 1 = T 2 = / 1 +
Q
41
2
4
El 50% de los entrevistados tienen una edad inferior a 41,6 aos
1 Cuartil = T 1
4
1
176 = 44 El 1 cuartil es el valor de la variable que ocupa el lugar 44.
4
Intervalo en el que se encuentra el 1 cuartil (26-36)
1
4
1
1
1 1
176 38
1
4
= / 1 + 4
& = 26 +
10 = 28,22 aos
Q
27
3
176 = 132 El 1 cuartil es el valor de la variable que ocupa el lugar 132.
4
Intervalo en el que se encuentra el 3 cuartil (46-61)
3
4
3
3
1 1
176 107
1
4
4
= / 1 +
& = 70 +
15 = 54,93aos
Q
42
Varianza =
6
Desviacin =
;
1
; =
351.991,75
42,04 2 = 232,59
176
6
27
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Coeficiente de variacin =
&9
( )=
;
6
;
&9
( )
;
15,25
= 0,36
42,04
28
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N Hogares
3.433.103
2.129.198
1.002.469
748.196
167.814
70.025
16.477
16.916
3.411
90
150
210
370
750
1500
2500
3500
4500
; Q
3433103
2129198
1002469
748196
167814
70025
16477
16916
3411
7.587.612
; Q
; Q
; Q
0,4225
0,2806
0,1321
0,0968
0,0221
0,0092
0,0022
0,0022
0,0005
1
0,4525
0,7331
0,8652
0,9638
0,9859
0,9951
0,9973
0,9995
1
; Q
acumulado
308.979.270
319.379.700
210.518.490
276.832.520
125.860.500
105.037.500
41.192.500
59.216.500
15.349.500
1.462.366.500
=1
0,2113
0,2184
0,1440
0,1893
0,0861
0,0718
0,0282
0,0405
0,0104
1
0,2113
0,4297
0,5737
0,7630
0,8491
0,9209
0,9491
0,9896
1
45,25
73,31
86,52
96,38
98,59
99,51
99,73
99,95
100
21,13
42,97
57,37
76,30
84,91
92,09
94,91
98,96
100
24,21
30,34
29,15
20,08
13,68
7,42
4,82
0,99
0
130,60
130,60
= 0,187 No existe demasiada concentracin, El coeficiente
699,24
=1
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 22.- A partir de los siguientes datos sobre ingresos mensuales por hogar (en euros) de
cierta localidad
Ingreso mensual
por hogar
280-600
600-1200
1200-1800
1800-2400
2400-3000
3000-3600
3600-4200
4200-4800
4800-5400
5400-6000
6000-7000
7000-10000
10000-15000
N de hogares
15
120
150
224
270
310
358
320
208
115
35
9
1
&
; Q
; Q
280-600
600-1200
1200-1800
1800-2400
2400-3000
3000-3600
3600-4200
4200-4800
4800-5400
5400-6000
6000-7000
7000-10000
10000-15000
320
600
600
600
600
600
600
600
600
600
1000
3000
5000
15
120
150
224
270
310
358
320
208
115
35
9
1
2.135
0.04
0.20
0.25
0.37
0.45
0.52
0.60
0.53
0.35
0.19
0.03
0.00
0.00
440
900
1500
2100
2700
3300
3900
4500
5100
5700
6500
8500
12500
30
6600
108000
225000
470400
729000
1023000
1369200
1440000
1060800
655500
227500
76500
12500
7.431.000
15
135
285
509
779
1089
1447
1767
1975
2090
2125
2134
2135
6600
114600
339600
810000
1539000
2562000
3958200
5398200
6459000
7114500
7342000
7418500
7431000
0.09
1.54
4.57
10.90
20.71
34.48
53.27
72.65
86.93
95.75
98.81
99.84
100
0.70
6.32
13.35
23.84
36.49
51.01
67.78
82.76
92.51
97.89
99.53
99.95
100
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
; Q
7.431.000
= 3.480,5621 Euros
1
2.135
2.El ingreso ms comn ser el valor que ms veces se repita, es decir la moda:
Intervalo modal, aquel en el que se encuentra la moda, es el intervalo que tenga
mayor densidad de frecuencia (3.600 4.200)
1.-
Moda =
/ 1
F 1
Q 1
F
Q 1
F
1
320
600
3.600 +
600 = 3.904,76
320 310
+
600 600
Euros.
3.- Mediana = Me
1
2135 = 1067,5 La mediana es el valor de la variable que ocupa el lugar central,
2
en nuestro caso el lugar 1068
Intervalo mediano = Es aquel en el que se encuentra la mediana (3.000 3.600)
1
1
1 1
2135 779
1
2
& = 3.000 +
600 = 3.558,38 Euros
Me = T 1 = T 2 = / 1 + 2
Q
310
2
4
La tercera parte de esa cantidad (mximo a dedicar en concepto de alquiler) es de
3558,38
= 1186,13 Euros.
3
Luego una vivienda cuyo alquiler fuera mayor de 1186.13 Euros/mes no seria accesible
para la mitad de los hogares.
4.No parece a simple vista que sea cierta ya que no se aprecia excesiva concentracin.
No obstante vamos a calcular los porcentajes que los valores acumulados ; Q representan
sobre el total de ingresos 7.431.000 (que denominamos
31
). Calculamos
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
[1
Q1
+N
[2
Q2
[2
.
.
.
.
.
+N
+k
[ +k
3
.
.
.
.
.
.
.
.
.
.
+k
8
+N
Es un cambio de origen
Media Aritmtica
;
; Q
1
8 Q
1
+ N )Q
; Q
NQ
; Q
+N
=; +N
(
=
+N ; N
1
(
=
;
1
32
((
=
+ N )
1
+N
))
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 24.- En una caja de reclutas se han medido la altura de 110 jvenes obtenindose la
tabla:
Altura
N Jvenes
1,55-1,60
18
1,60-1,70
31
1,70-1,80
24
1,80-1,90
20
1,90-2,00
17
1,60-1,70
1,70-1,80
1,80-1,90
1,90-2,00
18
31
24
20
17
18
49
73
93
110
Altura
N Jvenes
PERCENTIL r-esimo
= / 1
+ 100
100
DECIL r-esimo
= / 1
+ 10
&
1 1
Q
10
1 1
&
1.21
110 = 23,1
100
Valor de la variable que ocupa el lugar 24, se encuentra en el intervalo (1,60-1,70)
1.1.- Percentil 21
21
21
1 1
110 18
1
100
100
T
& = 1,60 +
0,10 = 1,6164 metros
21 = / 1 +
Q
31
100
El 21% de los jvenes miden menos de 1,6164 metros
87
110 = 95,7
100
Valor de la variable que ocupa el lugar 96, se encuentra en el intervalo (1,90 -2,00)
1.2.- Percentil 87
87
100
87
87
1 1
110 93
1
100
100
= / 1 +
& = 1,90 +
0,10 = 1,9159 metros
17
Q
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
3
110 = 33
10
Valor de la variable que ocupa el lugar 33-34, se encuentra en el intervalo (1,60-1,70)
1.3.- Decil 3
3
10
3
3
1 1
110 18
1
10
= / 1 + 10
& = 1,60 +
0,10 = 1,6483 metros
Q
31
3.- Se consideran "altos" aquellos cuya altura est sobre el percentil 82. Cul es su altura
mnima?
82
Percentil 82
110 = 90,2
100
Valor de la variable que ocupa el lugar 91, se encuentra en el intervalo (1,80-1,90)
82
82
110 73
1 1
1
100
100
T
=
/
+
& = 1,80 +
0,10 = 1,8860 metros
82
1
Q
20
100
El 82% de los jvenes miden menos de 1,8860 metros
= / 1
+ 100
100
1 1
&
= 1,78 Hallar r
= 1,70 + 100
100
Por tanto
62
100
110 49
24
= 1,78
0,10
(1,78 1,70)24
100
r =
+ 49
= 62
0,10
110
En el percentil 62
34
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
20
16
15
10
5
1
0
10
35
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
; Q
2
6
;
&9
Mtodo I
<
< Q
(
=
<
<
=+
=+
( )=
&9 <
((
=
; Q
1
+ & )
+&
&
))
+&
(
=
=6 2
= 6
6
<
+ & )Q
+&
Mtodo II
:
(
=
=+
: Q
=+
( )=
&9 :
6
:
; . Q
1
=.
((
=
* . )
; Q
1
*.
* 6 2 = . * 6
.
.
* 6
*;
6
;
= &9 ( ; )
36
= .*;
))
;
1
*6 2
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Luego:
Con el sueldo actual
CV(X) =
Aumento Mtodo I
&9 <
Aumento Mtodo II
&9 :
( )=
( )=
6
;
6
<
6
:
6
;
+&
.
.
* 6
*;
6
;
= &9 ( ; )
Por tanto
CV (Y) < CV (W) Luego el Mtodo I presenta menor dispersin en trminos
relativos. Luego hace disminuir la desigualdad de los salarios.
37
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
0-20
6
20-40
40
40-50
30
50-60
28
60-70
48
70-80
40
80-90
8
1
/
Q
0 - 20
20 - 40
40 - 50
50 - 60
60 - 70
70 - 80
80 - 90
6
40
30
28
48
40
8
200
;
Q
;
1
10
30
45
55
65
75
85
; Q
60
1200
1350
1540
3120
3000
680
10950
QL
600
36000
60750
84700
202800
225000
57800
667650
1
6
46
76
104
152
192
200
&
20
20
10
10
10
10
10
10950
54,75 aos
200
;
667650
54,75 2 = 340,68 aos
200
1
4
1
1
1 1
200 46
1
4
= / 1 + 4
& = 40 +
10 = 41,33DxRV
Q
30
2
4
2
2
1 1
200 76
1
4
4
= / 1 +
& = 50 +
10 = 58,57 DxRV
Q
28
3
4
3
3
1 1
200 104
1
4
4
= / 1 +
& = 60 +
10 = 69,58DxRV
Q
48
0,3
2,0
3,0
2,8
4,8
4,0
0,8
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/
70
100
1
,QWHUYDOR
(60 70)
70
1 1
1
100
&
Q
70
200 104
100
60
10
48
67,5DxRV
F 1
/ 1
0
Q 1
F
Q 1
60
F
1
40
10
40 28
10 10
10
65,88 aos
Clnica
54,75DxRV
55,8DxRV ...
1
1
200
150
Media Total
1
1
+ ;
+ 1
1
39
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 28.- Una residencia de ancianos tiene 5 tipos de habitaciones, cuyos precios, as como
los ingresos obtenidos, son los siguientes:
Precio por habitacin
Ingresos
200
16.000
500
20.000
750
37.500
1.000
30.000
1.300
26.000
ni
X i ni
200
500
750
1000
1300
20
40
50
30
20
220
16.000
20.000
37.500
30.000
26.000
129.500
; Q
&9
2
6
2
6"
;
1
ni
3.200.000
10.000.000
28.125.000
30.000.000
33.800.000
105.125.000
129.500
= 588,64XQLGDGHV
220
calcularemos el Coeficiente de
Q!
;
105.125.000
2
6#
=
588,64 2 = 131.343,86
6 $ = + 131,343,86 = 362, 4
220
362,4
&9 ( ; )
0,61
588,64
Para poder comparar las estructuras de precios entre dos residencias, compararemos los
coeficientes de variacin de ambas. Ser ms homognea aquella que tenga menor
coeficiente de variacin. En este caso como la otra residencia tiene un coeficiente de 0,75
>0,61. Quiere decir que la primera residencia tiene una estructura ms homognea ya que
presenta menor dispersin.
40
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1.-
1
2
2.-
6
4
Solucin
;
1.- < =
<
1
2
1
2
<% Q %
1 =
; % 1 %
Q
2
1
;
1
= 2
; % Q%
1 Q %
1 ; % Q%
Q%
1
1
2 1
1 6 1
=
= 2,5
2
2
6&
6)
6&
(
=
<
<(
Q(
; ( 1
2
2
Q(
1
=
4
;
1
Q(
1
= 6'2
4
1 * 2 6,
4
6
=
= =2
4
2
2
Los cambios de origen No afectan a la desviacin tpica
Los cambios de escala Si afectan a la desviacin tpica
6+
=+
2.- 7 =
6+
6
4
7- Q -
1
4
6 =
;- 6 Q
4
1
;
1
= 4
; - Q-
6 Q -
1 ; - Q Q6
4 1
1
6 66
=
=0
4
4
=+
6.
41
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
61
63
( 0
=
=+
63
Q0
;0 6
4
2
Q0
1
=
16
1 2 2 64
4
6
=
= =1
16
4
4
;
66
6
=75
4
42
;
1
Q0
1
= 6/ 2
16
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 30.- De dos regiones con la misma poblacin, de un determinado pas, se han tomado
sendas muestras sobre las rentas percibidas. La informacin recogida es la siguiente:
REGION I
Renta (en miles)
N Familias
10-20
24
20-30
36
30-40
20
40-50
20
50-100
50
REGION II
Renta (en miles)
N Familias
05-15
10
15-25
42
25-55
35
55-75
20
75-95
13
a) Hllese la renta media de las muestras de cada regin y del conjunto de las dos regiones.
Cul de las dos rentas medias es ms representativa?
b) Es posible decir si una regin posee un nivel de vida superior a la otra, si medimos este
nivel a travs de la renta?
d) Cul es el nivel de renta percibido por un mayor nmero de familias en la primera
regin?
e) Si en la segunda regin clasificamos a una familia en el grupo en donde se encuentra el
50 % de las menos favorecidas. Cul sera el tope de renta que podra percibir?
Solucin
REGIN I
/7
/7
10-20
20-30
30-40
40-50
50-100
Q7
24
36
20
20
50
18
24
60
80
100
150
; 9 Q9
15
25
35
45
75
360
900
700
900
3750
6610
Q:
5400
22500
24500
40500
281250
374.150
&;
G<
10
10
10
10
50
Q<
&<
2,4
3,6
2
2
1
REGIN II
/<
/<
05-15
15-25
25-55
55-75
75-95
Q<
10
42
35
20
13
1<
10
52
87
107
120
<
; < Q<
10
20
40
65
85
100
840
1400
1300
1105
4745
=
43
; @ Q@
1
Q=
1000
16800
56000
84500
93925
252.225
&>
10
10
30
20
20
G?
Q?
&?
1
4,2
1,17
1
0,65
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Regin I
Regin II
; A QA
1
; B QB
1
6.610
= 44,06
150
4.745
= 39,54
120
C DEC FHG
1;1
2.- Para estudiar cual de las dos medias es ms representativa debemos calcular sus
correspondientes coeficientes de variacin. Y ser ms representativa aquella que
tenga menor coeficiente de variacin.
6O
QN
&9
6J
&9
( 2) =
6P
QL
;
374150
2
(44,06 ) = 553,04
150
23,52
= 0,53
44,06
Regin II
= + 553.04 = 23,52
6P
(1) =
2
6M
2
6J
;
6K
6M
6K
Regin I
6I
&9
6Q
;
QL
6P
;
6M
;
1
QL
;
252225
2
(39,54 ) = 538,46
120
= + 538,46 = 23,20
=
23,20
= 0,58
39,54
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/R T
1
0 S
QR U
FR U
QR U
FR U
QR T
1
20 +
2
10 = 24,56 24,18aos
2 + 2,4
FR T
1
.- Mediana = Me
1
120 = 60 La mediana es el valor de la variable que ocupa el lugar central, en
2
nuestro caso el lugar inmediatamente siguiente al 60.
Intervalo mediano = Es aquel en el que se encuentra la mediana, en el que se
encuentran los valores que ocupan los lugares 60 y 61 (25 55)
Me =
1
2
= T2
4
1
1
1 1V
120 52
1
2
2
= /V 1 +
& V = 3.000 +
30 = 31,85
Q
35
V
45
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 31.- El Servicio Central de Correos realiza una encuesta por muestreo sobre el franqueo
medio de las cartas (en unidades monetarias) que diariamente tiene que distribuir en el
Hospital de Navarra. La informacin recogida, sobre una muestra de 500 cartas es la
siguiente:
Franqueo
N Cartas
3
145
4
132
5
84
7
50
10
48
12
22
18
10
20
8
25
1
10
12
18
20
25
N Cartas
QX
145
132
84
50
48
22
10
500
; Y QY
435
528
420
350
480
264
180
160
25
2842
625
23000
Z 2 QZ
6^
6\
;
1
6_
Q]
; 2 =
23000
2
(5,684) = 13,7
500
6_
=+
6_
= 13,7 = 3,7
3,7
= 0,65 Como es menor de 1 podemos decir que no hay gran dispersin y
5,684
;
por tanto la media es bastante representativa.
&9
2.- Si la muestra anterior es significativa del total de cartas que diariamente se reparten en
el hospital, calclese si el servicio es rentable, teniendo en cuenta que se reparten 35.000
cartas al da y que el costo diario del servicio es de medio milln de unidades monetarias.
Para determinar si el servicio es rentable debemos estimar los ingresos diarios por este
servicio, para ello supondremos que el franqueo medio de la muestra es el franqueo medio
del total de las 35.000 cartas, es decir el franqueo medio de la poblacin.
Ingresos = (350.000) 5,684 = 1.989.400 u.m.
Beneficio = Ingresos Costes = 1.989.400-2.000.000 = -106.000 u.m.
Como el beneficio es negativo, significa que el servicio de correos, en este supuesto No es
rentable.
46
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Salario
medio/mes
(En miles.)
Desviacin
tpica
(En miles.)
CV=
6[
;
Tcnicos
20
300
70
70/300= 0,233
Administrativos
50
145
22.5
22.5/145 = 0,155
operarios
130
156
42
1b
1a
1b
1a
1`
1`
CV=
6[
;
Tcnicos
70/300= 0,233
Administrativos
22.5/145 = 0,155
operarios
47
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/c
/c
10-20
20-30
30-40
40-50
50-60
60-70
Qc
11
15
10
Ni
7
105
18
275
33
525
43
450
48
275
50
130
; d Qd
1760
Calclese: Media, mediana, moda, tercer cuartil, sexto decil, trigsimo percentil
Solucin
Media
Mediana
; e Qe
= T2
0H
1760
35,2
50
1
1
1 1f
50 18
1
2
= /f 1 + 2
& f = 30 +
10 = 34,66
Q
15
f
0 h
/g i 1
Qg j 1
Fg j
1 Cuartil
3 Cuartil
1
4
Fg j 1
Qg i 1
30 +
11
10 = 34,76
11 + 10
Fg i
1
1
1
1 1k
50 7
1
4
= /k 1 + 4
& k = 20 +
10 = 25
Q
11
k
3
4
3
3
1 1l
50 33
1
4
= /l 1 + 4
& l = 40 +
10 = 44,5
Q
10
l
6 Decil = Percentil 60
60
50 = 30 ,QWHUYDOR(30 40)
100
48
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
60
100
60
60
1 1m
50 18
1
100
= /m 1 + 100
& m = 30 +
10 = 38
Q
15
m
Percentil 30
30
50 = 15
100
30
100
,QWHUYDOR
(30 40)
30
30
1 1
50 7
n 1
100
= /n 1 + 100
& n = 30 +
10 = 37,27
Q
11
n
49
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/o
/o
0-1
1-2
2-3
3-4
4-5
Qo
10
12
12
10
Ni
10
22
34
44
50
Solucin
1 Cuartil
2 Cuartil
3 Cuartil
1
4
1
1
1 1p
50 10
1
4
= /p 1 + 4
&p = 1 +
1 = 1,208
Q
12
p
2
4
2
1
1 1q
50 22
1
4
= /q 1 + 4
&q = 2 +
1 = 2,25
Q
12
q
3
4
3
3
1 1q
50 34
1
4
4
= /q 1 +
&q = 3 +
1 = 3,35
Q
10
q
50
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
36
25
36
64
36
188
Solucin
Xi
1
2
3
5
6
8
ni
1
2
2
1
2
1
9
Media:
Varianza:
6v
Desviacin Tpica:
=
;
; t Qt
Qu
6x
X i ni
1
4
6
5
12
8
36
;
6w
36
=4
9
188
4 2 = 4,89
9
X i 2 ni
1
8
18
25
72
64
188
= + 4,89 = 2,21
51
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/z
/z
7-9
9 - 11 11 - 12 12 - 13 13 - 14 14 - 15 15 - 17 17 - 19
Qz
18
14
27
42
31
20
ni
4
18
14
27
42
31
20
1
157
La media ser:
La varianza ser:
Xi
8
10
11,5
12,5
13,5
14,5
16
18
6}
=
;
Q|
6
; { Q{
=+
Ni
4
22
36
63
105
136
156
157
; =
6~
Xi2ni
256
1800
1851,5
4218,75
7654,5
6517,75
5120
324
27742,5
2065
= 13,15DxRV
157
27742,5
13,15 2 = 3,78DxRV 2
157
6
= + 3,78 = 1,94DxRV
X i ni
32
180
161
337,5
567
449,5
320
18
2065
calcularemos el Coeficiente de
1,94
= 0,15 Es muy representativo ya que se acerca bastante a 0
13,15
;
Para analizar la simetra de la distribucin hallaremos las distancias entre cuartiles, para
ello primero hallaremos los cuartiles:
&9
1 cuartil ser:
1
157 = 39,25 El 1 cuartil ser el valor de la variable que ocupa el lugar
4
inmediatamente siguiente al 39.25 y se encuentra en el intervalo (12 13) por tanto,
aplicando la formula:
52
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
4
1
1
1 1
200 46
1
4
= / 1 + 4
& = 40 +
10 = 41,33DxRV
Q
30
4
3 cuartil ser:
3
157 = 117,75 El 3 cuartil ser el valor de la variable que ocupa el lugar
4
inmediatamente siguiente al 117,75 y se encuentra en el intervalo (14 15) por tanto,
aplicando la formula:
3
3
1 1
157 105
1
4
4
T
=
/
+
& = 60 +
1 = 14,41 aos
3
1
Q
31
4
Comprobamos las distancias
T
3
4
100
El percentil 70 ser:
70
157 = 109,9 El 70 percentil ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 109.9 y, que se encuentra en el intervalo (14 15) por
tanto, aplicando la formula:
70
100
70
70
1 1
157 105
1
100
= / 1 + 100
& = 14 +
1 = 14,158 aos
Q
31
53
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
70
100
T 2 = T 2 T 30
4
100
habiendo una pequea diferencia, esto nos indica que hay una pequea asimetra
54
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 37.- Dado el nmero de horas semanales trabajadas por un colectivo de 100 empleados,
obtener:
1.- La variable tipificada Z
2.- Valores de la media y varianza de la Z
horas trabajadas
nmero empleados
Solucin
/
1 /
04
4 10
10 20
20 - 40
0-4
47
2
7
15
25
; Q
47
32
17
4
100
=+
= Q
1
94
224
255
100
673
La media ser:
La varianza ser:
4 - 10
32
=
;
=+
; Q
; =
6
20 - 40
4
= Q
= Q
-0,7937
0,0453
1,3877
3,0656
0
=
=0
100
188
1568
3825
2500
8081
10 - 20
17
-37,304
1,450
23,591
12,263
0
29,61
0,060
32,74
37,59
100
673
= 6,73
100
8081
6,73 2 = 35,5171
100
6
2
6
=+ 1= 1
55
= + 35,5171 = 5,9596
= Q
1
; =
100
02 = 1
100
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
150
25.000
180
35.000
200
40.000
210
45.000
<
100
150
180
200
210
840
La media ser:
<
20
25
35
40
45
165
10.000
22.500
32.400
40.000
44.100
149.000
<
Consumo
Renta
6
6
356
= 0,9673
(9,27)(39,70)
< =
149.000
168 2 = 1.576
5
<
2.000
3.750
6.300
8.000
9.450
29.500
840
= 168
5
165
=
= 33
5
Renta
;<
La covarianza Consumo/renta
<
400
625
1.225
1.600
2.025
5.875
Renta
; =
5.875
332 = 86
5
=+
= + 31.576 = 39,70
=+
= + 86 = 9,27
; <
1
;< =
= (0,9673) 2 = 0,9357
56
29.500
(168)(33) = 356
5
93,57% de fiabilidad
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Como es bastante grande nos indica que es buena la relacin lineal entre Consumo y Renta.
Por lo que establecemos esa relacin:
6
<
<
2
6
356
= 4,14
86
&RQVXPR
Re QWD
= 31,38 + 4,14 ;
57
=
<
2
6
356
= 0,22
1.576
= Re QWD
&RQVXPR
= 3,96 + 0,22<
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
<
10
20
30
40
50
200
180
150
120
100
<
200
180
150
120
100
750
10
20
30
40
50
150
La varianza ser:
40.000
32.400
22.500
14.400
10.000
119.300
<
La media ser:
<
<
<
100
400
900
1.600
2.500
5.500
119.300
150 2 = 1.360
5
; =
=+
; <
2.000
3.600
4.500
4.800
5.000
19.900
< =
;<
750
= 150
5
150
=
= 30
5
5.500
30 2 = 200
5
= + 1.360 = 36,88
=+
= + 200 = 14,14
19.900
(150)(30) = -520
1
5
Covarianza negativa por tanto relacin inversa, cuando una variable crece la otra decrece y
viceversa.
La covarianza
6
6
520
= 0,9971
(36,88)(14,14)
;< =
= (0,9971) 2 = 0,9943
58
99,43% de fiabilidad
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Como es bastante grande nos indica que es buena la relacin lineal entre las dos variables.
Por lo que establecemos esa relacin:
E
520
= 2,6
1200
<
<
2
6
= 228 2,6 ;
2
6
520
= 0,38
1.360
E < = 30 + 0,38(150) = 87
<
= 87 0,38<
Significados
Coeficiente de correlacin lineal = r = 0,9971
Mide la bondad de la estimacin, la bondad de la prediccin o la bondad del ajuste.
Mide la fiabilidad
Vara entre (-1 y + 1). Cuanto ms se acerque a +1 o a -1 mayor ser la bondad, mejor
ser el ajuste
Su signo nos indica si la correlacin es positiva o negativa, es decir directa o inversa.
En este caso inversa las variables varan en sentido contrario.
Tiene el mismo signo que el de la covarianza y el de los coeficientes de regresin
Covarianza = 6
6 = 520 Covariacin (variacin conjunta) negativa. Nos indica que existe cierta
covariacin pero no nos dice si es muy grande o no. Es una medida en trminos absolutos
59
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 40.- El consumo y la renta mensual de 100 familias expresadas en 104 pesetas, son los
siguientes: X= (Consumo) Y = (Renta).
X/Y
30
40
50
15 25 35 45
10 15 -- -5 20 25 --- 15
5
5
15
25
35
45
; Q
; < Q
X
30
40
50
Q
< Q
<
10
5
15
15
20
15
50
25
5
30
5
5
25
50
25
100
750
2000
1250
4.000
225
12250
1050
225
2750
3775
31250
36750
10125
81500
15
65
95
100
22500
80000
62500
165.000
15750
25
58000
75
38750
100
112.500
Solucin
=
4000
= 40
100
2750
= 27,5
100
<
165000
(40) 2 = 50
100
6
81500
(27,5) 2 = 58,75
100
25
= 0,46
(7,07)(7,66)
= (0,46) 2 = 0,213
<
= 58,75 = 7,66
112500
(40)(27,5) = 25
100
6
6
= 50 = 7,07
25
= 0,5
50
6
6
= 47,5 + 0,5 ;
60
21,3% de fiabilidad
=
*
25
= 0,425
58,75
= 28,3 + 0,4257<
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1.-
= 28,3 + 0,4257<
conocido
<
= 60
= 28,3 + 0,4257<
25
= 0,46
(7,07)(7,66)
= (0,46) 2 = 0,213
21,3% de fiabilidad
61
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1986
1,9
20,5
1987
1,8
20,8
1988
2,0
21,2
1989
2,1
21,7
1990
1,9
22,1
1991
2,0
22,3
1992
2,2
22,2
1993
2,3
22,6
1994
2,7
23,1
1995
3,0
23,5
Ajstese un modelo lineal que explique el comportamiento del ahorro en funcin de la renta.
Solucin
;
<
<
;<
1,9
1,8
2,0
2,1
1,9
2,0
2,2
2,3
2,7
3
20,5
20,8
21,2
21,7
22,1
22,3
22,2
22,6
23,1
23,5
3,61
3,24
4,00
4,41
3,61
4,00
4,84
5,29
7,29
9,00
420,25
432,64
449,44
470,89
488,41
497,29
492,84
510,76
533,61
552,25
38,95
37,44
42,40
45,57
41,99
44,60
48,84
51,98
62,37
70,50
21,9
220
49,29
4.848,38
484,64
Media
Varianza
Desviacin tpica
21,9
49
,
29
; =
6
= 0,133 = 0,365
= 2,19 6 2 =
(2,19) 2 = 0,133
10
10
Media
Varianza
Desviacin tpica
220
4848,38
2
6
6
= 0,838 = 0,915
< =
= 22
=
(22) 2 = 0,838
10
10
Covarianza
484,64
=
(2,19)(22) = 0,284
6
10
Coeficiente de correlacin
Coeficiente de determinacin
0,284
2
U =
= 0,85
U
= (0,85) 2 = 0,723 72,3% de fiabilidad
(0,365)(0,915)
Coeficiente de regresin de Y/X
Coeficiente de regresin de X/Y
6
6
0,284
0,284
E =
=
=
2
,
13
E =
=
= 0,34
2
2
0,133
0,838
6
6
Ordenada en el origen
Ordenada en el origen
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Coeficiente
Productividad
Personal No
Cualificado
(En %)
10
20
30
30
10
1
2
3
4
5
Personal
Cualificado
(En %)
5
20
20
40
15
Personal
Tcnico
(En %)
10
40
30
20
Personal No
Cualificado
(En %)
Personal
Cualificado
(En %)
Personal
Tcnico
(En %)
1
2
3
4
5
10
20
30
30
10
5
20
20
40
15
10
40
30
20
; Q
1
100
; Q
1
100
4,5
17
28
35
15,5
100
4,5
34
84
140
77,5
340
%
acumulado
4,5
21,5
49,5
84,5
100
340
= 3,4 Coeficiente de productividad media.
100
= 50 Luego la mediana es
=4
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Personal No
Cualificado
(En %)
1
2
3
4
5
10
20
30
30
10
100
(1) =
(S
100
(1) =
10
40
90
120
50
310
310
=
= 3,1
100
10
80
270
480
250
1090
2
6 (1) =
2 = 1,29 = 1,1358
2 S
; =
100
&9
(1)=
1090
(3,1) 2 = 1,29
100
1,1358
= 0,36 Homogeneidad
3,1
aceptable ya que es menor de 1. Nos dice que hay una dispersin bastante pequea.
;
Personal No
Cualificado
(En %)
1
2
3
4
5
5
20
20
40
15
100
( 2) =
( 2) =
( S
100
6
340
=
= 3,4
100
2 = 1,24 = 1,1135
5
40
60
160
75
340
2 S
5
80
180
640
375
1280
2
6 ( 2) =
&9
2 S
; =
100
(2)=
1280
(3,4) 2 = 1,24
100
1,1135
= 0,32 Homogeneidad
3,4
aceptable ya que es menor de 1. Nos dice que hay una dispersin bastante pequea.
Mayor homogeneidad ser el que tenga menor coeficiente de variacin, es decir el de
menor dispersin en este caso el personal cualificado presenta una productividad
MS homognea.
64
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
DAS DE
AUSENCIA
65 71
58 64
51 57
44 50
20 - 28
29 - 37
0
2
5
14
1
6
9
6
EDAD
38 - 46 47 - 55
8
10
5
2
56 - 64
7
2
0
2
16
4
1
0
Solucin
Primero reorganizamos los datos y construimos la tabla:
2 Q
4755
51
5664
60
44 50
(47)
50 57
(54)
57 64
(62)
64 71
(68)
14
24
1128
53016
20
1080
58320
10
24
1488
92256
16
32
2176
147968
21
22
25
11
21
100
5872
351560
504
726
1050
561
1260
4101
2 Q
12096
23958
44100
26611
75600
182365
25248
39864
64176
35394
83400
248082
< Q
<
; Q
;
; < Q
<
2 =
=+
"! =
3846
42
<
2937
33
<
2028
24
<
2
5872
= 58,72 das
100
2
< =
2 Q
1
6
4101
= 41,01 aos
100
351560
(58,72 2 = 67,56
100
2
; =
182365
(41,01) 2 = 141,83
100
;< =
=+
2 = + 141,83 = 12 aos
248082
(41,01)(58,72) = 72,71
100
65
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
$"#
72,71
= 0,74 U 2 = (0,74) 2 = 0,546
54,6% de fiabilidad. Es decir el
6$ 6#
(12)(8,2)
54,6% de las variaciones de la edad explican las variaciones de los das de ausencia, y
viceversa.
U
Como es bastante grande nos indica que es buena la relacin lineal entre Edad y das de
ausencia. Por lo que establecemos esa relacin:
6
%"&
72,71
= 0,51
141,83
2
6%
<
<
=
*
'tDV$XVHQFLD
(GDG
= 37,7 + 0,51; )
=
<
=
;
("'
2
6'
72,71
= 1,07
67,56
'tDV$XVHQFLD
= 22,18 + 1,07<*
66
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
10
15
1
1
2
2
7
1
2
4
5
<
100
125
150
Solucin
<
15
1
1
2
4
2
7
1
10
2
4
5
11
5
12
8
25
2 2
20
100
165
285
3 2 Q3
100
1000
2475
3575
45
2625
12250
21750
36625
3200
= 128
25
< Q
0 2 Q0
<
; Q
;
4 5
; < Q
10
100
125
150
<
<
92 =
<2 =
A"B =
2
<8
< =
; 2 Q;
;
1
@ ?
; <
1
D"C
6D
417500
128 2 = 316
25
2
500
1500
1200
3200
285
= 11,4
25
: =+
3575
(11,4) 2 = 13,04
25
36625
=
(128)(11,4) = 5,8
25
; =
;<
5,8
6C
(3,61)(17,77)
= 0,09
50000
187500
180000
417500
: 2 = + 316 = 17,77
> =+
= (0,09) 2 = 0,00817
= 2 = + 13,04 = 3,61
0,8% de fiabilidad.
Es decir solamente el 0,8% de las variaciones de una variable vienen explicadas por las
variaciones de la otra variable. Como U 2 es muy pequeo nos indica que es muy mala la
relacin lineal entre las variables. Aun y todo establecemos la relacin:
6
E"F
<
5,8
= 0,44
13,04
<
= 122,9 + 0,44 ; I
=
<
H"G
5,8
= 0,018
316
= 9,05 + 0,018<J
67
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
180
1905
220
2370
260
2835
300
3300
340
3765
<
M2
N2
; <
<
180
220
260
300
340
1905
2370
2835
3300
3765
32400
48400
67600
90000
115600
3629025
5616900
8037225
10890000
14175225
342900
521400
737100
990000
1280100
1300
14175
354000
42348375
3871500
Media
Varianza
Desviacin tpica
1300
354000
; =
= 260 6 O 2 =
(260) 2 = 3200
6P
= 3200 = 56,56
5
5
Media
Varianza
Desviacin tpica
14175
42348375
2
< =
= 2835
6Q
=
(2835) 2 = 435450 6 R = 435450 = 659,88
5
5
Covarianza
3871500
=
(260)(2835) = 37200
6 S"T
5
Coeficiente de correlacin
Coeficiente de determinacin
37200
2
U =
= 0 ,9965
U
= (0,9965) 2 = 0,9931 99,31% de fiabilidad
(56 ,56 )( 659 ,88 )
Coeficiente de regresin de Y/X
Coeficiente de regresin de X/Y
6 U"V
6 U"V
37200
37200
E =
=
= 11,625
E =
=
= 0,08
2
2
3200
435450
6U
6V
Ordenada en el origen
Ordenada en el origen
68
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 46.- En un estudio sobre alcohlicos se informa que el 40% de los mismos tienen padre
alcohlico y el 6% madre alcohlica. El 42% tienen al menos uno de los padres
alcohlicos.
1.- Porcentaje de personas que tengan ambos padres alcohlicos.
2.- Porcentaje de personas que tengan madre alcohlica si lo es el padre.
3.- Porcentaje de personas que tengan madre alcohlica pero no un padre alcohlico.
4.- Porcentaje de personas que tengan madre alcohlica si el padre no lo es
Solucin
P = padre alcohlico
M = madre alcohlica
%(P) = 40%
%(M) = 6%
%(P M) = 42%
0 = suceso
SI
NO
Madre
alcohlica
SI
NO
1.-
%(P M ) = 4%
2.-
%( 0 ) =
3.-
%( ( 3 0 ) = 2%
4.-
%( 0 ) =
SI
%0 3
%0 3
%3
P
NO
%0 3
%0 3
%3
Padre alcohlico
SI
NO
4
2
6
36
58
94
40
60
100
4
100 = 10%
40
%( 0 3)
2
100 = 100 = 33,33%
6
%( 3)
69
%0
%0
100
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 47.- Realizada una encuesta entre fumadores se obtuvieron los resultados sobre las
variables:
X: N de cigarrillos fumados diariamente
Y: Horas de sueo diarias
Que hemos recogido en la siguiente tabla
X
Y
4-6
6-7
7-8
8-9
2
10
24
26
62
8
16
14
10
48
26
20
12
4
62
36
26
14
2
78
72
76
82
70
300
^ ^
200
558
624
1054
1950
4386
800
5022 8112
17918
48750
80602
1700
4284 4342
6528
11775
28629
50
112
222
300
; Q
0
4
18
28
50
2 - 6 6 - 12 12 14 14 - 20 20 - 30
4
9
13
17
25
` a
; < Q
`a
160
360
494
615
595
2064
[ 2 Q[
1800
3211
4612,5
5057,5
14681
72
148
230
300
Solucin
=
4386
= 14,63
300
2064
= 6,88
300
<
c2 =
80602
(14,63) 2 = 54,63
300
e2 =
14681
(6,88) 2 = 1,6
300
g"h =
<
5,23
= 0,56
(7,39)(1,26)
i"j
= 54,63 = 7,39
f = 1,6 = 1,26
28629
(14,63)(6,88) = 5,23
300
= (0,56) 2 = 0,315
5,23
= 0,096
54,63
= 8,28 0,096 ; m
70
=
=
*
31,5% de fiabilidad
6
l"k
5,23
= 3,27
1,6
= 37,13 3,27<n
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
5 26 + 2 36 = 28,86
6
10
5 20 + 2 26 = 26,86
6
10
5 12 + 2 14 = 12,80
6
10
5 4 + 2 2 = 3,73
6
10
72,25
72,25
100 = 24,08%
300
2.- Obtener el nmero mnimo de cigarrillos diarios que fuma uno de los fumadores del
30% que ms fuma.
70
Hay que hallar el percentil 70
300 = 210 El valor de la variable que ocupa
100
el lugar 210, que esta en el intervalo (14 20)
70
100
70
1 1o
1
210 160
100
= /o 1 +
& o = 14 +
6 = 18,84 Cigarrillos
Q
62
o
<
6.- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no
fuman ms de 15 cigarrillos al da
71
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Si Duerme (6 8)
No Duerme (6 8)
Totales
No fuma
ms de 15
81,33
89
170,33
Si fuma
ms de 15
76,67
53
129,66
72
Totales
158
142
300
81,33
100 = 47,748%
170,33
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
%(A) = 10%
%(B) = 1%
%( $ % )=10,4%
B
%
1.-
A
0,6
9,4
10
0,4
89,6
90
1
99
100
%( $ % ) = 0,6%
2.-
%( % )=
3.-
%(
%
$
%( % $) 0,6
=,
100 = 6%
%( $)
10
)=
%( % $ )
0,4
=
100 = 0 , 444 %
90
%( $ )
73
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 49.- Se estima que el 30% de los ciudadanos de Navarra son obesos y el 3% sufre de
diabetes. El 2% son obesos y sufre diabetes. Cul es el porcentaje de personas que son
obesas o sufren diabetes?
Solucin
Suceso A = ser obeso
%(A) = 30%
%(B) = 3%
%(
B
%
A
2
28
30
1
69
70
3
97
100
74
)= 2 %
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 50.- De 300 estudiantes 100 cursan Antropologa y 80 Estadstica. Estas cifras incluyen
30 estudiantes que cursan ambas asignaturas. Cul es el porcentaje de estudiantes que
cursan Antropologa o Estadstica?
Solucin
100
100 = 33,33%
300
80
P(E) =
100 = 26,67%
300
30
3 ( $ ( )=
100 = 10%
300
Suceso A = Estudiar A
%(A) =
Suceso E = Estudiar E
E
(
% ($ % )=
A
30
70
100
50
150
200
80
220
300
30 + 50 + 70
100 = 50%
300
E
(
A
10
23,33
33,33
16,67
50
66,67
26,67
73,33
100
75
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 51.- Se estima que entre la poblacin total de Europa el 55% padece de obesidad, el
20% es hipertensa, y el 60% es obesa o hipertensa. Es, de hecho, independiente el que
una persona sea obesa de que padezca hipertensin?
Solucin
%(A) = 55%
% (B) = 20%
%(A B) = 60%
( )
% ( ) = 100 60 = 40%
% = suceso
B
%
A
15
40
55
5
40
45
20
80
100
Luego A y B
12
son Independientes
15
5
20
Independientes
76
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 52.- Se sabe por informes recientes que el 18% de los estudiantes sufren de depresin
en algn periodo de su escolarizacin, que el 2% piensa en el suicidio y que el 19% sufre
de depresin o piensa en el suicidio.
1.- Cul es el porcentaje de estudiantes que sufren depresin y piensen en el suicidio? 2.Cul es el porcentaje de estudiantes que sufren depresin pero no piense en el suicidio?
Solucin
Suceso A = Sufrir depresin
%(A) = 18%
%(B) = 2%
%(A B) = 19%
% = suceso
B
%
A
1
17
18
% = 100 19 = 81%
1
81
82
2
98
100
1.-
2.-
77
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 53.- Se estima que el 15% de la poblacin adulta padece de hipertensin, pero que el
75% de todos los adultos creen no tener este problema. Se estima tambin que el 6% de la
poblacin tiene hipertensin pero no es consciente de padecer dicha enfermedad. Cul es
el porcentaje de personas que creyendo que no tienen hipertensin, y sin embargo la
tienen?
Solucin
%(A) = 15%
%(B) = 75%
Sufrir Hipertensin
%(A B) = 6%
Padecer hipertensin / creer no tener problemas = Suceso
B
%
%( $ ) =
%
A
6
9
15
69
16
85
75
25
100
6
100 = 8%
75
78
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 54.- Dados los siguientes valores de las variables X e Y ajustar una recta por mnimos
cuadrados y dar una medida del ajuste realizado.
Y
X
16
52
19
39
22
45
25
51
16
19
22
25
82
52
39
45
51
187
s2
256
361
484
625
1726
t2
2704
1521
2025
2601
8851
v u
832
741
990
1275
3838
Solucin
<
<
; <
<
82
= 20,5
4
187
= 46,75
4
{"| =
w2 =
1726
(20,5) 2 = 11,25
4
6
y2 =
x = 11,25 = 3,35
8851
(46,75) 2 = 27,19
4
= 27,19 = 5,21
3838
(46,75)(20,5) = 1,125
4
1,125
= 0,064
(3,35)(5,21)
= (0,064) 2 = 0,0041
}"~
1,125
= 0,041
27,19
=
=
"
1,125
= 0,1
11,25
*
= 18,5 + 0,041;
;
= 344,7 + 0,1<
Demasiado pequea la bondad de las estimaciones
<
79
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 55.- En una residencia de ancianos tenemos: El 20% casados, el 30% solteros y el 50%
viudos. El 5% de los casados tienen mal carcter, el 10% de los solteros y el 20% de los
viudos tambin tienen mal carcter.
1.- Hallar el porcentaje de personas que tengan mal carcter y estn casadas.
2.- Sabiendo que tienen mal carcter hallar el porcentaje de personas que estn casadas.
Solucin
Tener mal
Carcter
SI
Estado civil
C
S
1
3
NO
V
10
14
19
27
40
86
20
30
50
100
) = 5%
C = Casado
%(C) = 20%
%( 0
S = Soltero
%(S) = 30%
%( 0 ) = 10%
V = Viudo
%(V) = 50%
%( 0 ) = 20%
1.-
2.-
%(0 ) = 1 + 3 + 10 = 14%
%(&
)=
%(& 0 )
=
%( 0 )
1
(100)= 7,14%
14
80
&
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
%(A) =
190
100 = 36,40%
522
%( $ ) =
332
100 = 63,6%
522
= No ser delincuente
( )
%
B
%
A
112
78
190
( )= 112
100 = 58,95%
190
%
122
% % =
100= 36,75%
$ 332
122
210
332
234
288
522
Luego A y B
12
son Independientes
Independientes
4
= 0,424
0,424 es el grado de asociacin entre sexo y delincuencia, se atraen el ser mujer con ser
delincuente
81
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
A favor
En contra
Total
P. vasco
37
13
50
Catalua
22
8
30
Andaluca
8
6
14
Total
77
33
110
Catalua
22
8
30
Andaluca
8
6
14
Total
77
33
110
Solucin
FRECUENCIAS OBSERVADAS (OB)
Galicia
10
6
16
A favor
En contra
Total
P. vasco
37
13
50
A favor
En contra
Total
P. vasco
35
15
50
Catalua
21
9
30
Andaluca
9,8
4,2
14
2 =
2%
7( )
7(
35
21
82
+ ....................... =
Total
77
33
110
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 58.- Deseamos analizar la posible relacin entre el color de la piel y el tener o no los
ojos azules, para ello tomamos una muestra de 200 personas de las cuales 79 tienen piel
clara y entre estas hay 49 con ojos azules, mientras que entre los que tienen piel oscura
tenemos 25 con ojos azules.
Solucin
A = Tener la piel clara
B = Tener ojos azules
B
%
A
49
30
79
25
96
121
74
126
200
49 25
74
12
son Independientes
(49)(96) (30)(25) =
(49)(96)+ (30)(25)
3954
= 0,7249
5454
0,7249 es el grado de asociacin entre el color de la piel y el de los ojos, tener piel clara
y tener ojos azules, se atraen
83
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Grupos
Pacifistas
Muy cercano
Cercano
Distante
Muy Distante
nunca
77
161
42
14
PRCTICA RELIGIOSA
Varias Algunas
Solo
Domingos
al ao al mes domingos y festivos
31
18
16
25
119
57
67
62
26
36
34
21
18
6
13
12
Varias a la
semana
4
3
2
0
Solucin
FRECUENCIAS OBSERVADAS (OB)
Grupos
Pacifistas
Muy cercano
Cercano
Distante
Muy Distante
TOTAL
nunca
77
161
42
14
294
PRCTICA RELIGIOSA
Varias Algunas
Solo
Domingos
al ao al mes domingos y festivos
31
18
16
25
119
57
67
62
26
36
34
21
18
6
13
12
194
117
130
120
Varias a la
semana
4
3
2
0
9
TOTAL
171
469
161
63
864
Varias a la
semana
1,6
4,9
1,6
0,9
9
TOTAL
171
469
161
63
864
2 =
2%
7( )
7(
(77 58,4)2
58,4
COEFICIENTE DE CONTINGENCIA
&
2
=
2 + 1
7, 2
= 0,09 No Parece demasiado grande
7,2 + 864
84
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 60.- Se esta estudiando la relacin existente entre los aos de estudio realizados por los
padres y los estudios realizados por los hijos. Para ello se toma una muestra de 7 personas.
ENTREVISTADOS
PADRES HIJOS
A
12
12
B
10
8
C
6
6
D
16
11
E
8
10
F
9
8
G
12
11
Analizar y establecer la posible dependencia y correlacin entre ambas variables. Y en su
caso, dar una medida de la bondad de los posibles pronsticos de ambas.
Solucin
Entrevistados
Padres
X
12
10
6
16
8
9
12
73
A
B
C
D
E
F
G
TOTAL
<
<
2
=
6
2
<
=+
" =
6
6
66
= 9,43 aos
7
<
Hijos
Y
12
8
6
11
10
8
11
66
666
=
(9,43) 2 = 6,2
7
; <
;< =
"
4,5
6
(3,01)(2,49)
<
144
100
36
256
64
81
144
825
;<
144
64
36
121
100
64
121
666
144
80
36
176
80
72
132
720
73
= 10,43 aos
7
2
=
6
2 Q
=+
; =
825
(10,43) 2 = 9,07
7
720
(9,43)(10,43) = 4,5
7
= 0,60
= (0,60) 2 = 0,36
bastante grande nos indica que no es demasiado buena la relacin lineal entre ambas
variables. De todas formas establecemos esa relacin:
E
"
2
6
4,5
= 0,49
9,07
85
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 61.- Hallar las rectas de regresin de las variables X e Y correspondientes a las edades
de hombres y mujeres a la hora de contraer matrimonio, y hallar el grado de correlacin.
Esposo
Esposa
40
27
36
25
20
17
18
16
60
37
50
32
Solucin
Esposo
X
40
36
20
18
60
50
224
<
<
2 =
2 =
=+
" =
<
< =
2 Q
; <
"
<
1600
1296
400
324
3600
2500
9720
;<
729
625
289
256
1369
1024
4292
;
1080
900
340
288
2220
1600
6458
;
224
= 37,3 aos
6
4292
(25,6) 2 = 59,97
6
2
; =
9720
(37,3) 2 = 228,71
6
154
= 25,6 aos
6
Esposa
Y
27
25
17
16
37
32
154
;< =
116,45
(15,12)(7,74)
6
=+
2 = +
6428
(25,6)(37,3) = 116,45
6
= 0,995
= (0,995) 2 = 0,99
grande nos indica que es buena la relacin lineal entre ambas variables. Establecemos esa
relacin:
E
"
2
6
116,45
= 0,50
228,71
*
Recta: < = 6,95 + 0,50 ;
86
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 62.- Dadas las variables estadsticas correspondientes a las edades de 5 nios y sus
pesos respectivos, hallar las rectas de regresin y su representacin grfica.
Edad
Peso
15
19
25
33
34
Solucin
Edad
X
2
4
6
7
8
27
<
<
2 =
=+
" =
<
4
16
36
49
64
169
;
;< =
;<
225
361
625
1089
1156
3456
=
3456
(25,2) 2 = 56,16
5
; <
1
< =
126
= 25,2 Kg.
5
<
Peso
Y
15
19
25
33
34
126
30
76
150
231
272
759
27
= 5,4 aos
5
2 =
=+
2 Q
;
1
; =
169
(5,4) 2 = 4,64
5
759
(25,2)(5,4) = 15,72
5
"
15,72
2
= 0,974
U
= (0,974) 2 = 0,95
95% de fiabilidad. Es bastante
6 6
(2,15)(7,5)
grande nos indica que es buena la relacin lineal entre ambas variables. Establecemos esa
relacin:
U
"
15,72
= 3,38 Es lo que varia Y al variar X en una unidad
4,64
87
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Yj
14 - 18
18 - 22
22 - 26
26 - 30
0,00
0,08
0,30
0,01
0,06
0,02
0,09
0,03
0,00
0,40
0,01
0,00
Xi
3-5
5-7
7-9
2 I
22 - 26
26 - 30
Xi
3-5
5-7
7-9
0,00
0,08
0,30
0,01
0,06
0,02
0,09
0,03
0,00
0,40
0,01
0,00
0,50
0,18
0,32
2,00
1,08
2,56
8,00
6,48
20,48
0,38
0,09
0,12
0,41
5,64
34,96
6,08
1,80
2,88
11,48
22,24
2 I
97,28
36,00
69,12
321,44
523,84
46,08
11,20
12,48
46,48
116,24
<
<
; <
<
18 - 22
14 - 18
= ;
= <
= 5,64
2 =
= 22,24
2 =
2 I
<
88
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
= 3,16 = 1,777
" =
; <
22,22 = 5,217
;<
Xi / Yj < 22
Xi / Yj > 26
4
6
8
0,01
0,14
0,32
0,47
= ;
4
6
8
0,021
0,298
0,681
= 7,32
2 =
Xi / Yj > 26
4
6
8
0,4
0,01
0,0
0,41
= ;
&9
4
6
8
= 4,048
= 0,093696 = 0,306098
2 I ;
( ; )=
2 =
0,976
1
1
1
;
2 I
&9
( ; )=
6
;
0,084
1,788
5,448
7,32
2 I
0,336
10,728
43,584
54,648
1,032
= 0,141
7,32
0,976
0,024
0
0,021
0,319
1
1
= 1,0656 = 1,032
Xi / Yj < 22
3,904
0,144
0
4,048
2 I
15,616
0,864
0
16,48
0,306098
= 0,075
4,048
Es ms homognea la que sea menos dispersa, es decir la que tenga menor coeficiente de
variacin. Es decir la distribucin de Xi / Yj > 26 es ms homognea que la distribucin
de Xi / Yj < 22
2.- Porcentaje de pacientes con edad inferior a 26 y mayores de 18 aos.
18 - 22
0,01
0,06
0,02
0,09
22 - 26
0,09
0,03
0,00
0,12
totales
0,10
0,09
0,02
0,21
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/5 <X< 7
14 - 18
0,08
18 - 22
0,06
22 - 26
0,03
26 - 30
0,01
totales
0,18
0,445
0,333
0,167
0,055
16
20
24
28
7,12
6,66
1,54
0,445
0,778
0,945
Yj
I
<
<
<
Yj / 5 < Xi < 7
19,32
= 19,32 aos
1
4
0,25 0
1
2
4
0,5 0,445
2
3
4
0,75 0,445
3
2
4
1
4
3
4
2
4
= 21,66 18,66 = 3
Para que la distribucin fuera simtrica, deberan de ser iguales ambas distancias.
4.- Analizar razonadamente la dependencia y la correlacin entre las variables X e Y.
FRECUENCIAS OBSERVADAS
Yj
Xi
3-5
5-7
7-9
14 - 18
18 - 22
22 - 26
26 - 30
0,00
0,08
0,30
0,01
0,06
0,02
0,09
0,03
0,00
0,40
0,01
0,00
0,50
0,18
0,32
0,38
0,09
0,12
0,41
Yj
Xi
3-5
5-7
7-9
14 - 18
18 - 22
22 - 26
26 - 30
0,19
0,0684
0,1216
0,045
0,0162
0,0288
0,06
0,0216
0,0384
0,205
0,0738
0,1312
0,50
0,18
0,32
0,38
0,09
0,12
0,41
90
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
6
6
"
9,1936
= -0,9916
(1,777)(5,217)
= (0,9916) 2 = 0,98337
98,337% de fiabilidad, o bondad del ajuste. El 98,337% de las variaciones de una variable
vienen explicadas por las variaciones de la otra variable a travs de las rectas de regresin.
Como es suficientemente bueno establecemos la recta de regresin.
6
"
9,1936
= 2,9 Es lo que varia Y al variar X en una unidad
3,16
* = 38,65 2,9 ;
<
Recta: Y/X
E
"
2
6
;
9,1936
= 0,413 Es lo que varia X al variar Y en una unidad
22,22
* = 14,83 0,413<
6.- En el mes de marzo una persona estuvo ingresada en Ubarmin por rotura de menisco
7 das
y afirma tener 18 aos. Comentar posible veracidad y fiabilidad de su
afirmacin.
*
; = 14,83 0, 413<
Para Y = 18
X = 7,369 das
*
= 38,65 2,9 ;
<
*
Para X = 7 < = 38,65 2,9(7) = 18,35 aos
Puede ser verdad.
Con una fiabilidad del 98,337%
91
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 64.- A un grupo de alumnos se les examina de teora (X) y prctica (Y) de una
asignatura. La nota global de dicha asignatura (Z) se obtiene de la siguiente forma:
Zi = X + Y
Se pide: Comparar la Homogeneidad de la distribucin de la nota global en los dos casos
siguientes:
1.- las variables X e Y estn totalmente correlacionadas
2.- Las variables X e Y son totalmente independientes
Solucin
Zi = X + Y
=
= Q
1
(
=
(
=
&9
) = ((
+ <
)
Q
( = )=
(
+
<
; Q
1
) (
+ <
+<
< Q
1
))
<
1
+2
((
=
+<
)(
<
)+ (
<
<
))
< Q
A.1.- r = +1
A.2.- r = 1
B.- r = 0
> 0
< 0
= 0
&9
&9
&9
( = )=
( = )=
( = )=
2 + 6 2 + 2 6
;
2 + 6 2 2 6
;
+<
+<
2 + 6
2
+<
92
+ 2 6
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 65.- Un hospital adquiere una nueva maquina para rellenar bombonas de oxigeno. Al
cabo de un mes, se eligen 100 bombonas al azar y se comprueba su peso:
peso en Kg.
N bombonas
Ni
(45 - 48)
10
10
(48 - 50)
48
58
(50 - 53)
30
88
(53 - 55)
12
100
Se supone que si el 75% de las bombonas pesan menos de 52 Kg., la maquina ser
aceptada como buena, en caso contrario la maquina ser devuelta. Cree usted que el
hospital aceptara la maquina? Explique clara y exactamente el porqu de su respuesta.
Solucin
Habr que comprobar que el 75% de las bombonas pesan ms o menos de 52 kilos.
Para ello hallaremos el percentil 75 y comprobaremos si es mayor o menor de 52.
O Tambin podemos hallar bajo que percentil se encuentra el valor 52 y comprobar
si es mayor o menor que 75.
El percentil 75 ser:
75
100 = 75 El percentil 75 ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 75 y, que esta en el intervalo (50 53). Aplicando la
formula:
75
100
75
75
1 1
100 58
1
100
100
= / 1 +
& = 14 +
3 = 51,7 < 52
Q
30
Por tanto No devolver la maquina ya que 75% de las bombonas pesan menos de
52 kilos
De la otra forma:
Despejaremos r de la formula del percentil
U
T
= / 1
+ 100
100
1 1
1
Q
&
(T 75 / 1 ) * Q
U
100
&
+ 1 =
(52 50)(30)
+ 58 = 78
3
93
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 66.-A una feria acuden 600 firmas expositoras que ocupan otros tantos Stands. La
superficie de estos, as como el personal asignado a cada uno vienen dados en la siguiente
tabla:
m2 X
Personal
Y
0-2
2-6
6 - 10
10 - 12
12 - 18
totales
10 - 20
74
46
18
2
0
140
20 - 30 30 - 70
10
0
86
22
76
26
60
50
30
26
262
124
70 - 130
0
2
12
22
38
74
total
84
156
132
134
94
600
1.- Superficie aproximada de la feria teniendo en cuenta que hay 60.000 m2 desocupados.
2.- Distribucin, en frecuencias relativas, de la superficie de los Stands en que trabajan
entre 5 y 15 personas.
3.- Distribucin del personal asignado en Stands con superficie entre 25 y 70 m2.
Analizar la posible simetra de dicha distribucin.
4.- Distribuciones de: N personas asignadas a un Stand / superficie > 30 m2
N personas asignadas a un Stand / superficie < 30 m2
Cul de las dos es ms homognea y por qu?
5.- % de Stands que tengan asignadas menos de10 personas sabiendo que ocupan ms
de 25 m2.
6.- Analizar y establecer la posible relacin lineal entre ambas variables
7.- Estimar el nmero de personas que podemos esperar que tenga asignado un Stand
con 78 m2. Dar una media de la bondad de dicha estimacin.
Solucin
m2 X
15
Personal
Y
10 - 20
1
4
8
11
15
0-2
2-6
6 - 10
10 - 12
12 - 18
Q
25
20 - 30
50
30 - 70
100
70 - 130
74
46
18
2
0
140
10
86
76
60
30
262
0
22
26
50
26
124
0
2
12
22
38
74
84
156
132
134
94
600
2100
6550
6200
7400
22250
31500
163750
310000
740000
1245250
6360
51800
61800
91600
211560
; Q
;
; < Q
< Q
2 Q
<
84
624
1056
1474
1410
4648
84
2496
8448
16214
21150
48392
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 /
10 - 20
20 30
30 70
70 - 130
Frecuencias absolutas
1 46 + 18 + 2 + 1 0 = 31,5
4
2
1 86 + 76 + 60 + 1 30 = 172,5
4
2
1 22 + 26 + 50 + 1 26 = 94,5
4
2
1 2 + 12 + 22 + 1 38 = 53,5
4
2
352
0,090
0,490
0,270
0,150
1
3.- Distribucin del personal asignado en Stands con superficie entre 25 y 70 m2.
Analizar la posible simetra de dicha distribucin.
/
/
Frecuencias absolutas
02
26
6 10
10 12
12 - 18
1 10 + 0 = 5
2
1 86 + 22 = 65
2
1 76 + 26 = 64
2
1 60 + 50 = 80
2
1 30 + 26 = 41
2
255
70
134
214
255
1
4
63,75 5
1
2
4
127,5 70
2
3
4
191,25 134
3
2
4
1
4
3
4
2
4
Para que la distribucin fuera simtrica, deberan de ser iguales ambas distancias. Por tanto
No es simtrica.
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
/
<
> 30
0+0=0
22 + 2 = 24
26 + 12 = 38
50 + 22 = 72
26 + 38 = 64
198
< Q
<
02
26
6 10
10 12
12 - 18
La varianza ser:
<
La media ser:
#2 =
<
" 2 Q"
< =
$ =+
! !
< Q
1
1
4
8
11
15
0
384
2432
8712
14400
25928
2152
= 10,87
198
25928
10,87 2 = 12,82
198
$ 2 = + 12,82 = 3,58
&9
0
96
304
792
960
2152
<
3,58
= 0,329
10,87
&
/&
02
26
6 10
10 12
12 - 18
'
< 30
74 + 10 = 84
46 + 86 = 132
18 + 76 = 94
2 + 60 = 62
0 + 30 = 30
402
) )
< Q
+ 2 Q*
<
<
La media ser:
La varianza ser:
<
2
=
6.
- 2 Q-
<
/ =+
1
4
8
11
15
, ,
< Q
1
< =
6
84
528
752
682
450
2496
84
2112
6016
7502
6750
22464
2496
= 6,20
402
22464
6,20 2 = 17,44
402
/ 2 = + 17,44 = 4,1762
&9
<
96
4,1762
= 0,6735
6,20
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Personal
Menos de 10
Ms de 10
372
228
600
148
100 = 44,985%
329
140 * 84
= 19,6
600
<= =
6
; :
; <
1
;< =
8 2 = + 700,5 = 26,46
211560
(37,08)(7,75) = 65,23
600
?>
65,23
= 0,543 U 2 = (0,543) 2 = 0,295
29,5% de fiabilidad. Es
6? 6>
(26,46)(4,54)
bastante pequea nos indica que es bastante pequea la relacin lineal entre ambas
variables. Solamente el 29,5% de las variaciones de una variable vienen explicadas por las
variaciones de la otra variable a travs de las rectas de regresin.
Establecemos esa relacin:
Recta Y/X
6 @A
65,23
E =
=
= 0,09 Es lo que varia Y al variar X en una unidad
2
@
700,5
6
U
97
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
98
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Personal
no cualificado
en %
10
20
30
30
Personal
cualificado
en %
5
20
20
40
Personal
tcnico
en %
10
40
30
Solucin
1.- Para hallar la productividad media Haremos:
Coeficiente
Productividad
Personal No
Cualificado
(En %)
Personal
Cualificado
(En %)
Personal
Tcnico
(En %)
1
2
3
4
5
10
20
30
30
10
5
20
20
40
15
10
40
30
20
L L
; Q
1
L L
; Q
1
M = I M 100
N SN
acumulado
4,5
17
28
35
15,5
100
O %
4,5
34
84
140
77,5
340
4,5
21,5
49,5
84,5
100
340
P SP
=
= 3,4 Coeficiente de productividad media.
100
100
= 50 Luego la mediana es
R =4
Personal No
S SS
T 2 ST
99
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Productividad
; (1)
Cualificado
(En %)
1
2
3
4
5
10
20
30
30
10
100
(1) =
10
40
90
120
50
310
U ( SU 310
=
= 3,1
100
100
X (1) =
10
80
270
480
250
1090
6
W 2 (1) =
X 2 = 1,29 = 1,1358
V 2 SV
; =
100
&9
(1)=
1090
(3,1) 2 = 1,29
100
1,1358
= 0,36 Homogeneidad
3,1
aceptable ya que es menor de 1. Nos dice que hay una dispersin bastante pequea.
;
Personal No
Cualificado
(En %)
1
2
3
4
5
5
20
20
40
15
100
( 2) =
_ ( 2) =
340
\ ( S\
=
= 3,4
100
100
6
_ 2 = 1,24 = 1,1135
Z SZ
5
40
60
160
75
340
[ 2 S[
5
80
180
640
375
1280
6
^ 2 (2) =
&9
] 2 S]
; =
100
(2)=
1280
(3,4) 2 = 1,24
100
1,1135
= 0,32 Homogeneidad
3,4
aceptable ya que es menor de 1. Nos dice que hay una dispersin bastante pequea.
Mayor homogeneidad ser el que tenga menor coeficiente de variacin, es decir el de
menor dispersin en este caso el personal cualificado presenta una productividad
MS homognea.
100
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 68.- En los ltimos 10 aos (1.988 - 1.997) el nmero de personas menores de 18 aos
ingresadas en Ubarmin han sido: 28 - 30 - 29- 30 - 32 - 34 - 33 - 33 - 34 - 35
1.- Podemos confirmar la aparente tendencia lineal creciente, del nmero de personas,
menores de 18 aos, ingresadas en Ubarmin en los ltimos aos? Con que fiabilidad?
2.- Pronosticar el nmero de personas, menores de 18 aos, que cabe esperar para el ao
2.005. Suponiendo que se mantiene la tendencia lineal.
3.- Analizar la representatividad del nmero medio de ingresos en Ubarmin de personas
menores de 18 aos, en los ltimos 10 aos.
Solucin
Aos
T
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
d2 =
c 2 Qc
g2
<
Personas
X
28
30
29
30
32
34
33
33
34
35
318
318
= 31,8
10
2
; =
T- 1.993
Y
1
2
3
4
5
6
7
8
9
10
55
<
<
784
900
841
900
1024
1156
1089
1089
1156
1225
10164
<
10164
(31,8) 2 = 5,16
10
1
4
9
16
25
36
49
64
81
100
385
;<
28
60
87
12
160
204
231
264
306
350
1810
55
= 5,5
10
6
f =+
e 2 = + 5,16 = 2,27
385
(5,5) 2 = 8,25 6 i = + 6 i 2 = + 8,25 = 2,87
1
10
; k <j ; < = 1810 (31,8)(5,5) = 6,1
6 lm
=
1
10
< =
on
6,1
2
= 0,936
U
= (0,936) 2 = 0,8767
87,67% de fiabilidad. Es
n
6
(2,27)(2,87)
bastante grande nos indica que es buena la relacin lineal entre ambas variables.
Establecemos esa relacin:
U
6o
pq
2
6p
6,1
= 1,18 Es lo que varia Y al variar X en una unidad
5,16
*
Recta: <s = 31,36 + 1,18 ; r
101
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
ut
6,1
= 0,74 Es lo que varia X al variar Y en una unidad
8,25
w * = 27,73 + 0,74<v
= (0,936) 2 = 0,8767
87,67% de fiabilidad.
1.- Podemos confirmar la aparente tendencia lineal creciente, del nmero de personas,
menores de 18 aos, ingresadas en Ubarmin en los ltimos aos? Con que fiabilidad?
Si porque r es positivo y adems bastante cercano a 1 con lo que la fiabilidad es bastante
grande U = 0,936 lo que significa que U 2 = (0,936) 2 = 0,8767 87,67% de fiabilidad.
2.- Pronosticar el nmero de personas, menores de 18 aos, que cabe esperar para el ao
2.005. Suponiendo que se mantiene la tendencia lineal.
*
*
; z = 27,73 + 0,74(7 1993)
; { = 27,73 + 0,74( 20051993) = 36,61
T = 2.005
Es decir estimamos que en 2.005 habr 37 ingresos de personas menores de 18 aos, en
Ubarmin.
2,27
= 0,071 Menor de 1 y adems muy pequeo, Luego poca dispersin,
31,8
;
es decir es muy homognea la distribucin, los datos son muy parecidos, la media es muy
representativa del conjunto.
&9
(; )
102
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 69.- En una clase el 30% de alumnos varones y el 10% de mujeres son repetidores.
Sabiendo que en una clase de 160 alumnos hay 90 varones. Calcular el porcentaje de
alumnos que siendo repetidores sean mujeres.
Solucin
A = 90
= 160 90 = 70
% ) = 27
0,1 (70) = 7
% =7
Suceso B =
B
%
%) +
A
27
63
90
% = 27 + 7 = 34
= 160 34 = 126
7
63
70
34
126
160
Re SHWLGRUD )
7
=
100 = 20,588 %
(Re SHWLGRUD )
34
0XMHU
103
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1,5-2,5
14
4
6
4
2,5-3,5
28
8
12
8
3,5-4,5
21
6
9
6
4,5-5,5
7
2
3
2
Sabiendo que:
Xi = peso, en kilos, de los nios nacidos en maternidad en una semana
Yj = peso, en gramos, que pierden los recin nacidos en esos primeros das
1.- Analizar y establecer la posible relacin lineal entre ambas variables.
2.- Pronosticar el peso de un nio que ha perdido en esos das 400 gramos de peso. Dar una
medida de la fiabilidad de dicho pronstico.
3.- Calcular el peso medio de los nios nacidos en maternidad que han perdido menos de
200 gramos. Compararla con la media de los que si han perdido mas de 200 gramos. Y
decir cual es mas representativa y porque.
4.- distribucin de X/ 100 < Y< 400 podemos afirmar que es simtrica?
5.- Distribuciones marginales de ambas variables. Cul es ms homognea? Por qu?
Solucin
1,5 2,5
Y
2
100 50-150
14
200 150-250
4
300 250-350
6
400 350-450
4
28
Q
70
20
30
20
140
56
168
168
70
462
2 Q
112
504
672
350
1638
11200
33600
33600
14000
92400
; Q
;
; < Q
14
4
6
4
28
2,5 3,5
3,5 4,5
4,5 5,5
28
8
12
8
56
21
6
9
6
42
7
2
3
2
14
104
70
20
30
20
140
~ ~
< Q
7000
4000
9000
8000
28000
2 Q
<
700000
800000
2700000
3200000
7400000
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
14
4
6
4
28
2,5 3,5
3,5 4,5
4,5 5,5
28
8
12
8
56
21
6
9
6
42
7
2
3
2
14
70
20
30
20
140
2 =
<
7400000
(200) 2 = 12857,14 6 = + 12857,14 = 113,39
1
140
;
<
92400
6
=
;< =
(3,3)(200) = 0 Incorrelacin total
1
140
2
< =
2.- Pronosticar el peso de un nio que ha perdido en esos das 400 gramos de peso. Dar una
medida de la fiabilidad de dicho pronstico.
No se puede pronosticar ya que son dos variables Independientes e Incorrelacionadas
3.- Calcular el peso medio de los nios nacidos en maternidad que han perdido menos de
200 gramos. Compararla con la media de los que si han perdido mas de 200 gramos. Y
decir cual es mas representativa y porque.
(1) = Nios nacidos en maternidad que han perdido menos de 200 gramos.
X
1,5 2,5
2
2,5 3,5
3
3,5 4,5
4
4,5 5,5
5
16
32
24
80
32
96
96
40
264
2 Q
64
288
384
200
936
; Q
(1) =
(1) =
;
1
( Q
264
= 3,3
80
2 (1) =
2 Q
2 = 0,81 = 0,9
; =
936
(3,3) 2 = 0,81
80
6
0,9
&9 (1)=
=
= 0,2727
3,3
;
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1,5 2,5
2
2,5 3,5
3
3,5 4,5
4
4,5 5,5
5
12
24
18
60
24
72
72
30
198
48
216
288
150
702
; Q
;
( 2) =
6
( Q
( 2) =
198
= 3,3 6 2 (2) =
60
2 Q
; =
2 = 0,81 = 0,9
702
(3,3) 2 = 0,81
60
6
0,9
&9 ( 2)=
=
= 0,2727
3,3
;
Son igual de homogneas adems tienen la misma media, y son igual de representativas. Es
porque las variables son independientes y por tanto se mantienen las proporciones.
4.- distribucin de X/ 100 < Y< 400 podemos afirmar que es simtrica?
X
1,5 2,5
2
2,5 3,5
3
3,5 4,5
4
4,5 5,5
5
19
38
28,5
9,5
95
; Q
38
114
114
47,5
313,5
2 Q
76
342
456
237,5
1111,5
19
57
85,5
95
; Q
1
315,5
= 3,3
95
1
4
23,75 19
1
2
4
47,5 19
2
3
4
71,25 57
3
2
4
1
4
3
4
2
4
= 4 3,25 = 0,75
Para que la distribucin fuera simtrica, deberan de ser iguales ambas distancias. Por tanto
No es simtrica.
106
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1,5 2,5
2,5 3,5
3,5 4,5
4,5 5,5
28
56
42
14
140
50-150
150-250
250-350
350-450
70
20
30
20
140
462
< Q = 28000 = 200 .
< =
= 3,3
1
140
1
140
6
= + 0,81 = 0,9
6
= + 12857,14 = 113,39
6
6
113,39
0,9
=
= 0,56
&9 (< )=
&9 ( ; )=
=
= 0,2727
200
3,3
<
;
Es ms homognea la distribucin de la variable X (peso de los recin nacidos) que la
distribucin de la variable Y (peso, en gramos, que pierden los recin nacidos en esos
primeros das) Ya que presenta un coeficiente de variacin menor, es decir tiene menor
dispersin por tanto es ms homognea.
;
; Q
107
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 71.- Un hospital adquiere una nueva maquina para rellenar bombonas de oxigeno. Al
cabo de un mes, se eligen 100 bombonas al azar y se comprueba su peso:
Peso en Kg.
N bombonas
(45 - 48)
10
(48 - 50)
48
(50 - 53)
30
(53 - 55)
12
Se supone que si el 75% de las bombonas pesan menos de 52 Kg., la maquina ser
aceptada como buena, en caso contrario la maquina ser devuelta. Cree usted que el
hospital aceptara la maquina? Explique clara y exactamente el porqu de su respuesta.
Solucin
Habr que comprobar que el 75% de las bombonas pesan ms o menos de 52 kilos.
Para ello hallaremos el percentil 75 y comprobaremos si es mayor o menor de 52.
O Tambin podemos hallar bajo que percentil se encuentra el valor 52 y comprobar
si es mayor o menor que 75.
El percentil 75 ser:
75
100 = 75 El percentil 75 ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 75 y, que esta en el intervalo (50 53). Aplicando la
formula:
75
100
75
75
1 1
100 58
1
100
100
= / 1 +
& = 14 +
3 = 51,7 < 52
Q
30
Por tanto No devolver la maquina ya que 75% de las bombonas pesan menos de
52 kilos
De la otra forma:
Despejaremos r de la formula del percentil
U
T
= / 1 + 100
100
1 1
1
Q
&
(T 75 / 1 ) * Q
U
100
&
+ 1 =
(52 50)(30)
+ 58 = 78
3
108
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 72.- Realizada una encuesta entre fumadores se obtuvieron los resultados, de la tabla,
sobre las variables:
X: N de cigarrillos fumados diariamente
Y: Horas de sueo diarias
Horas
4-6
6-7
7-8
8-9
total
2 -6
0
4
18
28
50
N DE CIGARRILLOS
6 - 12 12 - 14 14 - 20
2
8
26
10
16
20
24
14
12
26
10
4
62
48
62
20 - 30
36
26
14
2
78
total
72
76
82
70
300
Solucin
,QWHUYDORV
4-6
6-7
6,5
7-8
7,5
8-9
8,5
5
2
26+ 36 =28,87
6
10
5
2
20+ 26 =21,86
6
10
5
2
12+ 14 =12,80
6
10
5
2
4+ 2 =3,73
6 10
67,26
28,87
50,73
63,53
67,26
67,26
= 22,42%
300
Obtener el nmero mnimo de cigarrillos diarios que fuma uno de los fumadores
del 30% que ms fuma.
2).-
Percentil 70
70
300 = 210 ,QWHUYDOR(14 20)
100
3).-
70
100
70
70
1 1
300 160
1
100
= / 1 + 100
& = 60 +
6 = 18,84FLJDUULOORV
Q
62
109
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Estimar el consumo de tabaco para una poblacin de 1.500 personas de las que son
fumadoras el 32%
32% de 1.500 = (0,32) (1500) = 480 personas que fuma
Como la media de cigarrillos es de 14,62 es decir 15 cigarrillos por persona
El consumo de tabaco ser 480 personas a un promedio de 15 cigarrillos por
persona sern: ( 480)(15 ) = 7.200 cigarrillos/da
5).- Estimar el nmero de horas de sueo diarias para una persona que fuma 35
cigarrillos al da.
Como la recta de regresin de Y/X es Y* = 8,3 0,1 Xi
Para un valor X = 35 aos sustituimos en la recta y obtenemos
Y* = 8,3 (0,1 )(35) = 4,8 horas de sueo que pronosticamos para una persona
que tiene 35 aos, pero con una fiabilidad, o bondad de 0,58 es decir del 34,34% Que
parece un poco pequea.
6).- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no
fuman ms de 15 cigarrillos al da
Menos de 6 horas de
sueo
Entre 6 y 8 horas de
sueo
Ms de 8 horas de
sueo
Menos de 15
cigarrillos
14,33
Ms de 15
cigarrillos
57,67
72
91,33
66,67
158
64,67
5,33
70
170,33
129,67
91,33
%
=
100 = 53,62%
No
fuman
ms
de
15
cigarrillo
s
170,33
110
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 73.- Una empresa decide hacer un reajuste entre sus empleados. La clasificacin se lleva a
cabo mediante un Test, que arroja las siguientes puntuaciones:
N de Empleados
Puntuacin
0 30
30 50
50 70
70 90
90 - 100
Ni
94
140
160
98
8
94
234
394
492
500
La planificacin ptima de la empresa exige que el 65% sean Administrativos, el 20% Jefes de
Seccin, el 10% Jefes de Departamento y el 5% Inspectores, segn sea la puntuacin obtenida
(estas categoras van de menor a mayor puntuacin) Calcular la puntuacin mxima para ser
Administrativo, Jefe de Seccin y Jefe de Departamento.
Solucin
65%
Administrativos
siguiente a
65
100
65
(500) = 325
100
T
85
(500) = 425
100
85
100
95
100
95
(500) = 475
100
El ltimo 5% Inspectores.
Luego hay que hallar los tres puntos que dividirn la distribucin en cuatro partes:
T
65 T 85
100 100
95
100
U
= / 1 + 100
100
T
65
100
65
100
1 1
1
Q
&
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
85
100
85
100
95
100
95
100
112
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
() ) =
16,7 15,5
= 0,48
2,5
() ) =
77,5 75
= 0,081
30,6
(* ) =
14 15,5
= 0,6
2,5
(* ) =
82,4 75
= 0,24
30,6
= *
113
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 /
15.000 25.000
25.001- 30.000
30.001 - 40.000
40.001 - 50.000
50.001 - 60.000
60.001 - 80.000
80.001 -100.000
100.001 - 200.000
; Q
; Q
; Q
20
27,5
35
45
55
70
90
150
; Q
; Q
16
34
211
332
310
582
194
134
1813
*100= T
16
50
261
593
903
1485
1679
1813
0.882
2.758
14.40
32.70
49.80
81.91
92.61
100
0.882
2.758
14.40
32.70
49.80
81.91
92.61
100
0.275
1.080
7.430
20.28
34.94
69.97
84.98
100
* 100 =
acumulado
320
935
7385
14940
17050
40740
17460
20100
116290
=1
0.275
0.805
6.35
12.85
14.66
35.03
15.01
7.39
)
=
0.275
1.080
7.430
20.28
34.94
69.97
84.98
100
0.607
1.678
6.966
12.42
14.86
11.94
7.63
0
56,101
= 0,2004
275,0056
=1
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 76.- Se conocen las ventas de un cierto nmero de empresas. Y se desea obtener las
ventas medias de este nmero de empresas.
Ventas (millones)
Empresas
4
10
5
3
6
3
7
10
Solucin
;
4
5
6
7
Ventas Medias
10
3
3
10
26
; Q
40
15
18
70
143
; Q
1
143
= 5,5 millones
26
115
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 77.- De una encuesta realizada entre 100 familias han agrupado la masa de salarios
segn la siguiente distribucin:
Salario
Familias
1.2.3.4.-
1.000
20
2.000
30
3.000
30
4.000
20
Solucin
1.- Obtener el salario medio
;
20
30
30
20
100
1000
2000
3000
4000
Salario medio
; Q
20000
60000
90000
80000
250.000
.
2.- Obtener el salario medio con cambio de origen 2.000
= ; 2000
-1000
0
1000
2000
Salario medio
20
30
30
20
100
-20000
0
30000
40000
50.000
1
2
3
4
1.000
20
30
30
20
100
8 Q
1
50000
= 500
100
= 8 + 2.000 = 2.500
1.000
Salario medio
8 Q
250.000
= 2.500
100
= ; 2000
8 Q
; Q
20
60
90
80
250
=
;
116
8 Q
1
50000
= 500
100
= 8 + 2.000 = 2.500
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
2000
1000
-1
0
1
2
2000
1000
20
30
30
20
100
Salario medio
8 Q
-2
0
3
4
5
117
8 Q
1
5
= 0,05
100
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Xi
ni
1
2
3
4
5
Ni
6
11
14
17
20
6
5
3
3
3
20
Xi ni
6
10
9
12
15
52
valores de la variable
7
Frecuencia
2
Desv. tp. = 1,47
Media = 2,6
N = 20,00
0
1,0
2,0
3,0
4,0
valores de la variable
118
5,0
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 .- Dados los siguientes valores: 2,38; 2,06; 2,15; 2,47; 2,21; 2,36; 2,32; 2,32; 2,24;
2,15; 2,10; 2,13; 2,49; 2,41; 2,29; 2,36; 2,22; 2,46; 2,19; 2,06.
1.- Obtener la tabla estadstica de valores agrupados, comprendidos entre 2,00 y 2,50; con
una amplitud de 0,10 para cada intervalo
2.- Obtener el histograma de frecuencias
Solucin
INTERVALOS
2 2,10
2,10 2,20
2,20 2,30
2,30 2,40
2,40 2,50
ni
2
5
4
5
4
20
Xi
2,05
2,15
2,25
2,35
2,45
valores de la variable
6
Frecuencia
Media = 2,27
N = 20,00
0
2,05
2,15
2,25
2,35
valores de la variable
119
2,45
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
7,90
0,10
8,10
0,20
8,30
0,40
8,50
0,30
6ROXFLyQ
;
I
= I (50)
= Q
=1
7,90
8,10
8,30
8,50
0,10
0,20
0,40
0,30
5
10
20
15
120
5
15
35
50
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
5.000
6.000
7.000
8.000
9.000
60
50
70
80
50
Q
1
; Q
5.000
6.000
7.000
8.000
9.000
60
50
70
80
50
60
110
180
260
310
300.000
300.000
490.000
640.000
450.000
Media =
Xini
N
3.422
= 171,1 cm.
20
121
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 82-. Realizada una encuesta entre 100 pacientes de un hospital sobre dos caractersticas
x e y se obtuvieron los siguientes resultados:
= 1.650
; Q
<
= 840
< Q
2 Q =149.000
2 Q = 587.500
= 295.000
; < Q
; Q
1
; 2 Q
2 =
1
<
1.650
= 16,50
100
2
; =
<
< Q
1
587.500
(16,5) 2 = 5602,75
100
840
= 8,4 .
100
=+
2 = + 5602,75 = 74,85
149.000
(8,4) 2 = 1419,44 6 = + 1419,44 = 37,67
1
100
; < ; < = 295.000 (16,5)(8,4) = 2811,4 Correlacin positiva
6
=
100
1
6
2811,44
2
2
=
= 0,9971
U =
U
= (0,9971) = 0,9942 99,42% de fiabilidad
(74,85)(37,67)
6 6
6
2 =
< =
(1 ) = (1 0,9942) = 0,0058
U
0,58% No explicado
6
37,67
&9 (< )=
=
= 4,484
8,4
<
6
74,85
( ; )=
=
= 4,536
16,5
;
6
2811,4
2 =
E =
= 0,5 Es lo que varia Y al variar X en una unidad
5602,75
6
&9
6
;
Recta
<
2811,4
= 1,98 Es lo que varia X al variar Y en una unidad
1419,44
Recta
122
<
* = 0,13 + 1,98<
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
6
2811,44
=
= 0,9971
U =
(74,85)(37,67 )
6 6
Coeficiente de correlacin lineal es bastante cercano a 1 luego hay mucha correlacin,
prcticamente perfecta, y positiva, es decir ambas variables varan en el mismo sentido. La
recta ser creciente.
3.- % de la variacin de Y explicada por la variacin de X
2
2
U
= (0,9971) = 0,9942
4.- Variacin de X al variar Y en una unidad
6
2811,4
2 =
E =
= 1,98 Coeficiente de regresin de ;
<
1419,44
6
5.- Estimar el valor de X para Y =9
*
*
;
= 0,13 + 1,98<
; = 0,13 + 1,98(9 ) = 17,69
&9
( ; )=
123
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
124
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 84.- En un museo se sabe que el precio medio de las entradas es de 76 Pts. Los adultos
deben pagar sus correspondientes entradas a 100 Pts. Y los nios a 20 Pts. Que porcentaje
de adultos y nios visitan el museo?
Solucin
125
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 85.- En un barrio de una ciudad, el 20% de las viviendas tienen una superficie entre 50
y 60 m2, el 25% entre 60 y 70 m2, el 20% entre 70 y 80 m2, el 25% entre 80 y 100 m2 y, el
10% entre 100 y 120 m2. Determnese:
1.- La superficie media por vivienda
2.- El tipo de vivienda ms frecuente.
Solucin
126
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
127
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
128
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
129
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
; < Q
= 15
Pueden ser las rectas de regresin entre las variables X e Y las siguientes:
2X Y = 1
X 3Y = 2
Diga razonadamente El Porqu.
Solucin
130
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Edad actual
Grado
Madurez
0
1
2
3
4
(3 - 9)
5
2
1
0
0
(9-13)
3
5
10
2
0
(13-17)
3
6
15
5
1
(17-23)
2
8
17
4
3
(23-27)
0
1
5
1
1
= 1.598
; Q
<
=402
< Q
= 174
; < Q
= 28.058
= 2.960
Solucin
131
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
4) Las variables X e Y
son Independientes
5) si aumenta X en una unidad
Y disminuye en 2 unidades
6) si aumenta Y en una unidad
X disminuye en 0,96
7) Las variables X e Y
estn correlacionadas
8)la desviacin tpica es negativa
9)coeficiente de determinacin
es igual 0,96
10) coeficiente de correlacin
es igual 0,96
11)coeficiente de regresin
es positivo
12) la recta es decreciente
132
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
Seale todas las expresiones que son ciertas, marcando V, y las que son falsas marcando
F
El coeficiente de correlacin
no puede ser 2,3
La Mediana es el valor central
de la distribucin
La desviacin tpica es siempre
no negativa
La mediana es igual
al segundo cuartil
Coeficiente de determinacin
es siempre no negativo
la covarianza puede
ser negativa
la varianza nunca
puede ser negativa
El percentil 50 es igual
a la mediana
La covarianza puede ser positiva
La probabilidad de un suceso X V
puede ser 0,5
el coeficiente de correlacin
V
puede ser negativo
la covarianza puede ser cero
V
El coeficiente de variacin
V
puede ser -1,4
El coeficiente de regresin puede V
ser - 1.4
El Coeficiente de correlacin
V
puede ser 0,98
F
F
F
F
El percentil 50
es un Promedio
La Varianza
puede ser cero
Coeficiente de correlacin
puede ser 0
19)La
La Moda es el valor de
mayor densidad
La Covarianza
puede ser negativa
La Moda es un promedio
La desviacin tpica
no puede ser < 0
La Covarianza puede
ser negativa
La Media aritmtica
puede ser negativa
La Varianza siempre
es positiva
La Probabilidad de X
puede ser 0,2
La media aritmtica
puede ser cero
La desviacin tpica
no puede ser <0
Coeficiente de variacin
puede ser 0.98
la moda puede ser cero 0
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
1 Que significa que entre dos variables haya un coeficiente r = -0,999 (seale todos los
significados ciertos marcando la V, y todos los falsos marcando la F):
Estn poco
correlacionadas
ambas variables
son dependientes
el coeficiente de regresin
es 0,999
cuando Y disminuye
X aumenta
varan en sentido contrario
la covarianza es < 0
la covarianza es > 0
V F
V F
V F
V
V
F
F
ambas variables
son independientes
rectas de regresin
son perpendiculares
Estn incorrelacionadas
la covarianza es muy grande
133
V F
V F
V F
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 Que significa que entre dos variables haya un coeficiente r = 0 (seale todos los
significados ciertos marcando la V, y todos los falsos marcando la F):
ambas variables
estn correlacionadas
la recta de X sobre Y
es decreciente
las varianzas
son negativas
la covarianza
es muy grande
el coeficiente de
determinacin es cero
las varianzas
son iguales
un disparate
V F
V F
V F
V F
V F
V F
V F
134
ambas variables
son dependientes
ambas variables
estn incorrelacionadas
las medias son
muy representativas
el coeficiente de variacin
es cero
el coeficiente de regresin
es uno
ambas varan
conjuntamente
la recta de Y sobre X
Es creciente.
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
;
Solucin
135
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
136
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 Cincuenta y cinco alumnos reciben puntuaciones de una asignatura (Z): En Teora
(X) y en problemas (Y) del 1 al 10 reflejndose en la siguiente tabla:
7(25,$
0-2
2-4
4-5
5-7
7 - 10
352%/(0$6
0 -2
5
4
1
0
0
2-4
4
4
4
3
0
4-5
4
2
5
2
2
5-7
2
4
3
2
1
7 - 10
0
1
1
0
1
+ 3<
3
137
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
= 3,5
=2
Sx = 1,2
Sz = 0,8
Solucin
138
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
ODV 1~PHURSDJRV
1~PHURSDJRV
&XDQWtD
FRPSDxtD$
,QGHPQL]DFLRQHV
GH
FRPSDxtD%
FLHQWRV
0LOORQHV
FLHQWRV
10
12
30
40
10
0 - 20
20 - 40
40 - 50
50 - 100
100 - 150
11
12
41
20
8
- Qu porcentaje del montante total de las indemnizaciones que ha pagado la compaa
B corresponde al 20% de los pagos ms bajos?
Calcular la cuanta mxima de la indemnizacin, que ha pagado la compaa B, recibida
por el 20% de las personas con menores indemnizaciones.
Calcular la cuanta mnima de la indemnizacin, que ha pagado la compaa B, recibida
por el 20% de las personas con mayores indemnizaciones.
6ROXFLyQ
Qu porcentaje del montante total de las indemnizaciones que ha pagado la
compaa B corresponde al 20% de los pagos ms bajos?
; Q
; Q
3
=1
=
; Q
=1
; Q
(100)
=
(100)
10
30
45
75
125
11
12
41
20
8
11
23
64
84
92
110
360
1.845
1.500
1.000
110
470
2.315
3.815
4.815
11,96
25,00
69,56
91,30
100,00
2,28
9,76
48,08
79,23
100,00
=
= 92
= 4.815
; Q
3 (VHODFXPXODGRGH Q H[SUHVDGRHQSRUFHQWDMHV
T HVHODFXPXODGRGH ; Q H[SUHVDGRHQSRUFHQWDMHV
o
o
[
o
o
o
[
139
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
[
= 2,28 +
3RU WDQWR HO GHO PRQWDQWH WRWDO GH ODV LQGHPQL]DFLRQHV TXH KD
SDJDGRODFRPSDxtD%FRUUHVSRQGHDOGHORVSDJRVPiVEDMRV
;
0 20
20 40
40 50
50 100
100 - 150
11
12
41
20
8
11
23
64
84
92
20
92 = 18,4 El percentil 20 ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente a 18,4 y que est en el intervalo (20 40).
Aplicando la formula del percentil ser:
= / 1 + 100
100
1 1
1
Q
&
20
100
20
92 11
= 20 + 100
(20) = 32,33
12
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
= / 1 + 100
100
1 1
1
Q
&
80
100
80
92 64
= 50 + 100
(50) = 74
20
141
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
X:
Y:
95
8
105
5
87
3
98
6
115
8
100
7
99
8
125
9
<
<
;<
87
95
98
99
100
105
115
125
3
8
6
8
7
5
8
9
7569
9025
9604
9801
10000
11025
13225
15625
9
64
36
64
49
25
64
81
261
760
588
792
700
525
920
1125
$2 =
# 2 Q#
;
1
<
'2
824
= 103
8
2
; =
<
<
"
185874
(103) 2 = 125,25
8
54
= 6,75
8
6
& =+
% 2 = + 125,25 = 11,19
392
(6,75) 2 = 3,4375 6 ) = + 6 ) 2 = + 3,4375 = 1,85
1
8
; + <* ; < = 5671 (103)(6,75) = 13,625
6 ,=
1
8
/.
6/
< =
13,625
6.
(11,19)(1,85)
= 0,66
= (0,66) 2 = 0,43
pequea nos indica que no es buena la relacin lineal entre ambas variables. Establecemos
esa relacin:
6
01
2
60
13,625
= 0,1 Es lo que varia Y al variar X en una unidad
125,25
*
Recta: <3 = 4,45 + 0,1; 2
142
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
54
13,625
= 3,96 Es lo que varia X al variar Y en una unidad
3,4375
7 * = 76,24 + 3,96<6
1
8=2
4
2
8=4
4
3
8=6
4
1
4
8 =
2
4
3
4
1
4
95 + 98
= 96,5
2
99 + 100
= 99,5
2
105 + 115
= 110
2
2
4
3
4
'LVWDQFLDVHQWUHFXDUWLOHV
0
3
4
8 -
1
4
= 99,5 96,5 = 3
143
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 En un estudio sobre alcohlicos se informa que el 40% de los mismos tienen un
padre alcohlico y el 6% madre alcohlica. El 42% tienen al menos uno de los padres
alcohlicos.
Se pide: obtener razonadamente los porcentajes de personas alcohlicas que:
1. - Tenga ambos padres alcohlicos.
2. - Tenga madre alcohlica si lo es el padre.
3. - Tenga madre alcohlica y no padre alcohlico.
4. - Tenga madre alcohlica si el padre no lo es.
Solucin
P = padre alcohlico
%(P) =40%
M = madre alcohlica
%(M) = 6%
%(P M) = 42 %
% 3 0 = % 3 0 = 100 - %(3 0 ) 100 42 = 58%
Madre
alcohlica
1.-
SI
NO
Padre alcohlico
SI
NO
4
2
36
58
40
60
6
94
100
2.-
%( 0 ) =
3.-
%( ( 3 0 ) = %( 0 ) %( 3 0 ) = 6 4 = 2%
4.-
%( 0 ) =
%( 0 3 )
2
100 = 100 = 33%
6
%( 3 )
144
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 Cincuenta y cinco alumnos reciben puntuaciones de una asignatura (Z): En Teora
(X) y en problemas (Y) del 1 al 5 reflejndose en la siguiente tabla:
;<
5
4
1
0
0
4
4
4
3
0
4
2
5
2
2
2
4
3
2
1
0
1
1
0
1
145
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Solucin
1
2
3
4
6
= 2 Q=
; Q
15
43
76
11
5
15
86
228
44
30
15
172
684
176
180
La media ser:
La varianza ser:
< <
Q
2
6@
=
? 2 Q?
> >
; Q
1
; =
403
= 2,686 extracciones
150
1227
2,686 2 = 0,965 extracciones2
150
B =+
Que mide Dispersin en trminos absolutos, viene expresada en las mismas unidades
que la variable
Para comprobar si este promedio es representativo
Variacin
calcularemos el Coeficiente de
Que es una medida de Dispersin relativa. Indica que a mayor valor implica mayor
Dispersin y por tanto menor Homogeneidad y menor representatividad de la media.
La distribucin ser homognea cuando el coeficiente de variacin sea menor de 1
&9
0,9825
= 0,3658
2,686
146
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 .-Se desea analizar la relacin entre la madurez de la persona (medida por un test
porcentual) y la edad de un grupo de 120 jvenes discapacitados psquicos, despus de tres
aos de funcionamiento de un centro de salud mental, con un programa especfico.
En la tabla siguiente se recogen los datos de las dos variables:
Xi : = edad actual de los jvenes
Yj : = grado de madurez alcanzado.
Y
X
15
20
25
(2-6)
(6-8)
(8-14)
5
8
15
6
12
6
6
0
6
(1418)
4
9
3
(1824)
0
4
12
(2430)
6
12
6
147
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 105.- Realizada una encuesta entre fumadores se obtuvieron los resultados, de la tabla,
sobre las variables:
X: N de cigarrillos fumados diariamente Y: Horas de sueo diarias
X
Y
4-6
6-7
7-8
8-9
total
2 -6
6 - 12
12 - 14 14 - 20 20 - 30 total
0
4
18
28
50
2
10
24
26
62
8
16
14
10
48
26
20
12
4
62
36
26
14
2
78
72
76
82
70
300
Solucin
,QWHUYDORV
4-6
6-7
6,5
7-8
7,5
8-9
8,5
5
2
26+ 36 =28,87
6
10
5
2
20+ 26 =21,86
6
10
5
2
12+ 14 =12,80
6
10
5
2
4+ 2 =3,73
6 10
67,26
28,87
50,73
63,53
67,26
67,26
= 22,42%
300
2).- Obtener el nmero mnimo de cigarrillos diarios que fuma uno de los
fumadores del 30% que ms fuma.
Percentil 70
70
300 = 210 ,QWHUYDOR(14 20)
100
70
100
70
70
1 1F
300 160
1
100
100
= /F 1 +
& F = 60 +
6 = 18,84FLJDUULOORV
QF
62
148
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Menos de 6 horas de
sueo
Entre 6 y 8 horas de
sueo
Ms de 8 horas de
sueo
Menos de 15
cigarrillos
14,33
Ms de 15
cigarrillos
57,67
72
91,33
66,67
158
64,67
5,33
70
170,33
129,67
149
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 .- Tomamos el nmero de pulsaciones por minuto de 15 pacientes que acuden a una
consulta y obtenemos los siguientes datos: 68 - 100 - 94 - 86 - 72 - 70 - 84 - 85 - 69 - 73 - 65 78 - 83 - 86 - 75. Hallar las Medidas de tendencia central y de dispersin.
Solucin
;
G G
Q
; Q
H 2 QH
1
65
68
69
70
72
73
75
78
83
84
85
86
94
100
1
1
1
1
1
1
1
1
1
1
1
2
1
1
65
68
69
70
72
73
75
78
83
84
85
172
94
100
4225
4624
4761
4900
5184
5329
5625
6084
6889
7056
7225
14792
8836
10000
1
2
3
4
5
6
7
8
9
10
11
13
14
15
;
La media ser:
;
1
1188
= 79 , 2
15
pulsaciones por
minuto
1
La mediana
K2 =
;
1
J 2 QJ
; =
95530
79,2 2 = 96,026 pulsaciones2
15
M =+
150
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
&9
9,799
= 0,12373
79,2
151
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 .- A lo largo de los doce meses del ao, en un servicio de ciruga se realizan las
siguientes apendicectomas 8 - 12 - 7 - 1 - 20 - 6 - 8 - 16 - 9 - 3 - 4 - 5
Hallar: Medidas de tendencia central, cuartiles, Medidas de dispersin
Solucin
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
8
12
7
1
20
6
8
16
9
3
4
5
99
R = 99
Tiempo
99
=
= 8,25
12
(ordenada)
1
3
4
5
6
7
8
9
12
16
20
99
2
S = 1145
U2
1
1
1
1
1
1
2
1
1
1
1
1
2
3
4
5
6
8
9
10
11
12
= 12
2
; =
1145
8.25 2 = 27,354
12
W =
27,354 = 5,25
&9
5,25
= 0,634
8,25
12
=6
2
2
La mediana ser el valor de la variable, media aritmtica de los que ocupan el lugar
7+8
6 y el lugar 7, es decir, la mediana ser:
= 7,5
2
0
0
152
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
caracterstica %
Caracterstica A
SI
NO
57
32
82
91
139
123
SI
NO
89
173
262
1.- porcentaje de personas que presentan una sola de las dos caractersticas
2.- porcentaje de personas que no tienen ninguna caracterstica
3.- porcentaje de personas que teniendo la caracterstica A no tienen la caracterstica B
4.- porcentaje de personas que tienen ambas caractersticas
5.- porcentaje de personas que teniendo la caracterstica B tienen tambin la caracterstica
A
6.- porcentaje de personas que presentan alguna caracterstica
Solucin
1.2.3.4.-
82 + 32
100 = 43,51%
262
91
100 = 34,73%
262
82
100 = 58,99%
139
57
100 = 21,75%
262
5.6.-
153
57
100 = 64,04%
89
57 + 32 + 82
100 = 65,26
262
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
1-yYHQHV
1,55-1,60
18
1,60-1,70
31
1,70-1,80
24
1,80-1,90
20
1,90-2,00
17
1.- Se consideran "altos" aquellos cuya altura est sobre el percentil 82. Cul es su altura mnima?
2.- En qu percentil estar un joven de altura 1,78?
Solucin
$OWXUD
1
1
-yYHQHV
1,55-1,60
1,60-1,70
1,70-1,80
1,80-1,90
1,90-2,00
18
31
24
20
17
18
49
73
93
110
1.-
Se considera altos aquellos cuya altura est sobre el percentil 82, es decir (100-82)=18,
el 18% de los ms altos, son aquellos que se consideran altos, y su altura mnima ser el
percentil 82.
Habr que hallar el percentil 82, ya qu
82
(110) = 90,2 El percentil 82, ser aquel valor de la variable que ocupe el lugar
100
inmediatamente siguiente a 90,2 y est en el intervalo (1,80 1,90). Aplicando la
formula del percentil:
U
= /\ 1 + 100
]
100
1 \ 1
&
82
100
82
110 73
= 1,80 + 100
(0,10) = 1,886
20
]
100
= /\ 1 + 100
1 \ 1
1
Q
&
154
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
(T _ /^ 1 )Q ^
100
=
+ 1 ^ 1 *
=
+ 49
= 62
0,10
110
&^
1
Por tanto
62
100
= 1,78 metros
El 62% de los reclutas miden menos de 1,78 metros luego (100 62) = 38, el 38%
restante medirn ms de 1,78 metros.
155
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1.-Se desea analizar la relacin entre la madurez de la persona (medida por un test
porcentual) y la edad de un grupo de 120 jvenes discapacitados psquicos, despus de tres
aos de funcionamiento de un centro de salud mental, con un programa especfico. En la
tabla siguiente se recogen los datos de las dos variables:
xi := edad actual de los jvenes
y j := grado de madurez alcanzado.
Y
X
15
20
25
(2-6)
5
8
15
(6-8)
6
12
6
(8-14)
6
0
6
(14-18)
4
9
3
(18-24)
0
4
12
Solucin
156
(24-30)
6
12
6
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
Hb %
9-10
N de pacientes
2
10-11
8
11-12
12
12-13
17
13-14
14
14-15
4
15-16
3
( /` 1 /` )
Hb. gr.
9-10
10-11
11-12
12-13
13-14
14-15
15-16
Marca de clase
;
9.5
10.5
11.5
12.5
13.5
14.5
15.5
2
8
12
17
14
4
3
2
10
22
39
53
57
60
c c
; Q
19
84
138
212,5
189
58
46,5
d 2 Qd
180,50
882
1587
2656,25
2551,50
841
720,75
;
e e
; Q
747
12,45 Hb.gr.
60
g = /f 1 +
F
Qf
+1
F
f +1
f +1
f +1
Qf
1
F
f 1
F
12 +
14
1 = 12,53+E.JU.
14 + 12
1
1
1 1h
60 22
1
2
2
0 i = /h
& h = 12 +
1 = 12,47 +E.JU.
1 +
Qh
17
157
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
60 = 15 El 1 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 15, y est en el intervalo (11-12)
1
4
1
1
1 1j
60 10
1
4
4
= /j 1 +
& j = 11 +
1 = 11,416 +E.JU.
Qj
12
2
60 = 30 El 2 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 30, y est en el intervalo (12-13)
2
4
2
2
1 1k
60 22
1
4
= /k 1 + 4
& k = 12 +
1 = 12,47 +E.JU.
Qk
17
3
60 = 45 El 3 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 45, y est en el intervalo (13-14)
3
4
3
3
1 1l
60 39
1
4
4
= /l 1 +
& l = 13 +
1 = 13,428 +E.JU.
Ql
14
De este modo:
El 25% de los pacientes tienen un contenido de Hb. menor de 11,416gr.
El 50% de los pacientes tienen un contenido de Hb. menor de 12,53 gr.
El 75% de los ingresados tienen un contenido de Hb. menor de 13,428 gr.
0HGLGDVGHGLVSHUVLyQ
Varianza: 6 n 2
m 2 Qm
Desviacin tpica: 6 o =
;
9419
12,45 2 = 1,98 Hb.gr.2
60
1,4
= 0,1124
12,45
158
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
;L<M
50-80
80-110
110-150
150-220
220-300
300-500
15
20
4
0
0
0
5
30
26
6
0
0
0
10
34
13
3
0
0
0
16
7
3
0
0
0
0
4
2
2
Sabiendo que:
Xi =salario mensual de 200 empleados de un hospital (miles de pesetas)
Yj = valor de los automviles de los 200 empleados del hospital (millones pesetas) Hallar:
1.- Distribuciones marginales de ambas variables. Cul es ms homognea? y por qu
2.- Por encima de que salario se sita el 70% de los empleados mejor pagados?
3.- De entre los empleados que poseen coche valorado entre 1,3 y 1,9 millones qu
porcentaje representan aquellos que cobran un sueldo inferior a 130.000?
4.- Qu porcentaje de la masa salarial total corresponde al 60% de los empleados que
ms cobran? Y al 30% que menos cobran?
5.- Podemos asegurar que empleados que cobran mayores salarios poseen automviles
ms caros
6.- Estimar, utilizando una funcin lineal, el valor del automvil de un nuevo empleado
que cobra 600.000 Fiabilidad de la estimacin
Solucin
159
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
El consumo y la renta mensual de 100 familias expresadas en 104 pesetas, son los
siguientes: C = Consumo Y = Renta.
1
C/Y
30
40
50
15 25 35 45
10 15 -- -5 20 25 --- 15 5
5
160
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
( /q 1 /q )
Marca de clase
;
9-9,5
9,5-10
10-10,5
10,5-11
11-11,5
11,5-12
12-12,5
12,5-13
13-13,5
9,25
9,75
10,25
10,75
11,25
11,75
12,25
12,75
13,25
1
3
8
16
13
11
5
2
1
t t
; Q
1
4
12
28
41
52
57
59
60
u 2 Qu
9,25
29,25
82
172
146,25
129,25
61,25
25,50
13,25
85,56
285,18
840,50
1849
1645,31
1518,68
750,31
325,12
175,56
v v
; Q
668
11,13gr.
1
60
Moda Mo = Valor de la variable que ms veces se repite, estar en el
intervalo que presente mayor densidad de frecuencia, frecuencia por unidad de
intervalo, este caso al ser todos los intervalos de igual amplitud, estar en el de
mayor frecuencia, es decir, en el intervalo (10,5-11), que se repite 16 veces, y
dentro de el cualquier valor , aplicando la formula ser:
Media
Es el promedio ms utilizado
Q
0
x = /w 1 +
F
Q
F
w +1
w +1
w +1
w +1
Q
F
w 1
w 1
F
10,5 +
13
(0,5) = 10,81JU.
13 + 8
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
2
2
60 28
1 1y
1
4
4
0 z = /y
& y = 11 +
(0,5) = 11,077 JU.
1 +
13
Qy
1
60 = 15 El 1 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 15, y est en el intervalo (10,5-11)
1
4
1
1
1 1{
60 12
1
4
= /{ 1 + 4
& { = 10,5 +
(0,5) = 10,6 JU.
Q{
16
2
60 = 30 El 2 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 30, y est en el intervalo (11-11,5) el 2 cuartil es la
Mediana.
2
4
2
2
1 1|
60 28
1
4
4
= /| 1 +
& | = 11 +
* 0,5 = 11,077 JU.
Q|
13
3
60 = 45 El 3 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 45, y est en el intervalo (11,5-12)
3
4
3
3
1 1}
60 41
1
4
= /} 1 + 4
& } = 11,5 +
(0,5) = 11,68 JU.
Q}
11
De este modo: el 25% de los pacientes tienen un contenido de Urea. menor de10,6
gr..
162
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
176
174
172
170
168
166
164
162
160
158
158
160
162
164
166
168
170
172
Varianza: 6 2
~ 2 Q~
Desviacin tpica: 6 =
;
2 =
7475,25
11,13 2 = 0,5875 JU 2 .
60
0,766
= 0,0688
11,13
163
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1.- Medimos las alturas de un grupo de 11 padres y sus respectivos hijos y obtenemos los
siguientes resultados:
<
= D + E;
<
160
158
Lineal
158
160
162
164
166
168
170
172
164
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
;<
0
1
0
0
1
1
2
3
1
1
2
1
4
0
2
2
1
3
3
4
0
2
1
0
0
165
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
71
71
37.2 36.8
73 73
74
37.3 37.5 38
Solucin
166
75
76
37.4 38
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
4
10
167
5
3
6
3
7
10
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
9$/25(6
Vlidos
14
15
16
19
21
22
23
24
25
26
27
28
29
32
34
36
38
43
45
Total
Frecuencia Porcentaje
2
3,6
2
3,6
2
3,6
2
3,6
4
7,1
3
5,4
5
8,9
4
7,1
1
1,8
6
10,7
2
3,6
1
1,8
3
5,4
5
8,9
2
3,6
2
3,6
5
8,9
2
3,6
3
5,4
56
100,0
Porcentaje
vlido
3,6
3,6
3,6
3,6
7,1
5,4
8,9
7,1
1,8
10,7
3,6
1,8
5,4
8,9
3,6
3,6
8,9
3,6
5,4
100,0
(VWDGtVWLFRV
VALORES
N
Vlidos
Perdidos
56
0
27,68
26,00
26
Media
Mediana
Moda
168
Porcentaje
acumulado
3,6
7,1
10,7
14,3
21,4
26,8
35,7
42,9
44,6
55,4
58,9
60,7
66,1
75,0
78,6
82,1
91,1
94,6
100,0
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
(VWDGtVWLFRV
VALORES
N
Vlidos
Perdidos
Desv. tp.
Varianza
Coeficiente variacin
56
0
8,315
69,131
0,3009
$*583$'26(1,17(59$/26'($03/,78'
LQWHUYDORV
Q
1
; Q
2 Q
; Q
1566
= 27,96
1
56
Moda Mo = Valor de la variable que ms veces se repite, estar en el
intervalo que presente mayor densidad de frecuencia, frecuencia por unidad de
intervalo, este caso al ser todos los intervalos de igual amplitud, estar en el de
mayor frecuencia, es decir, en el intervalo (23 25), que se repite 9 veces, y
dentro de el cualquier valor , aplicando la formula ser:
Media
Es el promedio ms utilizado
Q
0
= / 1 +
F
Q
+1
F
+1
+1
+1
Q
1
F
F
23 +
7
(2) = 24
7+7
169
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
1
1 1
56 24
1
2
2
0 = /
+
& = 25 +
(2) = 26,14
1
Q
7
1
56 = 14
4
El 1 cuartil ser el valor de la variable que ocupe el lugar inmediatamente siguiente
al 14, y est en el intervalo (21 23)
1
4
1
1
1 1
56 8
1
4
& = 21 +
(2) = 22,71
= / 1 + 4
Q
7
El 2 cuartil es la mediana
2
4
= T 1 = 0 = 26,14
2
3
56 = 42 El 3 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 42, y est en medio de los intervalos (31- 33) y (33
35), as que uniremos ambos y formaremos un nico intervalo de (31 - 35) en el
que se encontrar el 3 percentil, y aplicando la formula tendremos:
3
4
3
3
1 1
56 37
1
4
& = 31 +
(4) = 33,857.
= / 1 + 4
Q
5+2
0HGLGDVGHGLVSHUVLyQ
Varianza: 6 2
2 Q
Desviacin tpica: 6 =
;
2 =
47380
27,96 2 = 64
56
64 = 8
8
= 0,286
27,96
Como vemos no hay demasiadas diferencias entre los resultados obtenidos con los
valores sin agrupar y con los valores agrupados en intervalos, en el segundo caso
perdemos informacin y ganamos rapidez.
170
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
Q
1
3
4
6
10
; Q
2 Q
5
12
20
8
5
5
36
80
48
50
5
108
320
288
500
1
5
17
37
45
50
;
; Q
1
219
4,38
50
0HGLGDVGHGLVSHUVLyQ
2 Q
1221
4,38 2 = 5,2356 medida de dispersin
1
50
absoluta, viene expresada en unidades al cuadrado
9DULDQ]D 6
;
2,288
= 0,522 medida de dispersin relativa.
4,38
;
Se considera aceptable si esta entre 0 y 1. Mide el grado de homogeneidad de la
distribucin. Y tambin el grado de representatividad de la media.
: &9 =
&RHILFLHQWHGHYDULDFLyQ
171
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
PULSO
TEMPERATURA
74
35.5
70
37
68 77 75 66 69 75 76
37 35.8 36.3 37.8 38.7 37.7 38.4
172
69
39
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
Edades..........(18 - 26)..... (26 - 36) ...(36 - 50) .... (50 - 60) .... (60 - 70)
N Empleados .... 7............... 13 ............ 20 ...............15............... 5
1.- Hallar La media aritmtica de las edades.
2.- Analizar la asimetra.
Solucin
173
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
;
Q
10
TOTALES
12
20
50
17
37
45
50
36
80
48
50
219
2 Q
108
320
288
500
1221
; Q
;
; Q
1
219
4,38
50
&9
2 Q
2 =
( )=
;
;
1221
(4,38) 2 = 5,2356
50
5,2356 = 2,228
2,228
= 0,522
4,38
Dispersin relativa
174
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
13
14
16
21
ni
15
14
20
18
15
;
Q
13
14
16
21
Totales
15
14
20
18
15
82
15
29
49
67
82
90
182
280
288
315
1155
2 Q
540
2366
3920
4608
6615
18049
; Q
;
; Q
1
&9
2 Q
2 =
( )=
;
1155
14,085
82
;
18049
(14,085) 2 = 21,71
82
21,71 = 4,66
4,66
= 0,33
14,085
Dispersin relativa
3
4
1
4
= 13
175
3
4
= 16
3
3
82 = 61,5
1 =
4
4
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
Dada la distribucin
Xi
450
367
965
ni
23
69
47
1.- Calcular La media, la mediana y la moda.
2.- Hallar El percentil 67
3.- Explicar el Significado de los resultados obtenidos.
146
78
349
95
Solucin
;
Q
146
349
367
450
965
Totales
78
95
69
23
47
312
78
173
242
265
312
11.388
33.155
25.323
10.350
45.355
2 Q
; Q
; Q
2 Q
125.571
125.571
402,47
312
;
70.952.359
(402,47) 2 = 65.429,3
312
Medidas de dispersin
absolutas
&9
=
2
( )=
;
65.429,3 = 255,79
=
255,79
= 0,635
402,47
Dispersin relativa
3
4
67
100
1
4
3
4
3
3
312 = 234 valor de
1 =
4
4
= 367
146 + 349
= 247,5
2
67
100
= 367
67
67
1 =
312 = 209,04
100
100
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
210
70
120
65
360
58
149
52
225
69
177
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
1 /
Q
215
320
225
105
178
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 Un anlisis de la relacin entre el consumo de tabaco y el nmero de personas con cncer
de pulmn se resume en la siguiente recta de regresin estimada:
<
;
en dondeU
Siendo ; el n de aos durante los cuales una persona ha fumado, e < el porcentaje de
cancergenos habidos en cada grupo de personas segn sus aos de fumador.
1.- Explquese el significado de los resultados -2 y 1,2 en la recta de regresin.
2.- Cul es la expectativa respecto a la tasa de cancergenos para personas que han fumado 30
aos?
3.- Si U hubiese sido = 1 Podramos decir que el tabaco fue la nica causa del cncer de pulmn?
Solucin
179
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1 Supongamos que el Coeficiente de variacin de una distribucin es 0,2 y su media es 30.
Hllese la desviacin tpica de la distribucin.
Solucin
180
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1
10
50
20
45
30
38
40
32
181
50
29
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1.-La distribucin de las acciones de una determinada sociedad, entre sus accionistas,
segn la edad de estos, viene expresada por intervalos en la tabla siguiente:
Edad X
N Acciones
Y
0-20
20-28
28-32
32-48
menos
de 18
2
8
9
1
20
10
32
50
8
100
182
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
N 132.- De una poblacin de 100 personas, se ha observado que 30 de ellas estn en paro.
Los padres de 11 de estas 30 tampoco tienen empleo. Estdiese si el paro es una situacin
que se reproduce dentro de las familias, teniendo en cuenta que de las 100 personas
observadas 40 tienen padres en desempleo.
Solucin
183
'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$
1.- Se han estudiado las calificaciones de 100 alumnos en dos asignaturas: Economa
(xi) y Estadstica (yj) obtenindose los siguientes datos:
;
= 110
<
= 2,5
= 10
= 0,5
Adems se sabe que el coeficiente de correlacin lineal entre ambas variables es 0,85.
Obtener razonadamente, demostrando brevemente el porqu de sus respuestas, y
explicando el significado de los resultados:
1.- Qu nota se puede esperar de un alumno que ha obtenido 125 puntos en Economa, en
la asignatura de Estadstica? Bondad de la estimacin.
2.- Se puede decir que aquellos alumnos que obtienen mayor calificacin en Economa,
sean los mismos que obtienen mayor calificacin en Estadstica
3.- Un alumno que obtiene 120 puntos en Economa y 3,5 en Estadstica En cul obtuvo
mejor calificacin relativa?
Solucin
184