Académique Documents
Professionnel Documents
Culture Documents
14/08/2017
Consultores en Estadstica e Informtica Grupo COESI
Ing. Luis Fernndez Vizcarra
Estadstica
Contenido
Captulo I: Estadstica Descriptiva ........................................................................................................... 2
1. Captacin y elaboracin de datos ................................................................................................... 2
1.1. Introduccin ............................................................................................................................ 2
1.2. Definicin de algunos trminos estadsticos ........................................................................... 2
1.3. Variable ................................................................................................................................... 3
1.4. Captacin de datos .................................................................................................................. 4
1.5. La elaboracin de datos .......................................................................................................... 5
Ejercicios ................................................................................................................................................ 20
Captulo II: Medidas de tendencia central y dispersin ........................................................................ 23
2. Introduccin .................................................................................................................................. 23
2.1. Medidas de tendencia central ............................................................................................... 24
2.1.1. Medidas de tendencia central para datos no agrupados .................................................. 24
2.1.2. Medidas de tendencia central para datos agrupados ....................................................... 27
2.2. Los cuartiles ........................................................................................................................... 30
2.2.1. Cuartiles (Q) ....................................................................................................................... 30
2.2.2. Deciles (D).......................................................................................................................... 30
2.2.3. Percentiles (P).................................................................................................................... 31
2.3. Medidas de dispersin .......................................................................................................... 32
2.3.1. Amplitud total (A) .............................................................................................................. 33
2.3.2. Varianza V(X) y Desviacin estndar ................................................................................ 33
2.3.3. Coeficiente de variacin .................................................................................................... 36
Ejercicios ................................................................................................................................................ 37
Captulo III: Correlacin lineal ............................................................................................................... 39
3. Introduccin .................................................................................................................................. 39
3.1. Cuanficacin de la fuerza de la relacin lineal ...................................................................... 39
3.2. Contraste de hiptesis para determinar si el coeficiente de correlacin muestral es
significativo ....................................................................................................................................... 41
Ejercicios ................................................................................................................................................ 45
Pgina 1
Estadstica
1.1. Introduccin
Pgina 2
Estadstica
1.3. Variable
Las variables son caractersticas de las personas u objetos que pueden tomar
diferentes valores. Ejemplo: peso, edad, sexo, nmero de hijos por hogar, etc.
Pgina 3
Estadstica
B. Variables cuantitativas
Variable cuantitativa continua: Toman valores que pueden ser cualquier nmero
real, es decir, entre dos valores distintos siempre encontraremos infinitos valores,
resultan por lo general de un proceso de medicin. Por ejemplo: peso, talla, vida
til de focos de cierta marca, etc.
Que los datos ya hayan sido obtenidos de las unidades de observacin y que
estn publicados o registrados en alguna parte reciben el nombre DATOS
SECUNDARIOS se recogen de historias clnicas, registros de hechos vitales,
anuarios estadsticos, censos de poblacin y vivienda, etc.
Pgina 4
Estadstica
Una vez que se ha captado y recopilado la informacin de cada uno de los elementos
del conjunto en estudio, esta tiene que ser revisada, clasificada, representada y
resumida para permitir su anlisis e interpretacin y a este conjunto de actividades
se le denomina elaboracin de datos.
A. Revisin de datos
B. Clasificacin de datos
Pgina 5
Estadstica
Ejemplo N 1
Paciente Ciudad Edad Sexo Paciente Ciudad Edad Sexo
1 A 30 H 16 B 46 M
2 A 43 H 17 A 69 H
3 B 58 M 18 A 44 H
4 C 61 H 19 C 59 M
5 A 70 H 20 D 62 H
6 D 42 M 21 D 66 H
7 C 58 M 22 C 71 H
8 A 39 H 23 A 70 M
9 B 60 M 24 C 65 H
10 B 55 H 25 D 39 H
11 C 57 H 26 A 40 M
12 A 49 H 27 A 61 M
13 A 61 M 28 B 65 H
14 D 69 H 29 B 56 H
15 D 43 H 30 C 38 H
Ciudad N Sexo N
A Hombre (H)
B Mujer (M)
C Total
D
Total
Pgina 6
Estadstica
Tabla N 1
Ciudad N %
A 11 36.7
B 6 20.0
C 7 23.3
D 6 20.0
Total 30 100.0
Tabla N 2
Sexo N %
Mujer 10 33.3
Hombre 20 66.7
Total 30 100.0
Sin embargo, los pacientes pueden ser clasificados segn dos caractersticas
cualitativas. Por ejemplo, la clasificacin de los pacientes segn sexo y por
ciudad de residencia, los resultados se presenta en la Tabla N 3.
Tabla N 3
Sexo Ciudad Total
A B C D
Mujer 4 3 2 1 10
Hombre 7 3 5 5 20
Total 11 6 7 6 30
En este caso, las categoras o clases que se establecen son de acuerdo a los
valores posibles que toma la variable. Por ejemplo: clasificar a las familias de
una comunidad segn el nmero de hijos por familia.
Pgina 7
Estadstica
2, 1, 4, 5, 2, 0, 1, 3, 5, 5, 0, 1, 3, 2, 5, 3, 2, 4, 1, 2, 3, 5, 0, 2, 3
Xi (N de hijos/familia) fi
0 3
1 4
2 6
3 5
4 2
5 5
Total 25
Donde:
fi : frecuencia absoluta de un valor Xi, es el nmero de veces que aparece
repetido dicho valor en un conjunto de observaciones realizadas.
= ( ) + 1
Considerando los datos de la edad dado en el anterior ejemplo tenemos
que:
= (71 30) + 1 = 42
Nota: si = 71.4 y = 30.2, se tiene que la amplitud ser:
= (71.4 30.2) + 0.1 = 41.3
Esto significa que si los valores mximo y mnimo estn expresados hasta
decimas se incrementara un dcimo (0.1), si los valores estn expresados
en centsimos, se agregara un centsimo (0.01) y as sucesivamente.
Pgina 8
Estadstica
30-36
37-43
44-50
51-57
58-64
65-71
Hay que cuidar que en la primera y ltima clase deben estar el Vminy Vmax
respectivamente. A estos lmites tambin se les llaman lmites nominales.
Pgina 9
Estadstica
Tabla N 4
fi: Frecuencia absoluta del i-esimo intervalo (o valor xi), nos indica el
nmero de veces que aparece repetido dicho intervalo (o valor) en el
conjunto de observaciones estudiadas.
0 fi n y
f1 + f2+ + fm = n,
Donde:
F1 = f 1
F2 = f1 + f2
.
.
.
Fm = f1 + f2+ fm
hi% = fi / n *100
Se tiene que 0 hi 1 0 hi * % 100%
Hi% = Fi / n *100
Se tiene que 0 Hi 1 0 Hi * % 100%
Pgina 10
Estadstica
Tabla N 5
SEXO
EDAD (aos) TOTAL
HOMBRE MUJER
30 - 36 1 0 1
37 - 43 5 2 7
44 - 50 2 1 3
51 - 57 3 0 3
58 - 64 2 6 8
65 - 71 7 1 8
TOTAL 20 10 30
C. Presentacin de datos
La presentacin de los datos se hace fundamentalmente utilizando dos mtodos:
el mtodo tabular y el mtodo grfico.
a) Mtodo tabular
Consiste en una presentacin resumida usando tablas o cuadros. Si se
utilizan los cuadros o tablas debe prestarse atencin a los cuatro elementos
que los constituyen: el ttulo, la matriz, el cuerpo y las notas aclaratorias.
Un buen ttulodebe hacer nfasis en el contenido del cuadro, por tal
motivo debe contestar a la siguientes preguntas:
Qu contiene el cuadro?,
Cmo se presenta este contenido?,
De dnde se presenta? y
Cundo se presenta?.
Pgina 11
Estadstica
Cuadro N 1
Pacientes con cncer pulmonar segn lugar de residencia,
Hospital Unanue del Departamento de Tacna, 2014
CIUDAD N %
A 11 36,7
B 6 20,0
C 7 23,3
D 6 20,0
Total 30 100,0
Fuente: Archivo del Departamento de Estadstica delHospital Unanue del
Departamento de Tacna, 2014.
Cuadro N 2
Pacientes con cncer pulmonar segn lugar de residencia y por sexo
Hospital Hiplito Unanue del Departamento de Tacna, 2014
CIUDAD
SEXO A B C D Total
HOMBRE 7 3 5 5 20
MUJER 4 3 2 1 10
Total 11 6 7 6 30
Fuente: Archivo del Departamento de Estadstica delHospital Hiplito Unanue del Departamento
de Tacna, 2014.
Pgina 12
Estadstica
b) Mtodo grfico
Pgina 13
Estadstica
Pgina 14
Estadstica
Grfico N 1
Pacientes con cncer pulmonar, segn lugar de residencia
Hospital Unanue del Departamento de Tacna, 2014
Fuente: Archivo del Departamento de Estadstica del Hospital Hiplito Unanue del
Departamento de Tacna, 2014.
Grfico N 2
Pacientes con cncer pulmonar segn lugar de residencia y por sexo
Hospital Hiplito Unanue del Departamento de Tacna, 2014
Fuente: Archivo del Departamento de Estadstica del Hospital Hiplito Unanue del
Departamento de Tacna, 2014.
Pgina 15
Estadstica
Cuadro N 4
Porcentaje de pacientes con cncer pulmonar segn lugar de residencia
y por sexo, Hospital Hiplito Unanue del Departamento de Tacna, 2014
CIUDAD
SEXO TOTAL
A (%) B (%) C (%) D (%)
HOMBRE 63,6% 50,0% 71,4% 83,3% 66,7%
MUJER 36,4% 50,0% 28,6% 16,7% 33,3%
Total 100,0% 100,0% 100,0% 100,0% 100,0%
Fuente: Archivo del Departamento de Estadstica del Hospital Hiplito Unanue del Departamento de
Tacna, 2014.
Grfico N 3
Porcentaje de pacientes con cncer pulmonar segn lugar de residencia
y por sexo, Hospital Hiplito Unanue del Departamento de Tacna, 2014
Fuente: Archivo del Departamento de Estadstica del Hospital Hiplito Unanue del
Departamento de Tacna, 2014.
Pgina 16
Estadstica
Grfico N 4
Pacientes con cncer pulmonar segn lugar de residencia,
Hospital Hiplito Unanue del Departamento de Tacna, 2014
Fuente: Archivo del Departamento de Estadstica del Hospital Hiplito Unanue del
Departamento de Tacna, 2014.
Pgina 17
Estadstica
Grfico N 5
Pacientes con cncer pulmonar segn edad, Hospital Hiplito
Unanue del Departamento de Tacna, 2014
fi
10
9
8
Nmero de pacientes
7
6
5
4
3
2
1
x
29.5 36.5 43.5 50.5 57.5 64.5 71.5
EDAD (a os)
Fuente: Archivo del Departamento de Estadstica del Hospital Hiplito Unanue del
Departamento de Tacna, 2014.
Grfico N 6
Pacientes con cncer pulmonar segn edad, Hospital Hiplito
Unanue del Departamento de Tacna, 2014
fi
10
9
8
Nmero de pacientes
7
6
5
4
3
2
1
x
29.5 36.5 43.5 50.5 57.5 64.5 71.5
EDAD (a os)
Fuente: Archivo del Departamento de Estadstica del Hospital Hiplito Unanue del
Departamento de Tacna, 2014.
Pgina 18
Estadstica
Grfico N 7
(Histograma y polgono de frecuencias relativas acumuladas en porcentajes)
Pacientes con cncer pulmonar segn edad, Hospital Hiplito
Unanue del Departamento de Tacna, 2014
Hi %
100
OJIVA
90
80
70
60
50
40
30
20
10
x
29.5 36.5 43.5 50.5 57.5 64.5 71.5
EDAD (a os)
Fuente: Archivo del Departamento de Estadstica del Hospital Hiplito Unanue del
Departamento de Tacna, 2014.
Pgina 19
Estadstica
Ejercicios
a) Poblacin: _______________________________
b) Muestra: _________________________________
c) Variable: _________________________________
Pgina 20
Estadstica
Donde:
N= Normal EN+ = Enano nutricional de 1er. Grado
O= Obeso EN++= Enano nutricional de 2do. Grado
Elabore adecuadamente el cuadro respectivo y el grfico correspondiente con los
resultados, Qu comentario tiene ante esta informacin?
Pgina 21
Estadstica
Pgina 22
Estadstica
2. Introduccin
Un valor que refleje la tendencia de los datos puede darse mediante las medidas de
posicin o tendencia central. Para cuantificar la variabilidad de los datos con respecto a
un valor central se utilizara las medidas de dispersin o variabilidad.
Segn el grfico, observamos en esta distribucin, que los datos tienden a concentrarse
alrededor de un valor central, que puede ser:
Pgina 23
Estadstica
Sin embargo, tambin se puede visualizar una variabilidad o dispersin de los datos con
respectos al valor central y para cuantificar esta variabilidad se utiliza una medida de
dispersin y puede ser:
Las medidas de tendencia central permiten hallar un solo valor numrico e indican
el centro de un conjunto de datos. Debido a estas circunstancias, suelen ser
llamados de posicin o tendencia central.
a. Media aritmtica
1, 2 , ,
=
Simblicamente lo podemos representar como:
=1
=
Ejemplo: las edades de 6 pre-escolares son:
: 4, 1, 3, 5, 2, 3
4 + 1 + 3 + 5 + 2 + 3 18
= = =3
6 6
Pgina 24
Estadstica
( ) = 0
=1
b. Mediana
= (+1)/2
Donde ( + 1)/2 es la posicin de la mediana.
Pgina 25
Estadstica
/2 + (/2+1)
=
2
Esto quiere decir que el valor de la mediana se encuentra entre los
valores cuya posicin son: /2 y/2 + 1
Ejemplo
c. La moda
Ejemplo
2 1
3 1
4 2
5 3
6 1
Total 8
Pgina 26
Estadstica
a. Media aritmtica
1 1 + 2 2 + +
=
1 + 2 + +
Dnde:
=1
=
=1
Ejemplo
Edad
(aos)
5-9 3 7 21
10-14 9 12 108
15-19 15 17 255
20-24 8 22 176
25-29 5 27 135
Total 40 695
695
= = 17.375
40
Pgina 27
Estadstica
b. Mediana
(/2 1 )
= +
Donde:
/2 : Posicin de la Me
Variable
5 - 9 3 3
10-14 9 12
15-19 15 27
20-24 8 35
25-29 5 40
Total 40
Pgina 28
Estadstica
Procedimiento:
= 14.5, 1 = 12, = 5, = 15
(20 12)
= 14.5 + 5
15
= 17.17
c. Moda
Variable
15-19 15 27
14.5 + 19.5
= 17
2
Luego la moda es 17
Pgina 29
Estadstica
Son aquellos que dividen a la distribucin en cuatro, diez o cien partes iguales.
(4 1 )
1 = + C
1
2 =
(34 1 )
3 = + C
3
Dnde:
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
Q2
Me
Pgina 30
Estadstica
Las formulas son tambin similares a las del Q1, Q3. As:
(10 1 )
1 = + C
1
5 =
(710 1 )
7 = + C
7
Dnde:
1% 1% 1% 1% 1% 1% 1%
P1 P2 P3 P4 P5 P6 P99
(10100 1 )
10 = + C
10
(60100 1 )
60 = + C
60
Dnde:
Pgina 31
Estadstica
Ejemplo
Variable fi Fi
55 - 58 20 20
59 62 30 50
63 66 80 130
67 - 70 70 200
71 74 40 240
75 - 78 10 250
Total 250
Procedimiento:
(187.5 130)
3 = 66.5 + 4
70
Por consiguiente, se tiene que el 75 % de los valores estn por debajo de
69.8 puntos y el 25 % de los valores estn por encima de 69.8
Todos los valores representativos discutidos en las secciones precedentes han sido
una especie de promedio o medida de posicin. Sin embargo, el uso de un solo
valor para describir una distribucin oculta muchos hechos importantes.
Por ejemplo, dos grupos separados de datos pueden contener la misma media, pero
un grupo puede estar ms disperso o esparcido alrededor del valor promedio que el
otro.
Pgina 32
Estadstica
A = Vmax - Vmin
Adems, sobre una base intuitiva, la amplitud solo utiliza las dos
observaciones extremas desestimando toda la informacin relacionada con
la variacin que puede obtenerse a partir de las restantes observaciones.
Ejemplo
A =179 - 139 = 40
Dado un conjunto de N datos X1, X2, ... , XN con una media aritmtica.
Pgina 33
Estadstica
=1
= , la varianza de estos datos se define como:
2
=1( )
() =
Ejemplo
4, 7, 8, 3, 5, 9, 10, 2
Solucin
4 + 7 + 8 + 3 + 5 + 9 + 10 + 2
=
8
48
= =6
8
Ahora encontraremos la varianza de acuerdo a la definicin
(4 6)2 + (7 6)2 + (8 6)2 + (3 6)2 + (5 6)2 + (9 6)2 + (10 6)2 (2 6)2
() =
8
60
() = = 7.5
8
2
=1( )2
=
1
A pesar que la varianza cuantifica correctamente la variabilidad de las
observaciones de los datos con respecto a la media, sin embargo hay
dificultades en su interpretacin porque sus unidades estn expresadas al
Pgina 34
Estadstica
= ()
Ejemplo
Supngase que se tiene la estancia en das de 6 pacientes que fueron
admitidos en un hospital.
3, 4, 7, 2, 6, 5
Se pide calcular la desviacin estndar
Solucin
Primeramente necesitamos calcular:
3+4+7+2+6+5
=
6
27
= = 4.5
6
Ahora encontraremos la varianza de acuerdo a la definicin
17.5
() = = 2.917
6
= 2.917
Propiedades de la varianza
1. El valor de la V (X) es mayor o igual que cero cualquiera sea su
distribucin.
Pgina 35
Estadstica
Pgina 36
Estadstica
Ejercicios
1. Se realiz un estudio sobre la edad de las mujeres que utilizan anticonceptivos. Los
resultados fueron:
TIPO 1: 3, 4, 5, 6,9
TIPO 2: 1, 4, 5, 6, 7
a) Calcular la media aritmtica y la desviacin estndar para cada tipo de vacuna.
b) Explique las eventuales diferencias.
3. La siguiente tabla muestra la distribucin del nmero de leucocitos en sangre de los
pacientes de un hospital, para una cierta enfermedad.
Nmero de leucocitos fi
(en miles)
5.0 5.9 8
6.0 6.9 15
7.0 7.9 33
8.0 8.9 41
9.0 9.9 28
10.0 10.9 19
11.0 11.9 6
Total 150
Pgina 37
Estadstica
4. Un investigador tiene los siguientes datos sobre los niveles de cido rico en el suero
de 50 varones sanos.
Calificacin fi
30 39 5
40 49 10
50 59 18
60 69 26
70 79 15
80 89 7
90 99 4
Total 85
Pgina 38
Estadstica
3. Introduccin
n xy( x)( y)
r=
n( x2 )( x)2 n( 2 )( )2
-1 r 1
Pgina 39
Estadstica
Pgina 40
Estadstica
Ho: = 0
H1: 0
n2
t 0 = r 1r2
Pgina 41
Estadstica
Ejemplo 1:
Tabla 1
ESTATURA (cm.) X 150 155 180 160 170 165 185 175 160 165
PESO
Y 55 50 85 65 75 60 80 70 65 60
(kg.)
Solucin
n = 10 x = 1,665 y = 665
xy = 111,700 x2 = 278,325 y2 = 45,325
xy = 1107,225 (x)2 = 2772,225 (y)2 = 442,225
nxy = 1117,000 nx2 = 2783,250 ny2 = 453,250
Pgina 42
Estadstica
r = 0.88662131519 r 2 = 0.786097356549245
r 0.89 r 2 0.79
Grfico N 8
Dispersin de los datos
Pgina 43
Estadstica
n2
t = r 1r2 Le corresponde la distribucin t de student con n 2 grados de
libertad (t(n.2)), si H0 es verdadera.
n2
tc = r
1 r2
10 2
t c = 0,89
1 (0,89)2
8
t c = 0,89
0,2079
Pgina 44
Estadstica
Ejercicios
1. Una compaa farmacutica conduce un estudio piloto para evaluar la relacin entre
tres dosis de un nuevo agente hipntico y tiempo de sueo. Los resultados de este
estudio son presentados de la siguiente manera:
2. El administrador d un hospital reuni los siguientes datos respecto del costo por
comida de una comida estndar a diferentes volmenes de preparacin. Los
resultados son presentados de la siguiente manera:
Pgina 45
Estadstica
Se pide que:
a) Identifique la variable independiente y dependiente.
b) Elabore un diagrama de dispersin de puntos. Qu tipo de relacin se da entre
las dos variables?
c) Determine e interprete el coeficiente de correlacin.
d) Realice el contraste de la hiptesis.
Sujeto Hb GR
(mg/100 ml) (millones/mm3)
1 15.2 5.1
2 16.4 5.4
3 14.2 4.5
4 13.0 4.2
5 14.5 4.3
6 16.1 6.1
7 15.2 5.2
8 14.8 4.3
9 15.8 4.7
10 14.9 4.8
11 15.6 4.6
12 14.7 4.8
Pgina 46
Estadstica
Pgina 47