Académique Documents
Professionnel Documents
Culture Documents
20
15
10
0
11 12 14 16 17 19
1.1 Introduccin
La dinmica del mundo moderno, exige que todo ciudadano, para ejercer sus
derechos y comprender su entorno, requiera de una alfabetizacin en estadstica.
Le parece a usted que podramos definir a la estadstica como la ciencia que nos
proporciona los elementos de juicio necesarios para llegar a tomar decisiones
adecuadas?, si est de acuerdo reflexione sobre las razones que le llevan a estarlo;
si no lo est tambin reflexione sobre la definicin adecuada y regrese al texto para
constatarlo.
Ford reporta que en 2011 sus ventas fueron de $146900 millones (de dlares),
arriba en un 7,2%; sus ganancias fueron de $4400 millones, con ascenso en un
7,0%, y el efectivo neto circulante fue de S/.7200 millones.
Los egresados de postgrado de la Universidad, contaron con un sueldo promedio
inicial de $400 dlares y un 70% de ellos consiguieron trabajo a los tres meses de
la graduacin.
Para los futbolistas que gustan de jugar en campos deportivos, el alquiler de los
campos promediaban S/.500 nuevos soles por semana.
La segunda razn para tomar el curso de Estadstica es que las tcnicas estads-
ticas se utilizan para tomar decisiones que afectan nuestra vida diaria. Esto quiere
decir que afectan a nuestro bienestar personal. He aqu algunos ejemplos:
Las compaas de seguros utilizan anlisis estadsticos para establecer las tarifas
de los seguros de casa, automvil, vida y salud. Existen tablas que resumen la
probabilidad de que una mujer de 25 aos de edad viva el ao siguiente, los si-
guientes cinco aos, etc. Las primas del seguro de vida se pueden establecer
basndose en estas probabilidades.
La Agencia de Proteccin al Medio Ambiente est interesada en la calidad del
agua en el Lago Ene. Peridicamente toman muestras de agua para establecer el
nivel de contaminacin y mantener el nivel de calidad.
Los investigadores mdicos estudian las tasas de cura de enfermedades, basn-
dose en el uso de diferentes medicamentos y distintas formas de tratamiento. Por
ejemplo, cul es el efecto de tratar cierto tipo de dao a la rodilla con ciruga o
con terapia fsica? Si se toma una aspirina diaria, se reducir el riesgo de sufrir un
ataque cardiaco?
Figura N 01
Muestreo
Inferencia
Figura N 02
b) Variables Cuantitativas.
Edad nmero de hijos por familia, ingresos, viviendas por centro poblado, niveles
de, desempleo, produccin, utilidades por empresas, etc.,
Hijos por familia nmero de accidentes por da, trabajadores por empresa;
poblacin por distritos, habitaciones por vivienda. etc.
Operaciones Admisibles
Ya que en una escala nominal la clasificacin puede estar igualmente bien
representada por cualquier conjunto de smbolos, se dice que la escala nominal
es "nica hasta una transformacin de uno a uno". Los smbolos que designan las
variadas subclases en la escala pueden ser intercambiados si esto se hace de
manera cabal y consistentemente. Por ejemplo:
Cuando se emiten nuevas placas para automviles, el cdigo que previamente
perteneca a una ciudad puede ser intercambiado con el de otra ciudad. La
escala nominal podra preservarse si este cambio se ejecutara cabal y
consistentemente en la emisin de todas las placas.
Ya que los smbolos que designan los variados grupos de una escala nominal
pueden ser intercambiados sin alterar la informacin esencial en la escala, el
nico tipo de estadsticos descriptivos admisibles son aquellos que pueden ser
Operaciones Admisibles
Ya que cualquier transformacin que preserve el orden no cambia la informacin
contenida en la escala ordinal, se dice que la escala es "nica hasta una trans-
formacin monotnica". Una transformacin monotnica es aquella que preserva
el orden de los objetos. Esto es, no importa qu nmeros demos a un par de
clases o a los miembros de esas clases, siempre que les sea asignado un nmero
mayor a los miembros de la clase que es "mayor que" o "ms preferida".
(Naturalmente, se pueden usar nmeros menores para las clases "ms
preferidas". As nos referimos generalmente a una ejecucin excelente como
"primera clase", y a ejecuciones progresivamente inferiores como "segunda clase"
y "tercera clase". Siempre que seamos consistentes, no importa si se usan
nmeros mayores o menores para denotar "mayor que" o "ms preferido".) Por
ejemplo:
En el ejrcito un cabo usa dos bandas en su manga y un sargento usa tres.
Estas insignias denotan que el sargento > el cabo, y el smbolo > denota "mayor
rango que". Esta relacin podra ser igualmente bien expresada si el cabo usara
cuatro bandas y el sargento siete.
c) La escala de Intervalo
Cuando una escala tiene todas las caractersticas de una escala ordinal y cuando
adems tienen sentido las distancias o diferencias entre cualesquiera dos
nmeros de la escala, se ha logrado una medicin considerablemente ms fuerte
que la ordinal. En tal caso, la medicin ha sido lograda en el sentido de una
escala de intervalo. Esto es, si nuestro mapeo de varias clases de objetos es tan
preciso que conocemos cun grandes son los intervalos (distancias) entre todos
los objetos de la escala, y estos intervalos tienen significado sustantivo, entonces
hemos logrado una medida de intervalo. Una escala de intervalo est
caracterizada por una unidad comn y constante de medida que asigna un
nmero a todos los pares de objetos en el orden establecido. En esta clase de
medicin, la razn de cualesquiera dos intervalos es independiente de la unidad
de medida y del punto cero. En la escala de intervalo, el punto cero y la unidad de
medida son arbitrarios. Por ejemplo
Medimos la temperatura en una escala de intervalo. De hecho, comnmente se
usan dos diferentes escalas: Celsius y Fahrenheit. Al medir la temperatura, la
unidad de medida y el punto cero son arbitrarios; son diferentes en ambas
escalas. Sin embargo, las dos escalas contienen la misma cantidad y la misma
clase de informacin. Esto es as debido a que estn linealmente relacionadas.
Celsius 18 0 10 30 100
Fahrenheit 0 32 50 86 212
Ntese que la razn de las diferencias entre las lecturas de temperatura en una
escala, es igual a la razn entre las diferencias equivalentes en la otra escala. Por
ejemplo,
En la escala Celsius la razn de las diferencias entre 30 y 10, y 10 y 0 es (30
10) / (10 0) = 2. Para las lecturas comparables en la escala Fahrenheit, la
razn es (86 50) / (50 32) = 2. En ambos casos las razones son las
mismas; a saber, 2. En otras palabras, en una escala de intervalo, la razn de
cualesquiera dos intervalos es independiente de la unidad usada y del punto
cero, siendo ambos arbitrarios.
Propiedades Formales
Axiomticamente, se puede mostrar que las operaciones y relaciones que dan
origen a la estructura de una escala de intervalo son tales que las diferencias en
la escala son isomrficas a la estructura de la aritmtica. Los nmeros pueden ser
asociados con las posiciones de los objetos en una escala de intervalo tal que las
operaciones de la aritmtica pueden ser significativamente ejecutadas con las
diferencias entre los nmeros.
Al construir una escala de intervalo no slo se deben especificar equivalencias,
como en la escala nominal, y relaciones "mayor que", como en la escala ordinal,
sino tambin se debe ser capaz de especificar la razn entre dos intervalos
cualesquiera.
Ntese que en este caso, la diferencia entre los atributos de los dos objetos es
proporcional a la diferencia entre las asignaciones de clasificacin:
(, ) () = [ ( ) ( )]
Cualquier cambio en los nmeros asociados con las posiciones de los objetos
medidos en una escala de intervalo debe preservar no slo el orden de los
objetos, sino tambin las diferencias relativas entre los objetos. Esto es, la escala
de intervalo es "nica hasta una transformacin lineal". As, como hemos
sealado, la informacin proporcionada por la escala no es afectada si cada
nmero se multiplica por una constante positiva y despus se le suma a este
producto una constante, esto es, () = + . (En el ejemplo de la
temperatura, c = 9/5 y b = 32.)
Ya hemos notado que en una escala de intervalo el punto cero es arbitrario. Esto
es inherente al hecho de que la escala est sujeta a transformaciones que
consisten en agregar una constante a los nmeros que constituyen la escala.
d) La escala de razn
Cuando una escala tiene todas las caractersticas de una escala de intervalo y,
adems, tiene un punto cero verdadero en su origen, se llama escala de razn.
En una escala de razn, la razn de cualesquiera dos puntos es independiente de
la unidad de medida. Por ejemplo
Medimos la masa o el peso en una escala de razn. La escala de onzas y libras
tiene un punto cero verdadero, al igual que la escala de gramos. La razn entre
Propiedades Formales
Las operaciones y relaciones que dan origen a los valores numricos en una
escala de razn son tales que la escala es isomrfica a la estructura de la
aritmtica. Por tanto, las operaciones de la aritmtica son permisibles con los
valores numricos asignados a los objetos, as como a los intervalos entre los
nmeros, como en el caso de la escala de intervalo.
Los nmeros asociados con los valores de la escala de razn son nmeros "ver-
daderos" con un cero verdadero: slo la unidad de medida es arbitraria. As, la es-
cala de razn es nica hasta la multiplicacin por una constante positiva. Esto es,
las razones entre cualesquiera dos nmeros se preservan cuando los valores de
la escala son todos multiplicados por una constante positiva y, adems, tal
transformacin no altera la informacin contenida en la escala.
Cualquier prueba estadstica paramtrica puede usarse cuando se han logrado
medidas de razn y se encuentran las suposiciones adicionales concernientes a
la distribucin. Ms an, existen algunos estadsticos que se aplican slo a datos
que descansan en una escala de razn; debido a la fuerza de las suposiciones
que sub- yacen a la escala, la mayora de estas pruebas son pararntricas.
ESCALAS DE MEDICIN
Ejemplos Gnero Estado Civil Instruccin Intensidad Temperatura Hora del da Peso. Hijos
b) Variables Independientes
Son las variables explicativas o predicativas, cuya asociacin, relacin o
influencia en la variable dependiente se pretende escribir en la investigacin. Las
variables independientes son los que traducen o explican las causas o razones
de las variaciones en la variable dependiente. Simplificando, en la relacin de
variables, las causas o antecedentes seran las variables independientes (VI) y la
causa o consecuente es la variable dependiente (VD). Ejemplos: En el caso ms
simple, para la relacin d dos variables.
El presupuesto familiar (VD) depende de los ingresos (VI).
El volumen de ventas (VD) se explica por la inversin en propaganda (V).
El nmero de hijos por familia (VD) tiene relacin con el nivel educativo de los
padres (VI).
c) Variables Intervinientes o interferentes
Son aquellas que coparticipan con la variable independiente condicionando el
comportamiento de la variable dependiente. En el caso de la relacin entre
presupuesto familiar (VD) y los ingresos (VI), algunas variables intervinientes
serian la conducta de consumo, la edad de los miembros de la familia, etc.
Ejemplo 2:
a) Nombre : Ingresos
b) Definicin Son los recursos monetarios netos incluyendo todas las
Bonificaciones que percibe una persona por su ocupacin principal y secundaria
durante el perodo de referencia de la encuesta.
c) Categoras : Puede proponerse en forma de niveles o simplemente intervalos.
Niveles de ingreso: alto, medio, bajo
Intervalos: Por ejemplo 8 intervalos
Menos de 4000; 4001 l 8000; 8001 a 12000; 1 2001 a 1 6000; 16001 a 20000:
20001 a 25000; 25001 a 30000; 30001 y ms soles.
d) Categorizacin: Cul fue su ingreso total en el ltimo mes?
e) Indicadores : Ingreso promedio.
Dispersin de los ingresos. etc.
Ventajas
Los cuadros permiten presentar en forma resumida y ordenada muchos datos
Es un instrumento que clasifica, resume y comunica informacin estadstica
Facilita el anlisis de los datos
Su fcil comprensin, permite que sea utilizado por muchas personas
Todo cuadro estadstico debe explicarse por s mismo, sin necesidad de texto o
figuras anexas, y debe ser sencillo y claro
D. Partes Principales de un Cuadro Estadstico
En general, un cuadro estadstico completo, tal como el Cuadro N 01, por ejemplo,
puede tener ocho partes:
1. QUE
2. DONDE Donde Como Cuando
3. COMO
4. CUANDO Descripcin de las filas y 7 Expresa en qu unidades
columnas del cuadro (Distribucin porcentual) estn las variables
estadstico
3 PEA de N i v e l d e Educacin
15 aos
Ramas de Actividad y ms Sin Sup. No Superior
Primaria Secundaria No Especificado
Nivel* Univer. Univer.
5) NOTA DE PIE O LLAMADAS, se usa para aclarar algunos trminos o siglas, y tambin para indicar qu
elementos estn o no incluidos en algunos de los conceptos del cuadro.
6) FUENTE, es la indicacin al pie el cuadro, que sirve para nombrar la publicacin, entidad, estudio o fuente
de donde se obtuvieron los datos utilizados para construir el cuadro. La identificacin de la fuente permite,
si fuera el caso, comprobar la informacin o para obtener informacin complementaria.
Hay dos tipos de fuentes: i) primaria, cuando se obtiene directamente de la unidad de anlisis o cuando se
recurre a los propios formularios de una encuesta: ii) secundaria, cuando se recurre a documentos
boletines o cuadros estadsticos publicados.
7) Nota Unida de Medida se escribe debajo del ttulo, se usa cuando se abrevia la escritura
8) ELABORACIN, es una indicacin que se coloca debajo de la fuente, y sirve para mencionar el
responsable, que utilizando datos originales o de la fuente elabor el cuadro estadstico final: indica la
responsabilidad de la publicacin del cuadro. A veces resulta til indicar la fecha de elaboracin.
QUE : Poblacin Total Econmicamente Activa De 15 Aos Y Ms
DONDE : Del Departamento Cajamarca
COMO : Por Nivel Educativo Segn Ramas de Actividad
CUANDO : Censo de Poblacin 2009.
Nmero de Porcentaje de
Nmero de
Leucocitos Pacientes
Pacientes (ni )
(miles)1/ ( hi % )
5.0 - 5.9 3 5.5
6.0 - 6.9 10 18.2
7.0 - 7.9 11 20.0
8.0 - 8.9 13 23.6
9.0 - 9.9 10 18.2
10.0 - 11.0 8 14.5
Total a/ 55 100.0
- Nota de pie. a/. Muestra aleatoria sistemtica.
1/. Datos expresados en miles.
- Fuente. H.R.C
E. Caractersticas:
F. Tipos de cuadros.
En su forma ms general los cuadros pueden dividirse en simples y
compuestas.
a) Cuadros Simples. Clasifican un fenmeno segn una nica variable. Ejemplo
CUADRO 05
REACCIN A LA VACUNACIN CONTRA EL SARAMPIN Y LA RUBOLA EN UNA
MUESTRA DE 288 NIOS DE CAJAMARCA -1994.
T O T A L 196 92 288
CUADRO 07
TRABAJADORES NO TRABAJADORES T O T A L
EDAD Hombr Mujere Hombr Mujere Hombr Mujer
Total Total Total
es s es s es es
15 19
20 24
25 29
.
.
.
50 54
55 59
60 +
TOTAL
Nota: Con este tipo de cuadros podemos extraer datos de las personas que padecen
Tuberculosis en un determinado intervalo de edad (A), tambin del total de
personas que no trabajan y han contrado la TBC (B), y del total de mujeres, ya
sean trabajadoras o no, que tienen tuberculosis (C).
ni
hi Frecuencia absoluta o Repeticiones
n
Nmero de Observaciones
CUADRO N 7.8
NUMERO DE NACIMIENTOS EN EL DEPARTAMENTO DE LAMBAYEQUE,
POR PROVINCIAS 2004
Nmero de
Provincias Porcentaje de Nacimientos
Nacimientos
Lambayeque n1 = 325 n
h1 1
325x100 34,43
n 944
Chiclayo n2 =330
n
h2 2
330x100 35,96
n 944
Ferreafe n3 = 289
n
h3 3
289x100 30,61
n 944
Total n = 944 100,00
Guardera
14.3%
8 8
8
6
Conteo
4
4
0
Parking amplio Oferta permanente Tarjeta de crdito Guardera Aire acondicionado
Razn de visita
Salida de Minitab
Grfica de Nmero de hijos
12
12
11
10
8
Conteo
6
5
4
4
3
0
2 3 1 4 0
Nmero de hijos
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 509 462 380 518 480 625 507 645 382
m = 7 intervalos
()
c) Regla de Stockes = +1
(2)
370 420
420 470
470 520
520 570
570 620
620 670
n i ,= N)
Marca Frecuencias
Intervalos Frecuencia Frecuencias Frecuencias Relativas
de Absolutas
de clases Absolutas Relativas Acumuladas
clase Acumuladas
<Li-1 Li] xi ni Ni hi Hi
n1 N1
<L 1 L 2 ] x1 n1 N1=n1 h1= H1=
N N
n N
<L2, L3] x2 n2 N2 = n1+n2 h2= 2
H2= 2
N N
n N
<L3, L4] x3 n3 N3 =n1+n2+n3 h3= 3
H3= 3
N N
. . . . . .
. . . . . .
. . . . . .
nk Nk
<Lk-1, L k] xk nK Nk = n1+...+nK=n hk = Hk = =1.00
N N
Total n ni =n hi =1
=1+3.322*LOG(CONTAR(A2:A61))
Para redondear a un entero superior se utiliza la siguiente funcin
=MULTIPLO.SUPERIOR(D7,1)
I1 I2 I3 I4 I5 I6 I7
observacin porque es intervalo abierto (321 1 = 320), para el lmite superior al valor
obtenido en el lmite inferior se suma la amplitud (se fija la amplitud con F4)=E16+$E$9
=E17+$E$9
Figura:
. . .
. . .
. . .
Lk-1, L k> nK Nk = n1+...+nK=n
Total n ni =n
Figura N
24: Cuentas de variables individuales
20
Porcentaje
15
10
0
30 45 60 75 90 105 120 135
Gasto semanal
Amplitud del
intervalo
Observacin
Observacin
Mnima
Mxima
25
20
Porcentaje
15
10
0
30.0 48.4 66.8 85.2 103.6 122.0 140.4
Gasto semanal
2. Histogramas Se construye con cada punto medio o marca de clase (Xi) de cada
63 Dr. Miguel Angel Macetas Hernndez
Estadstica General 2016
intervalo se levanta un segmento de altura igual a la respectiva Frecuencias
Absolutas (ni hi).
25
20
Frec. Rela
15
10
25
20
Frec. Rela
15
10
0
20 40 60 80 100 120 140 160
Marca de clase
Pas 6.- Doble Click en eje de Gasto mensual donde se presenta la ventana Editar escala
100
80
Porcentaje acumulado
60
40
20
0
30 45 60 75 90 105 120 135
Gasto semanal
100
80
Porcentaje acumulado
60
40
20
0
30.0 48.4 66.8 85.2 103.6 122.0 140.4
Gasto semanal
Las frecuencias (ni, hi, Ni, Hi) siempre son cantidades no negativas ( 0), por lo tanto el
grafico de las frecuencias sean para variables discretas como para variables
Abscisas continuas, se construye en el primer cuadrante del plano cartesiano o rectangular. En
eje de las abscisas (horizontal) se indican los valores de la variable (sean puntos o
intervalos), y en el eje de las ordenadas (vertical) se anota el valor de la respectiva
frecuencia.
8
Frecuenc Frecuen
1
5 Opinin ia cia
1 de los absoluta Relativa
1 1
2 Clientes ni hi %
0 0 A 6 12,5
G 10 20,8
6
5 O 18 37,5
P 2 4,2
2 V 12 25,0
0 Total 48 100,0
A G O P V
Opinin de los Clientes
40
(Li-1 L i as
Xi das 35
] ni
Ni
Acumuladas
30
16 27 21,5 3 3 25
27 38 32,5 5 8 20
38 49 43,5 10 18 15
49 60 54,5 3 21 10
60 71 65,5 8 29 5
71 82 76,5 7 36 0
82 93 87,5 4 40 0 20 40 60 80 100
Total 40
Marca de Clase
Frecuencia Absoluta
12
En el caso de Grficos de 14
12 10
Barras, en el eje horizontal
10
representa los valores de Yi, y 8
6
en el eje vertical se presentan 6
los valores de las frecuencias 4 2
ni
Intervalo Frecuen
s de cia
10 Absoluta
clases
Frecuencia Absolutas
s
8 (Li-1 L i ]
ni
16 27 3
6
27 38 5
4 38 49 10
49 60 3
2
60 71 8
0 71 82 7
0 16 27 38 49 60 71 82 93 82 93 4
Lmite inferior
Total 40
Otro grfico que se usa para representar las frecuencias es el Polgono de Frecuencias,
que se construye como sigue: en cada punto medio o marca de clase (Xi) de cada intervalo
se levanta un segmento de altura igual a la respectiva frecuencias Absolutas (ni hi), luego
une los extremos con una lnea poligonal, resultando el Polgono de Frecuencias. Para
completar los extremos, se extiende el polgono en media amplitud de cada extremo.
Frecuencia Absoluta
s
(Li-1 L i ] Xi
ni 8
10.5 0
6
16 27 21,5 3
27 38 32,5 5 4
38 49 43,5 10
2
49 60 54,5 3
60 71 65,5 8 0
71 82 76,5 7 0 10.5 21.5 32.5 43.5 54.5 65.5 76.5 87.5 98.5
98.5 0
Total 40
Por su parte, las frecuencias acumuladas (Absolutas o Relativas) se grafican mediante los
Polgonos Acumulativos de Frecuencias (Ojiva). De igual manera, en el eje horizontal
se ubican los extremos los intervalos y en el eje vertical lo valores de N i, Hi. En el extremo
superior de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencia
absoluta, luego partiendo del extremo inferior del primer intervalo se une, con segmentos
de recta, los extremo de los segmentos verticales, obteniendo una lnea poligonal que, a
partir de la ltima frecuencia acumulativa, se extiende paralelamente al eje horizontal,
obtenindose la grfica del Polgono Acumulativo de Frecuencias
Frecuencia
Frecuenci
Marca s Absolutas
Intervalos a 45
de clase Acumulada
de clases Absolutas
s 40
<Li-1 Li]
Xi
ni 35
Ni
Frecuencias Absolutas
30
16 27 21,5 3 3
Acumuladas
25
27 38 32,5 5 8
20
38 49 43,5 10 18
15
49 60 54,5 3 21
60 71 65,5 8 29 10
71 82 76,5 7 36 5
82 93 87,5 4 40 0
Total 40 0 16 27 38 49 60 71 82 93
Intervalo
Grfico N 3.3: Diagrama de dispersin
Aos Demanda de cobre en China de Clase
Demanda de cobre refinado en China
1990 505 (miles de toneladas mtricas)
2000
1991 600 1800
1992 850 1600
Demanda de cobre en China
(variable dependiente = Y)
1000
1995 1125
800
1996 1240 600
1997 1260 400
1999 1550 0
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2000 1660
Aos (variable independiente = X)
2001 1750
2002 1840
2003 1900
0
1 2 3 4
D
T
I
S O BARRAS SIMPLES BARRAS AGRUPAS
30
C
D
25
20 8
R 15
10
7
A 5
5
E 0
1 2 3 4
4
T S 1
0
1 2 3 4
A
SECTOR CIRCULAR BARRAS
S
100
90
COMPUESTAS
80
70
60
50
40
30
20
10
0
1 2 3 4
I 40
HISTOGRAMA 32
CORRELACIN
N 30
T 30
28
C E 20
26
R 24
O V 10
22
20
N A 0
18
T O
I
O
N
POLGONO DE
U R
A FRECUENCIAS LINEAL
A Z
60
60
50 50
S O 40 40
N 30 30
20 20
10 10
0 0
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9
6. Tambin puedes transformar los datos de los distintos grupos de edades en porcentaje
respecto a la poblacin total. En una nueva columna divide el valor del grupo de edad entre
el total de la poblacin.
Creacin del Grfico
1. Selecciona todos los datos -excepto el ttulo y la fila Total- haciendo clic con el ratn y
arrastrando a lo largo de los datos de la tabla (A3:C22).
2. Haz clic en el botn Asistente para grficos.
Paso 1. Elige Tipo de grfico: Barras, y selecciona el subtipo Barra agrupada.
Pulsa el botn Siguiente.
Pas 2. Vers la pirmide. Deja los datos como estn y pulsa Siguiente.
Pas 3. Escribe el ttulo de tu grfico (p.e., Per 2001). Deja los otros cuadros en
blanco, y pulsa el botn Siguiente.
Pas 4. Selecciona el botn En una hoja nueva (llama a esta hoja como desees) y
pulsa el botn Finalizar.
3. Ya tienes tu pirmide. Es hora de mejorar su apariencia:
Arreglar las barras. Haz doble clic en una de las barras del grfico. En el cuadro de
dilogo Formato de la serie de datos, selecciona la pestaa Opciones. Configura
79 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
Superposicin a 100 y pulsa Ancho del rango a 0 y pulsa el botn OK. No
cambies nada ms. Las barras del grfico deben aparecer juntas, sin agujeros.
Arreglar el eje vertical (desplazar las etiquetas de edades hacia la izquierda). Haz
doble click en los datos del eje vertical. En el cuadro de dilogo Formato de ejes,
elige la pestaa Tramas y configura los botones de marca de graduacin a Ninguno
y el botn de rtulos a Inferior.
Arreglar el eje horizontal (eliminar los valores negativos del eje hombres). Haz
doble clic sobre los datos del eje horizontal. En la pestaa Nmero selecciona
Categora: Personalizada y escribe en Tipo: 0;0.
Aplica cualquier otro formato para mejorar la apariencia de la pirmide: colores de
las barras, tamao y tipo de fuentes y ttulos, eliminacin de rejilla y fondo...
Mujeres Hombres
80- +
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4
8.0000 6.0000 4.0000 2.0000 0.0000 2.0000 4.0000 6.0000 8.0000
2. Segn Nielsen Media Research, los cinco programas de TV ms vistos a las 8:00 P.M.
del 14 de octubre de 2012 fueron Congo, The X-Files, Holliday in Your Heart, Ellen
Foster y Unhappily Ever After. La lista siguiente es una encuesta entre 50
espectadores.
Unhappily Ellen Congo X-Files Congo Ellen Ellen X-Files
Administracin 55
Contabilidad 51
Finanzas 28
Nmero de
Material de los muros Proporciones Porcentajes
viviendas
R P P P P R C S L R P C L C
P P R P 2 3 P H L P 1 C P P
P P S 1 L R R 1 2 H S 3 H
7:00 8:30 9:00 8:00 7:30 7:30 8:30 8:30 7:30 7:00
8:30 8:30 8:00 8:00 7:30 8:30 7:00 9:00 8:30 8:00
7. .Durante los primeros 11 meses de 1997, los coches Honda Accord, Chevy Cavalier,
Toyota Camry, Honda Civic y Ford Taurus fueron los coches nuevos ms vendidos
en USA. Se presentan los datos de 50 compras de automvil en Cleveland, Ohio.
8. Cada una de las 500 empresas Fortune se clasifica como perteneciente a uno de
varios giros industriales. A continuacin vemos una muestra de 20 empresas con
su correspondiente ramo industrial.
10. Cuando se les pidi clasificar la destreza que se requiere para obtener una alta
calificacin en un nuevo juego de computadoras como principiante, aprendiz,
competidor, maestro o experto, 44 evaluadores respondieron de la manera siguiente:
experto, maestro, maestro, competidor, experto, maestro, maestro, maestro,
experto, aprendiz, maestro, maestro, maestro, maestro, experto, maestro,
competidor, maestro, maestro, principiante, experto, competidor, maestro, maestro,
experto, experto, maestro, maestro, maestro, competidor, competidor, experto,
maestro, experto, experto, experto, competidor, maestro, maestro, experto,
competidor, maestro, maestro y experto. Construye una tabla que indique las
frecuencias correspondientes a estas clasificaciones de destreza que se
requiere para obtener una alta calificacin.
En este tema te presentamos las medidas de resumen para variables cualitativas que
se utilizan con mayor frecuencia en los estudios que realizas en el nivel primario de
atencin de salud.
Supongamos que de los 600 recin nacidos (RN) de un hospital en cierto perodo, 300
presentaron los ojos oscuros (OO), en tanto que slo 100 los tenan claros (OC).
Aplicando la expresin general, la razn OO/OC es
a RN con OO 300
R= = = =
b RN con OC 100
Pero, qu significa este resultado? Expresa que hay tres recin nacidos con ojos
oscuros por cada recin nacido de ojos claros en ese hospital y en ese perodo.
Tasas
Siempre que necesites medir el riesgo de que acontezca cierto fenmeno en una
poblacin determinada, dispones de un indicador valioso y nico: las tasas
Esta es una medida que expresa el riesgo de ocurrencia del evento estudiado en el
numerador en la poblacin involucrada, en el tiempo y lugar establecidos.
Las tasas que ms importancia revisten para nuestro desempeo en el campo de la
Salud son las siguientes:
Una particularidad realmente til de las tasas es que puedes calcularlas tanto para la
totalidad de la poblacin, como para parte de ella (por ejemplo, para el grupo de edad
de cinco a nueve aos, para los estudiantes, para los residentes del rea rural, y as
por el estilo); por otra parte, puedes calcular las tasas para todas las causas, o
solamente para una de ellas (o un grupo de ellas). De este modo, tendrs calculadas
tasas brutas, crudas, generales o globales si se tratara de tasas que involucren a toda
la poblacin o al total de causas; al tiempo que habrs calculado tasas especficas si
incluan a una parte de la poblacin o a una causa o grupo de ellas.
Tambin haz de saber que las poblaciones estn sometidas a constantes cambios en
lo que a su nmero atae, determinados por los nacimientos y defunciones y por
los movimientos migratorios (emigracin e inmigracin), que provocan que no sea la
misma a lo largo de todo el ao. De ah que, por convenio, se tome la poblacin
existente a mediados del perodo 11 o poblacin media para el clculo de las tasas.
Por otra parte, debes tener especial cuidado al calcular tasas para poblaciones
pequeas, como la que usualmente manejan los Consultorios, pues suelen volverse
inestables, ya que cualquier evento mueve mucho la tasa, y a veces no guarda
relacin el resultado obtenido con la magnitud del evento acontecido.
Ahora nos tropezamos con una contrariedad: la poblacin expuesta al riesgo es muy
difcil de definir, ya que tener un hijo no involucra a toda la parte femenina de la
poblacin, y va ms all, pues otros factores de ndole psicosocial actan en tal
decisin. Por estas razones, vers que se han buscado soluciones alternativas a esta
situacin.
Bien, ya tienes el nmero calculado. Pero, es suficiente con eso? Claro que no,
necesitas saber qu significa, a fin de manejarlo apropiadamente. En primer lugar,
debes informar el resultado de la siguiente forma: La tasa bruta de natalidad de Per
en 2008 fue de 14 nacidos vivos por cada 1000 habitantes, ello significa que durante
2008 en Cajamarca nacieron como promedio 14 nios por cada 1 000 habitantes.
Interpretacin: En Per, durante 2008, nacieron como promedio 49 nios por cada
1000 mujeres en edad frtil (15 a 49 aos).
19476
1549 = 1000 56.3
345942
Interpretacin: Durante 2008 en Per nacieron como promedio 56 nios por cada
1000 mujeres de 15 a 49 aos de edad.
Tasas de mortalidad
Entrando en la materia que nos ocupa, te decimos a continuacin las tasas que
podrs calcular.
92 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
Esta tasa expresa el riesgo que tienen todos los habitantes de cierta poblacin, en un
momento dado, de morir por cualquier causa.
= 1000
En 2008, en nuestro pas esta tasa fue:
77558
= 1000 7.0
11122308
Esto significa que en 2008, en Per fallecieron como promedio 7 personas por cada
1000 habitantes.
= 1000
En Per, durante 2008 la tasa de mortalidad por enfermedades del corazn fue:
21467
. = 1000 193.
11122308
= 1000
La TMM fue de 47.7 por 100 000 NV en 2008 para nuestro pas. Esto quiere decir que
por cada 100 000 nacidos vivos, murieron en promedio 48 mujeres por causas
directamente relacionadas con el embarazo, parto y puerperio durante 2008 en Per.
Tasas de morbilidad
La morbilidad, entendida como el patrn de enfermedades que sufren los habitantes
de alguna regin, puede ser estudiada numricamente mediante las tasas de
morbilidad. Ellas son la tasa de incidencia, la tasa de prevalencia y la tasa de
letalidad.
La tasa de incidencia (TI) mide el riesgo que tiene una persona que habita en un lugar
y tiempo determinados, de contraer o adquirir cierta enfermedad, visto esto en funcin
del tiempo. Por su lado, la tasa de prevalencia (TP) mide el riesgo de tener la
enfermedad, o sea, de estar enfermo; y la tasa de letalidad (TL) expresa la gravedad
de la enfermedad.
Comparacin de tasas
En ocasiones, pretendemos comparar los riesgos de morir, de enfermar, etc. entre
distintas poblaciones o entre distintas categoras o clases de una variable. Para ello,
lo ms conveniente es utilizar la tipificacin, bien por el mtodo directo o por el
indirecto; tcnicas que no se expondrn en este curso, pues se abordarn en cursos
posteriores. Esta tcnica solo sirve para comparar, sus resultados no miden en modo
alguno el riesgo de ocurrencia de los eventos estudiados en la poblacin
Resumen
En este tema estudiaste que:
MEDIDAS RESUMEN VARIABLES CUALITATIVAS 41
1. Las medidas de resumen para datos cualitativos ms frecuentemente utilizadas
son las razones, las proporciones y las tasas.
2. Cada uno de esos indicadores tiene diferente interpretacin. As, los ms
refinados son las tasas, pues expresan el riesgo de ocurrencia del evento
consignado en su numerador.
3. Debes tener cuidado al calcular las tasas para poblaciones pequeas, por
ejemplo, en el Consultorio Mdico de la Familia, porque suelen ser inestables.
4. Las tasas pueden dividirse en generales y especficas.
5. En el mbito sanitario, las tasas ms usadas son las de natalidad, mortalidad y
morbilidad.
1. La Media Aritmtica
Es la medida de tendencia central con la cual probablemente est usted ms
familiarizado es la media aritmtica; se conoce tambin como media o promedio; se
representa como x y se conoce como "x barra"; la frmula para calcularla es:
1.1. Para Datos Sin Agrupar
media x
x i
29 31 24 29 30 25 168
media x 28 das
6 6
Entonces, el promedio del perodo de incubacin del brote es 28 das
Frecuencia absoluta
media x
xini Total de Observaciones
n
Frecuenci
Intervalos Marca de
a
de clases clase xi ni
Absolutas
(Li-1 Li] xi ni
16 27 21,5 3 64,5
27 38 32,5 5 162,5
38 49 43,5 10 435
49 60 54,5 3 163,5
60 71 65,5 8 524
71 82 76,5 7 535,5
82 93 87,5 4 350
Total 40 2235
2. La Mediana (Me)
Otra medida de tendencia central es la mediana; como se ver es especialmente til
cuando los datos estn sesgados.
Ejemplo Al tener los siguientes datos de presin arterial sistlicas: 110, 120, 122, 130,
180 Mm. de Hg.
En este ejemplo, hay dos observaciones mayores y dos menores que 122, luego
entonces, la mediana es 122 Mm. de Hg., el valor de la 3 observacin. Al obtener la
media (132) sta sera mayor que 4 de los 5 valores.
n 1
101 Mg. Miguel Angel Macetas Hernndez
2
Estadstica General 2012
Rango mediano =
n
2 N j1
Me L ji c j
nj
Donde
Ejemplo
Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
n 40
Aqu n = 40 luego 20 se compara con los N i se obtiene que 20,
2 2
observando en la tabla este valor no coincide con algn N i, est entre 18 y 21,
n
es decir: 18 < 20 < 21 N j1 Nj
2
Frecuencias
Intervalos de Frecuencia
Absolutas
clases Absolutas
Acumuladas
(Li-1 Li ] ni Ni
I1 16 27 n1 = 3 N1 = 3
I2 27 38 n2 = 5 N2 = 8
I3 38 49 n3 = 10 N3 = 18 Nj-1
IMe= I4 49 60 n4 = 3 N4 = 21 Nj
Lj-1 I5 60 71 n5 = 8 N5 = 29
nj
I6 71 82 n6 = 7 N6 = 36
I7 82 93 n7 = 4 N7 = 40
Total 40
Reemplazar los valores obtenidos en la frmula de Me:
40
2 18
Me 49 11 56,33
3
Me 56,33
d1 10 5
Mo L j1 C i Mo 38 11 42,5833
d1 d 2 10 5 10 3
Donde
Lj-1 = Lmite inferior del Intervalo Modal
Cj = Amplitud del intervalo Modal
d1 = nj nj1
d2 = nj nj+1
Ejemplo
Calcular el puntaje de rendimiento ms frecuente en la lnea de accin
educativa de Lenguaje de una muestra de 40 alumnos de un determinado
centro educativo
Frecuencia
Intervalos de Clases
Absolutas
(Li-1 Li ] ni
I1 16 27 n1 = 3
I2 27 38 n2 = 5 nj-1
IMo= I3 38 49 n3 = 10 nj
Lj-1 I4 49 60 n4 = 3 nj+1
I5 60 71 n5 = 8
I6 71 82 n6 = 7
I7 82 93 n7 = 4
Total 40
Media Aritmtica
1. Es una medida totalmente numrica o sea slo puede calcularse en datos de
caractersticas cuantitativas.
2. En su clculo se toman en cuenta todos los valores de la variable.
3. Es lgica desde el punto de vista algebraico.
4. La media aritmtica es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan clases
abiertas.
6. La media aritmtica es nica, o sea, un conjunto de datos numricos tiene una
y solo una media aritmtica.
Mediana
1. En su clculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lgica desde el punto de vista algebraico.
Moda
1. En su clculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el mtodo de
designacin de los intervalos de clases.
3. No est definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
5. No es afectada por valores extremos.
2. Los estadsticos del programa de Meals on Wheels (comida sobre ruedas), el cual
lleva comidas calientes a enfermos confinados en casa, desean evaluar sus
servicios. El nmero de comidas diarias que suministran aparece en la siguiente
tabla de frecuencia. Calcular la media, mediana y la moda e intrprete.
0-5 3
5 - 10 6
10 - 15 5
15 - 20 8
20 - 25 2
25 - 30 3
3. Bill Karl compr 20 acciones a $ 15 cada una, 50 acciones a $20 cada una,100
acciones a $30 cada una y 75 acciones a $35 cada una. Cul es el precio
promedio por accin?.
4. Dado el siguiente cuadro estadstico con ancho de clase constante igual a 20.
Determine la media de los datos.
16
14
Nmero de Alumnos
12
10
8
6
4
2
0
4 6 8 10 12 14
Notas
6. En una encuesta sobre los ingresos anuales en miles de soles de un grupo de
familias se obtuvo la siguiente informacin:
Li Ls ni
10 30 20
30 50
50 70
70 - 90 20
Adems, x 54 y n2 / n3 1 / 5 , calcular el nmero de familias con ingreso no
menos de 50 mil soles.
Li Ls ni
16 32 6
Li Ls ni
20 30 3
30 40 1
40 50 2
50 60 6
60 70 n
11. Una compaa minera tiene 100 trabajadores. Para los nombrados el haber
mximo es 450 dlares y el mnimo 60 dlares. Hay un 5% de eventuales (en
prueba) que trabajan ad-honorem o perciben compensaciones inferiores a $60.
Quince trabajadores nombrados perciben haberes inferiores a $250 y el 85% ganan
haberes inferiores a $400. Con esta informacin, calcule las medidas de tendencia
central posibles.
Produccin Porcentaje
Menos de 206 20 %
206 214 25%
214 222 18%
222 230 15%
230 238 13%
Ms de 238 9%
13. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. se divide en dos
grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg.
Cuntos estudiantes hay en cada grupo?.
14. En una clase hay 35 estudiantes varones con una edad media de 17. 5 aos y 15
estudiantes mujeres las que en promedio son 12% ms Jvenes. Cul es la edad
media de la clase?.
15. Las temperaturas registradas en una ciudad, en grados Fahrenheit (F), fueron: 51,
60, 58, 62, 57, 49, 52, 62, 61 y 63. Determinar la Media en grados centgrados (C)
sabiendo que: C=(5/9)(F-32).
16. De una muestra de tamao tres se sabe: la suma de los cubos de las tres
observaciones es 1971, la media aritmtica es 7 y la mediana es 6. Calcular el
valor de cada una de las observaciones.
19. Los costos de fabricacin, en soles, de diez objetos son los siguientes: 9.35, 9.46,
9.20, 9.80, 9.77, 9.00, 9.99, 9.36, 9.50, 9.60, si el precio de venta de cada objeto es
3 veces su costo de fabricacin menos 5 soles, calcular la utilidad media por objeto.
20. De las edades de cuatro personas, se sabe que la media es igual a 24 aos, la
mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas.
21. Para calcular el suministro de agua que una ciudad requiere mensualmente, se
escogen 15 familias de la ciudad, resultando los siguientes consumos en metros
cbicos; 11.2, 21.5, 16.4, 19.7, 14.6, 16.9, 32.2, 18.2, 13.1. 23.8, 18.3, 15.5, 18.8,
22.7, 14.0. Si en la ciudad hay 5,000 familias, cuntos metros cbicos de agua se
requieren mensualmente si el consumo promedio por familia permanece igual?.
22. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos
alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo ms 10 soles a
cada uno. Si la empresa dispone a lo ms de S/. 94,000 para pagar sueldos, cul
alternativa es ms conveniente?.
23. Al calcular la media de 125 datos, result 42. Un chequeo posterior mostr que en
lugar del valor 12.4 se introdujo 124. Corregir la media.
b) Si el 60% de los obreros tienen menos de 30 aos y percibe el 20% del total de
los sueldos, cunto es el sueldo medio de los obreros de al menos 30 aos?
28. Al tabular las calificaciones de un examen se obtuvieron las siguientes notas: 07,
08, 09, 10, 11, 12, 13, 14, 15, 16, 17 y las frecuencias del nmero de alumnos
respectivas: 1, 1, 1, 1, 1, 6, 8, 16, 18, 20, 2. Cunto es la media, la mediana y la
moda de las notas?, qu valor escogera como el promedio?.
29. Los sueldos en una empresa varan de $300 a $800 distribuidos en forma simtrica
en 5 intervalos de igual amplitud, con el 15%, 20%, y 30% de casos en el primer,
segundo y tercer intervalo respectivamente. Calcule los diferentes indicadores de
tendencia central.
i 1
b) Datos agrupados
l
m
. Xi ni
n
X G x , x ...x
n n1
1
n2
2
nm
m
i 1
Aplicando logaritmos tenemos:
1 m
XG ni log Xi log Xi
n i 1
Entonces:
X G 10 log x
La media geomtrica se utiliza los datos tienen crecimiento geomtrico: poblacin, montos de
capital, produccin
1.3.3. Propiedad:
XG < X
Ejemplo
La media geomtrica es til en el clculo de tasas de crecimiento; por ejemplo, si el
crecimiento de las ventas en un pequeo negocio son 3%, 4%,8%,9% y 10%, hallar la media
de crecimiento.
5
= (3)(4)(8)(9)(10) = 6.128
Respuesta: 6.128%
Utilizando logaritmo
3 + 4 + 8 + 9 + 10 3.9365
= = = 0.7873
5 5
= 0.7873
= 6.128
Solucin:
Es necesario calcular el porcentaje que las ventas de cada mes representan respecto de los
obtenidos el mes anterior.
Porcentaje del
Mes Ventas
mes anterior
Enero 500
Febrero 550 550/500=1,100
Marzo 600 600/550=1,091
Abril 700 700/600=1,167
Mayo 800 800/700=1,143
Junio 850 850/800=1,063
Calculando la media geomtrica se obtiene:
5
= (1100)(1091)(1167)(1143)(1063) = 1.112
Comprobacin:
Ejemplo
Calcular la media geomtrica para las siguientes calificaciones de Estadstica:
xi ni
4 5
6 8
8 9
9 10
10 8
Solucin:
Se llena la siguiente tabla, realizando los clculos respectivos:
xi ni log x i log x i ni
4 5 0.602 3.010
6 8 0.778 6.225
8 9 0.903 8.128
9 10 0.954 9.542
10 8 1.000 8.000
Total 40 34.906
PROPIEDADES
Es un promedio que se utiliza para el clculo del costo promedio y todo tipo de variables
expresadas en tasas o porcentajes. como por ejemplo: velocidad/distancia,
productividad/tiempo, etc
La media armnica no est definida en el caso de la existencia en el conjunto de
valores nulos.
Cuando la unidad constante o unidad de evaluacin es igual a la unidad del numerador
de una razn,
se usa el promedio armnico, y si es igual a la unidad del denominador se usa el
promedio aritmtico.
Ejemplo:
La velocidad de produccin de azcar de tres mquinas procesadoras son 0,5, 0,3 y 0,4
minutos por kilogramo. Hallar el tiempo promedio de produccin despus de una jornada de
4800 minutos del proceso
Solucin:
Como en la razn minutos/kilogramos (min/kg) cada mquina trabaja 4800 min, la razn
contante es el tiempo de trabajo (4800 min), es decir la contante es la unidad del numerador,
por lo tanto se debe emplear el promedio armnico
3
= = 0.383
1 1 1
+ +
0.5 0.3 0.4
b) Datos Agrupados:
Propiedad:
XH < XG < X
Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en horas que se demoran en
realizar la misma obra determinados obreros. Calcular el tiempo promedio que se demora en
realizar la obra un obrero tipo (un obrero promedio).
Tiempo Obreros
4 4
5 5
6 7
7 2
9 2
Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se demoran
para resolver una prueba de Estadstica determinados estudiantes. Calcular el tiempo
promedio que se demora en resolver la prueba un estudiante tipo.
Tiempo Estudiantes
[40-50) 4
[50-60) 8
[60-70) 10
[70-80) 7
[80-90] 11
Solucin:
Realizando los clculos respectivos se obtiene:
ni xi ni/xi
[40-50) 4 45 0,089
[50-60) 8 55 0,145
[60-70) 10 65 0,154
[70-80) 7 75 0,093
[80-90] 11 85 0,129
Total 40 0,611
40
= = 65,47
0.611
A. Los Cuartiles
Para Datos No Agrupados
La posicin o ubicacin de los cuartiles se encuentra aplicando la siguiente ecuacin:
= +
[ ]
Donde
n = Nmero total de datos
K = Nmero del cuartil
Ejemplo
Encuentre los cuartiles dada la siguiente distribucin, y represntelos grficamente
mediante un diagrama de caja y bigotes: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los cuartiles se ordena los datos de menor a mayor
6 9 9 12 12 12 15 17
1 2 3 4 5 6 7 8
Aplicando la ecuacin para el cuartil uno se obtiene:
= ()()+ = .
[ ]
Como la posicin del cuartil 1 es 2.5, su valor es el promedio de los datos segundo y
tercero
+ +
= . = = =
O tambin la posicin 2.5 dice que el cuartil 1 est ubicado al 50% del trayecto
comprendido entre el segundo dato, que es 9 y el tercer dato que es 9, es decir, Q1=
9+0.5 (9-9) = 9
Interpretacin: Este resultado indica que el 25% de los datos es inferior a 9
+ +
= ()()+ = . = = =
[ ]
O tambin la posicin 4.5 dice que el cuartil 2 est ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que tambin es 12, es
decir,
Q2= 12+0,5(12-12) = 12
Interpretacin: Este resultado indica que el 50% de los datos es inferior a 12
Aplicando la ecuacin para el cuartil tres se obtiene:
+ +
= ()()+ = . = = = .
[
]
O tambin la posicin 6,5 dice que el cuartil 2 est ubicado al 50% del trayecto
comprendido entre el doceavo dato, que es 12 y el quinceavo dato que 15, es decir,
Q3= 12+0,5(15-12)
Donde
Lj-1 = Lmite inferior del Intervalo del Cuartil
Cj = Amplitud del intervalo Cuartill
j = El nmero de Cuartil j = 1, 2 y 3
n = Nmero total de observaciones o datos.
Nj = Es un inmediato superior a jn
4
Nj-1 = Es una Ni inmediata inferior a jn
4
nj = Es el nj que le corresponde al Intervalo
Paso Uno
jn
1x 40 10
Aqu n = 40 y j =1 luego 4 4 se compara con los N i se obtiene que 10,
observando
En la tabla este valor no coincide con algn N i, est entre 8 y 10, es decir: 8 < 10 <
18
Frecuencias
Intervalos de Frecuencia
Absolutas
clases Absolutas
Acumuladas
(Li-1 Li ] ni Ni
I1 16 27 n1 = 3 N1 = 3
Nj-1
N2 = 8
I2 27 38 n2 = 5
Nj
IQ1= I3 38 49 n3 = 10 N3 = 18
nj
Lj-1 I4 49 60 n4 = 3 N4 = 21
I5 60 71 n5 = 8 N5 = 29
I6 71 82 n6 = 7 N6 = 36
I7 82 93 n7 = 4 N7 = 40
Total 40
124 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
Interpretacin Que el 25% del total de alumnos, es decir 10 de ellos tienen una puntuacin
inferior o igual a 40,2 puntos, y los 30 restantes, o sea el 75% de trabajadores, tienen un
puntaje superior a 40,2 puntos.
En la tabla este valor no coincide con algn Ni, est entre 18 y 21, es decir:
18 < 20 < 21
Frecuencias
Intervalos de Frecuencia
Absolutas
clases Absolutas
Acumuladas
(Li-1 Li ] ni Ni
I1 16 27 n1 = 3 N1 = 3
I2 27 38 n2 = 5 N2 = 8
I3 38 49 n3 = 10 N3 = 18 Nj-1
IQ2= I4 49 60 n4 = 3 N4 = 21 Nj
Lj-1 I5 60 71 n5 = 8 N5 = 29
nj
I6 71 82 n6 = 7 N6 = 36
I7 82 93 n7 = 4 N7 = 40
Total 40
Interpretacin Que el 50% del total de alumnos, es decir 20 de ellos tienen una puntuacin
inferior o igual a 56,33 puntos, y los 20 restantes, o sea el 50% de trabajadores, tienen un
puntaje superior a 56,33 puntos.
30, observando en la tabla este valor no coincide con algn N i, est entre 29 y 36, es
decir:
29 < 30 < 36
Frecuencias
Intervalos de Frecuencia
Absolutas
clases Absolutas
Acumuladas
(Li-1 Li ] ni Ni
I1 16 27 n1 = 3 N1 = 3
I2 27 38 n2 = 5 N2 = 8
I3 38 49 n3 = 10 N3 = 18
I4 49 60 n4 = 3 N4 = 21
I5 60 71 n5 = 8 N5 = 29 Nj-1
IQ3= I6 71 82 n6 = 7 N6 = 36 Nj
Lj-1 nj
I7 82 93 n7 = 4 N7 = 40
Total 40
= +
[ ]
Donde
n = Nmero total de datos
K = Nmero del cuartil
Ejemplo
Ejemplo:
Calcular el quinto decil de la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los deciles se ordena los datos de menor a mayor.
6 9 9 12 12 12 15 17
1 2 3 4 5 6 7 8
Aplicando la ecuacin para el quinto decil se obtiene:
+ +
= ()()+ = . = = =
[ ]
O tambin la posicin 4,5 dice que el decil 5 est ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que tambin es 12, es
decir,
D5= 12+0,5(12-12) = 12
En Excel se calcula de la siguiente manera:
Donde
Lj-1 = Lmite inferior del Intervalo de clase del decil
Cj = Amplitud del intervalo Decil
j = El nmero de Decil j = 1, 2, 3,,9
n = Nmero total de observaciones o datos.
Nj = Es un inmediato superior a jn
10
Nj-1 = Es una Ni inmediata inferior a jn
10
nj = Es el nj que le corresponde al Intervalo
= +
[ ]
Donde:
n = nmero total de datos
k = nmero del percentil
Ejemplo:
Calcular los percentiles de orden 20 y 33 del peso de diez personas que pesan (en
kg) 80, 78, 65, 73, 65, 67, 72, 68, 70 y 72
Solucin:
Se ordena los datos de menor a mayor se tiene:
65 65 67 68 70 72 72 73 78 80
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
1) Clculo del percentil de orden 20 se obtiene:
+ +
= ()()+ = . = =
[ ]
En Excel se obtiene un valor aproximado insertando la funcin PERCENTIL.INC
Donde
Lj-1 = Lmite inferior del Intervalo de clase del Percentil
Cj = Amplitud del intervalo Percentil
j = El nmero de Percentil j = 1, 2, 3,,99
n = Nmero total de observaciones o datos.
Nj = Es un inmediato superior a jn
100
Edades Frecuencias
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1
Consumo N de casos
($miles)
46 17
68 26
8 10 14
10 12 9
12 14 11
En datos no agrupados:
R = Xmax Xmin
Q3 Q1
Q
2
C. Varianza (s2)
Es el estadgrafo de dispersin ms importante. y expresa el grado de dispersin
de las observaciones respecto a la media aritmtica. Se denota por s 2; V(X); V(Y);
2; etc.
La varianza se define como:
"La varianza es la media o promedio del cuadrado de las desviaciones de la
variable respecto a su media".
132 Mg. Miguel Angel Macetas Hernndez
Estadstica General 2012
La expresin de la definicin, tambin se escribe:
x x n xn
2
x n
2
s 2
i i 2 i i
n 1 s2
i i
n
n 1
Propiedades de la varianza:
Sean:
X : variables
k : constante
V( ): Operador varianza
a) V (X) 0
b) V (k) = 0
c) V (x + k) = V(x)
d) V (kx) = K2 V(X)
Si tenemos una muestra tamao n la dividimos en r sub muestras determinando en
cada una de ellas sus respectivas medias, entonces la media total se determina por la
formula siguiente:
r n
S 2 ni (X 1 X t )ni
XT i 1
i 1
n n
Intravarianza + Intervarianza
32652,4
1030
2
s2 40 157,1769
40 1
V X s
157,1769 12,5370221
Es uno de los estadgrafos de dispersin de mayor uso, en si cual las unidades de
la variable ya no estn elevadas al cuadrado. La desviacin estndar, al igual que
la varianza, es no negativa (s 0), puesto que es la raz cuadrada positiva de la
varianza. A mayor dispersin le corresponder una mayor desviacin estndar.
CV
12,537100 48,68746446%
25,75
Asimetra.-
Es el grado de deformacin de la curva representativa de una distribucin de frecuencias
con respecto a la vertical que pasa por la abscisa de la media aritmtica; se mide a
travs del Coeficiente de Asimetra.
A. Relacin Entre La Media, Mediana y Moda
La distribucin de frecuencias de un conjunto de datos puede ser simtrica o
asimtrica.
B. Distribucin Simtrica
Una distribucin es simtrica cuando su grafica semeja una de las tres curvas:
Me = X = Mo Mo X = Me Mo X = Me
Curva Unimodal
Mo < Me < X
Mo X
Me
Distribucin Negativa Asimtrica
Es una distribucin donde los valores extremos son observaciones menores. La
grafica presenta una prolongacin hacia la izquierda, como la siguiente curva
hipottica. Curva Negativa Asimtrica (o Curva con
Sesgo Negativo).
Curva Unimodal
X
Mo Mo > Me > X
Mo = 3 Me 2 X
C. Importancia de la Asimetra.-
El conocimiento de la asimetra es importante por el hecho de que la teora estadstica
se basa a menudo en el supuesto de una distribucin normal. Por lo tanto una medida
de asimetra de una distribucin es necesario para preservarnos de las consecuencias
de esta suposicin (La condicin necesaria de una distribucin normal es que sea
simtrica).
D. Coeficiente de Asimetra.
Consideramos varias frmulas para el clculo de la medida de asimetra:
Coeficiente de Asimetra en base a Momentos.
1 ( xi - x ) ni
m 3
AS =
n s3
E. Kurtosis o Apuntamiento.-
D. Leptocrtica
D. Mesocrtica (Normal )
D. Platicrtica
Donde:
Los percentil P90 y P10 se calcula con la Lj-1=Limite inferior del Intervalo del Percentil
siguiente frmula:
Cj =Amplitud del intervalo Percentilico
rn
100 N J 1 r = El nmero de Percentill r = 1,2,3,,99
Pr L i 1 C j n = Nmero total de observaciones o datos.
nj
Nj = Es un inmediato superior a jn
100
(x
1
i ) 3 ni
116555 .56
Coeficiente Asimetra = = = 0.2799,
n 3 60 * (19.076) 3
8
(x
1
i ) 4 ni
18818611 .1111
Coeficiente Kurtosis = = = 2.3686
n * 4
60 * (19.076) 4
Por tanto se puede afirmar que la distribucin emprica es:
Aprox. Simtrica, puesto que AS = 0.28 0
Platicrtica, puesto que K = 2.37 < 3.
Entonces se puede concluir que dicha distribucin difiere ligeramente de la normal.
2.4. Aplicaciones de las medidas en datos univariados
Ejemplo 1. Los siguientes datos constituyen las vidas tiles en horas. de una muestra
aleatoria de 60 bombillas de luz de 100 watts.
807 811 620 660 817 732 747 823 844 907
660 753 1050 918 857 867 675 880 878 890
881 872 869 841 847 833 829 827 822 811
766 787 923 792 803 933 947 717 817 753
1056 1076 958 970 776 828 831 781 1088 1082
832 863 852 788 980 889 1030 897 755 891
a) Clasifique convenientemente con Anchos de Clase iguales y trace el Polgono de
Frecuencias Absolutas.
b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan
entre 700 y 1000 horas.
c) Encuentre los lmites que sub-clasifiquen las bombillas en tres categoras con referencia
a su duracin.
El 15 % ms durables en la categora A
El 15 % menos .durables en la categora C.
El resto en la categora B
Solucin
Clculos previos para elaborar la tabla
CUADRO N 01
DISTRIBUCIN DE DATOS CONSTITUYEN LAS VIDAS TILES EN HORAS. DE UNA
MUESTRA ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS.
Marca Nmero Frecuencia Frecuencia
Vida til en horas Frecuencia
de de Acumulada Relativa
Relativa
clase Bombillas Simple Acumulada
[Li-1 Li>
xi ni Ni hi Hi
[620 698> 659 4 4 0,0667 0,0667
[698 776> 737 7 11 0,1167 0,1833
[776 854> 815 23 34 0,3833 0,5667
[854 932> 893 15 49 0,2500 0,8167
[932 1010> 971 5 54 0,0833 0,9000
[1010 1088> 1049 6 60 0,1000 1,0000
Total 60 1,0000
GRAFICO N 01
POLGONO DE FRECUENCIA DE LA VIDA TIL EN HORAS DE UNA MUESTRA
ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS
Nmero de bombillas
23
20
15 15
10
5
7 6
5 4
0 0 0
581 681 781 881 981 1081
Vida promedio en horas de bombillas de luz de 100 watts.
b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan
entre 700 y 1000 horas.
Vida til en horas Nmero de Frecuencia Frecuencia
Bombillas Relativa Relativa
[Li-1 Li> ni hi hi %
[620 698> 4 0,0667 6,667
[698 776> 7 0,1167 11,667
[776 854> 23 0,3833 38,333
[854 932> 15 0,2500 25,000
[932 1010> 5 0,0833 8,333
[1010 1088> 6 0,1000 10,000
Total 60 1,0000 100,000
Calculamos el nmero de observaciones pedido:
2(11,66667)
698 a 776 11,66667 78 11,6667 = = 0,2991453
78
698 a 700 x 2 x
Para encontrar el valor 698 a 700 = 11,6666667 0,2991453 = 11,3675214
68(8,3333)
932 a 1010 8,3333 78 8,333 = =
78
7,2649526
932 a 1000 x 68 x
Para encontrar el valor 700 y 1000 horas. = 11,368 + 38,333 + 25,000 + 7,265 =
81,966%
El 15 % ms durables en la categora A
Basta calcular el percentil 15 y el percentil 85
94
15 = 698 + 78 ( ) = 753,7
7
51 49
85 = 932 + 78 ( ) = 963.2
5
Ejemplo 2. En la siguiente distribucin de frecuencias relativas calcular:
a) Las desviacin cuartillita
b) Discutir el sesgo y la kurtosis
Tiempo 0 3 3 6 6 9 9 12 12 15 15 18
hi 0,04 0,06 0,40 0,38 0,10 0,02
Solucin
Tiempo Xi hi Hi xi h i xi2 hi
0 3 1,5 0,04 0,04 0,06 0,09
3 6 4,5 0,06 0,10 0,27 1,215
6 9 7,5 0,40 0,50 3,00 22,5
9 12 10,5 0,38 0,88 3,99 41,895
12 15 13,5 0,10 0,98 1,35 18,225
3( ) 3(9 9)
= = =0
2,893
No podemos concluir que la distribucin sea simtrica. En efecto, como la media est a la
derecha de la moda la distribucin es sesgada a la derecha y usando el primer Coeficiente
de Pearson tenemos:
9 8.83
= = = 0.059
2.893
Como Sk > 0 la distribucin es ligeramente sesgada a la derecha
Q 1,9245
= = = 0,29
D9 D1 12,6 6
Como es K>0.263, puede considerarse la distribucin que es Leptocrtica
Ejemplo 3. Al investigar el nivel socioeconmico en los valores: Bajo (B), Medio (M), Alto
(A),
20 familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.
Construir la distribucin de frecuencias y trazar su grfica.
Nivel Frecuencia Frecuencia
socioeconmico Absoluta Relativa
Medio 8 40,0
Bajo 9 45,0
Alto 3 15,0
Total 20 100
10 9
8 Alto
Nmero de Familias
8 15% Medio
6 40%
4 3
2
0
Medio Bajo Alto Bajo
Nivel Socioecnomico 45%
El trmino de error es la diferencia entre los valores reales observados Y i y los valores
estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual
se utiliza el mtodo de mnimos cuadrados.
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el
siguiente ejemplo por claridad. Se tienen los siguientes supuestos:
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera
y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que
se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
b1 b1
( Xi X )(Yi Y ) S XY = 2.902704421
( Xi X ) 2
S XX
b0 b0
Y b X
i 1 i
Y bX = 5.114515575
n
r r 2 = 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es
un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r
= 0 indicara correlacin nula.
2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas
en una lnea area. Las quejas son por cada 100000 pasajeros.
%puntos Quejas a. Trazar un diagrama de dispersin
Aerolnea X Y b. Obtener la ecuacin de regresin lineal
A 81.8 0.21 c. Estimar las quejas para un porcentaje de
B 76.6 0.58 puntualidad de 80%
C 76.6 0.85
d. Obtener los intervalos de prediccin y de confianza
D 75.7 0.68
E 73.8 0.74 para una altura de 63"
F 72.2 0.93 e. Obtener el coeficiente de correlacin y de
G 70.8 0.72 determinacin
H 68.5 1.22