Vous êtes sur la page 1sur 146

Estadstica General 2013

20

15

10

0
11

12

1 Mg. Miguel Angel Macetas Hernndez

14

16

17

19

Estadstica General 2013


NDICE
CAPITULO Qu es la Estadstica? ................................................................................................. 4

I.

1.1

Introduccin ................................................................................................................................... 4

1.2

Qu se entiende por estadstica? .......................................................................................... 4

1.3

Por qu hay que estudiar Estadstica? ................................................................................ 5

1.4

Tipos de estadstica ..................................................................................................................... 7

1.5

Elementos que caracterizan a los problemas estadsticos ............................................... 8

1.6

Definiciones bsicas.................................................................................................................... 8

1.7

Clasificacin de las Variables ................................................................................................. 10

A.

Segn la Naturaleza de la Variable .................................................................................... 10

B.

Segn la Escala de Medicin............................................................................................... 11

ESCALAS DE MEDICIN ................................................................................................................... 21


Segn la Relacin Entre Variables..................................................................................... 22

C.

CAPITULO Presentacin de Datos ........................................................................................... 24

II.
2.1.

Clasificacin y cmputo de datos uni. y bivariables:. ...................................................... 24

A.

Codificacin y tabulacin ..................................................................................................... 24

B.

Presentacin tabular de los Datos: cuadros de distribucin de frecuencias ........ 24

C.

Cuadros estadsticos ............................................................................................................. 24

D.

Partes Principales de un Cuadro Estadstico ................................................................. 25

2.2.

Cuadros de Frecuencias de Variables Discretas ............................................................... 30

A.

DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS: .................. 36

B.

REPRESENTACIN GRAFICA DE LA VARIABLE CUALITATIVAS: .......................... 37


REPRESENTACIN GRAFICA DE LA CUANTITATIVAS DISCRETAS: ......................... 43

D.

Cuadros de Frecuencias de Variables Continuas.......................................................... 46

2.3.
E.

DISTRIBUCIN DE FRECUENCIAS, DE LA VARIABLE CUANTITATIVA CONTINUA: ......................... 55

F.

REPRESENTACIN GRAFICA DE LA CUANTITATIVAS CONTINUA: ................................................. 60

Grficos Estadsticos............................................................................................................................ 72
Clasificacin De Los Grficos ............................................................................................................. 72
CAPITULO Medidas de Resumen .............................................................................................. 87

III.
3.1

Medidas de resumen para variables cualitativas ................................................................ 87

3.2

Razn e ndice. Definicin. Clculo e interpretacin ........................................................ 87

3.3

Medidas de resumen para variables cuantitativas. ........................................................... 99

3.3.1
1.

Medidas de Posicin Centrales (Tendencia Central) ................................................ 99

La Media Aritmtica ...................................................................................................................... 99

2 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


2.

La Mediana (Me) ......................................................................................................................... 101

3.

Moda (Mo) (Valor Modal o Promedio Tpico) ......................................................................... 105

Caractersticas de las Medidas de Posicin Centrales ................................................................. 107


4.

Media Geomtrica: X G , G ...................................................................................................... 114

5.

Media Armnica: X H , H ......................................................................................................... 118


CAPITULO Estadgrafos de Tendencia No central ............................................................. 121

IV.
4.1.

Estadgrafos de Tendencia No central ................................................................................ 121

A.

Los Cuartiles .......................................................................................................................... 121

B.

Para elaborar un diagrama de caja y bigotes es necesario saber: ......................... 123

C.

Deciles ..................................................................................................................................... 127

D.

Percentiles o Centiles ......................................................................................................... 129

CAPITULO Medidas de Dispersin ............................................................................................. 132

V.

5.1.

Medidas de dispersin ............................................................................................................ 132

A.

Recorrido o rango (R) ................................................................................................................ 132

B.

Recorrido Semi Cuartil (Q) ........................................................................................................ 132

C.

Varianza (s2) ........................................................................................................................... 132

D.

Desviacin Estndar o Tpica (s) ......................................................................................... 134

E.

Coeficiente de Variacin (CV)................................................................................................... 134


CAPITULO Estadgrafos de Deformacin ............................................................................. 135

VI.

Asimetra.- ................................................................................................................................................. 135

VII.

A.

Relacin Entre La Media, Mediana y Moda .................................................................... 135

B.

Distribucin Simtrica ......................................................................................................... 135

C.

Importancia de la Asimetra.-................................................................................................. 136

D.

Coeficiente de Asimetra. ................................................................................................... 136

E.

Kurtosis o Apuntamiento.- ..................................................................................................... 136


CAPITULO Regresin y Correlacin Lineal .......................................................................... 142

Regresin y Correlacin Lineal ........................................................................................................ 142

3 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


I.

CAPITULO Qu es la Estadstica?

1.1 Introduccin
La importancia de la estadstica en la actualidad, no se pone en discusin. Casi
todos los programas profesionales universitarios incluyen en su currculo, al menos
un curso de estadstica. En muchos pases, inclusive en el Per, la estadstica forma
parte del currculo de la educacin secundaria e inclusive se incluyen algunos
tpicos en la educacin primaria.

La dinmica del mundo moderno, exige que todo ciudadano, para ejercer sus
derechos y comprender su entorno, requiera de una alfabetizacin en estadstica.
1.2

Qu se entiende por estadstica?


Al revisar el texto, vemos que esta parte se encuentra desarrollada posteriormente a
las razones por las que se debe estudiar estadstica, aqu lo hacemos primero, para
iniciar entendiendo lo que significa la Estadstica.

Realice la lectura de este acpite e identifique las ideas principales al respecto. Le


sugiero que subraye las ideas principales que encuentre.
Est de acuerdo en que la idea central se relaciona con el tratamiento de
informacin numrica?

Lo invito ahora a que enuncie su propia definicin sobre la estadstica.

Le parece a usted que podramos definir a la estadstica como la ciencia que nos
proporciona los elementos de juicio necesarios para llegar a tomar decisiones
adecuadas?, si est de acuerdo reflexione sobre las razones que le llevan a estarlo;
si no lo est tambin reflexione sobre la definicin adecuada y regrese al texto para
constatarlo.

De las diferentes formas de enunciar lo que significa la estadstica, realice ahora un


cuadro sinptico en la que se resuman las ideas claves que se observan en
cualquiera de las definiciones encontradas. Para ello lea detenidamente este acpite
que se encuentra en el texto bsico y reflexione sobre los distintos ejemplos que se
han planteado all.
4 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


1.3 Por qu hay que estudiar Estadstica?
Si se revisa un catlogo de informacin de la universidad, se descubrir que la
educacin estadstica se requiere en muchos Facultades. Por qu pasa esto?.
Cules son las diferencias en los cursos de Estadstica impartidos en una
Facultades de la Universidad. La mayor diferencia son los ejemplos utilizados.
Bsicamente, el contenido del curso es el mismo; Por ejemplo en una Escuela
Profesional de Administracin interesan cosas como las ganancias, horas de trabajo,
y salarios. En un Departamento de Salud interesan los resultados de las pruebas, y
en una Facultad de Ingeniera pueden interesar cuntas unidades son producidas
por una mquina en especial. Sin embargo, las tres reas tienen inters en lo que es
un valor tpico y en la cantidad de variacin existente en la informacin. Es posible
que tambin exista una diferencia en el nivel de matemticas requerido. Un curso de
Estadstica en ingeniera generalmente requiere del Clculo, los cursos de
Estadstica en escuelas de administracin y en la educacin, generalmente ensean
un curso orientado a aplicaciones. Entonces, por qu se requiere estudiar
Estadstica en tantas carreras?.

La primera razn es que en todos lados encontramos informacin numrica. Si se


revisan los peridicos, revistas de informacin, revistas de negocios, publicaciones
de inters general, o revistas de deportes, uno estar bombardeado con informacin
numrica.

Presentamos aqu algunos ejemplos:


Ford reporta que en 2011 sus ventas fueron de $146900 millones (de dlares),
arriba en un 7,2%; sus ganancias fueron de $4400 millones, con ascenso en un
7,0%, y el efectivo neto circulante fue de S/.7200 millones.
Los egresados de postgrado de la Universidad, contaron con un sueldo promedio
inicial de $400 dlares y un 70% de ellos consiguieron trabajo a los tres meses de
la graduacin.
Para los futbolistas que gustan de jugar en campos deportivos, el alquiler de los
campos promediaban S/.500 nuevos soles por semana.

5 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Cmo podemos determinar si las conclusiones presentadas son razonables?, las
muestras fueron suficientemente grandes?, cmo se seleccionaron las unidades de
la muestra? Para poder ser un consumidor con conocimientos sobre esta
informacin, necesitamos poder leer los cuadros, las grficas y entender la discusin
de la informacin numrica. El entender los conceptos bsicos de la Estadstica ser
de gran ayuda.

La segunda razn para tomar el curso de Estadstica es que las tcnicas estadsticas se utilizan para tomar decisiones que afectan nuestra vida diaria. Esto quiere
decir que afectan a nuestro bienestar personal. He aqu algunos ejemplos:
Las compaas de seguros utilizan anlisis estadsticos para establecer las tarifas
de los seguros de casa, automvil, vida y salud. Existen tablas que resumen la
probabilidad de que una mujer de 25 aos de edad viva el ao siguiente, los siguientes cinco aos, etc. Las primas del seguro de vida se pueden establecer
basndose en estas probabilidades.
La Agencia de Proteccin al Medio Ambiente est interesada en la calidad del
agua en el Lago Ene. Peridicamente toman muestras de agua para establecer el
nivel de contaminacin y mantener el nivel de calidad.
Los investigadores mdicos estudian las tasas de cura de enfermedades, basndose en el uso de diferentes medicamentos y distintas formas de tratamiento. Por
ejemplo, cul es el efecto de tratar cierto tipo de dao a la rodilla con ciruga o
con terapia fsica? Si se toma una aspirina diaria, se reducir el riesgo de sufrir un
ataque cardiaco?

La tercera razn para tomar el curso de Estadstica es que el conocimiento de los


mtodos estadsticos ayudar a entender por qu se toman ciertas decisiones, y le
aportarn una mejor comprensin sobre la manera en la que lo afectan.
Sin importar el tipo de trabajo que seleccione, encontrar que tiene que enfrentar la
toma de decisiones con la ayuda del anlisis de datos. Para poder realizar una decisin basada en la informacin, necesitar:

1. Determinar si la informacin existente es adecuada o si se requiere informacin


adicional.

6 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


2. Reunir informacin adicional, si es necesario, de tal forma que no hayan resultados
errneos.
3. Resumir la informacin de una forma til e informativa.
4. Analizar la informacin disponible.
5. Sacar las conclusiones y realizar las deducciones necesarias, al tiempo que se
evala el riesgo de llegar a una conclusin incorrecta.
1.4 Tipos de estadstica
Por lo general, el estudio de la estadstica se divide en dos categoras
Estadstica Descriptiva: cuando se recoleccin, clasificacin resumen,
procesamiento y representa un grupo de datos utilizando mtodos numricos y
grficos que resumen y presentan la informacin contenida en ellos. No pretende
ir ms all del conjunto de datos investigados.
Estadstica Inferencial: cuando apoyndose en el clculo de probabilidades y a
partir de datos muestrales, efecta estimaciones, decisiones, predicciones y
otras generalizaciones sobre un conjunto mayor de datos.

Figura N 01

7 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


1.5 Elementos que caracterizan a los problemas estadsticos
La poblacin de inters y el procedimiento cientfico que se emple para tomar la
muestra de la poblacin.
La muestra y el anlisis matemtico de su informacin.
Las inferencias estadsticas que resultan del anlisis de la muestra.
La probabilidad de que las inferencias sean correctas.

1.6 Definiciones bsicas


Poblacin o Universo (N) Est referido a un colectivo finito o infinito de elementos
individuales. Poblacin es un conjunto completo de individuos u objetos que
poseen alguna caracterstica comn observable. Poblacin es el nmero de
elementos que definen la cobertura de un estudio. La poblacin es el universo de
estudio que est integrado por la totalidad de todas las unidades de anlisis. Por
ejemplo
Alumnos de Ingeniera Civil matriculados en ciclo acadmico 2012 en la
Universidad.
Alumnos de IV ciclo de la Escuela Profesional de Ingeniera Civil de la
Universidad.
Ingenieros Civiles Colegiados en el departamento de Cajamarca en el ao 2012.
Muestra (n) Es la parte o subconjunto de una poblacin. La muestra est
constituida de elementos seleccionados de una manera deliberada, con el objeto
de investigar las propiedades de su poblacin. La muestra slo da informacin de
aquella poblacin de la que ha sido extrada.
POBLACIN (N)

MUESTRA (n)
Muestreo

Inferencia

Figura N 02
8 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Unidad de Anlisis o Unidad de Observacin Es el objeto o elemento indivisible
que ser estudiado en una poblacin sobre los cuales se va a obtener datos. La
unidad de anlisis no es el fenmeno investigado sino el que genera el fenmeno y
proporciona datos concretos. Por ejemplo
El tipo de anlisis al que se someter la informacin es determinante para elegir
la unidad de anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin
del usuario de un servicio mdico, la unidad de anlisis natural es el paciente
atendido, o la persona que se atiende en ese servicio mdico.
La unidad de muestreo corresponde a la entidad bsica mediante la cual se
acceder a la unidad de anlisis. En algunos casos, ambas se corresponden. Por
ejemplo:
Si se desea estimar la prevalencia de dao auditivo en relacin con niveles de
ruido ambiental en una muestra de trabajadores de una fbrica, la unidad de
muestreo puede corresponder a la entidad "sujeto", si se dispone de un registro
detallado de cada sujeto. La unidad de anlisis es por cierto el trabajador de la
fbrica.
Dato. Es el valor o respuesta que adquiere variable la en cada unidad de anlisis.
Dato es el resultado de la observacin, entrevista o recopilacin en general. Los
datos son. materia prima de la Estadstica.
Parmetro. Es una medida usada para describir algunas caractersticas de una
poblacin, y para determinar su valor es necesario utilizar la informacin de la
poblacin completa y por lo tanto, las decisiones se tomaran con certidumbre total.
Por ejemplo:
Media poblacional (), Varianza poblacional (2), Proporcin poblacional (p).
Estadgrafo. Es una medida usada para describir alguna caracterstica de la
muestra y la toma de decisiones contiene un grado de incertidumbre. Por ejemplo:
Media muestral ( ), Varianza muestral ( ), Proporcin muestral ( )

9 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Variable: Es una caracterstica que puede tomar diferentes valores o atributos. Las
variables son caractersticas observables, susceptibles de adoptar distintos
valores (cuantificado) o ser expresados en varias categoras

Variable
Rendimiento acadmico

Valores o atributo
12, 14, 17, 20

Genero

Masculino, femenino

Calidad

de

atencin

de

un Psimo, malo, regular bueno excelente

restaurante
Peso de alumnos

45,6 Kg. 57,8 Kg. 73,6 Kg

Nmero de hijos

1, 2, 3,

1.7 Clasificacin de las Variables


Podemos considerar muchos criterios de clasificacin como:
A. Segn la Naturaleza de la Variable

a) Variables Cualitativas o Estadsticas de Atributos.

Cuando expresan una cualidad, caracterstica o atributo, tienen carcter cualitativo


sus datos se expresan mediante una palabra es no numrico. Por ejemplo:
Estado civil, los colores, lugar de nacimiento, profesiones, actividad econmica,
causas de accidentes, etc.

b) Variables Cuantitativas.

Cuando el valor de la variable se expresa por una cantidad, es de, carcter


numrico. El dato o valor puede resultar de la operacin de contar o de medir. Por
ejemplo:
Edad nmero de hijos por familia, ingresos, viviendas por centro poblado, niveles
de, desempleo, produccin, utilidades por empresas, etc.,

10 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Las variables cuantitativas pueden ser: discreta y continua.

b.1. Variable Discreta.


Cuando el valor de la variable resulta de la operacin de contar su valor est
representado slo por nmeros naturales (enteros positivos). Por Ejemplos:
Hijos por familia nmero de accidentes por da, trabajadores por empresa;
poblacin por distritos, habitaciones por vivienda. etc.
b.2. Variable Contina.
Cuando la variable es susceptible de medirse es toda variable cuyo valor se
obtiene por medicin o comparacin con una unidad o patrn de medida. Las
variables continuas pueden tener cualquier valor dentro de su rango o recorrido
por tanto se expresa por cualquier nmero real. Por ejemplos:
Ingresos monetarios, produccin de maz, peso, estatura, tiempo de
servicios, horas trabajadas, niveles de empleo. etc.
B. Segn la Escala de Medicin
a) La escala nominal o categrica
La medicin en su nivel ms dbil existe cuando los nmeros u otros smbolos se
usan simplemente para clasificar un objeto, una persona o una caracterstica.
Cuando se emplean nmeros u otros smbolos para identificar los grupos a los
cuales pertenecen varios objetos, estos nmeros o smbolos constituyen una
escala nominal o categrica. Esta escala se conoce como escala clasificatoria.
Por ejemplo:
Se resumen en preguntas dicotmicas, o aquellas con dos opciones de
respuesta, y de seleccin mltiple, o aquellas con tres o ms opciones de
respuesta. Veamos algunos ejemplos:
Dicotmicas

Gnero:

Femenino

Has comprado el producto X?


Seleccin mltiple

Masculino
SI

NO

En tus prximas compras incluirs el producto X?


SI

11 Mg. Miguel Angel Macetas Hernndez

NO

No sabe

Estadstica General 2013


Propiedades Formales
Todas las escalas tienen ciertas propiedades formales, las cuales proporcionan
definiciones casi exactas de las caractersticas de la escala; definiciones ms
exactas que las que pueden darse en trminos verbales. Estas propiedades
pueden ser formuladas de manera ms abstracta de lo que hemos hecho aqu,
por un conjunto de axiomas que especifican las operaciones de la escala y las
relaciones entre los objetos que han sido escalados.
En una escala nominal, las operaciones de la escala dividen a una clase dada en
un conjunto de subclases mutuamente excluyentes. La nica relacin implica- da
es la de equivalencia; esto es, los miembros de cualquier subclase deben ser
equivalentes en la propiedad que est siendo escalada. Esta relacin se simboliza
por el signo familiar de "igual" (=). La relacin de equivalencia es reflexiva,
simtrica y transitiva.
Considrese un conjunto de objetos

. . Supngase que el objeto x,

tiene algn atributo verdadero, A (x). Entonces, para cualquier par de atributos en
el conjunto
( )

( )

( )

( )
( )

( )

( )

( )

( )

( )

( )

( )
( )

Operaciones Admisibles
Ya que en una escala nominal la clasificacin puede estar igualmente bien
representada por cualquier conjunto de smbolos, se dice que la escala nominal
es "nica hasta una transformacin de uno a uno". Los smbolos que designan las
variadas subclases en la escala pueden ser intercambiados si esto se hace de
manera cabal y consistentemente. Por ejemplo:
Cuando se emiten nuevas placas para automviles, el cdigo que previamente
perteneca a una ciudad puede ser intercambiado con el de otra ciudad. La
escala nominal podra preservarse si este cambio se ejecutara cabal y
consistentemente en la emisin de todas las placas.
Ya que los smbolos que designan los variados grupos de una escala nominal
pueden ser intercambiados sin alterar la informacin esencial en la escala, el
nico tipo de estadsticos descriptivos admisibles son aquellos que pueden ser
12 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


incambiables por tal transformacin: la moda, la cuenta de frecuencias, etc. En
ciertas condiciones, podemos probar hiptesis considerando la distribucin de
casos entre las categoras, usando pruebas no paramtricas tales como la ji
cuadrada o una prueba basada en la distribucin binomial. Estas pruebas son
adecuadas para da- tos escalados nominalmente debido a que se enfocan sobre
la frecuencia en las categoras, es decir, sobre datos enumerativos. En suma,
cuando los datos en una escala nominal, podemos rotular las categoras "1", "2",
"3",.., en cualquier orden que el Vamos. En una muestra podemos contar el
nmero de "1", el nmero de "2", etc. (Estas son cuentas de frecuencia) Podemos
calcular el porcentaje de "1" en la muestra, el porcentaje de "2", etc. (Esta es la
distribucin de frecuencia relativa.) Y podemos registrar qu categora tiene la
frecuencia ms grande. (sta es la moda.) Pero en general, no podemos "sumar"
las categoras "1" y "2" para formar la categora "3", ya que podramos violar las
suposiciones de un sistema de clasificacin nominal. En captulos posteriores
estudiaremos diferentes tcnicas estadsticas adecuadas para datos categricos o
escalados nominalmente.

b) La escala ordinal o de rangos


Puede suceder que los objetos en una categora de una escala no sean tan slo
diferentes de los objetos en otras categoras de esa escala, sino que tambin
exista algn tipo de relacin entre ellos. Las relaciones tpicas entre las clases
son: ms alto, ms preferido, ms difcil, ms perturbador, ms maduro, etc. Tales
relaciones se denotan por medio del smbolo >, el cual en general significa "mayor
que". En referencia a escalas particulares, > puede ser usado para designar que
es preferido a, es ms alto que, es ms difcil que, etc. Su significado especfico
depende de la naturaleza de la relacin que define la escala.
Dado un grupo de clases de equivalencia (esto es, dado una escala nominal), si la
relacin > se sostiene entre algunos pero no todos los pares de clases, tenemos
una escala parcialmente ordenada. Si la relacin > se sostiene para todos los
pares de clases, de manera que es posible un rango completo ordenado de
clases, tenemos una escala ordinal. Por ejemplo:
Grado de Instruccin: Primaria Secundaria Superior
Intensidad del dolor: Leve Moderado Intenso

13 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Propiedades Formales
Axiomticamente, la diferencia fundamental entre una escala nominal y una
ordinal es que esta ltima incorpora no slo la relacin de equivalencia (=), sino
tambin la relacin "mayor que" (>). Esta ltima relacin es irreflexiva, asimtrica
y transitiva.
Considrese un conjunto de objetos

. Supngase que existe alguna

relacin en el atributo verdadero entre los objetos de cada categora, adems de


la equivalencia dentro de las categoras. Esto es,
( )

( )

( )

( )
( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

Es decir, la funcin de clasificacin ordena los objetos en el mismo modo en que


de hecho estn ordenados los atributos.
Operaciones Admisibles
Ya que cualquier transformacin que preserve el orden no cambia la informacin
contenida en la escala ordinal, se dice que la escala es "nica hasta una transformacin monotnica". Una transformacin monotnica es aquella que preserva
el orden de los objetos. Esto es, no importa qu nmeros demos a un par de
clases o a los miembros de esas clases, siempre que les sea asignado un nmero
mayor a los miembros de la clase que es "mayor que" o "ms preferida".
(Naturalmente, se pueden usar nmeros menores para las clases "ms
preferidas". As nos referimos generalmente a una ejecucin excelente como
"primera clase", y a ejecuciones progresivamente inferiores como "segunda clase"
y "tercera clase". Siempre que seamos consistentes, no importa si se usan
nmeros mayores o menores para denotar "mayor que" o "ms preferido".) Por
ejemplo:
En el ejrcito un cabo usa dos bandas en su manga y un sargento usa tres.
Estas insignias denotan que el sargento > el cabo, y el smbolo > denota "mayor
rango que". Esta relacin podra ser igualmente bien expresada si el cabo usara
cuatro bandas y el sargento siete.
14 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Vale decir, una transformacin que no cambia el orden de las clases es
completamente admisible ya que no implica prdida alguna de informacin.
Cualesquiera o todos los nmeros que se aplican a las clases en una escala
ordinal pueden ser cambiados de cualquier forma que no altere el orden (rango)
de los objetos. Puede aplicarse cualquier transformacin montnica y an
preservarse las propiedades de la escala, esto es, preservar la relacin entre los
objetos.
El estadstico ms, apropiado para describir la tendencia central de las
puntuaciones en una escala ordinal es la mediana, ya que en relacin con la
distribucin de puntuaciones, la mediana no es afectada por los cambios en
cualesquiera de las puntuaciones que estn por arriba o por abajo de ella,
siempre que el nmero de puntuaciones por arriba y por debajo permanezca
constante. Con el escalamiento ordinal, las hiptesis pueden ser probadas usando
el gran grupo de pruebas estadsticas no paramtricas que en ocasiones se
llaman estadsticos de rango o estadsticos de orden.

c) La escala de Intervalo
Cuando una escala tiene todas las caractersticas de una escala ordinal y cuando
adems tienen sentido las distancias o diferencias entre cualesquiera dos
nmeros de la escala, se ha logrado una medicin considerablemente ms fuerte
que la ordinal. En tal caso, la medicin ha sido lograda en el sentido de una
escala de intervalo. Esto es, si nuestro mapeo de varias clases de objetos es tan
preciso que conocemos cun grandes son los intervalos (distancias) entre todos
los objetos de la escala, y estos intervalos tienen significado sustantivo, entonces
hemos logrado una medida de intervalo. Una escala de intervalo est
caracterizada por una unidad comn y constante de medida que asigna un
nmero a todos los pares de objetos en el orden establecido. En esta clase de
medicin, la razn de cualesquiera dos intervalos es independiente de la unidad
de medida y del punto cero. En la escala de intervalo, el punto cero y la unidad de
medida son arbitrarios. Por ejemplo
Medimos la temperatura en una escala de intervalo. De hecho, comnmente se
usan dos diferentes escalas: Celsius y Fahrenheit. Al medir la temperatura, la
unidad de medida y el punto cero son arbitrarios; son diferentes en ambas
escalas. Sin embargo, las dos escalas contienen la misma cantidad y la misma
clase de informacin. Esto es as debido a que estn linealmente relacionadas.
15 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Es decir, una lectura en una escala puede ser transformada en la lectura
equivalente de la otra por medio de una transformacin lineal.

Donde
F = nmero de grados en la escala Fahrenheit
C = nmero de grados en la escala Celsius
Se puede mostrar que las razones de las diferencias de temperatura (intervalos)
son independientes de la unidad de medida y del punto cero. Por ejemplo, el
punto de "congelacin" ocurre en 0 en la escala Celsius, y el punto de "ebullicin" ocurre en los 100. En la escala Fahrenheit, la "congelacin" ocurre en los
32 y la "ebullicin" en 212. Algunas otras lecturas de la misma temperatura en
las dos escalas son las siguientes:
Celsius

18

Fahrenheit

10

30

100

32

50

86

212

Ntese que la razn de las diferencias entre las lecturas de temperatura en una
escala, es igual a la razn entre las diferencias equivalentes en la otra escala. Por
ejemplo,
En la escala Celsius la razn de las diferencias entre 30 y 10, y 10 y 0 es (30
10) / (10 0) = 2. Para las lecturas comparables en la escala Fahrenheit, la
razn es (86 50) / (50 32) = 2. En ambos casos las razones son las
mismas; a saber, 2. En otras palabras, en una escala de intervalo, la razn de
cualesquiera dos intervalos es independiente de la unidad usada y del punto
cero, siendo ambos arbitrarios.

Muchos cientficos de la conducta aspiran a crear escalas de intervalo, y en pocas


ocasiones tienen xito. Sin embargo, generalmente lo que es tomado como xito
son suposiciones no probadas que el constructor de la escala voluntariamente
cree. Una suposicin frecuente es que la variable que est siendo escalada est
normalmente distribuida entre los individuos a los que se evala con base en esta
suposicin, el constructor de la escala manipula las unidades de la escala hasta
que se encuentre la supuesta distribucin normal de las puntuaciones de los
individuos. Naturalmente, el procedimiento es slo tan bueno como la intuicin del
investigador al elegir la distribucin que supone.

16 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Otra suposicin que se hace a menudo para crear una escala de intervalo aparente es la suposicin de que las respuestas "afirmativas" de las personas en
cualquier reactivo son exactamente equivalentes a responder de manera
afirmativa en cualquier otro reactivo. Esta suposicin se hace para satisfacer el
requisito de que una escala de intervalo debe tener una unidad de medida comn
y constante. En escalas de habilidades o de aptitudes, la suposicin de
equivalencia consiste en que dar la respuesta correcta a cualquier reactivo es
exactamente equivalente (en la cantidad de habilidad mostrada) a dar la
respuesta correcta a cualquier otro reactivo.
Propiedades Formales
Axiomticamente, se puede mostrar que las operaciones y relaciones que dan
origen a la estructura de una escala de intervalo son tales que las diferencias en
la escala son isomrficas a la estructura de la aritmtica. Los nmeros pueden ser
asociados con las posiciones de los objetos en una escala de intervalo tal que las
operaciones de la aritmtica pueden ser significativamente ejecutadas con las
diferencias entre los nmeros.
Al construir una escala de intervalo no slo se deben especificar equivalencias,
como en la escala nominal, y relaciones "mayor que", como en la escala ordinal,
sino tambin se debe ser capaz de especificar la razn entre dos intervalos
cualesquiera.

Considrese un conjunto de objetos

Supngase que los atributos

verdaderos de los objetos existen en alguna relacin unos con otros, adems de
sus equivalencias dentro de las categoras. Esto es:
( )
( )

( )
( )

( )
( ))
Entonces, una escala de intervalo es un sistema clasificatorio de los objetos L (x)
que tienen las propiedades de una escala ordinal y, adems
( )

( )

Ntese que en este caso, la diferencia entre los atributos de los dos objetos es
proporcional a la diferencia entre las asignaciones de clasificacin:
( )

17 Mg. Miguel Angel Macetas Hernndez

( )

( )

Estadstica General 2013


Operaciones Admisibles
Cualquier cambio en los nmeros asociados con las posiciones de los objetos
medidos en una escala de intervalo debe preservar no slo el orden de los
objetos, sino tambin las diferencias relativas entre los objetos. Esto es, la escala
de intervalo es "nica hasta una transformacin lineal". As, como hemos
sealado, la informacin proporcionada por la escala no es afectada si cada
nmero se multiplica por una constante positiva y despus se le suma a este
producto una constante, esto es

( )

. (En el ejemplo de la

temperatura, c = 9/5 y b = 32.)

Ya hemos notado que en una escala de intervalo el punto cero es arbitrario. Esto
es inherente al hecho de que la escala est sujeta a transformaciones que
consisten en agregar una constante a los nmeros que constituyen la escala.

La escala de intervalo es la primera escala verdaderamente "cuantitativa" que


hemos encontrado. Todos los estadsticos paramtricos comunes (medias,
desviaciones estndar, correlaciones producto-momento, etc.) son aplicables a
los datos en una escala de intervalo. Si de hecho se ha logrado una medida en
una escala de intervalo y si se han encontrado adecuadamente todas las
suposiciones del modelo estadstico paramtrico (dadas en la seccin "El modelo
estadstico"), entonces el investigador puede utilizar pruebas estadsticas
paramtricas tales como la prueba t o la prueba F. En tal caso, los mtodos no
paramtricos no aprovechan toda la informacin contenida en los datos de
investigacin. Puede notarse que una escala de intervalo es una condicin
necesaria, pero no suficiente, para usar una prueba estadstica paramtrica que
incluya la distribucin normal.

d) La escala de razn
Cuando una escala tiene todas las caractersticas de una escala de intervalo y,
adems, tiene un punto cero verdadero en su origen, se llama escala de razn.
En una escala de razn, la razn de cualesquiera dos puntos es independiente de
la unidad de medida. Por ejemplo
Medimos la masa o el peso en una escala de razn. La escala de onzas y libras
tiene un punto cero verdadero, al igual que la escala de gramos. La razn entre

18 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


cualesquiera dos pesos es independiente de la unidad de medida. Por ejemplo,
si de- terminamos los pesos de dos objetos diferentes no slo en libras sino
tambin en gramos, encontraremos que la razn de los dos pesos en libras es
idntica a la razn de los dos pesos en gramos.

Aunque es difcil identificar ejemplos significativos en las ciencias sociales y de la


conducta,

los

contraejemplos

abundan.

Consideramos

dos.

Notamos

anteriormente que las calificaciones se miden en una escala ordinal. Considrese


a dos estudiantes, uno de los cuales recibe una A y el otro una C; y supngase
que las asignaciones numricas fueron 4 y 2, respectivamente. Aunque la razn
de las dos calificaciones es dos (4/2 = 2), no tiene sentido decir que el estudiante
con una A posee el doble de "algo" del estudiante que recibe la C. (El estudiante
puede obtener el doble de ciertos puntos, pero no es claro si esto tiene algn
significado sustantivo en conocimiento, habilidad o perseverancia.) Finalmente, en
el caso de la temperatura, considrese un cambio en la temperatura de 100 a 30
C. No podemos decir que el incremento representa que el calor se increment al
triple. Para ver esto, ntese que el cambio en la temperatura es equivalente a un
cambio de 500 a 86 F. Debido a que las razones de las temperaturas en las dos
escalas son claramente diferentes, la razn no tiene sentido interpretable alguno.
Propiedades Formales
Las operaciones y relaciones que dan origen a los valores numricos en una
escala de razn son tales que la escala es isomrfica a la estructura de la
aritmtica. Por tanto, las operaciones de la aritmtica son permisibles con los
valores numricos asignados a los objetos, as como a los intervalos entre los
nmeros, como en el caso de la escala de intervalo.

Las escalas de razn, que se encuentran ms comnmente en las ciencias


fsicas, se logran slo cuando son operacionalmente posibles de alcanzar todas
las siguientes cuatro relaciones: 1. equivalencia; 2. mayor que; 3. razn conocida
entre cualesquiera dos intervalos, y 4. razn conocida entre cualesquiera dos
valores de la escala.

19 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Considrese un conjunto de objetos

. Supngase que el atributo

verdadero de los objetos existe con alguna relacin entre cada uno de ellos,
adems de la equivalencia dentro de las categoras. Esto es
( )
( )
( )

( )
( )
( )

Entonces, una escala de razn es un sistema clasificatorio de los objetos L (x) si


(

( )
( )

( )

( )
( )
y la razn de las clasificaciones asignadas es igual a la razn de los atributos
verdaderos.
Operaciones Admisibles
Los nmeros asociados con los valores de la escala de razn son nmeros "verdaderos" con un cero verdadero: slo la unidad de medida es arbitraria. As, la escala de razn es nica hasta la multiplicacin por una constante positiva. Esto es,
las razones entre cualesquiera dos nmeros se preservan cuando los valores de
la escala son todos multiplicados por una constante positiva y, adems, tal
transformacin no altera la informacin contenida en la escala.
Cualquier prueba estadstica paramtrica puede usarse cuando se han logrado
medidas de razn y se encuentran las suposiciones adicionales concernientes a
la distribucin. Ms an, existen algunos estadsticos que se aplican slo a datos
que descansan en una escala de razn; debido a la fuerza de las suposiciones
que sub- yacen a la escala, la mayora de estas pruebas son pararntricas.

20 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


ESCALAS DE MEDICIN
Tipo

Variables Categricas

Variables numricas

Naturaleza

CUALITATIVAS

CUANTITATIVAS

Escala

(0) NOMINAL Ningn


atributo

Atributos de la
escala

Orden Distancia Origen

Orden

Caracterstica

Posee categoras a las


que se asigna un nombre
sin que exista ningn
orden
implcito
entre
ellas.

Posee
categoras
ordenadas,
pero
no
permite
cuantificar
la
distancia
entre
una
categora y otra.

Ejemplos

Gnero
Masculino

Valor Final

Observaciones

Femenino

Estado Civil

(1) ORDINAL Un atributo


Distancia Origen

Instruccin

Intensidad

Soltero

Primaria

Leve

Casado

Secundaria

Conviviente

Superior

(2) INTERVALO Dos atributos


Orden

Distancia

Origen

Tiene intervalos iguales y


medibles, pero no tiene un
origen real. Puede asumir
valores negativos.
Temperatura

Hora del da

(3) RAZN Tres atributos


Orden

Distancia

Origen

Tiene
intervalos
constantes entre valores;
adems de un origen real.
El
cero
significa
la
ausencia de la variable.
Peso.

Hijos

-10 C

00 Horas

00.00 Kg

Uno

Moderado

0C

10 Horas

10.24 Kg

Dos

Severo

20 C

20 Horas

20.00 Kg

Tres

Continuas: Provienen de medir


Dicotmicas: Tienen solamente dos categoras Ejemplos
Se pueden representar con nmeros enteros o fraccionarios
de Ordinal Dicotmica: Nuevo - Continuador
Vivo Fallecido
Entre dos valores siempre existe un nmero intermedio
Sano Enfermo
Politmicas: Tienen ms de dos categoras.

21 Mg. Miguel Angel Macetas Hernndez

Discretas: Provienen de contar


Solamente pueden ser representados con nmeros enteros

Estadstica General 2013


C. Segn la Relacin Entre Variables
a) Variables Dependientes
Son aquellas que se explican por otras variables, son los efectos o resultados
respecto a los cuales hay que buscar su motivo, causas o razn de ser, Es la
variable que traduce la consecuencia del efecto de una varias razones o causas.
b) Variables Independientes
Son las variables explicativas o predicativas, cuya asociacin, relacin o
influencia en la variable dependiente se pretende escribir en la investigacin. Las
variables independientes son los que traducen o explican las causas o razones
de las variaciones en la variable dependiente. Simplificando, en la relacin de
variables, las causas o antecedentes seran las variables independientes (VI) y la
causa o consecuente es la variable dependiente (VD). Ejemplos: En el caso ms
simple, para la relacin d dos variables.
El presupuesto familiar (VD) depende de los ingresos (VI).
El volumen de ventas (VD) se explica por la inversin en propaganda (V).
El nmero de hijos por familia (VD) tiene relacin con el nivel educativo de los
padres (VI).
c) Variables Intervinientes o interferentes
Son aquellas que coparticipan con la variable independiente condicionando el
comportamiento de la variable dependiente. En el caso de la relacin entre
presupuesto familiar (VD) y los ingresos (VI), algunas variables intervinientes
serian la conducta de consumo, la edad de los miembros de la familia, etc.
Elementos de una Variable
La identificacin y definicin de variables es la tarea ms delicada de toda
investigacin y del trabajo estadstico. En consecuencia, para tener xito en la
seleccin de variables, es recomendable distinguir las siguientes cinco
caractersticas.
Un nombre o denominacin. de la variable.
Alguna definicin o conceptualizacin.
Un conjunto de categoras. que es definida por el investigador. Las

categoras no son nicas.


Procedimientos para categoras las unidades de anlisis.
Algunas medidas de resumen o indicadores.

22 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Ejemplo 1:
a) Nombre : Estado civil o conyugal.

b)

Definicin: Es la situacin de la persona empadronada en relacin con las leyes


y costumbres del pas.

c)

Categoras:
01) Sol tero (a).
02) Casado (a).
03) Conviviente.
04) Viudo (a).
05) Divorciado (a).
06) Separado (a).

d)

Categorizacin: Cul es su estado civil o conyugal?

e)

Medidas de Porcentajes
Resumen Tasa de nupcialidad que indica la frecuencia de matrimonios, etc.

Ejemplo 2:
a) Nombre : Ingresos
b) Definicin Son los recursos monetarios

netos incluyendo todas las

Bonificaciones que percibe una persona por su ocupacin principal y secundaria


durante el perodo de referencia de la encuesta.
c) Categoras

: Puede proponerse en forma de niveles o simplemente intervalos.

Niveles de ingreso: alto, medio, bajo


Intervalos: Por ejemplo 8 intervalos
Menos de 4000; 4001 l 8000; 8001 a 12000; 1 2001 a 1 6000; 16001 a 20000:
20001 a 25000; 25001 a 30000; 30001 y ms soles.
d) Categorizacin: Cul fue su ingreso total en el ltimo mes?
e) Indicadores

: Ingreso promedio.
Dispersin de los ingresos. etc.

23 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


II.
CAPITULO Presentacin de Datos
2.1. Clasificacin y cmputo de datos uni. y bivariables:.
A. Codificacin y tabulacin
La codificacin facilita la tabulacin y el conteo. (obtencin de una buena
informacin)
La codificacin de las respuestas da lugar a categoras o modalidades.
Es recomendable que los cuestionarios tengan las alternativas de respuesta pre
codificadas.
Si el cuestionario tiene preguntas abiertas (respuesta libre), estas previamente
debe ser clasificadas en categoras.
B. Presentacin tabular de los Datos: cuadros de distribucin de frecuencias
Es necesario agrupar los datos y presentarlos en cuadros y diagramas sencillos.
Un cuadro de frecuencias, son cuadros que indican la distribucin de un conjunto
de datos en clases o categoras y muestran el nmero de elementos y la
proporcin de cada uno de los valores de la variable.
Un cuadro de frecuencias, permite una buena ayuda para formularse
interrogantes acerca de los datos.
Un cuadro de frecuencias, es un punto de partida en la bsqueda de un modelo
terico para analizar la distribucin de los datos.
En la cuadro se observa la frecuencia o repeticin de cada uno de los valores de
la variable.
Las observaciones o recopilaciones de datos denotaremos la variable por X y los
datos originales:

. donde Xi representan la i sima observacin de

la variable con (i = 1, 2, 3, 4,..., N). Es decir que:


X1 = dato de la primera observacin
X2 = dato de la segunda observacin
X3 = dato de la tercera observacin

.
XN = dato de la N sima observacin
C. Cuadros estadsticos
En una investigacin, despus que los datos han sido recogidos, revisados y
almacenados en una base de datos, se procede a la presentacin de los
resultados en forma tabular o grfica y al anlisis estadstico de la informacin.
La facilidad de su construccin y el rpido efecto en la transmisin de los
contenidos, han hecho de los cuadros estadsticos los recursos idneos para la
24 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


presentacin de los resultados de las investigaciones en todas las reas
cientficas.
La presentacin tabular y el grfico no son competidores, sino ms bien
elementos que se complementan. Los grficos deben agregarse a los cuadros o
distribuciones de frecuencias para llamar la atencin y despertar el inters por
los datos que se presentan, as como para reforzar las argumentaciones o
conclusiones a las que se haya llegado. Como un principio muy conveniente,
debe adoptarse el de que en ningn caso puede considerarse que el grfico
sustituye a la presentacin tabular. La prctica seguida por algunas personas, de
presentar grficos omitiendo los cuadros que contienen la informacin bsica,
debe ser evitada y combatida por inconveniente y por limitar la calidad y la
utilidad de las publicaciones y estudios. Slo en casos de verdadera excepcin,
como cuando se trata de propaganda o de artculos meramente divulgadores,
podra aceptarse la prctica comentada.
Objetivo
Un cuadro estadstico tiene como objetivo presentar datos numricos ordenados,
en filas y columnas, de acuerdo a ciertos criterios de clasificacin.
Ventajas
Los cuadros permiten presentar en forma resumida y ordenada muchos datos
Es un instrumento que clasifica, resume y comunica informacin estadstica
Facilita el anlisis de los datos
Su fcil comprensin, permite que sea utilizado por muchas personas
Todo cuadro estadstico debe explicarse por s mismo, sin necesidad de texto o
figuras anexas, y debe ser sencillo y claro
D. Partes Principales de un Cuadro Estadstico
En general, un cuadro estadstico completo, tal como el Cuadro N 01, por ejemplo,
puede tener ocho partes:
1. Nmero del cuadro.
4. Cuerpo.

2. Ttulo.

3. Encabezamiento o conceptos.

5. Nota de pie o llamadas. 6. Fuente.

7. Nota de unidad de medida.

8. Elaboracin.

25 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


2
CUADRO N 01
Es
la
descripcin
resumida del contenido
del cuadro. La redaccin
del ttulo debe ser breve,
claro y completo, de
modo que se puedan
deducir sin ambigedad
qu tipo de informa.
Debe indicar
1.
2.
3.
4.

QUE
DONDE
COMO
CUANDO

Es el cdigo o elemento de
identificacin que permite
ubicar el cuadro en el interior
de un documento

POBLACIN TOTAL ECONMICAMENTE ACTIVA DE 15 AOS Y MS, DEL DEPARTAMENTO DE


Donde

Que

CAJAMARCA: POR NIVEL EDUCATIVO SEGN RAMAS DE ACTIVIDAD. CENSO DE POBLACIN 2009
Donde

Descripcin de las filas y


columnas del cuadro
estadstico

Cuando
Expresa en qu unidades
estn las variables

Como

7
(Distribucin porcentual)

Ramas de Actividad

PEA de
15 aos
y ms

TOTAL

N i v e l d e Educacin
Sin
Nivel*

Primaria

Secundaria

Sup. No
Univer.

Superior
No Especificado
Univer.

100,0

5,89

42,11

35,87

5,67

8,66

1,80

1. Agricultura, Caza, Selvicultura y


Pesca

100,0

14,97

64,05

15,59

0,70

1,30

3,40

2. Explotacin de Minas y Canteras.

100,0

0,75

41,13

39,59

5,79

12,63

0,11

3. Industrias Manufactureras.

100,0

3,60

43,57

41,60

2,94

6,70

1,59

4. Electricidad, Gas y Agua.

100,0

0,00

21,95

48,29

8,29

20,49

0,98

5. Construccin.

100,0

4,78

64,36

24,99

1,05

3,54

1,28

6. Comercio, Restaurantes y Hoteles.

100,0

6,95

45,04

39,66

2,06

4,39

1,91

100,0

1,34

45,18

46,87

2,28

3,15

1,18

100,0

0,64

11,60

48,71

9,28

29,25

0,52

100,0

2,10

26,56

43,35

11,46

15,22

1,30

10. Actividades No bien especificadas.

100,0

9,35

44,70

34,99

3,55

4,97

2,43

11. Buscan trabajo por primera vez.

100,0

1,94

25,75

56,97

6,70

7,94

0,71

7. Transportes, Almacenamiento y
Comunicaciones.
8. Establecimientos Financieros,
Seguros, Bienes Inmuebles y
Servicios a las Empresas
9. Servicios Comunales, Sociales y
Personales.

* Incluye PEA con educacin inicial o pre escolar


Fuente: INE Resultados definitivos de los Censos Nacionales IX de Poblacin y IV de Vivienda
Elaborado: Statistic MAH.
5) NOTA DE PIE O LLAMADAS, se usa para aclarar algunos trminos o siglas, y tambin para indicar qu
elementos estn o no incluidos en algunos de los conceptos del cuadro.
6) FUENTE, es la indicacin al pie el cuadro, que sirve para nombrar la publicacin, entidad, estudio o fuente
de donde se obtuvieron los datos utilizados para construir el cuadro. La identificacin de la fuente permite,
si fuera el caso, comprobar la informacin o para obtener informacin complementaria.
Hay dos tipos de fuentes: i) primaria, cuando se obtiene directamente de la unidad de anlisis o cuando se
recurre a los propios formularios de una encuesta: ii) secundaria, cuando se recurre a documentos
boletines o cuadros estadsticos publicados.
7) Nota Unida de Medida se escribe debajo del ttulo, se usa cuando se abrevia la escritura
8) ELABORACIN, es una indicacin que se coloca debajo de la fuente, y sirve para mencionar el
responsable, que utilizando datos originales o de la fuente elabor el cuadro estadstico final: indica la
responsabilidad de la publicacin del cuadro. A veces resulta til indicar la fecha de elaboracin.
QUE
: Poblacin Total Econmicamente Activa De 15 Aos Y Ms
DONDE
: Del Departamento Cajamarca
COMO
: Por Nivel Educativo Segn Ramas de Actividad
CUANDO
: Censo de Poblacin 2009.

26 Mg. Miguel Angel Macetas Hernndez

4
Es el
contenido
numrico
del cuadro

Estadstica General 2013


CUADRO 04
PACIENTES SEGN NMERO DE LEUCOCITOS /mm3.
HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA - 2007..
Nmero de
Nmero de
Leucocitos
Pacientes (ni )
(miles)1/
5.0 - 5.9
3
6.0 - 6.9
10
7.0 - 7.9
11
8.0 - 8.9
13
9.0 - 9.9
10
10.0 - 11.0
8
Total
a/ 55
- Nota de pie. a/. Muestra aleatoria sistemtica.
1/. Datos expresados en miles.
- Fuente. H.R.C

Porcentaje de
Pacientes
( hi % )
5.5
18.2
20.0
23.6
18.2
14.5
100.0

E. Caractersticas:
1. La cuadro estadstica debe ser lo ms simple posible.
2. Si se utilizan smbolos, abreviaturas, etc., deben explicarse detalladamente en
notas de pie de pgina.
3. Deben ser incluidas las unidades especficas de medida que corresponden a los
datos.
4. Debern consignarse los totales.
5. Si los datos no son originales debe quedar explcita la fuente de donde se ha
tomado.
6. Cuando se utilizan escalas cualitativas hay que tener cuidado si se desea
comparar datos de una cuadro con otra, ya que en los criterios de clasificacin de
la variable puede que el entendimiento nuestro de un concepto no coincida
totalmente con el de otro investigador.
7. Una cuadro estadstica puede ser completada con las frecuencias acumuladas,
frecuencias relativas (porcentajes, promedios o razones), etc.
F. Tipos de cuadros.
En su forma ms general los cuadros pueden dividirse en simples y
compuestas.
a) Cuadros Simples. Clasifican un fenmeno segn una nica variable. Ejemplo
27 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Cuadro 04.
b) Cuadros Compuestos. Son las que recogen los datos de dos o ms variables,
cada una de ellas con sus correspondientes criterios de clasificacin. Dentro de los
cuadros compuestos las que se utilizan con mayor frecuencia son: Las cuadros
dobles y las Maestras.

c) Cuadros Dobles. Resumen informacin clasificadas segn 2 variables, y estas se


denominan: Cuadros de contingencia y cuadros de correlacin.

d) Cuadro de Contingencia. Cuando ambas variables son cualitativas o mixtas.


Ejemplo. El cuadro siguiente muestra una distribucin bidimensional (Cuadro de
contingencia)
CUADRO 05
REACCIN A LA VACUNACIN CONTRA EL SARAMPIN Y LA RUBOLA EN UNA
MUESTRA DE 288 NIOS DE CAJAMARCA -1994.
Vacunados contra
sarampin

Vacunados contra rubola


Reaccin Positiva Reaccin Negativa

T O T A L

Reaccin positiva

76

72

148

Reaccin negativa

120

20

140

T O T A L

196

92

288

La interpretacin a esta cuadro sera la siguiente: de una muestra de 288 individuos,


76 tuvieron reacciones positivas a las dos vacunaciones, 20 individuos tuvieron
reaccin negativa a ambas pruebas, 120 individuos tuvieron reaccin positiva ante la
vacuna contra la rubola, pero negativamente ante la vacuna contra el sarampin, y
72 nios tuvieron reaccin negativa a la vacuna contra la rubola y positiva en la
vacuna contra el sarampin.

CUADRO DE CORRELACIN. Cuando ambas variables son cuantitativas. Por


ejemplo

28 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


CUADRO 06
MUJERES EN EDAD FRTIL SEGN GRUPO ETREO Y NMERO DE HIJOS
NACIDOS VIVOS - HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA 2007
GRUPO ETREO
(Aos Cumplidos)
15 20 25 30 35 40 45 T o t

2.

Nmero de Hijos Nacidos Vivos


0

5y
+

T O T A L

19
24
29
34
39
44
49
a l

Cuadro Maestra. En este tipo de cuadros todos los criterios de clasificacin de


cada una de las variables son sometidos a una clasificacin cruzada. Esto da
lugar a una perspectiva mucho ms amplia, ya que nos permite obtener datos
de una nica variable o de cualquier combinacin de las variables que entran
en juego en la cuadro.
Ejemplo. El cuadro muestra la composicin por edad, sexo y trabajo de un
grupo de personas con Tuberculosis pulmonar en Cajamarca (Esquema)
durante 2007.

CUADRO 07
PERSONAS CON TBC SEGN EDAD, CONDICIN LABORAL Y SEXO - DISTRITO DE
CAJAMARCA - 2007

EDAD

TRABAJADORES
NO TRABAJADORES
T O T A L
Hombr Mujere
Hombr Mujere
Hombr Mujer
Total
Total
Total
es
s
es
s
es
es

15 19
20 24
25 29
.
.
.
50 54
55 59
60 +
TOTAL
29 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Nota: Con este tipo de cuadros podemos extraer datos de las personas que padecen
Tuberculosis en un determinado intervalo de edad (A), tambin del total de
personas que no trabajan y han contrado la TBC (B), y del total de mujeres, ya
sean trabajadoras o no, que tienen tuberculosis (C).

2.2. Cuadros de Frecuencias de Variables Discretas


Para este tipo de variables cuyo valor slo se puede expresar por nmero enteros
positivos, los datos que caen dentro de cada clase.
Elementos de un cuadro de Frecuencia
Frecuencias Absolutas o Repetidas (fi o ni).- Es el nmero de veces que se repite

un determinado valor de la variable.


Frecuencia Relativa (hi ).- Es el cociente de:

hi

ni

Frecuencia absoluta o Repeticiones


Nmero de Observaciones

CUADRO N 7.8
NUMERO DE NACIMIENTOS EN EL DEPARTAMENTO DE LAMBAYEQUE,
POR PROVINCIAS 2004
Nmero de
Provincias
Porcentaje de Nacimientos
Nacimientos
Lambayeque

n1 = 325

Chiclayo

n2 =330

Ferreafe

n3 = 289

Total

n = 944

30 Mg. Miguel Angel Macetas Hernndez

n1 325x100

34,43
n
944
n
330x100 35,96
h2 2
n
944
n
289x100 30,61
h3 3
n
944
h1

100,00

Estadstica General 2013


Ejemplo con variables cualitativas
Ejemplo. El restaurante "Hay Que Rico" en la ciudad de Chiclayo, usa un cuestionario
para conocer la opinin de sus clientes sobre el servicio, la calidad de los alimentos, los
ccteles, los precios y el ambiente del restaurante en el mes de julio del 2005. Cada
caracterstica se valora en una escala: notable (O), muy bueno (V), bueno (G), mediano (A)
y malo (P). Elabore un cuadro estadstico
G
O
V
G
A
O
V
G
O
V
A
G
V
O
P
V
O
G
A
O
O
O
G
O
V
V
A
G
O
V
P
V
O
O
G
O
O
V
O
G
A
O
V
O
O
G
V
A

Aplicacin de la funcin de Excel en la Elaboracin de Tablas con variables cualitativas

Figura N 03 Ingreso de los datos


Paso.- 1 Se ubica en la celda A1 (Calidad) Insertar se selecciona tabla dinmica

Figura N 04 Seleccin de la tabla dinmica


31 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013

Paso.- 2 En la ventana de Crear tabla dinamica se elije donde se desea colocar el


informe de la tabla dinamica

Figura N 05 Crear tabla dinamica

Paso.- 3 En la ventana de lista de campos de la tabla dinmica se selecciona la variable


Calidad en Etiqueta de la fila y de columnas y en valores

Figura N 06 Seleccionar campos para agregar al informe


32 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Paso.- 4 Insertamos un grfico un dinmico de barras

Figura N 07 Insertar grafico

Paso.- 4 Presentacin del grfico de barras de la variable calidad

Grafico N 01: Grafico de Barras de la variable calidad

33 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Ejemplo:
En un estudio de mercado para determinar la aceptacin de un centro comercial Shopping Plaza
por departamentos ubicada en la ciudad de Cajamarca, se eligi una muestra de 35 clientes para
conocer sus impresiones. Los resultados son los siguientes:
Gasto
Ingreso
Nmero Forma de
Cliente
Razn de visita
semanal
Mensual
de hijos
Pago
1
Oferta permanente
66.00
1200
2
Efectivo
2
Guardera
72.50
1500
1
Crdito
3
Tarjeta de crdito
79.10
2100
3
Crdito
4
Oferta permanente
82.70
2000
3
Efectivo
5
Guardera
55.30
1500
1
Efectivo
6
Parking amplio
100.10
2200
2
Crdito
7
Aire acondicionado
35.30
1450
3
Efectivo
8
Tarjeta de crdito
60.40
1310
1
Crdito
9
Aire acondicionado
57.20
1150
2
Efectivo
10
Parking amplio
140.00
2320
0
Crdito
11
Tarjeta de crdito
69.10
1350
2
Efectivo
12
Parking amplio
73.10
1640
1
Crdito
13
Guardera
75.30
1680
3
Crdito
14
Aire acondicionado
30.00
1100
0
Efectivo
15
Parking amplio
95.20
1850
2
Efectivo
16
Guardera
65.30
1410
1
Efectivo
17
Tarjeta de crdito
68.00
1580
3
Crdito
18
Parking amplio
115.30
2110
0
Efectivo
19
Parking amplio
130.20
2180
2
Crdito
20
Aire acondicionado
48.40
1640
3
Crdito
21
Guardera
86.00
1840
2
Crdito
22
Parking amplio
102.20
1950
3
Efectivo
23
Oferta permanente
50.10
1230
2
Efectivo
24
Tarjeta de crdito
101.20
2000
2
Crdito
25
Parking amplio
102.20
2810
3
Crdito
26
Oferta permanente
58.10
1530
4
Efectivo
27
Tarjeta de crdito
90.30
1980
2
Crdito
28
Parking amplio
119.10
2900
4
Crdito
29
Oferta permanente
125.10
2680
3
Efectivo
30
Tarjeta de crdito
70.20
1970
2
Crdito
31
Parking amplio
118.40
2560
3
Crdito
32
Oferta permanente
110.10
2180
4
Crdito
33
Tarjeta de crdito
84.30
1980
3
Efectivo
34
Oferta permanente
77.20
2050
2
Crdito
35
Oferta permanente
104.20
2500
4
Crdito

34 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Se copia (Ctrl + C) y se pega (Ctrl + V) al Minitab las 35 observaciones

Figura N 08: Pantalla del Minitab ingresado los datos

35 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


A. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS: Realizamos
la tabulacin de la variable Razn de visita procedemos a ejecutar en el Minitab
MINITAB: Tabla de frecuencias
1. Paso 1 .- Estadsticas/Tablas/cuenta de variables individuales

Figura N 09 Estadsticas/Tablas/cuenta de variables individuales


2. Paso 2.- En la ventana cuenta de variables individuales se selecciona la variable
Razn de Visita. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajes
acumulados. Aceptar

Figura N 10 Ventana cuenta de variables individuales


Resultado del procesamiento en Minitab

36 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013

Figura N 11 Cuenta de la variable Razn de visita

B. REPRESENTACIN GRAFICA DE LA VARIABLE CUALITATIVAS: Realizamos la


tabulacin de la variable Razn de visita procedemos a ejecutar en el Minitab
1. Grafico Circular.- Se trabaja con los valores de las frecuencias Absolutas (n i)
frecuencias relativas (hi) como la variables seleccionada es variable cualitativa
(Razn de Visita)
Paso 1 .- Grfica/Grfica Circular

Figura N 12 Grfico circular en minitab

37 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Paso 2 .- En la ventana de Grafica circular se selecciona Variables Categrica:
Razn de visita

Figura N 13 Grafica Circular


Paso 3 .- En la ventana de Grafica circular se selecciona Etiquetas
Seleccionar la pestaa Etiqueta de divisin de la grfica circular con: Nombre de
categora/ Porcentaje /Dibujar una lnea de la etiqueta a la divisin

Figura N 14 Etiqueta de divisin de la grfica circular

38 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Grfica circular de Razn de visita
Aire acondicionado
11.4%
Tarjeta de crdito
22.9%

Categora
Aire acondicionado
Guardera
Oferta permanente
Park ing amplio
Tarjeta de crdito

Guardera
14.3%

Park ing amplio


28.6%

Oferta permanente
22.9%

Grfico N 02 Grfico Circular de Razn de visita

2. Grfico de Barras.- En el eje horizontal representa los valores o las categoras y


en el eje vertical se presentan los valores de las frecuencias Absolutas (ni)
frecuencias relativas (hi) como la variables seleccionada es variable cualitativa
(Razn de Visita)
Paso 1 .- Grfica/Grfica de barras

Figura N 15 Grfico barras en minitab

39 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Paso 1 .- En la ventana Grfica de barras
Las barras representan: Conteos de valores nicos
Barras simples/ Aceptar

Figura N 16: Grfica de barras


Paso 2.- En la ventana Grfica de barras Conteo de valores nicos, simples se
selecciona la variable categrica: Razn de visita y se selecciona Opciones de
grficas

Figura N 17: Grfica de barras Conteo de valores nicos, simples

40 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Paso 3.- En la ventana Grfica de barras Opciones de grficas
Ordenar grupos de X principal por Y descendente/Aceptar

Figura N 18: Grfica de barras Opciones


Paso 4.- En la ventana Grfica de barras Conteo de valores nicos, simples se
selecciona Etiquetas
En Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar

Figura N 19: Grfica de barras Etiquetas

41 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Grfica de Razn de visita
10

10

Conteo

6
5
4

Parking amplio

Oferta permanente Tarjeta de crdito

Razn de visita

Guardera

Aire acondicionado

Grfico N 03 Grfico de barras Razn de visita

C. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUANTITATIVAS


DISCRETAS: Realizamos la tabulacin de la variable Nmero de hijos procedemos a
ejecutar en el Minitab
1. Paso 1 .- Estadsticas/Tablas/cuenta de variables individuales

Figura N 20 Estadsticas/Tablas/cuenta de variables individuales


42 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


2. Paso 2.- En la ventana cuenta de variables individuales se selecciona la variable
Nmero de hijos. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajes
acumulados. Aceptar

Figura N 21 Ventana cuenta de variables individuales

Resultado del procesamiento en Minitab

Figura N 22 Cuenta de la variable Nmero de hijos

D. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS DISCRETAS: Realizamos la


tabulacin de la variable Nmero de hijos procedemos a ejecutar en el Minitab
1. Grfico de Barras.- Se trabaja con los valores de las frecuencias Absolutas (ni)
frecuencias relativas (hi) como la variables seleccionada es variable discreta
Nmero de hijos

43 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Paso 1 .- En la ventana Grfica de barras
Las barras representan: Conteos de valores nicos
Barras simples/ Aceptar

Figura N 23: Grfica de barras


Paso 2.- En la ventana Grfica de barras Conteo de valores nicos, simples se
selecciona la variable categrica: Nmero de hijos y se selecciona Opciones de
grficas

Figura N 24: Grfica de barras Conteo de valores nicos, simples


Paso 3.- En la ventana Grfica de barras Opciones de grficas
Ordenar grupos de X principal por Y descendente/Aceptar
44 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013

Figura N 25: Grfica de barras Opciones


Paso 4.- En la ventana Grfica de barras Conteo de valores nicos, simples se
selecciona Etiquetas
En Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar

Figura N 26: Grfica de barras Etiquetas


Salida de Minitab
Grfica de Nmero de hijos
12

12
11

10

Conteo

8
6

5
4

2
0

1
Nmero de hijos

Grfico N 04 Grfico de barras Nmero de hijos


45 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


2.3. Cuadros de Frecuencias de Variables Continuas
Los sueldos mensuales en dlares de 60 empleados de la empresa Z.S.A., son los
siguientes:
440 560

335

587

613

400

424

466

565

393

453 650

407

376

470

560

321

500

528

526

570 430

618

537

409

600

550

432

591

428

440 340

558

460

560

607

382

667

512

492

450 530

501

471

660

470

364

634

580

450

574 509

462

380

518

480

625

507

645

382

Construir un cuadro de Frecuencias se aplica el procedimiento siguiente:


Poblacin: Empleados de la empresa Z.S.A (n = 60)
Variable:

X = sueldo mensual en dlares.

Datos:

Xi = sueldo mensual en dlares


Xi (i =1, 2, 3,.....,60)

n =60 trabajadores

Determinamos el mximo y mnimo de Xi, el sueldo ms alto (Xmax) y el sueldo mnimo


(Xmin).
X38 = Xmax = 667

X17 = Xmin = 321

1. Recorrido(R): Xmax Xmin = 667 321 =346


2. Elegimos el nmero de Intervalos (m). Se puede considerar 5 15 intervalos
Si aplicamos:
Para calcular el nmero de clases de un cuadro de frecuencias podemos usar las
siguientes expresiones frmulas:

a) Raz cuadrada

b) Regla de Sturges m =

1 + 3.322 Log(n)

1 + 3.322 Log(60)

7 intervalos

c) Regla de Stockes

46 Mg. Miguel Angel Macetas Hernndez

( )
( )

Estadstica General 2013


3. Determinar la amplitud de los intervalos (C)

ci

X max X min 667 321

49,4285.......
m
7

Se puede redondear a 50
4. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o
segmentos, cuyo extremos son:
I1
320

370

I2

I3

420

I4
470

I5
520

I6
570

I7
620

670

Utilizaremos un concepto matemtico de intervalo abierto (parntesis) y de intervalo


cerrado (corchete). Donde (Li-1 Li] significa que est abierto por la izquierda y
cerrado por la derecha, es decir que en cada intervalo no est incluida el extremo
inferior (Li-1) pero si lo est el extremo superior (Li).
Forma de expresar:
Intervalo de clase
(Li-1 Li]
320 370
370 420
420 470
470 520
520 570
570 620
620 670
Punto medio de cada intervalo, es la MARCA DE CLASE se denota con yi donde
320 370
y1
345
2

y4

y7
47 Mg. Miguel Angel Macetas Hernndez

470 520
495
2

620 670
645
2

Estadstica General 2013


5. Elementos de una cuadro de frecuencia, en toda cuadro de frecuencia se
identifica los siguientes elementos:

a) Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi de la


variable X, el nmero de veces ni que se repite ese valor.

b) Frecuencia relativa (hi): Se denomina frecuencia relativa del valor xi de la variable


X la relacin por cociente entre el nmero de veces que aparece el valor xi y el
nmero total de valores de la variable (N). h i

c) Frecuencia

absoluta

acumulada

(Ni):

ni
n
Se

denomina

frecuencia

absoluta

acumulada del valor n i a la suma de las frecuencias absolutas de los valores de la


variable X anteriores o iguales a n i . Su valor es N i ni con j = 1......i

d) Frecuencia relativa acumulada (Hi): Es la frecuencia absoluta acumulada dividida


por el nmero total de valores de la variable. Su valor es Hi =

Ni
.
N

De todas estas definiciones se extraen las siguientes deducciones:


La

suma de las frecuencias absolutas sin acumular es igual al nmero total de los (

,= N)

La ltima frecuencia relativa acumulada es el total de elementos (n).

La suma de todos las frecuencias relativas acumular es igual

La ltima frecuencia relativa acumulada es la unidad

La distribucin de frecuencias de una variable suele presentarse ordenadamente


mediante la tabla de frecuencias siguiente:

48 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Marca
de
clase

Frecuencia
Absolutas

Frecuencias
Absolutas
Acumuladas

Frecuencias
Relativas

Frecuencias Relativas
Acumuladas

Li]

xi

ni

Ni

hi

Hi

<L 1 L 2 ]

x1

n1

Intervalos
de clases

<Li-1

<L2, L3]

<L3, L4]

x2

x3

n2

n3

N1=n1

h1=

N2 = n1+n2

N3 =n1+n2+n3

.
.
.

.
.
.

.
.
.

.
.
.

<Lk-1, L k]

xk

nK

Nk = n1+...+nK=n

Total

ni =n

n1
N
n

h2=

H2=

H3=

N
N

.
.
.
hk =

N1

N
n

h3=

H1=

.
.
.
nk

Hk =

Nk

=1.00

hi =1

Los Intervalos pueden ser de la


siguiente manera:
<Li-1 Li]
<Li-1 Li>
[Li-1 Li>
[Li-1 Li]

Lectura de la informacin debe considerar los Signos y Smbolos siguientes:


()

No existe el fenmeno que trata

(0)

La cantidad no alcanza a la mitad de la unidad tomada como base

()

Informe no disponible.

49 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Aplicacin de la funcin de Excel en la Elaboracin de Tablas
Se ingresa los datos sobre el sueldo mensual en dlares de 60 empleados de la empresa
Z.S.A., en una columna desde la celda A1 hasta la celda A61.

Determinamos el mximo y mnimo de Xi, el sueldo ms alto (Xmax =MAX(A2:A61) =


667 y el sueldo mnimo (Xmin =MIN(A2:A61). = 321
1. Rango Recorrido(R): Xmax Xmin = 667 321 =346
Restamos la Celda A2 menos la Celda A3

2. Elegimos el nmero de Intervalos (m). Se puede considerar 5 15 intervalos


Si aplicamos:

Para calcular el nmero de clases de un cuadro de frecuencias podemos usar las


siguientes expresiones frmulas:
a) Regla de Sturges m =
m

1 + 3.322 Log(n)
1 + 3.322 Log(60)= 6.907
=1+3.322*LOG(CONTAR(A2:A61))

Para

redondear

un

entero

=MULTIPLO.SUPERIOR(D7,1)
50 Mg. Miguel Angel Macetas Hernndez

superior

se

utiliza

la

siguiente

funcin

Estadstica General 2013


m

7 intervalos

3. Determinar la amplitud de los intervalos (C)

ci

X max X min 667 321

49,4285.......
m
7

Se divide el rango y el nmero de Intervalos =D5/E7. Tambin redondear a un


entero superior =MULTIPLO.SUPERIOR(D9,1) Se puede redondear a 50

4. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o


segmentos, cuyo extremos son:

Utilizaremos un concepto matemtico de intervalo abierto (parntesis) y de intervalo


cerrado (corchete). Donde (Li-1 Li] significa que est abierto por la izquierda y
cerrado por la derecha, es decir que en cada intervalo no est incluida el extremo
inferior (Li-1) pero si lo est el extremo superior (Li).
Forma de expresar:
I1

320

I2

370

I3

420

I4

470

I5

I6

I7

520

570

620

670

En el primer intervalo I1 en el lmite inferior la observacin mnima se le resta una


observacin porque es intervalo abierto (321 1 = 320), para el lmite superior al valor
obtenido en el lmite inferior se suma la amplitud (se fija la amplitud con F4)=E16+$E$9
En el segundo intervalo I2 en el lmite inferior es =F16, para para el
=E17+$E$9

51 Mg. Miguel Angel Macetas Hernndez

lmite superior

Estadstica General 2013

5. Elementos de una cuadro de frecuencia, en todo cuadro de frecuencia se


identifica los siguientes elementos:

a) Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi de la


variable X, el nmero de veces ni que se repite ese valor.

Para calcular la Frecuencia absoluta en Excel se tendr que activar Archivo


Opciones Complementos Ir Herramienta para anlisis
Se selecciona el Rango de entrada desde la celda A2 hasta A61 y el Rango de
Clase F:16 hasta F22

52 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013

Por lo tanto las frecuencias quedan determinadas de la siguiente manera


b) Frecuencia relativa (hi): Se denomina frecuencia relativa del valor xi de la variable
X la relacin por cociente entre el nmero de veces que aparece el valor xi y el
n
nmero total de valores de la variable (N). h i i
n
Se divide H16/$H$23
c) Frecuencia absoluta acumulada (Ni): Se denomina frecuencia absoluta
acumulada del valor n i a la suma de las frecuencias absolutas de los valores de la
variable X anteriores o iguales a n i . Su valor es N i ni con j = 1......i

d) Frecuencia relativa acumulada (Hi): Es la frecuencia absoluta acumulada dividida


N
por el nmero total de valores de la variable. Su valor es Hi = i .
N

53 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013

Figura:

54 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


E. DISTRIBUCIN DE FRECUENCIAS, DE LA VARIABLE CUANTITATIVA CONTINUA: Se trabajara con
la variable Gasto semanal en la tienda VENDO
Calculo previos para tabular la variable
Paso 1.- Hallar el rango o amplitud de los datos
Rango = Observacin mayor Observacin menor

Rango = 140.0 30.0 = 110.0


Clculos del Rango con el Minitab

Figura N 19: Calculo del Rango

Figura N 20: Calculo de las observaciones mnimas, mximas y el rango

55 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013

Figura N 21: Calculo del Rango


Pas 2.- Hallar el nmero de Intervalos (m) Dos maneras:
a) Por la experiencia del investigador, usualmente
5 m 15
b) Por la frmula de Sturges
m = 1 + 3.322 log
(n)
m = 1 + 3.322 log (35) = 6.12939 6 Intervalos
Seleccionamos Calc para calcular nmero de clases

Figura N 22: Clculo de Nmero de Intervalos

56 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Paso 3.- Hallar la amplitud de los intervalos (C)

Redondeo por exceso


Igual # decimales que los datos

Paso 4.- Hallar los intervalos de clase


Li-1 = lmite inferior de la clase i
Li = lmite superior de la clase i
Intervalos de clases
[Li-1

Frecuencia
Absolutas

Li>

ni

[ Observacin menor L 2 >

n1

N1=n1

[L2, L3>

n2

N2 = n1+n2

[L3, L4>

n3

N3 =n1+n2+n3

.
.
.

.
.
.

.
.
.

Lk-1, L k>

nK

Nk = n1+...+nK=n

Total

Los intervalos son los siguientes:


[Li-1
[L1 = obs. menor = 30.0
[L2
[L3
[L4
[L5
[L6

Frecuencias
Absolutas
Acumuladas
Ni

ni =n

Li>
L1 = L1 +IC = 48.4>
L2 = 66.8>
L3 = 85.2>
L4 = 103.6>
L5 = 122.0>
L7 = 140.4>

= 48.4
= 66.8
= 85.2
= 103.6
= 122.0

Paso 5- Tabulacin de los datos (conteo de datos)


Gasto mensual
[Li-1

Li>

Frecuencia Frecuencia
absoluta ni relativa hi %

Frecuencia
acumulada
absoluta Ni

Frecuencia
acumulada
relativa Hi %

[ 30.0 48.4>
[ 48.4 66.8>
[ 66.8 85.2>
[ 85.2 103.6>
[103.6 122.0>

2
8
10
7
5

5.71
22.86
28.57
20.00
14.29

2
10
20
27
32

5.71
28.57
57.14
77.14
91.43

[122.0 140.4]

8.57

35

100.00

Nota: Creamos una nueva variable denominada Gastos en la columna C8


Paso 6- Tabulacin de los datos (conteo de datos) con Minitab. Seleccionamos Datos/
Codificar/ Numrico a numrico
57 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013

Figura N 23: Codificar de Numrico a numrico


Pas 6- En la ventana Cdigo Numrico a numrico se ingresan los valores de los
intervalos mencionando a que intervalo corresponde:

Figura N 24: En la ventana Cdigo Numrico a numrico se ingresan los valores

58 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Pas 7- Mostrar los intervalos con sus respectivos frecuencias absolutas y relativas.
Seleccionamos Estadsticas/Tablas/Cuentas de variables individuales seleccionamos C8:
Gastos en la ventana de variables. Tambin Conteos/Porcentajes/Conteos acumulados y
porcentaje acumulados.

Figura N
24: Cuentas de variables individuales

Figura N 25: Cuentas de variables: Gastos

59 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


F. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS CONTINUA: Realizamos la
tabulacin de la variable Gasto semanal procedemos a ejecutar en el Minitab
Calculo previos para tabular la variable
1. Histogramas Se utilizan para variables continuas o para variables discretas, con un gran
nmero de datos, y que se han agrupado en clases.

Paso 1.- Seleccionamos Grfica/Histograma

Figura N 25: Seleccionar Histogramas


Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar

Figura N 26: Ventana Histogramas

60 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Paso 3.- En la ventana Histograma simple en la ventana de Variables grficas:
Gasto semanal

Figura N 27: Histograma simple


Paso 4.- Se selecciona Escala selecciona Tipo de escala Y

Figura N 28: Histograma Escala

61 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


Paso 5.- En la ventana Histograma Escala/tipo de escala Y/Porcentaje

Figura N 29: Histograma Escala


Paso 6.- Se ejecuta doble click en el Histograma en el eje de X
Histograma de Gasto semanal
25

Porcentaje

20

15

10

30

45

60

75
90
Gasto semanal

105

120

Grfico N 03: Histograma de Gasto semanal

62 Mg. Miguel Angel Macetas Hernndez

135

Estadstica General 2013


Paso 7.En la ventana Editar Escala se seccionamiento: Tipo de
intervalo/Punto de corte. En Definicin de intervalo/posiciones de punto
medio/punto de corte: 30:140.4/18.4/Aceptar

Amplitud del
intervalo
Observacin
Mnima

Observacin
Mxima

Figura N 30: Histograma Escala

Histograma de Gasto semanal


30
25

Porcentaje

20
15
10
5
0

30.0

48.4

66.8

85.2
103.6
Gasto semanal

122.0

140.4

Grfico N 04: Histograma de Gasto semanal


2. Histogramas Se construye con cada punto medio o marca de clase (Xi) de cada
63 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2013


intervalo se levanta un segmento de altura igual a la respectiva Frecuencias
Absolutas (ni hi).
Paso 1.- Se copia la marca de clase y frecuencia relativa

Se agrega una clase:


39.2 18.4 =20.8

Se agrega una clase:


131.2 + 18.4 = 149.6

Figura N 31: Marca de clase y Frecuencia Relativa

Paso 2.- Seleccionamos Grfica/ Grfica de dispersin

Figura N 31: Grfica de dispersin

64 Mg. Miguel Angel Macetas Hernndez

Frec. Rela
h = 0.00

Frec. Rela
h = 0.00

Estadstica General 2012


Paso 3.- En la ventana Grfica de dispersin con lnea de conexin

Figura N 32: Grfica de dispersin

Paso 4.- En la ventana Grfica de dispersin con lnea de conexin:


Se agrega en la Variables Y: Frec. Rela y Variables X: Marca de Clase

Figura N 32: Grfica de dispersin con lnea de conexin

Pas 5.- En la Grfica de Frec. Rela vs Marca de Clase


Doble Crick en eje de Y en la frecuencia Relativa se muestra la venta Editar escala

65 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Grfica de dispersin de Frec. Rela vs. Marca de clase
30
25

Frec. Rela

20
15
10
5
0
20

40

60

80
100
Marca de clase

120

140

160

Grfico N 05: Polgono de frecuencia de Gasto semanal


Pas 6.- En la venta Editar escala en el Rango de escala/Mnimo =0/ Aceptar

Figura N 32: Editar escala

66 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Grfica de dispersin de Frec. Rela vs. Marca de clase
30
25

Frec. Rela

20
15
10
5
0

20

40

60

80
100
Marca de clase

120

140

160

Grfico N 05: Polgono de frecuencia de Gasto semanal


3. Polgonos Acumulativos de Frecuencias (Ojiva). Aquellos que se desarrollan mediante la
marca de clase que tiene coincidencia con el punto medio de las distintas columnas del
histograma. En el momento de la representacin de todas las frecuencias que forman parte
de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladas que
posibilita la diagramacin del polgono correspondiente.
Paso 1.- Seleccionamos Grfica/Histograma

Figura N 33: Seleccionar Histogramas

67 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar

Figura N 34: Ventana Histogramas


Paso 3.- En la ventana Histograma simple en la ventana de Variables grficas: Gasto
semanal

Figura N 35: Histograma simple

68 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Paso 4.- Se selecciona Escala selecciona Tipo de escala Y

Figura N 36: Histograma Escala


Paso 5.- En la ventana Histograma Escala/tipo de escala Y/Porcentaje

Figura N 37: Histograma Escala


Pas 6.- Doble Click en eje de Gasto mensual donde se presenta la ventana Editar escala

69 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Histograma de Gasto semanal

Porcentaje acumulado

100

80

60

40

20

30

45

60

75
90
Gasto semanal

105

120

Grfico N 06: Polgono de frecuencia Acumulada


Pas 7.- En la ventana de Editar Escala/Tipo intervalo/Punto de corte
Posiciones de punto medio/punto de corte: 30:140.4/18.4 Aceptar

Figura N 38: Ventana de Editar Escala

70 Mg. Miguel Angel Macetas Hernndez

135

Estadstica General 2012


Histograma de Gasto semanal

Porcentaje acumulado

100

80

60

40

20

30.0

48.4

66.8

85.2
103.6
Gasto semanal

122.0

140.4

Grfico N 06: Polgono de frecuencia Acumulada

4. Diagrama de Tallos y hojas: Permite obtener simultneamente una distribucin de


frecuencias de la variable y su representacin grfica. Para construirlo basta separar en cada
dato el ltimo dgito de la derecha (que constituye la hoja) del bloque de cifras restantes (que
formar el tallo).
Paso 1.- Seleccionamos Tallo y Hoja.

Figura N 38: Seleccionar Tallo y Hoja

71 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Grficos Estadsticos

Primero definir lo que es un grfico o diagrama en estadstica.

Un diagrama es una especie de esquemtico, formado por lneas, figuras, mapas,


utilizado para representar, bien datos estadsticos a escala o segn una cierta
proporcin, o bien los elementos de un sistema, las etapas de un proceso y las
divisiones o subdivisiones de una clasificacin. Entre las funciones que cumplen los
diagramas se pueden sealar las siguientes:
Hacen ms visibles los datos, sistemas y procesos
Ponen de manifiesto sus variaciones y su evolucin histrica o espacial.
Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de

un proceso y representar la correlacin entre dos o ms variables.


Sistematizan y sintetizan los datos, sistemas y procesos.
Aclaran y complementan las cuadros y las exposiciones tericas o cuantitativas.
El estudio de su disposicin y de las relaciones que muestran pueden sugerir

hiptesis nuevas.

Algunos de los diagramas ms importantes son el diagrama en rbol, diagrama de


reas o superficies, diagrama de bandas, diagrama de barras, diagrama de bloques,
diagrama circular, diagrama circular polar, diagrama de puntos, diagrama de tallo y
hoja diagrama, histogramas y grficos de caja y bigote o boxplots.
Clasificacin De Los Grficos
Los grficos podemos clasificarlos en la siguiente forma:
A.

Grficos de coordenadas ortogonales.


Con divisiones equidistantes: Cronodiagrama, historiograma, histograma y
polgono acumulativo, grfico en Z, grfico en escalera, grfico de banderola,
grfico mixto (La Banda Flaman), curva de frecuencia, estereograma, grfico
de Gantt, grfico de barras, etc
Con

divisiones

semi-equidistantes:

logartmico.

72 Mg. Miguel Angel Macetas Hernndez

Cuadriculado

logartmico

semi-

Estadstica General 2012


B.

Grficos de coordenadas seudo-ortogonales.

C.

Grficos de coordenadas no ortogonales.


Grficos de coordenadas polares, grfico en espiral, grfico triangular
equiltero, etc.

D.

Grficos sin coordenadas.

De superficies: Grficos de sectores, grficos geomtricos diversos.


De volmenes: Cubo, esfera, etc.
De figuras (pictrico).
Cartograma de sealizacin y densidad.

73 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


GRFICOS DE LA DISTRIBUCIN DE FRECUENCIAS

Las frecuencias (ni, hi, Ni, Hi) siempre son cantidades no negativas ( 0), por lo tanto el
grafico de las frecuencias sean para variables discretas como para variables
Abscisas continuas, se construye en el primer cuadrante del plano cartesiano o rectangular. En
eje de las abscisas (horizontal) se indican los valores de la variable (sean puntos o
intervalos), y en el eje de las ordenadas (vertical) se anota el valor de la respectiva
frecuencia.
i.

Frecuencias de variable Discreta


La representacin grfica de las (ni hi) se hace mediante el Diagrama de Frecuencia.
Par el efecto, en el eje horizontal se representan los valores Yi, y en el eje verticales
representa los valores de las frecuencias (ni hi)
ni

2
0

Frecuencia Absolutas

1
8
1
5

Opinin
de los
Clientes
A
G
O
P
V
Total

1
2
1
0

1
0

6
5

2
0

Frecuenc Frecuen
ia
cia
absoluta Relativa
ni
hi %
6
12,5
10
20,8
18
37,5
2
4,2
12
25,0
48
100,0

Opinin de los Clientes

Al considerar las frecuencias absolutas acumuladas o relativas acumuladas, la


representacin grfica se hace mediante el GRFICO ACUMULATIVO DE
FRECUENCIAS. En el eje horizontal se colocan los valores de la Marca de Clase (X i), y en
el eje vertical los valores Ni Hi, a continuacin, a partir de cada extremo de los segmentos
se traza tramos horizontales formando una escalera como se aprecia en el siguiente grafico
Intervalo
s de
clases
(Li-1 L i
]
16 27
27 38
38 49
49 60
60 71
71 82
82 93
Total

Marca
de
clase
Xi
21,5
32,5
43,5
54,5
65,5
76,5
87,5

Frecuenci
Frecuen
as
cia
Absolutas
Absolut
Acumula
as
das
ni
Ni
3
3
5
8
10
18
3
21
8
29
7
36
4
40
40

Frecuencias Absolutas
Acumuladas

Ordenadas

E.

74 Mg. Miguel Angel Macetas Hernndez

45
40
35
30
25
20
15
10
5
0
0

20

40

60

Marca de Clase

80

100

Frecuencia Absoluta

Estadstica General 2012


En el caso de Grficos de
Barras, en el eje horizontal
representa los valores de Yi, y
en el eje vertical se presentan
los valores de las frecuencias
Absolutas (ni hi)

18

18
16
14
12
10
8
6
4
2
0

12
10
6
2

Opinin de los Clientes

Opinin
de los
Clientes

Para los Grficos de Sectores


Circulares Pastel, se
convierten los valores de
las frecuencias Absolutas
(ni hi) a grados mediante

12,5

360 x12,5

En
Grad
os
45.0

100

10

20,8

360 x20,8

12.5%

25.0%

74.9

100

O
P
V
Total

360xhi %
100

ii.

Frecuen Frecuen Convierten


cia
cia
hi %
absoluta Relativa A Grados
ni
hi %

18
2
12
48

20.8%

37,5
4,2
25,0
100,0

135.0
16.3
91.8

4.2%

37.5%

Frecuencias de variable Continua


En el caso ms general, las variables continuas se agrupan en cuadros de frecuencias
con intervalos, por lo tanto se trata de representar grficamente intervalos en el eje
horizontal.
La representacin grfica de las frecuencias (absolutas o relativas) se hace mediante
el Histograma de Frecuencias, que est constituido por un conjunto de rectngulos,
cuya base es igual a la amplitud de un intervalo y la altura igual a la respectiva
frecuencia. Para construir el histograma de frecuencias, se indican en el eje horizontal
ni

Intervalo
s de
clases
(Li-1 L i ]

Frecuencia Absolutas

10
8
6
4
2
0
0

16

27

38

49

60

Lmite inferior

71

82

93

16 27
27 38
38 49
49 60
60 71
71 82
82 93
Total

Frecuen
cia
Absoluta
s
ni
3
5
10
3
8
7
4
40

Otro grfico que se usa para representar las frecuencias es el Polgono de Frecuencias,
que se construye como sigue: en cada punto medio o marca de clase (X i) de cada intervalo
se levanta un segmento de altura igual a la respectiva frecuencias Absolutas (ni hi), luego
une los extremos con una lnea poligonal, resultando el Polgono de Frecuencias. Para
completar los extremos, se extiende el polgono en media amplitud de cada extremo.

75 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012

Li ]

10.5
21,5
32,5
43,5
54,5
65,5
76,5
87,5
98.5

16 27
27 38
38 49
49 60
60 71
71 82
82 93
Total

12
10
8
6
4
2
0
0

10.5

21.5

32.5

43.5

54.5

65.5

76.5

87.5

98.5

Marca de clase

Por su parte, las frecuencias acumuladas (Absolutas o Relativas) se grafican mediante los
Polgonos Acumulativos de Frecuencias (Ojiva). De igual manera, en el eje horizontal
se ubican los extremos los intervalos y en el eje vertical lo valores de N i, Hi. En el extremo
superior de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencia
absoluta, luego partiendo del extremo inferior del primer intervalo se une, con segmentos
de recta, los extremo de los segmentos verticales, obteniendo una lnea poligonal que, a
partir de la ltima frecuencia acumulativa, se extiende paralelamente al eje horizontal,
obtenindose la grfica del Polgono Acumulativo de Frecuencias

35
30

16 27

21,5

27 38

32,5

38 49

43,5

10

18

49 60

54,5

21

60 71

65,5

29

71 82

76,5

36

82 93

87,5

40

20
15
10

40

76 Mg. Miguel Angel Macetas Hernndez

27

38

49

60

71

82

93

Intervalo
de Clase

Grfico N 3.3: Diagrama de dispersin


Demanda de cobre refinado en China
(miles de toneladas mtricas)
2000
1800
1600
1400
1200
1000
800
600
400
200

Aos (variable independiente = X)

2003

2002

2001

2000

1999

1998

1997

1996

Demanda de cobre en China


505
600
850
1000
770
1125
1240
1260
1380
1550
1660
1750
1840
1900

16

1995

Aos
1990
1991
1992
1993
1994
1995
1996
1997
2008
1999
2000
2001
2002
2003

Demanda de cobre en China


(variable dependiente = Y)

Total

25

1994

Ni

40

1993

ni

1992

Xi

45

1991

Intervalos
de clases
<Li-1 Li]

Frecuencia
Frecuenci
s Absolutas
a
Acumulada
Absolutas
s

1990

Marca
de clase

Frecuencias Absolutas
Acumuladas

(Li-1

Frecuen
cia
Absoluta
s
ni
0
3
5
10
3
8
7
4
0
40

Marca
de
clase
Xi

Frecuencia Absoluta

Intervalo
s de
clases

Estadstica General 2012


CLASIFICACIN DE LAS
VARIABLES
TAMAO
ESCALA DE
DEL
MEDICIN
RECORRIDO

OBJETIVO DEL GRAFICO


MOSTRAR
DISTRIBUCIN DE
ASOCIACIN ENTRE
FRECUENCIAS
VARIABLES (DOS O
(UNA VARIABLE)
MAS)
BASTONES
1

0
1

I
S
C

BARRAS SIMPLES

BARRAS AGRUPAS

T
8

R
E
T

30

25

20

5
4

15

10

1
0

0
1

A
S

SECTOR CIRCULAR

100

BARRAS
COMPUESTAS

90
80
70
60
50
40
30
20
10
0
1

C
O
N
T
I
N
U
A
S

I
N
T
E
R
V
A
L
O

HISTOGRAMA

40

CORRELACIN

32

30
30

28

26
20

24

22
10

20

18

0
16,0

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

16
0

10

20

30

O
R
A
Z
O
N

POLGONO DE
FRECUENCIAS

LINEAL

60

60

50

50

40

40

30

30

20

20

10

10

0
1

77 Mg. Miguel Angel Macetas Hernndez

9 10 11 12

0
1

Estadstica General 2012


F.

VENTAJAS Y DESVENTAJAS DE LOS GRFICOS


Ventajas de los grficos.
a) Sntesis.- Un cuadro con cifras es difcil de estudiar requiriendo a menudo un
penoso trabajo analtico para poder descubrir las informaciones que contiene.
Por el contrario, mediante un grfico el investigador hace aparecer las
principales caractersticas de una serie estadstica.
b) Descubrimiento.- El grfico permite descubrir hechos esenciales, que
pasaran desapercibidos al simple examen de los cuadros numricos.
c) Control.- Permite descubrir anomalas de clculo o tipogrficas, que no son
fciles de hallar en los cuadros.
d) Comparacin.- Si el anlisis de los datos de una serie en un cuadro, es una
labor delicada, la confrontacin de los datos de dos series lo es ms todava.
En cambio, los grficos permiten un conjunto de comparaciones a simple vista.
e) Bsqueda de las regularidades.- Los grficos permiten hallar fcilmente la
regularidad de los movimientos de las series cronolgicas. Tambin permite
destacar la alternancia o repeticin de ciertos fenmenos.
El Grfico es un instrumento de investigacin cientfica.
Desventajas de los grficos
a)

Ocultamiento.- El grfico oculta una cierta cantidad de informacin. En este


sentido es menos preciso que un cuadro.

b)

Deformaciones.- Por fallas deliberadas o no en la construccin, puede


introducir importantes deformaciones de los hechos. Un dibujante poco
escrupuloso puede exagerar o reducir, mediante un mal uso de las escalas y
de los trazos, la importancia de un fenmeno. Tal cosa puede ocurrir en
grficos para fines polticos, econmicos o publicitarios.

78 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Construir Una Pirmide Poblacional
Elaborar una pirmide poblacional a partir de datos
1. Abre una nueva hoja de clculo Excel para introducir los datos.
2. Escribe en la primera fila el ttulo de la tabla de Datos: Per 2011.
3. Introduce los grupos de edad en la primera columna:

En la cabecera de la columna escribe: Edad

A continuacin escribe los grupos de Edad: 0-4, 5-9, ..., 80 y ms

Al final de la columna escribe: Total

4. En las siguientes columnas escribe los datos, en el siguiente orden: Hombres,


Mujeres.
Nota: Los datos de que aparezcan en la columna izquierda de la pirmide
(Hombres) deben ser representados con nmeros negativos. Simplemente inserta el
signo - antes de cada valor o crea una nueva columna y multiplica la poblacin
masculina por 1.
5. Ya que estas trabajando con grandes poblaciones, debes ajustar la escala de la
figura, expresando los datos en miles. Puedes hacer esto dividiendo cada celda de
datos por 1.000.
6. Tambin puedes transformar los datos de los distintos grupos de edades en porcentaje
respecto a la poblacin total. En una nueva columna divide el valor del grupo de edad entre
el total de la poblacin.
Creacin del Grfico
1. Selecciona todos los datos -excepto el ttulo y la fila Total- haciendo clic con el ratn y
arrastrando a lo largo de los datos de la tabla (A3:C22).
2. Haz clic en el botn Asistente para grficos.

Paso 1. Elige Tipo de grfico: Barras, y selecciona el subtipo Barra agrupada.


Pulsa el botn Siguiente.

Pas 2. Vers la pirmide. Deja los datos como estn y pulsa Siguiente.

Pas 3. Escribe el ttulo de tu grfico (p.e., Per 2001). Deja los otros cuadros en
blanco, y pulsa el botn Siguiente.

Pas 4. Selecciona el botn En una hoja nueva (llama a esta hoja como desees) y
pulsa el botn Finalizar.

3. Ya tienes tu pirmide. Es hora de mejorar su apariencia:

Arreglar las barras. Haz doble clic en una de las barras del grfico. En el cuadro de
dilogo Formato de la serie de datos, selecciona la pestaa Opciones. Configura
79 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Superposicin a 100 y pulsa Ancho del rango a 0 y pulsa el botn OK. No
cambies nada ms. Las barras del grfico deben aparecer juntas, sin agujeros.

Arreglar el eje vertical (desplazar las etiquetas de edades hacia la izquierda). Haz
doble click en los datos del eje vertical. En el cuadro de dilogo Formato de ejes,
elige la pestaa Tramas y configura los botones de marca de graduacin a Ninguno
y el botn de rtulos a Inferior.

Arreglar el eje horizontal (eliminar los valores negativos del eje hombres). Haz
doble clic sobre los datos del eje horizontal. En la pestaa Nmero selecciona
Categora: Personalizada y escribe en Tipo: 0;0.

Aplica cualquier otro formato para mejorar la apariencia de la pirmide: colores de


las barras, tamao y tipo de fuentes y ttulos, eliminacin de rejilla y fondo...

Edades

Hombres

Mujeres

Totales

Edades

0-4

1266429

1203652

2470081

0-4

-5.5

5.2

5-9

1352926

1298331

2651257

5-9

-5.9

5.6

10-14

1269705

1243519

2513224

10-14

-5.5

5.4

15-19

1154745

1145976

2300721

15-19

-5.0

5.0

20-24

1072826

1097428

2170254

20-24

-4.7

4.8

25-29

918063

958505

1876568

25-29

-4.0

4.2

30-34

857675

894850

1752525

30-34

-3.7

3.9

35-39

768107

816358

1584465

35-39

-3.3

3.5

40-44

691549

729825

1421374

40-44

-3.0

3.2

45-49

561907

592190

1154097

45-49

-2.4

2.6

50-54

449661

471292

920953

50-54

-2.0

2.0

55-59

296106

319847

615953

55-59

-1.3

1.4

60-64

238627

261898

500525

60-64

-1.0

1.1

65-69

177284

204213

381497

65-69

-0.8

0.9

70-74

139265

163512

302777

70-74

-0.6

0.7

75-79

92800

113044

205844

75-79

-0.4

0.5

80 - +

136901

95194

232095

80 - +

-0.6

0.4

Totales

11444576

11609634

23054210

Totales

-49.6

50.4

80 Mg. Miguel Angel Macetas Hernndez

Hombres Mujeres

Estadstica General 2012


Pirmide Poblacional
Mujeres

Hombres

80- +
75-79
70-74
65-69
60-64
55-59
50-54

45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9

0-4
8.0000

6.0000

4.0000

2.0000

0.0000

2.0000

Fuente: Instituto Nacional de Estadstica e Informtica

81 Mg. Miguel Angel Macetas Hernndez

4.0000

6.0000

8.0000

Estadstica General 2012


Ejercicios de variables cualitativas
1. Construye una tabla de distribucin de frecuencia, haz una grfica de barras y un
diagrama de pastel para una muestra de compras de refresco segn la preferencia
de 50 personas:
Coke Classi

Sprite

Coke Classic

Pepsi-Cola

Coke Classic

Coke Classic

Pepsi-Cola

Diet Coke

Coke Classic

Diet Coke

Coke Classic

Coke Classic

Coke Classic

Diet Coke

Pepsi-Cola

Coke Classic

Coke Classic

Dr. Pepper

Dr. Pepper

Sprite

Diet Coke

Coke Classic

Diet Coke

Pepsi-Cola

Pepsi-Cola

Coke Classic

Pepsi-Cola

Pepsi-Cola

Coke Classic

Pepsi-Cola

Coke Classic

Coke Classic

Pepsi-Cola

Dr. Pepper

Pepsi-Cola

Pepsi-Cola

Coke Classic

Coke Classic

Coke Classic

Coke Classic

Sprite

Dr. Pepper

Diet Coke

Diet Coke

Pepsi-Cola

Coke Classic

Pepsi-Cola

Sprite

Sprite

Dr. Pepper

2. Segn Nielsen Media Research, los cinco programas de TV ms vistos a las 8:00 P.M.
del 14 de octubre de 2012 fueron Congo, The X-Files, Holliday in Your Heart, Ellen
Foster y Unhappily Ever After. La lista siguiente es una encuesta entre 50
espectadores.
Unhappily

Ellen

Congo

X-Files

Congo

Ellen

Ellen

X-Files

Ellen

Holliday X-Files

X-Files

Congo

Holliday Congo

Ellen

Congo

Holliday

X-Files

Ellen

Ellen

X-Files

X-Files

X-Files

Ellen

Holliday

Ellen

Ellen

Holliday Holliday Ellen

Unhapily

X-Files

Holliday

X-Files

X-Files

Congo

Holliday

Ellen

Holliday

Ellen

Holliday X-Files

Congo

Congo

Holliday

Ellen

Ellen

Ellen

X-Files

a) Traza una grfica de barras y un diagrama de pastel?


b) De acuerdo con la muestra, qu programa tiene la mayor parte del mercado?

3. Se pidi a los alumnos de primer ao del Colegio de Administracin en la Universidad


que indicaran su campo preferido, y se obtuvieron los siguientes datos.
82 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Campo

Alumnos

Administracin

55

Contabilidad

51

Finanzas

28

Mercadotecnia

82

Haz una grfica de barras y el diagrama de pastel.

4. En el censo de 1960 (Direccin General de Estadstica de la Secretara de Comercio


y Fomento Industrial) se encontr que la distribucin del material predominante en los
muros o paredes de las casas era como se muestra en la tabla:

Nmero de

Material de los muros

viviendas

Proporciones

Porcentajes

Adobe

3 184

0.499

49.9

Tabique

1 547

0.242

24.2

Madera

558

0.087

8.7

Embarro

495

0.078

7.8

Mampostera

171

0.027

2.7

76

0.012

1.2

Bloque de material ligero


Otros

349

0.055

5.5

Total

6 380

1.000

100.0

Traza un diagrama de pastel.

5. A continuacin vemos datos de una muestra de 55 miembros del Saln de la Fama


de Bisbol, en Cooperstown, Nueva York, para cada posicin en el campo. En cada
caso se indica la posicin principal del jugador: lanzador(P), receptor (H), primera
base (1), segunda base (2), tercera base (3), parador en corto (S), jardinero izquierdo
(L), jardinero central (C) y jardinero derecho (R).
L

83 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


P

b) Construye una grfica de pastel y otra de barras.


c) Qu posicin tiene ms miembros en el saln de la fama?
d) Qu posicin tiene menos miembros?

6. Los empleados de Electrnica Moderna tienen un sistema de horario flexible.


Pueden comenzar su jornada de trabajo a las 7:00, 7:30, 8:00, 8:30
datos

siguientes representan

una muestra de las

horas

o 9:00. Los

de entrada

que

seleccionaron.
7:00

8:30

9:00

8:00

7:30

7:30

8:30

8:30

7:30

7:00

8:30

8:30

8:00

8:00

7:30

8:30

7:00

9:00

8:30

8:00

a) Haz una grfica de barras y un diagrama de pastel.


b) Qu opinas acerca de las preferencias de los empleados en el sistema de
horarios flexible?

7. .Durante los primeros 11 meses de 1997, los coches Honda Accord, Chevy Cavalier,
Toyota Camry, Honda Civic y Ford Taurus fueron los coches nuevos ms vendidos
en USA. Se presentan los datos de 50 compras de automvil en Cleveland, Ohio.

Taurus

Civic

Civic

Camry

Camry

Taurus

Civic

Cavalier Cavalier Taurus Accord Cavalier

Taurus

Taurus

Camry

Civic

Cavalier Cavalier Camry Accord Camry

Cavalier

Camry

Camry Camry

Civic

Accord Cavalier Cavalier Accord Camry Tauru

Cavalier Taurus Accord

Taurus

Civic

Civic

Accord Civic

Accord

Camry Camry Accord

Accord Taurus Accord

Civic
Taurus
Camry

Traza un diagrama de pastel y di: Cul es el coche que ms se vende?

84 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


8. Cada una de las 500 empresas Fortune se clasifica como perteneciente a uno de
varios giros industriales. A continuacin vemos una muestra de 20 empresas con
su correspondiente ramo industrial.
Compaa

Ramo

Compaa

Ramo

IBP

Alimentos

Borden

Alimentos

Intel

Electrnica

McDonnell Douglas

Aeroespacial

Coca-Cola

Bebidas

Norton International

Prod. Qumicos

Unin Carbide

Prod. Qumicos

Quaker Oats

Alimentos

General Electric Electrnica

Pepsico

Bebidas

Motorola

Electrnica

Maytag

Electrnica

Kellogs

Alimentos

Textron

Aeroespacial

Dow Chemical

Prod. Qumicos

Sara Lee

Alimentos

Campbells Soup Alimentos

Harris

Electrnica

Ralston Purina

Eaton

Electrnica

Alimentos

Elabora una distribucin de frecuencias que muestre la cantidad de empresas en


cada ramo industrial y traza una grfica de barras.

9. Para realizar su ndice de Confianza Comercial, la revista Fortune encuest a 50


altos ejecutivos financieros preguntndoles sus polticas financieras actuales de
presupuesto de capital y publicidad. En Noviembre de 2011, los encuestados
describieron sus polticas como sigue: Agresiva 57%, Cautelosa 29%, Indecisa 14%.
Traza una grfica de barras

y una de pastel que describan las polticas de

dichos ejecutivos.

10. Cuando se les pidi clasificar la destreza que se requiere para obtener una alta
calificacin en un nuevo juego de computadoras como principiante,

aprendiz,

competidor, maestro o experto, 44 evaluadores respondieron de la manera siguiente:


experto, maestro, maestro, competidor,
experto,

aprendiz,

maestro,

experto,

maestro,

maestro,

maestro,

maestro, maestro, maestro, experto, maestro,

competidor, maestro, maestro, principiante, experto, competidor, maestro, maestro,


experto, experto, maestro, maestro, maestro, competidor, competidor, experto,
maestro,

experto,

experto,

experto,

85 Mg. Miguel Angel Macetas Hernndez

competidor,

maestro,

maestro,

experto,

Estadstica General 2012


competidor, maestro, maestro y experto. Construye una tabla que indique las
frecuencias

correspondientes

estas

clasificaciones

de

destreza

que

se

requiere para obtener una alta calificacin.

11. En la siguiente tabla se muestra la estructura de la fuerza de trabajo en el Per, por


sectores de actividad para los aos 2009, 2010 y 2011
Actividad

2009

2010

2011

Agropecuaria

65.4

58.3

54.3

Minero, metalrgico y petrolero

1.8

1.2

1.2

Electricidad

0.2

0.3

0.4

Manufacturero

9.0

11.8

13.8

Construccin e instalacin

1.8

2.7

3.6

Transporte

2.5

2.5

3.2

Comercio

9.4

8.3

9.1

Otras

9.9

14.9

14.3

Total

100.0%

100.0%

100.0%

5857

8273

11 202

Base de % (miles de habitantes)

Construye un diagrama de barras y un diagrama de pastel.

86 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


III.
CAPITULO Medidas de Resumen
3.1 Medidas de resumen para variables cualitativas
En trabajos de investigacin frecuencia se utilizan variables cualitativas, bien por su
naturaleza, o por la escala empleada. Por supuesto, una vez que la informacin se
recogi, es necesario calcular alguna medida de resumen cuyo resultado es un
indicador que deber analizarse en un momento posterior.

En este tema te presentamos las medidas de resumen para variables cualitativas que
se utilizan con mayor frecuencia en los estudios que realizas en el nivel primario de
atencin de salud.

3.2 Razn e ndice. Definicin. Clculo e interpretacin


Por razn puede entenderse:
Una razn es la relacin por cociente que se establece entre las unidades de anlisis
que pertenecen a un grupo o categora (a) y las unidades de anlisis que pertenecen
a otra categora (b) de la misma variable. Su expresingeneral es:
sa es la definicin? No te desanimes, es una medida de fcil comprensin. Te la
explicaremos con un ejemplo:

Supongamos que de los 600 recin nacidos (RN) de un hospital en cierto perodo, 300
presentaron los ojos oscuros (OO), en tanto que slo 100 los tenan claros (OC).
Aplicando la expresin general, la razn OO/OC es

La razn ojos oscuros/ojos claros es de 3; o lo que es lo mismo, 3:1.

Pero, qu significa este resultado? Expresa que hay tres recin nacidos con ojos
oscuros por cada recin nacido de ojos claros en ese hospital y en ese perodo.

Fjate que el numerador y el denominador son disjuntos, es decir, no se interceptan,


no estn contenidos uno en el otro. Ello te ayudar a establecer las diferencias con
las medidas de resumen que estudiars a continuacin.

Si multiplicas el resultado obtenido por 100, entonces el nuevo nmero se denomina


ndice, de tal suerte que en el ejemplo anterior el ndice sera 300. En otras palabras,
87 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


en el hospital de referencia, en el perodo estudiado, por cada 100 bebs de ojos
claros hay 300 de ojos oscuros.

Proporcin y Porcentaje. Definicin. Clculo e interpretacin


Una proporcin.- Es la relacin por cociente que se establece entre las
unidades de anlisis que pertenecen a un grupo o categora (a) de una variable y el
total de las unidades de anlisis estudiadas (a + b). Su expresin general es

. Si

se multiplica su resultado por 100, se obtendr el porcentaje

Seguiremos utilizando el ejemplo anterior. Lo recuerdas? Por supuesto que s. Pues


bien, determinemos la proporcin de nios con ojos oscuros (300) en la poblacin de
recin nacidos (400):

Alternativamente, puedes calcular el porcentaje:

Nota: Usamos la P con fines ilustrativos, pues la proporcin carece de simbologa.


Los resultados anteriores significan que tres de cada cuatro recin nacidos tienen los
ojos oscuros; o que el 75 por ciento de los recin nacidos tiene los ojos oscuros (y,
obviamente, el 25% los tiene claros).

No te resultan familiares estas nuevas medidas, o sea, la proporcin y el porcentaje?


Ya debes estarte preguntando la diferencia que existe entre stas y la distribucin de
frecuencias relativas que ya estudiaste. Nada ms claro: no es que sean parecidas,
son exactamente las mismas, pero restringidas a variables cualitativas.

Observa que el porcentaje te permite analizar el aporte, el peso especfico o la


importancia relativa de cada categora respecto al total.

Tasas

Siempre que necesites medir el riesgo de que acontezca cierto fenmeno en una
poblacin determinada, dispones de un indicador valioso y nico: las tasas

88 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Una tasa.- Es una relacin por cociente que expresa el riesgo de que ocurra cierto
evento en una poblacin y perodo determinado s. Est compuesta por tres elementos,
a saber

Veamos cules son esos elementos:


El numerador contiene al nmero de veces que ocurri determinado fenmeno en
un rea geogrfica y en un perodo determinado.
El denominador indica el nmero de habitantes de la poblacin en la cual puede
ocurrir el fenmeno.
k es un mltiplo de 10 cuyo uso est justificado por el hecho de que habitualmente
el resultado del cociente es un nmero fraccionario, y al multiplicarlo por una
potencia de 10 se facilita enormemente la lectura y comprensin del indicador.

Esta es una medida que expresa el riesgo de ocurrencia del evento estudiado en el
numerador en la poblacin involucrada, en el tiempo y lugar establecidos.
Las tasas que ms importancia revisten para nuestro desempeo en el campo de la
Salud son las siguientes:

Tasas de importancia Relevante en Salud


Tasas relacionadas con la natalidad
Tasas relacionadas con la mortalidad
Tasas relacionadas con la morbilidad

Una particularidad realmente til de las tasas es que puedes calcularlas tanto para la
totalidad de la poblacin, como para parte de ella (por ejemplo, para el grupo de edad
de cinco a nueve aos, para los estudiantes, para los residentes del rea rural, y as
por el estilo); por otra parte, puedes calcular las tasas para todas las causas, o
solamente para una de ellas (o un grupo de ellas). De este modo, tendrs calculadas
tasas brutas, crudas, generales o globales si se tratara de tasas que involucren a toda
la poblacin o al total de causas; al tiempo que habrs calculado tasas especficas si
incluan a una parte de la poblacin o a una causa o grupo de ellas.

As las cosas, estars en plena facultad de hallar tasas brutas de mortalidad, de


natalidad, o bien especficas por edad, por sexo, por edad y sexo a la vez, entre

89 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


muchas otras. Teniendo a tu disposicin los datos adecuados, podrs hallar una tasa
tan especfica como desees.

Existe en punto cardinal en el manejo de las tasas: la poblacin expuesta al riesgo en


cuestin. Como ya sabes, este es el denominador de la ecuacin, y de su correcta
determinacin depende la fidelidad del clculo. Nunca sern suficientes las medidas
que tomes para asegurarte que ests empleando el dato acertado. No creas que es
muy difcil saber que ests errado o en lo cierto, el problema radica en que muchas
veces se pasa por alto este detalle de forma involuntaria.

Probablemente te habrs preguntado: Bueno, y qu tanto problema con el


denominador?
Ah! Es que ah radica el quid de la cosa. Recuerda que calculas una tasa para medir
el riesgo de ocurrencia de un evento o fenmeno en una poblacin, pero no en
cualquier poblacin, sino en la poblacin expuesta a ese riesgo. Esto quiere decir que
slo podrs calcular la tasa de mortalidad por cncer de tero en las mujeres de cierta
ciudad, puesto que sera imposible calcularla en los hombres; del mismo modo que no
puedes calcular la tasa de morbilidad por cncer de pulmn de los habitantes de Per
en 2009, utilizando para ello a los habitantes del Per en el ao 2009.
Satisfecha tu inquietud?

Tambin haz de saber que las poblaciones estn sometidas a constantes cambios en
lo que a su nmero atae, determinados por los nacimientos y defunciones y por
los movimientos migratorios (emigracin e inmigracin), que provocan que no sea la
misma a lo largo de todo el ao. De ah que, por convenio, se tome la poblacin
existente a mediados del perodo 11 o poblacin media para el clculo de las tasas.

Por otra parte, debes tener especial cuidado al calcular tasas para poblaciones
pequeas, como la que usualmente manejan los Consultorios, pues suelen volverse
inestables, ya que cualquier evento mueve mucho la tasa, y a veces no guarda
relacin el resultado obtenido con la magnitud del evento acontecido.

Bueno, ya estamos en condiciones de particularizar en las tasas ms relevantes en la


prctica diaria.

90 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Tasas relacionadas con la natalidad

El estudio de la natalidad est relacionado con el nmero de nacimientos ocurridos en


una poblacin y tiempo determinados, as como la distribucin que siguen de acuerdo
con ciertas caractersticas. Como ves, todo gira en torno a la medicin de la misma, y
una de las formas de conseguirlo es utilizando las tasas.

Ahora nos tropezamos con una contrariedad: la poblacin expuesta al riesgo es muy
difcil de definir, ya que tener un hijo no involucra a toda la parte femenina de la
poblacin, y va ms all, pues otros factores de ndole psicosocial actan en tal
decisin. Por estas razones, vers que se han buscado soluciones alternativas a esta
situacin.

Tasa bruta de natalidad

Comencemos por la tasa bruta de natalidad. La misma expresa cmo se comportan


los nacimientos en un rea y tiempo determinados. Su clculo es sencillo:
(

Por ejemplo, la tasa cruda de natalidad de Per en 2008 fue:


Total de nacidos vivos en Per durante 2008: 151 08012
Total de habitantes en Per durante 2008: 11 122 308.

Bien, ya tienes el nmero calculado. Pero, es suficiente con eso? Claro que no,
necesitas saber qu significa, a fin de manejarlo apropiadamente. En primer lugar,
debes informar el resultado de la siguiente forma: La tasa bruta de natalidad de Per
en 2008 fue de 14 nacidos vivos por cada 1000 habitantes, ello significa que durante
2008 en Cajamarca nacieron como promedio 14 nios por cada 1 000 habitantes.

Esta tasa tiene el inconveniente de no tomar en cuenta a las personas realmente


expuestas al evento, pero por su sencillez y facilidad de comprensin es la
medida ms generalmente utilizada.

91 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


De ahora en adelante nos limitaremos a ensearte cmo calcular e interpretar el
indicador. Continuemos entonces.
Tasa general de fecundidad
Este indicador mide la natalidad, pero tomando en cuenta solamente a la poblacin
femenina en edad reproductiva o frtil (15 a 49 aos). El hecho de que se restringe el
denominador no inyecta especificidad a la tasa, pues contina siendo una mezcla de
diversos grupos de edades con situaciones diversas; amn de que se mueve a la par
de la tasa cruda de natalidad. Se calcula de la siguiente forma:

As, la tasa de Cuba en 2008 fue:

Interpretacin: En Per, durante 2008, nacieron como promedio 49 nios por cada
1000 mujeres en edad frtil (15 a 49 aos).

Tasa de fecundidad especfica por edad


Esta es una tasa especfica, que usualmente se calcula para grupos quinquenales
comprendidos entre 15 y 49 aos.

Interpretacin: Durante 2008 en Per nacieron como promedio 56 nios por cada
1000 mujeres de 15 a 49 aos de edad.

Tasas de mortalidad

La medicin de la mortalidad tiene como fin conocer el nmero de defunciones


ocurridas en cierta poblacin durante un perodo dado, a la vez que se estudia su
distribucin relacionndolas con diversas caractersticas de dicha poblacin.

Entrando en la materia que nos ocupa, te decimos a continuacin las tasas que
podrs calcular.
92 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Tasa bruta de mortalidad

Esta tasa expresa el riesgo que tienen todos los habitantes de cierta poblacin, en un
momento dado, de morir por cualquier causa.

En 2008, en nuestro pas esta tasa fue:

Esto significa que en 2008, en Per fallecieron como promedio 7 personas por cada
1000 habitantes.

Tasa de mortalidad por edad


Ahora te presentamos una tasa de mortalidad especfica, que solo mide el riesgo de
morir que tienen las personas del grupo de edad analizado. Su clculo se logra
restringiendo el denominador a las personas de la edad deseada, e incluyendo en el
numerador a los fallecidos en esa edad.

Por ejemplo, en 2008, en Per, la tasa de mortalidad en personas de 60 aos y ms


fue:

Tasa de mortalidad por sexo


El clculo de esta tasa es muy similar a la anterior, con la diferencia de que te
restringes a un sexo en particular. Expresa el riesgo de morir de las personas de ese
sexo en esa poblacin, en el perodo especificado. Para calcularla, sustituye el
numerador por el total de defunciones del sexo analizado, y el denominador por el
total de habitantes de ese sexo en el lugar y momento deseados.

En nuestro pas, durante 2008 la tasa de mortalidad del sexo femenino fue:

Interpretacin: en Per, en 2008 fallecieron como promedio 6 mujeres por cada 1000
fminas.
93 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Tasa de mortalidad por causa
Anlogamente, puedes conocer el riesgo a que estn sometidos los habitantes de
cierto lugar, en un momento definido, de morir por una causa de muerte dada. Ahora
el numerador est formado por las defunciones debidas a la causa en cuestin,
mientras que el denominador incluye al total de poblacin.

En Per, durante 2008 la tasa de mortalidad por enfermedades del corazn fue:

Interpretacin: en Per, en 2008 fallecieron como promedio 193 personas por


enfermedades del corazn por cada 100 000 habitantes

Tasa de mortalidad infantil


Arribamos a un punto de suma importancia al analizar la situacin de salud de una
comunidad. Este indicador es una especie de diana hacia la cual se dirigen los ojos de
todo aquel que, avezado o no, se tome inters en el estudio de las caractersticas de
una poblacin.
Es un indicador que toma como poblacin expuesta al riesgo a los nacidos vivos en
perodo estudiado, y se calcula de la siguiente forma:

A partir del triunfo revolucionario, este indicador ha mostrado una tendencia


descendente, llegando a alcanzar en los dos ltimos aos cifras inferiores a 8,
incluyndose de esta forma entre los pases de ms baja tasa a escala mundial. En
2008, la tasa cubana fue:

Ello significa que en 2008, en Cuba fallecieron como promedio 7 nios por cada 1000
nacidos vivos.
Este indicador tiene la singularidad de que puede descomponerse en varios
indicadores, que miden con ms especificidad el comportamiento de la mortalidad en
el menor de un ao. Estos componentes son los siguientes:
94 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


1. Tasa de mortalidad neonatal precoz
Al calcular esta tasa conocers el riesgo de morir de los bebs con menos de
siete das de nacidos. Su clculo estriba en sustituir el numerador de la TMI por
las defunciones ocurridas en recin nacidos de menos de siete das en el perodo
y lugar estudiados. En 2008 tuvimos una TMNP de 2.9 por 1000 NV. De este
modo, puedes decir que en Per, durante 2008, fallecieron como promedio 3
nios de menos de 7 das por cada 1000 nacidos vivos.
2. Tasa de mortalidad neonatal tarda
Conforme calculaste el riesgo de muerte de los bebitos menores de siete das,
puedes conocer tambin el de siete en adelante y menores de 28 das, cerrando
as el diapasn en la etapa neonatal de la vida. Slo tienes que sustituir el
numerador de la tasa anterior por las defunciones de nios de 7 - 27 das en la
poblacin de tu inters, durante el perodo que necesites.
Para nuestro pas la TMNT en 2008 fue de 1.4 por cada 1000 nacidos vivos, lo
que quiere decir que en 2008, en Per falleci como promedio 1 nio de 7 a 27
das por cada 1000 nacidos vivos.
3. Tasa de mortalidad posneonatal
Ahora determinars el riesgo de muerte de los nios mayores de 28 das y
menores de un ao. Con slo sustituir el numerador de la TMI por las defunciones
acaecidas en los bebs de 28 das a 11 meses, 29 das y 23:59 horas, habrs
cumplido tu cometido.
El que el denominador, de los tres componentes de la mortalidad infantil, sea el
mismo le imprime a estas tasas una peculiaridad: se puede obtener la mortalidad
infantil mediante la simple suma de sus componentes, o lo que es lo mismo, los
componentes de la mortalidad infantil son sumables.
En Per, durante 2008, tuvimos una TMP de 2.8 por 1000 NV. Dicho sea con
otras palabras: en 2008, en Per fallecieron como promedio 3 nios mayores de
28 das y menores de un ao por cada 1000 nacidos vivos.

Tasa de mortalidad perinatal


Esta es una tasa especial que mide el riesgo de morir en los momentos cercanos al
nacimiento.
Se calcula de la siguiente forma:

95 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Donde:
DFT: defunciones fetales tardas (edad materna igual o superior a las 28
semanas, o peso fetal de 1000 gramos o ms).
DNP: defunciones neonatales precoces (defunciones en el menor de siete das).
NV: nacidos vivos

Tasa de mortalidad materna


Aqu tienes otro de los indicadores ms celosamente cuidados por todo el personal de
salud, bien sabes de ello. La lgica aspiracin de todo pas interesado realmente en
exhibir indicadores de salud ejemplares, es mantener esta medida en niveles bajos,
juntamente con la tasa de mortalidad infantil, entre otros. Su clculo comprende algo
que puede inducir extraeza: el denominador est formado por los nacidos vivos del
lugar y tiempo escogidos. Al analizarlo con detenimiento vers que resulta lo ms
indicado, ya que brinda una estimacin mejor del riesgo puesto que este indicador
solamente toma en cuenta las defunciones maternas producidas por complicaciones
del embarazo, parto o puerperio (entendido como los 42 das siguientes al parto).

La TMM fue de 47.7 por 100 000 NV en 2008 para nuestro pas. Esto quiere decir que
por cada 100 000 nacidos vivos, murieron en promedio 48 mujeres por causas
directamente relacionadas con el embarazo, parto y puerperio durante 2008 en Per.

Tasas de morbilidad
La morbilidad, entendida como el patrn de enfermedades que sufren los habitantes
de alguna regin, puede ser estudiada numricamente mediante las tasas de
morbilidad. Ellas son la tasa de incidencia, la tasa de prevalencia y la tasa de
letalidad.

La tasa de incidencia (TI) mide el riesgo que tiene una persona que habita en un lugar
y tiempo determinados, de contraer o adquirir cierta enfermedad, visto esto en funcin
del tiempo. Por su lado, la tasa de prevalencia (TP) mide el riesgo de tener la
enfermedad, o sea, de estar enfermo; y la tasa de letalidad (TL) expresa la gravedad
de la enfermedad.
96 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012

Comparacin de tasas
En ocasiones, pretendemos comparar los riesgos de morir, de enfermar, etc. entre
distintas poblaciones o entre distintas categoras o clases de una variable. Para ello,
lo ms conveniente es utilizar la tipificacin, bien por el mtodo directo o por el
indirecto; tcnicas que no se expondrn en este curso, pues se abordarn en cursos
posteriores. Esta tcnica solo sirve para comparar, sus resultados no miden en modo
alguno el riesgo de ocurrencia de los eventos estudiados en la poblacin

Resumen
En este tema estudiaste que:
MEDIDAS RESUMEN VARIABLES CUALITATIVAS 41
1. Las medidas de resumen para datos cualitativos ms frecuentemente utilizadas
son las razones, las proporciones y las tasas.
2. Cada uno de esos indicadores tiene diferente interpretacin. As, los ms
refinados son las tasas, pues expresan el riesgo de ocurrencia del evento
consignado en su numerador.
3. Debes tener cuidado al calcular las tasas para poblaciones pequeas, por
ejemplo, en el Consultorio Mdico de la Familia, porque suelen ser inestables.
4. Las tasas pueden dividirse en generales y especficas.
5. En el mbito sanitario, las tasas ms usadas son las de natalidad, mortalidad y
morbilidad.

97 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Ejercicios
Un grupo de investigadores recogi algunos datos relacionados con la poblacin
cubana del ao 2008, con el objetivo de confeccionar indicadores que reflejaran la
situacin del pas.
Debido a un virus informtico, se estrope parte de la informacin almacenada. A
continuacin te mostramos los datos que se pudieron recuperar. A partir de los
mismos, podras ayudarnos a completar las partes faltantes? Para ello, calcula e
interpreta los indicadores solicitados.
Informacin recogida por los investigadores
Nacidos vivos bajo peso: 10 145
Poblacin total: 11 122 308
Nacidos vivos: 151 080
Defunciones totales: 77 558
Total de hombres: 5 571 882
Total de consultas mdicas y estomatolgicas: 100 819 793
Fallecidos de 15 a 49 aos: 10 057
Total de mujeres: 5 550 426
Fallecidos menores de un ao: 1 070
Fallecidos de la provincia Guantnamo: 2 722
Casos diagnosticados por enfermedad meningoccica: 44
Fallecidos mayores de 28 das y menores de 12 meses: 417
Poblacin de Guantnamo: 508 864
Hombres fallecidos por tumores malignos: 9 126
Total de nacidos vivos en Sancti Spritus: 5 642
Mujeres fallecidas: 34 692
Fallecidos menores de 7 das: 435
Poblacin de 15 a 49 aos: 6 117 424
Fallecidos mayores de 7 das y menores de 27 das: 218
Nacidos vivos de la provincia Guantnamo: 7 939

98 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


3.3 Medidas de resumen para variables cuantitativas.
3.3.1 Medidas de Posicin Centrales (Tendencia Central)
Se calcula una medida de tendencia central cuando se necesita un valor nico que
resuma una serie de datos; por ejemplo: si se presentara la informacin de
ingresantes a Universidad en el ao 2012, se puede decir que la edad mediana de los
postulantes fue de 18 aos.

1. La Media Aritmtica
Es la medida de tendencia central con la cual probablemente est usted ms
familiarizado es la media aritmtica; se conoce tambin como media o promedio; se
representa como x y se conoce como "x barra"; la frmula para calcularla es:
1.1. Para Datos Sin Agrupar

media x

Se lee as: la media es igual a la suma de las xs dividido por n.


Ejemplo Datos Sin Agrupar
En un brote de hepatitis A, 6 personas iniciaron sntomas 24 a 31 das despus de la
exposicin. Calcule el promedio del perodo de incubacin en ste brote; los perodos
de incubacin para las personas afectadas (Xi) fueron:
29, 31, 24, 29,30 y 25
Pas Uno Para calcular el numerador sume las observaciones individuales
x = 29+31+24+29+30+25= 168
Paso Dos para calcular el denominador cuente el nmero de las observaciones: n = 6

Paso Tres Para calcular la media divida el numerador sumatoria de las


observaciones) entre el denominador (nmero de las observaciones).

media x

29 31 24 29 30 25 168

28 das
6
6

Entonces, el promedio del perodo de incubacin del brote es 28 das

Aplicacin de la funcin de Excel en la Media Aritmtica Para Datos Sin Agrupar


Se ingresan los datos de los das de incubacin desde la celda A1 hasta la A6 y se la
funcin PROMEDIO(A2:A6)

99 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012

1.2. Para Datos Agrupados


Marca de Clase

media x

xini

Frecuencia absoluta
Total de Observaciones

Intervalos

Marca de

de clases

clase

(Li-1

Li]

a
Absolutas

xi ni

xi

ni

16 27

21,5

64,5

27 38

32,5

162,5

38 49

43,5

10

435

49 60

54,5

163,5

60 71

65,5

524

71 82

76,5

535,5

82 93

87,5

350

40

2235

Total
media x

Frecuenci

64,5 162,5 435 163,5 524 535,5 350 2235

55,875
40
40

100 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Interpretacin: El puntaje promedio en el rendimiento de la lnea de accin
educativa de Lenguaje de una muestra de 40 alumnos es 55,875.

1.3. Propiedades de la Media. Aritmtica.


Sean: x e y : variable
k

: constante

M []

: Operador Media Aritmtica.

a) M [k] = k
b) M [x + k] = M[x] + k
c) M[kx] = kM[x]
d) M [x y] = M[x] M [y]
e) M[x - ] = 0
f) f) M ((X M)2) es mnimo si K = X
La media aritmtica es un indicador de posicin sensible a valores extremos.

2. La Mediana (Me)
Otra medida de tendencia central es la mediana; como se ver es especialmente til
cuando los datos estn sesgados.
Mediana significa a la mitad y la mediana es el valor a la mitad de una serie de datos
que han sido colocados en orden. Especficamente, la mediana es el valor que divide
una serie de datos en dos mitades con una mitad de las observaciones mayores que
sta y la otra mitad menores a la mediana.
Para Datos Sin Agrupar

Ejemplo Al tener los siguientes datos de presin arterial sistlicas: 110, 120, 122, 130,
180 Mm. de Hg.
En este ejemplo, hay dos observaciones mayores y dos menores que 122, luego
entonces, la mediana es 122 Mm. de Hg., el valor de la 3 observacin. Al obtener la
media (132) sta sera mayor que 4 de los 5 valores.

Cmo Identificar la Mediana de Datos Individuales

Paso Uno

Ordene los datos de menor a mayor o viceversa

Paso Dos

Encuentre el rango medio con la siguiente frmula

n 1

101 Mg. Miguel Angel Macetas Hernndez


2

Estadstica General 2012


Rango mediano =
a. Si el nmero de observaciones (n) es impar el rango medio cae en una
observacin.
b. n es par el rango medio cae entre dos observaciones.

Paso Tres

Identifique el valor de la mediana

a. Si el rango medio cae en una observacin especfica (n = impar) la mediana es


igual al valor de sta observacin.
b. Si el rango medio cae entre dos observaciones (n = par) la mediana es igual
al promedio (media aritmtica) del valor de estas observaciones.

Ejemplo con Nmero Impar de Observaciones:


n=5

13, 7, 9, 15, 11

1. Ordenar de mayor a menor: 7, 9, 11, 13, 15 o viceversa: 15, 13, 11, 9, 7.


2. Encontrar el rango mediano

n 1 5 1 3

Rango mediano 2=

Entonces, el rango medio cae en el valor de la 3 observacin.


3. Identificar el valor de la mediana que es igual al valor de la tercera observacin
n = 11

Ejemplo con nmero par de Observaciones:

n = 6:

15, 7, 13, 9, 10, 11

1. Ordenar los datos 7, 9, 10, 11, 13, 15


2. Encontrar el rango medio

n 1 6 1 3,5
Rango mediano 2=

Entonces, el rango medio cae entre el valor de la 3 y la 4 observacin.

102 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


3. Identificar el valor de la mediana que es igual al promedio de la 3 y 4
observacin
11 10

Mediana =2

10,5

En contraste con la media, la mediana no est influenciada por valores


extremos.
Aplicacin de la funcin de Excel en la Mediana Para Datos Sin Agrupar

Se ingresan los datos desde la celda A1 hasta la A6 y se la funcin MEDIANA(A2:A6)

Para Datos Agrupados


Para calcular la mediana (Me) a partir de una tabla de frecuencias debe
determinarse las frecuencias absolutas acumuladas Ni, que permite conocer hasta
que el valor de la variable o intervalo se tienen acumulado el 50% de n;
Se Calcula con la Siguiente Frmula:

2 N j1
Me L ji c j

nj

Donde
103 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


n

nmero total de datos u observaciones

Nj

es una Ni inmediata superior a

Nj-1

es una Ni inmediata inferior a

Lj-1

extremo inferior del Intervalo Mediano

IMe

es el intervalo que corresponde a Nj

nj

es el nj que le corresponde al Intervalo Mediano

Cj

amplitud del intervalo mediano

Ejemplo
Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aqu n = 40 luego

40
20
2

se compara con los N i se obtiene que 20,

observando en la tabla este valor no coincide con algn Ni, est entre 18 y 21,
es decir:

18 < 20 < 21 N j1
Nj
2

Intervalos de Frecuencia
clases

(Li-1

IMe=
Lj-1

Absolutas

Li ]

Frecuencias
Absolutas
Acumuladas

ni

Ni

I1

16 27

n1 = 3

N1 = 3

I2

27 38

n2 = 5

N2 = 8

I3

38 49

n3 = 10

N3 = 18

Nj-1

I4

49 60

n4 = 3

N4 = 21

Nj

I5

60 71

n5 = 8

N5 = 29

I6

71 82

n6 = 7

N6 = 36

I7

82 93

n7 = 4

N7 = 40

Total

40

Reemplazar los valores obtenidos en la frmula de Me:


40

2 18
Me 49 11
56,33
3

Me 56,33

104 Mg. Miguel Angel Macetas Hernndez

nj

Estadstica General 2012


Interpretacin, significa que 20 alumnos tienen calificacin iguales o inferiores a
56,33 puntos, y los 20 alumnos restantes (el otro 50%) tienen una calificacin superior
a 56,33 puntos

3. Moda (Mo) (Valor Modal o Promedio Tpico)


La moda es el valor que ocurre ms frecuentemente en una serie de datos
1.3.1. Para Datos Sin Agrupar
Ejemplo:
a) El conjunto: 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 4, 6 tiene la Mo = 1
b) El conjunto: 4, 8, 12, 15, 26, 35 no tiene moda
c) El conjunto: 1, 3, 5, 5, 5, 7, 7, 9, 9, 9, 11 tiene dos modas, 5 y 9 es una distribucin
Bimodas.

Aplicacin de la funcin de Excel en la Moda Para Datos Sin Agrupar

Se ingresan los datos desde la celda A2 hasta la A12 y se la funcin


MODA.VARIOS(A2:A12)

1.3.2. Para Datos Agrupados


Cuando los datos se agrupan en una tabla de distribucin de frecuencias, el
modo es el punto medio o marca de clase que contiene la mayor frecuencia.
105 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Se Calcula con la Siguiente Formula

d1
Mo L j1 Ci

d1 d2

42,5833
10 5 10 3

Mo 38 11

10 5

Donde
Lj-1

Lmite inferior del Intervalo Modal

Cj =

Amplitud del intervalo Modal

d1 =

nj nj1

d2 =

nj nj+1

Ejemplo
Calcular el puntaje de rendimiento ms frecuente en la lnea de accin
educativa de Lenguaje de una muestra de 40 alumnos de un determinado
centro educativo

Intervalos de Clases
(Li-1

Li ]

Frecuencia
Absolutas
ni

I1

16 27

n1 = 3

I2

27 38

n2 = 5

nj-1

IMo=

I3

38 49

n3 = 10

nj

Lj-1

I4

49 60

n4 = 3

nj+1

I5

60 71

n5 = 8

I6

71 82

n6 = 7

I7

82 93

n7 = 4

Total

40

Reemplazando los valores obtenidos en la formula:

42,5833
10 5 10 3

Mo 38 11

10 5

Interpretacin La Moda indica que la calificacin ms frecuente en los 40


alumnos es 42,5833 puntos, o tambin la mayora de los alumnos tienen una
calificacin aproximados a los 42,5833 puntos.
106 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Caractersticas de las Medidas de Posicin Centrales
Media Aritmtica
1.

Es una medida totalmente numrica o sea slo puede calcularse en datos de

caractersticas cuantitativas.
2. En su clculo se toman en cuenta todos los valores de la variable.
3. Es lgica desde el punto de vista algebraico.
4. La media aritmtica es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan clases
abiertas.
6. La media aritmtica es nica, o sea, un conjunto de datos numricos tiene una
y solo una media aritmtica.

Mediana
1. En su clculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lgica desde el punto de vista algebraico.

Moda
1. En su clculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el mtodo de
designacin de los intervalos de clases.
3. No est definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
5. No es afectada por valores extremos.

107 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


EJERCICIOS PROPUESTOS
1. Una empresa grande de equipos deportivos est probando el efecto de dos planes
publicitarios sobre las ventas de los ltimos 4 meses. Dadas las ventas que se ven
aqu, cul programa de publicidad parece producir el crecimiento promedio ms
alto en ventas mensuales?

Mes

Plan 1

Plan 2

Enero

1657,0

4735,0

Febrero

2008,0

5012,0

Marzo

2267,0

5479,0

Abril

3432,0

5589,0

2. Los estadsticos del programa de Meals on Wheels (comida sobre ruedas), el cual
lleva comidas calientes a enfermos confinados en casa, desean evaluar sus
servicios. El nmero de comidas diarias que suministran aparece en la siguiente
tabla de frecuencia. Calcular la media, mediana y la moda e intrprete.

Nmero de comidas por da

Nmero de das

0-5

5 - 10

10 - 15

15 - 20

20 - 25

25 - 30

3. Bill Karl compr 20 acciones a $ 15 cada una, 50 acciones a $20 cada una,100
acciones a $30 cada una y 75 acciones a $35 cada una.

Cul es el precio

promedio por accin?.

4. Dado el siguiente cuadro estadstico con ancho de clase constante igual a 20.
Determine la media de los datos.

108 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Li Ls

ni

Xi

Ni

X i ni
880
1950

35

1800

13
200)
4

70

5. En el curso de Estadstica I; se tiene las notas de los alumnos distribuidas segn el


siguiente histograma de frecuencias, entonces la nota promedio del curso es:
16
Nmero de Alumnos

14
12
10
8
6
4
2
0
4

10

12

14

Notas

6. En una encuesta sobre los ingresos anuales en miles de soles de un grupo de


familias se obtuvo la siguiente informacin:

Li Ls

ni

10 30

20

30 50
50 70
70 - 90

20

Adems, x 54 y n2 / n3 1 / 5 , calcular el nmero de familias con ingreso no


menos de 50 mil soles.
7. Dada la siguiente distribucin de frecuencias, calcular el valor de n sabiendo que
la moda es 60 y pertenece al tercer intervalo.

Li Ls

ni

16 32

109 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


32 48

48 64

64 80

3n

80 - 96

8. Dada la siguiente distribucin de frecuencias, calcular el valor de n sabiendo que

la mediana vale 61.6 y que pertenece al quinto intervalo.

Li Ls

ni

20 30

30 40

40 50

50 60

60 70

9. El salario promedio mensual pagado a los trabajadores de una compaa es de 200


dlares. Los salarios promedios mensuales pagados a hombres y mujeres de la
compaa son 210 y 150 respectivamente. Determinar el porcentaje de hombres y
mujeres que trabajan en la compaa.

10. Las ganancias diarias de los establecimientos de un centro comercial se presentan


en una tabla de frecuencias con 6 intervalos de clase y se sabe que: la mnima
ganancia es de $6, el rango es 36, el promedio de ganancias diarias es $25.14, el
50% de los establecimientos ganan ms de 25.58 dlares diarios, H2=0.15,
N2=120, h3=0.25, H5=0.93, n4=304, n2=2n1. Reconstruir la distribucin de todas las
frecuencias y hallar la ganancia ms frecuente y la ganancia promedio.

11. Una compaa minera tiene 100 trabajadores. Para los nombrados el haber
mximo es 450 dlares y el mnimo 60 dlares. Hay un 5% de eventuales (en
prueba) que trabajan ad-honorem o perciben compensaciones inferiores a $60.
Quince trabajadores nombrados perciben haberes inferiores a $250 y el 85% ganan
haberes inferiores a $400. Con esta informacin, calcule las medidas de tendencia
central posibles.

110 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


12. La siguiente distribucin muestra la produccin diaria de un pozo de petrleo (en
barriles) durante n das. Halle la medida de tendencia central ms adecuada y
explique por qu su uso.
Produccin

Porcentaje

Menos de 206

20 %

206 214

25%

214 222

18%

222 230

15%

230 238

13%

Ms de 238

9%

13. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. se divide en dos
grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg.
Cuntos estudiantes hay en cada grupo?.

14. En una clase hay 35 estudiantes varones con una edad media de 17. 5 aos y 15
estudiantes mujeres las que en promedio son 12% ms Jvenes. Cul es la edad
media de la clase?.

15. Las temperaturas registradas en una ciudad, en grados Fahrenheit (F), fueron: 51,
60, 58, 62, 57, 49, 52, 62, 61 y 63. Determinar la Media en grados centgrados (C)
sabiendo que: C=(5/9)(F-32).

16. De una muestra de tamao tres se sabe: la suma de los cubos de las tres
observaciones es 1971, la media aritmtica es 7 y la mediana es 6. Calcular el
valor de cada una de las observaciones.

17. Cien estudiantes divididos en cuatro grupos A, B, C y D dan un examen y obtienen


un promedio general de 72 (calificacin centesimal). Los puntajes medios de los
grupos A, B, C son 75, 62 , 80, respectivamente. Los registros del grupo D se
extraviaron; pero se sabe que en el grupo A estn el 40% del total de alumnos, en
el grupo B un cuarto del total, en el grupo C haban 15 alumnos ms que en el
grupo D. Determinar el promedio del grupo D.

111 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


18. En una empresa el sueldo promedio por trabajador es de 360 dlares mensuales,
los trabajadores manuales constituyen el 40% del total y reciben el del monto
dela planilla, cunto recibe en promedio cada trabajador manual?.

19. Los costos de fabricacin, en soles, de diez objetos son los siguientes: 9.35, 9.46,
9.20, 9.80, 9.77, 9.00, 9.99, 9.36, 9.50, 9.60, si el precio de venta de cada objeto es
3 veces su costo de fabricacin menos 5 soles, calcular la utilidad media por objeto.

20. De las edades de cuatro personas, se sabe que la media es igual a 24 aos, la
mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas.

21. Para calcular el suministro de agua que una ciudad requiere mensualmente, se
escogen 15 familias de la ciudad, resultando los siguientes consumos en metros
cbicos; 11.2, 21.5, 16.4, 19.7, 14.6, 16.9, 32.2, 18.2, 13.1. 23.8, 18.3, 15.5, 18.8,
22.7, 14.0. Si en la ciudad hay 5,000 familias, cuntos metros cbicos de agua se
requieren mensualmente si el consumo promedio por familia permanece igual?.

22. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos
alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo ms 10 soles a
cada uno. Si la empresa dispone a lo ms de S/. 94,000 para pagar sueldos, cul
alternativa es ms conveniente?.

23. Al calcular la media de 125 datos, result 42. Un chequeo posterior mostr que en
lugar del valor 12.4 se introdujo 124. Corregir la media.

24. De una central telefnica salieron 70 llamadas de menos de 3 minutos


promediando 2.3 minutos, 40 llamadas de menos de 10 minutos pero no menos de
3 minutos, promediando 6.4 minutos, y 10 llamadas de al menos 10 minutos
promediando 15 minutos. Calcular la duracin promedio de todas las llamadas.

25. Cuatro fbricas A, B, C y D, producen un mismo objeto. La fbrica B produce el


doble de C, la D 10% menos que la C y la A el 60% menos que la B. Los costos de
produccin (en dlares) por unidad de estas fbricas son respectivamente: 0.2, 0.3,
0,2, y 0.5. Calcular el precio medio de venta si se quiere ganar el 20% por unidad.

26. El sueldo medio de los obreros de una fbrica es de $286.


112 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


a) Que porcentajes de hombres y mujeres trabajan en la fbrica si sus sueldos
medios respectivos son $300 y $260?.
b) Si el 60% de los obreros tienen menos de 30 aos y percibe el 20% del total de
los sueldos, cunto es el sueldo medio de los obreros de al menos 30 aos?

27. En una empresa donde el sueldo medio es de $400 se incrementa un personal


igual al 25% del ya existente con un sueldo medio igual al 60% de los antiguos. Si 3
meses ms tarde se incrementan cada sueldo en 20%, ms 30$, cunto es el
nuevo salario medio?.

28. Al tabular las calificaciones de un examen se obtuvieron las siguientes notas: 07,
08, 09, 10, 11, 12, 13, 14, 15, 16, 17 y las frecuencias del nmero de alumnos
respectivas: 1, 1, 1, 1, 1, 6, 8, 16, 18, 20, 2. Cunto es la media, la mediana y la
moda de las notas?, qu valor escogera como el promedio?.

29. Los sueldos en una empresa varan de $300 a $800 distribuidos en forma simtrica
en 5 intervalos de igual amplitud, con el 15%, 20%, y 30% de casos en el primer,
segundo y tercer intervalo respectivamente. Calcule los diferentes indicadores de
tendencia central.

113 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


4. Media Geomtrica: X G , G
La media geomtrica proporciona una medida precisa de un cambio porcentual
promedio en una serie de nmeros.
Se utiliza con ms frecuencia para calcular la tasa de crecimiento porcentual
promedio de series de datos, a travs del tiempo.
Es una medida de tendencia central por lo general menor que la media aritmtica
salvo en el extrao caso en que todos los incrementos porcentuales sean iguales,
entonces las dos medias sern iguales.
Se le define como la raz ensima del producto de n valores. Cuando los datos
son bastantes o cantidades grandes, para facilitar el clculo se lo debe simplificar
pero sin alterar su naturaleza, para lo cual se puede utilizar los logaritmos de base
10.
CLCULO DE LA MEDIA GEOMTRICA:
a) Datos Originales:

X G n x1 , x2 ,...xn Xi
i 1
n

1
n

b) Datos agrupados

X G x , x ...x
n1
1

n2
2

nm
m

. Xi ni
i 1

l
n

Aplicando logaritmos tenemos:

XG

1 m
ni log Xi log Xi
n i 1

Entonces:

X G 10 log x
La media geomtrica se utiliza los datos tienen crecimiento geomtrico: poblacin, montos de
capital, produccin
1.3.3. Propiedad:

XG < X
114 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012

Ejemplo
La media geomtrica es til en el clculo de tasas de crecimiento; por ejemplo, si el
crecimiento de las ventas en un pequeo negocio son 3%, 4%,8%,9% y 10%, hallar la media
de crecimiento.

( )( )( )( )(

Respuesta: 6.128%

Utilizando logaritmo

Empleando Excel se calcula insertando la funcin MEDIA.GEOM.

115 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Calcular la tasa de crecimiento promedio a la que ha variado las ventas de cierto producto
con base a la siguiente tabla:

Mes

Enero

Febrero

Marzo

Abril

Mayo

Junio

Ventas

500

550

600

700

800

850

Solucin:
Es necesario calcular el porcentaje que las ventas de cada mes representan respecto de los
obtenidos el mes anterior.
Mes

Porcentaje del
mes anterior

Ventas

Enero

500

Febrero

550

550/500=1,100

Marzo

600

600/550=1,091

Abril

700

700/600=1,167

Mayo

800

800/700=1,143

Junio

850

850/800=1,063

Calculando la media geomtrica se obtiene:

)(

)(

)(

)(

Restando 1 para convertirlo a un incremento mensual promedio da 1,112-1 =0,112, o un


incremento promedio de 11,2% para el perodo de 6 meses.
Comprobacin:
Mes
Ventas
Enero
500
Febrero
550
Marzo
600
Abril
700
Mayo
800
Junio
850

Ventas calculadas con G


500 x 1.112 = 556,000
556 x 1.112 = 618,272
618,272 x 1.112 = 687.518
687,518 x 1,112 = 764.52
764.52 x 1.112 = 850.146

Se puede observar que el valor de 850.146 calculado con la media geomtrica es


semejante al valor de venta real de 850, por lo tanto el valor calculado para la media
geomtrica est correcto.

116 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Para Datos Agrupados en Tablas de Frecuencias
Se emplea la siguiente ecuacin:

Donde:
ni = frecuencia absoluta de cada dato xi

Ejemplo
Calcular la media geomtrica para las siguientes calificaciones de Estadstica:

xi

ni

10

10

Solucin:
Se llena la siguiente tabla, realizando los clculos respectivos:
xi

ni

log x i

log x i ni

0.602

3.010

0.778

6.225

0.903

8.128

10

0.954

9.542

10

1.000

8.000

Total

40

Se aplica la siguiente ecuacin para obtener la respuesta.

117 Mg. Miguel Angel Macetas Hernndez

34.906

Estadstica General 2012


5. Media Armnica: X H , H
La media armnica se define como el recproco de la media aritmtica de los
recprocos
PROPIEDADES

Es un promedio que se utiliza para el clculo del costo promedio y todo tipo de variables
expresadas en tasas o porcentajes. como por ejemplo: velocidad/distancia,
productividad/tiempo, etc
La media armnica no est definida en el caso de la existencia en el conjunto de
valores nulos.
Cuando la unidad constante o unidad de evaluacin es igual a la unidad del numerador
de una razn,
se usa el promedio armnico, y si es igual a la unidad del denominador se usa el
promedio aritmtico.

CLCULO DE LA MEDIA ARMNICA:


a) Datos Originales:

XH

n
n

Xi
i 1

Ejemplo:
La velocidad de produccin de azcar de tres mquinas procesadoras son 0,5, 0,3 y 0,4
minutos por kilogramo. Hallar el tiempo promedio de produccin despus de una jornada de
4800 minutos del proceso

Solucin:
Como en la razn minutos/kilogramos (min/kg) cada mquina trabaja 4800 min, la razn
contante es el tiempo de trabajo (4800 min), es decir la contante es la unidad del numerador,
por lo tanto se debe emplear el promedio armnico

118 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Empleando Excel se calcula insertando la funcin MEDIA.ARMO

b) Datos Agrupados:
Se emplea cualquiera de las siguientes ecuacion
n
XH n
ni

i 1 Xi
Propiedad:
XH < XG < X
Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en horas que se demoran en
realizar la misma obra determinados obreros. Calcular el tiempo promedio que se demora en
realizar la obra un obrero tipo (un obrero promedio).
Tiempo

Obreros

119 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012

Para Datos Agrupados en Intervalos


Se emplea la siguiente ecuacin

XH

n
ni

i 1 Xi
n

Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se demoran
para resolver una prueba de Estadstica determinados estudiantes. Calcular el tiempo
promedio que se demora en resolver la prueba un estudiante tipo.

Tiempo

Estudiantes

[40-50)

[50-60)

[60-70)

10

[70-80)

[80-90]

11

Solucin:
Realizando los clculos respectivos se obtiene:
ni
[40-50)

45

ni/xi
0,089

[50-60)

55

0,145

[60-70)

10

65

0,154

[70-80)

75

0,093

[80-90]

11

85

0,129

Total

40

Aplicado la ecuacin se obtiene:

120 Mg. Miguel Angel Macetas Hernndez

xi

0,611

Estadstica General 2012


IV.

CAPITULO Estadgrafos de Tendencia No central

4.1. Estadgrafos de Tendencia No central


La medida de posicin no central son valores cuyas posiciones en las series ordenadas
de los datos permiten dividir a estos en grupos, cada grupo contiene igual nmero
(porcentaje). A estas medidas se conocen con el nombre genrico de cuantiles. Los
cuantiles ms importantes son los cuartiles

A. Los Cuartiles
Para Datos No Agrupados
La posicin o ubicacin de los cuartiles se encuentra aplicando la siguiente ecuacin:

Donde
n = Nmero total de datos
K = Nmero del cuartil
Ejemplo
Encuentre los cuartiles dada la siguiente distribucin, y represntelos grficamente
mediante un diagrama de caja y bigotes: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los cuartiles se ordena los datos de menor a mayor
6

12

12

12

15

17

Aplicando la ecuacin para el cuartil uno se obtiene:


( )( )
[

Como la posicin del cuartil 1 es 2.5, su valor es el promedio de los datos segundo y
tercero

O tambin la posicin 2.5 dice que el cuartil 1 est ubicado al 50% del trayecto
comprendido entre el segundo dato, que es 9 y el tercer dato que es 9, es decir, Q1=
9+0.5 (9-9) = 9
Interpretacin: Este resultado indica que el 25% de los datos es inferior a 9

121 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


En Excel se calcula insertando la funcin CUARTIL.INC

Aplicando la ecuacin para el cuartil dos se obtiene:

( )( )
[

O tambin la posicin 4.5 dice que el cuartil 2 est ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que tambin es 12, es
decir,
Q2= 12+0,5(12-12) = 12
Interpretacin: Este resultado indica que el 50% de los datos es inferior a 12
Aplicando la ecuacin para el cuartil tres se obtiene:
( )( )
[

O tambin la posicin 6,5 dice que el cuartil 2 est ubicado al 50% del trayecto
comprendido entre el doceavo dato, que es 12 y el quinceavo dato que 15, es decir,
Q3= 12+0,5(15-12)
Q3= 12+0.5 (3)=12+1,5=13,5
Interpretacin: Este resultado indica que el 75% de los datos es inferior a 13,5

122 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


B. Para elaborar un diagrama de caja y bigotes es necesario saber:
Un diagrama de caja y bigotes es una representacin grfica que ayuda a visualizar
una distribucin de datos: caja desde Q1 a Q3 (50% de los datos), y bigotes el
recorrido (distancia desde valor mnimo hasta el valor mximo).
Para elaborar un diagrama de caja se procede de la siguiente manera:

a) Se marca los valores de la serie de datos sobre el eje horizontal o vertical.


b) Se ubica sobre el eje el valor mnimo, primer cuartil, mediana o segundo cuartil,
tercer cuartil y el valor mximo.
c) Se construye un rectngulo (caja) paralelo al eje, de longitud desde Q 1 a Q3 y
anchura arbitraria.

De acuerdo al ejemplo ilustrativo se tiene:


Valor mnimo = 6
Q1 = 9
Q2 = 12
Q3 = 13,5
Valor mximo = 17

123 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Datos agrupados
Los cuartiles son estadgrafos de posicin que dividen al total de las observaciones,
debidamente ordenados o tabulados, en cuatro partes de igual tamao.
Para calcular los cuartiles se utiliza la siguiente formula

jn

4 N J 1
Q j L i 1 C j

nj

Donde
Lj-1 =
Cj =
j =
n =
Nj =

Lmite inferior del Intervalo del Cuartil


Amplitud del intervalo Cuartill
El nmero de Cuartil j = 1, 2 y 3
Nmero total de observaciones o datos.
Es un inmediato superior a jn

Nj-1

nj =

Es el nj que le corresponde al Intervalo

Es una Ni inmediata inferior a

jn
4

a) Primer Cuartil (Q1)


Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno

jn

Aqu n = 40 y j =1 luego

1x 40 10

se compara con los N i se obtiene que 10,

observando
En la tabla este valor no coincide con algn Ni, est entre 8 y 10, es decir: 8 < 10 <
18
Intervalos de
clases

(Li-1
I1

IQ1=
Lj-1

Li ]

16 27

Frecuencia
Absolutas

ni

Frecuencias
Absolutas
Acumuladas

n1 = 3

Ni
N1 = 3

I2

27 38

n2 = 5

N2 = 8

I3

38 49

n3 = 10

N3 = 18

I4

49 60

n4 = 3

N4 = 21

I5

60 71

n5 = 8

N5 = 29

I6

71 82

n6 = 7

N6 = 36

I7

82 93

n7 = 4

N7 = 40

Total
124 Mg. Miguel Angel Macetas Hernndez

40

Nj-1
Nj

nj

Estadstica General 2012


Reemplazando los valores obtenidos en la frmula:
10 8
Q1 38 11
40,2
10
Interpretacin Que el 25% del total de alumnos, es decir 10 de ellos tienen una puntuacin
inferior o igual a 40,2 puntos, y los 30 restantes, o sea el 75% de trabajadores, tienen un
puntaje superior a 40,2 puntos.

b) Segundo Cuartil (Q2)


Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aqu n = 40 y j =2 luego
observando

jn

2x 40 20

se compara con los N i se obtiene que 20,

En la tabla este valor no coincide con algn Ni, est entre 18 y 21, es decir:
18 < 20 < 21
Intervalos de
clases
(Li-1

IQ2=
Lj-1

Frecuencia
Absolutas

Frecuencias
Absolutas
Acumuladas

ni

Ni

Li ]

I1

16 27

n1 = 3

N1 = 3

I2

27 38

n2 = 5

N2 = 8

I3

38 49

n3 = 10

N3 = 18

Nj-1

I4

49 60

n4 = 3

N4 = 21

Nj

I5

60 71

n5 = 8

N5 = 29

I6

71 82

n6 = 7

N6 = 36

I7

82 93

n7 = 4

N7 = 40

Total

nj

40

Reemplazando los valores obtenidos en la frmula:


2x 40

4 18
Q 49 11
56,33
2
3

125 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Interpretacin Que el 50% del total de alumnos, es decir 20 de ellos tienen una puntuacin
inferior o igual a 56,33 puntos, y los 20 restantes, o sea el 50% de trabajadores, tienen un
puntaje superior a 56,33 puntos.

c) Tercer Cuartil (Q3)


Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
jn

Paso Uno

3x 40 30
4

Aqu n = 40 y j =3 luego se compara con los Ni se obtiene que


30, observando en la tabla este valor no coincide con algn Ni, est entre 29 y 36, es
decir:
29 < 30 < 36
Intervalos de
clases
(Li-1

IQ3=

Frecuencia
Absolutas

Frecuencias
Absolutas
Acumuladas

ni

Ni

Li ]

I1

16 27

n1 = 3

N1 = 3

I2

27 38

n2 = 5

N2 = 8

I3

38 49

n3 = 10

N3 = 18

I4

49 60

n4 = 3

N4 = 21

I5

60 71

n5 = 8

N5 = 29

Nj-1

I6

71 82

n6 = 7

N6 = 36

Nj

82 93

n7 = 4

N7 = 40

nj

Lj-1

I7

Total

40

Reemplazando los valores obtenidos en la frmula:


3 x 40

4 29
Q 71 11
39,57
3
7

Interpretacin Que el 75% del total de alumnos, es decir 30 de ellos tienen una puntuacin
inferior o igual a 39,57 puntos, y los 10 restantes, o sea el 25% de trabajadores, tienen un
puntaje superior a 39,57 puntos.
126 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


C. Deciles
Definicin
Son cada uno de los 9 valores D 1, D2, D3, D4, D5, D6, D7, D8, D9 que dividen a la
atribucin de los datos 10 partes iguales.
El primer decil es igual al dcimo percentil (D 1=P1), el segundo decil es igual a
veinteavo percentil (D2=P20), y as sucesivamente.

Para Datos No Agrupados


La posicin o ubicacin de los deciles se encuentra aplicando la siguiente ecuacin

Donde
n = Nmero total de datos
K = Nmero del cuartil
Ejemplo

Ejemplo:
Calcular el quinto decil de la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17

Solucin:
Para calcular los deciles se ordena los datos de menor a mayor.
6

12

12

12

15

17

Aplicando la ecuacin para el quinto decil se obtiene:


( )( )
[

O tambin la posicin 4,5 dice que el decil 5 est ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que tambin es 12, es
decir,
D5= 12+0,5(12-12) = 12
En Excel se calcula de la siguiente manera:

127 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Como D5 es igual a P50 se introduce la funcin PERCENTIL.INC

Datos Agrupados en Tablas de Frecuencia


Se emplea la misma ecuacin utilizada en el clculo de los deciles para datos sin
agrupar.
Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuacin:

jn

10 N J 1
D j Li 1 C j

nj

Donde
Lj-1 =
Cj =
j =
n =
Nj =

Lmite inferior del Intervalo de clase del decil


Amplitud del intervalo Decil
El nmero de Decil j = 1, 2, 3,,9
Nmero total de observaciones o datos.
Es un inmediato superior a jn

Nj-1

nj =

Es el nj que le corresponde al Intervalo

10

Es una Ni inmediata inferior a

128 Mg. Miguel Angel Macetas Hernndez

jn
10

Estadstica General 2012


D. Percentiles o Centiles
Son cada uno de los 99 valores P 1, P2, P3,..P99 que dividen atribucin de los
datos en 100 partes iguales.
Datos No Agrupados
La posicin o ubicacin de los percentiles se encuentra aplicando la siguiente
ecuacin:

Donde:
n = nmero total de datos
k = nmero del percentil

Ejemplo:
Calcular los percentiles de orden 20 y 33 del peso de diez personas que pesan (en
kg) 80, 78, 65, 73, 65, 67, 72, 68, 70 y 72
Solucin:
Se ordena los datos de menor a mayor se tiene:
65

65

67

68

70

72

72

73

78

80

1) Clculo del percentil de orden 20 se obtiene:


(
[

)(

En Excel se obtiene un valor aproximado insertando la funcin PERCENTIL.INC

129 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


Clculo del percentil de orden 33 se obtiene:
[

)(

Datos Agrupados en Tablas de Frecuencia


Se emplea la misma ecuacin utilizada en el clculo de los percentiles para datos sin
agrupar.
c) Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuacin:

jn

100 N J 1
Pj Li 1 C j

nj

Donde
Lj-1 =

Lmite inferior del Intervalo de clase del Percentil

Cj =

Amplitud del intervalo Percentil

El nmero de Percentil j = 1, 2, 3,,99

n =

Nmero total de observaciones o datos.

Nj =

Es un inmediato superior a

Nj-1

nj =

Es el nj que le corresponde al Intervalo

jn
100

Es una Ni inmediata inferior a

130 Mg. Miguel Angel Macetas Hernndez

jn
100

Estadstica General 2012


EJERCICIOS
1. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la
nacin reportadas aparecen en la siguiente tabla de frecuencias. Calcule e
interprete la media, la mediana y la moda. Adems, calcule e interprete: Q 1, Q2, D10,
D60, P15, P90.
Edades

Frecuencias

50 y menos de 55

55 y menos de 60

13

60 y menos de 65

15

65 y menos de 70

10

70 y menos de 75

75 y menos de 80

2. La siguiente informacin corresponde al consumo mensual en combustible


destinado a calefaccin, expresado en miles de $, en una muestra aleatoria de
hogares de un barrio de Santiago, durante los meses de invierno:

Consumo
($miles)

N de casos

46
68
8 10
10 12
12 14

17
26
14
9
11

a. Qu consumo deja bajo s al 25% de los consumos ms bajos?


b. Qu consumo deja sobre s al 15% de los consumos ms altos?
3. La siguiente distribucin corresponde a la recaudacin de impuestos de 40
contribuyentes. (Recaudacin de impuestos en miles de pesos).
[L i 1 L i ]

xi

ni

50- 70
70- 90
90 - 110
110 - 130
130 150

60
80
100
120
140

2
15
8
12
3

a) Cul es la recaudacin correspondiente a


cuartil 1? Interprtela.
b) Cul es la recaudacin correspondiente al
Percentil 65? Interprtela.
c) Bajo qu recaudacin estn el 20% de las
recaudaciones menores?

d) Sobre qu recaudacin est el 20% de las


131 Mg. Miguel Angel Macetas Hernndez
recaudaciones mayores?
e) Qu

orden

de

percentil

representa

la

Estadstica General 2012


V.

CAPITULO Medidas de Dispersin

5.1. Medidas de dispersin


Las medidas de dispersin permiten calcularla representatividad de una medida de
posicin, para lo cual ser preciso cuantificar la distancia de los diferentes valores de
la distribucin respecto a dicha medida. A tal distancia es a lo que, en trminos
estadsticos, denominaremos variabilidad o dispersin de la distribucin. Las medidas
de dispersin tienen como finalidad estudiar hasta qu punto, para una determinada
distribucin de frecuencias, las medidas de tendencia central o de posicin son
representativas como sntesis de toda la informacin de la distribucin. Medir la
representatividad de una medida de posicin equivale a cuantificar la separacin de
los valores de la distribucin respecto a dicha medida. Entre los estadgrafos de
Dispersin de mayor uso se tiene:
A. Recorrido o rango (R)
El recorrido do un conjunto de observaciones es simplemente la diferencia entre el
mayor y menor valor de la variable.
En datos no agrupados:
R = Xmax Xmin
B. Recorrido Semi Cuartil (Q)
La desviacin cuartil de un conjunto de datos est definido por

Q3 Q1
2

Donde Q1 y Q3 son el primer y tercer cuartil de los datos. A veces se usa el


"Recorrido Intercuartil Q3 Q1". El recorrido semi-intercuartil o desviacin cuartil,
da una idea de la dispersin del 50% de los datos centrales.
C. Varianza (s2)
Es el estadgrafo de dispersin ms importante. y expresa el grado de dispersin
de las observaciones respecto a la media aritmtica. Se denota por s 2; V(X); V(Y);
2; etc.
La varianza se define como:
"La varianza es la media o promedio del cuadrado de las desviaciones de la
variable respecto a su media".
132 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


La expresin de la definicin, tambin se escribe:

x x n

xn
x n

n 1

s2

2
i

n 1

Propiedades de la varianza:
Sean:
X : variables
k : constante
V( ): Operador varianza
a) V (X) 0
b) V (k) = 0
c) V (x + k) = V(x)
d) V (kx) = K2 V(X)
Si tenemos una muestra tamao n la dividimos en r sub muestras determinando en
cada una de ellas sus respectivas medias, entonces la media total se determina por la
formula siguiente:
r

XT

S 2 ni
i 1

(X

X t )ni

i 1

Intravarianza + Intervarianza
[Li-1 Li)

Xi

ni

xi ni

x i2ni

0,2 7,2

3,7

11,1

41,07

7,2 14,2

10,7

53,5

572,45

14,2 21,2

17,7

141,6

2506,32

21,2 28,2

24,7

123,5

3050,45

28,2 35,2

31,7

10

317

10048,9

35,2 42,2

38,7

154,8

5990,76

42,2 49,2

45,7

228,5

10442,45

40

1030

32652,4

Total

s2

1030
32652,4

40 1

40

133 Mg. Miguel Angel Macetas Hernndez

157,1769

Estadstica General 2012


D. Desviacin Estndar o Tpica (s)
La desviacin estndar o tpica, se define como la raz cuadrada de la varianza

V X s
157,1769 12,5370221
Es uno de los estadgrafos de dispersin de mayor uso, en si cual las unidades de
la variable ya no estn elevadas al cuadrado. La desviacin estndar, al igual que
la varianza, es no negativa (s 0), puesto que es la raz cuadrada positiva de la
varianza. A mayor dispersin le corresponder una mayor desviacin estndar.

NOTA: En general, los estadgrafos de dispersin se usa para comparar dos o ms


distribuciones o poblaciones. A mayor dispersin o heterogeneidad entre los
valores o elementos de una poblacin, le corresponde un valor mayor para
el estadgrafo de dispersin.
E. Coeficiente de Variacin (CV)
Est definido por la expresin:

CV

S
100
x

El valor se expresa en trminos porcentuales. Una regla emprica, cuando el CV


< 33% los datos no presentan dispersin en los datos recolectados los datos
son ms homogneos

CV

12,537100 48,68746446%
25,75

Datos presentan dispersin


0%<CV<5%,

Altamente representativa.

5%<CV<10%,

Representativa de su serie.

10%<CV<15%,

moderadamente representativa

15%<CV<30%,

Bajo grado de representatividad.

CV>30%,

No tiene ningn grado de representatividad

134 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


VI.

CAPITULO Estadgrafos de Deformacin

Asimetra.Es el grado de deformacin de la curva representativa de una distribucin de frecuencias


con respecto a la vertical que pasa por la abscisa de la media aritmtica; se mide a
travs del Coeficiente de Asimetra.
A. Relacin Entre La Media, Mediana y Moda
La distribucin de frecuencias de un conjunto de datos puede ser simtrica o
asimtrica.
B. Distribucin Simtrica
Una distribucin es simtrica cuando su grafica semeja una de las tres curvas:

Mo

Me = X = Mo

Curva
hipottica
Normal
Curva Unimodal
Me = X = Mo

X = Me

Mo

Curva hipottica en
U
Curva Bimodal
X = Me

X = Me

Curva
hipottica
Rectangular
Curva sin moda
X = Me

Distribucin Positivamente Asimtrica


Es una distribucin donde los valores extremos son observaciones mayores. La
grafica es semejante a la siguiente curva hipottica.

Curva Positivamente Asimtrica (o Curva


con Sesgo Positivo).

Mo
Me

Curva Unimodal

Mo < Me < X

Distribucin Negativa Asimtrica


Es una distribucin donde los valores extremos son observaciones menores. La
grafica presenta una prolongacin hacia la izquierda, como la siguiente curva
hipottica.
Curva Negativa Asimtrica (o Curva con
Sesgo Negativo).

Mo

Hernndez
135 Mg. Miguel Angel MacetasMe

Curva Unimodal

Mo > Me > X

Estadstica General 2012


Relacin Emperica Entre Media, Mediana y Moda
Cuando la distribucin es casi simtrica, se puede utilizar la frmula de la moda
emprica dad por:

Moda = 3(Mediana) 2(Media)

Mo

3 Me 2 X

C. Importancia de la Asimetra.El conocimiento de la asimetra es importante por el hecho de que la teora estadstica
se basa a menudo en el supuesto de una distribucin normal. Por lo tanto una medida
de asimetra de una distribucin es necesario para preservarnos de las consecuencias
de esta suposicin (La condicin necesaria de una distribucin normal es que sea
simtrica).

D. Coeficiente de Asimetra.
Consideramos varias frmulas para el clculo de la medida de asimetra:
Coeficiente de Asimetra en base a Momentos.

m
1 ( xi - x ) ni
n s3
3

AS =

Primero y segundo coeficiente de asimetra de PEARSON

AS1

A.
B.

AS2

X Mo
; Denominado primer coeficiente de Parson.
S

3(X Me)
; Denominado segundo coeficiente de Pearson.
S

Coeficiente de Asimetra cuartlico o de ARTHUR BOWLEY

AS

Q 3 2Q 2 Q1
Q 3 Q1

Decisin:

As=0, entonces la distribucin es simtrica.


As<0, entonces la distribucin es asimtrica (-)
As>0, entonces la distribucin es asimtrica (+)
E. Kurtosis o Apuntamiento.Es la mayor o menor altura de la curva representativa de una distribucin de
frecuencias en el punto o abscisa correspondiente a la media aritmtica.
136 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


D. Leptocrtica

D. Mesocrtica (Normal )
D. Platicrtica

KURTOSIS EN FUNCIN DE MOMENTOS:


4
m
( -x )
K = 1 xi 4 ni = M 42 ; x : media
ns
M2
Decisin:
K=3, Entonces la distribucin posee una curva mesocrtica (Normal).
K<3, Entonces la distribucin posee una curva platicrtica.
K>3, Entonces la distribucin posee una curva leptocrtica.

KURTOSIS EN FUNCIN DE CUARTILES Y PERCENTILES.

K
Donde:
Los percentil P90 y P10 se calcula con la
siguiente frmula:

rn

100 N J 1
Pr L i 1 C j

nj

Decisin:

Q3 Q1
2P90 P10
Lj-1=Limite inferior del Intervalo del Percentil
Cj =Amplitud del intervalo Percentilico
r = El nmero de Percentill r = 1,2,3,,99
n = Nmero total de observaciones o datos.
Nj = Es un inmediato superior a

jn
100

Nj-1= Es una Ni inmediata inferior a

K=0.263, la distribucin es mesocrtica.


nj =

K<0.263, la distribucin es platicrtica.


K>0.263, la distribucin es leptocrtica.

137 Mg. Miguel Angel Macetas Hernndez

jn
100

s el nj que le corresponde al Intervalo

Estadstica General 2012


Ejemplo. Calcular el grado de asimetra y kurtosis de la distribucin del nivel de glucosa de los
60 varones adultos evaluados. Los clculos son organizados en la tabla, de modo
que reemplazando datos en frmula se tiene:
Distribucin del Nivel de Glucosa de 60 varones adultos
(Li-1

Li]

xi

Xini

X ni

(X i X) 3 n i (X i X) 4 n i

35

45

40

200

8000

-158773.1481

5027816.358

45

55

50

350

17500

-71199.0741

1542646.605

55

65

60

11

660

39600

-17467.5926

203788.5802

65

75

70

14

980

68600

-64.8148

108.0246914

75

85

80

640

51200

4629.6296

38580.24691

85

95

90

630

56700

43134.2593

790794.7531

95

105

100

400

40000

90981.4815

2577808.642

105

115

110

4
60

440

48400

4300

330000

Total

(x

) 3 ni

Coeficiente Asimetra =

n
8

(x

225314.8148 8637067.901
116555.556 18818611.111

116555.56
= 0.2799,
60 * (19.076) 3

) 4 ni

18818611.1111
= 2.3686
n *
60 * (19.076) 4
Por tanto se puede afirmar que la distribucin emprica es:
Aprox. Simtrica, puesto que AS = 0.28
0

Coeficiente Kurtosis =

Platicrtica, puesto que K = 2.37 < 3.


Entonces se puede concluir que dicha distribucin difiere ligeramente de la normal.
2.4. Aplicaciones de las medidas en datos univariados
Ejemplo 1. Los siguientes datos constituyen las vidas tiles en horas. de una muestra
aleatoria de 60 bombillas de luz de 100 watts.
807
811 620 660 817 732 747 823
844 907
660
753 1050 918 857 867 675 880
878 890
881
872 869
841 847 833 829 827
822 811
766
787 923 792 803 933 947 717
817 753
1056 1076 958 970 776 828 831 781 1088 1082
832
863 852 788 980 889 1030 897 755 891
a) Clasifique convenientemente con Anchos de Clase iguales y trace el Polgono de
Frecuencias Absolutas.
b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan
entre 700 y 1000 horas.
c) Encuentre los lmites que sub-clasifiquen las bombillas en tres categoras con referencia
a su duracin.
El 15 % ms durables en la categora A
El 15 % menos .durables en la categora C.
El resto en la categora B
Solucin
Clculos previos para elaborar la tabla
Recorrido (R) =1088 620 = 468
138 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


(
Elegimos el nmero de Intervalos (m) =
Tomamos m = 6 intervalos
Determinar la amplitud de los intervalos (C)

a) Clasifique convenientemente con Anchos de Clase iguales


CUADRO N 01
DISTRIBUCIN DE DATOS CONSTITUYEN LAS VIDAS TILES EN HORAS. DE UNA
MUESTRA ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS.
Marca Nmero Frecuencia
Frecuencia
Vida til en horas
Frecuencia
de
de
Acumulada
Relativa
Relativa
clase Bombillas
Simple
Acumulada
[Li-1

L i>
xi
ni
Ni
hi
Hi
[620 698>
659
4
4
0,0667
0,0667
[698 776>
737
7
11
0,1167
0,1833
[776 854> 815
23
34
0,3833
0,5667
[854 932>
893
15
49
0,2500
0,8167
[932 1010> 971
5
54
0,0833
0,9000
[1010 1088> 1049
6
60
0,1000
1,0000
Total
60
1,0000
El Polgono de Frecuencias Absolutas.
Para graficar el polgono de frecuencias se realiza algunos clculos
Marca de Nmero de
clase
Bombillas
xi
ni
581
0
659
4
737
7
815
23
893
15
971
5
1049
6
1127
0
60

Vida til en horas

[Li-1
[620
[698
[776
[854
[932
[1010

L i>

698>
776>
854>
932>
1010>
1088>

Total

Nmero de bombillas

GRAFICO N 01
POLGONO DE FRECUENCIA DE LA VIDA TIL EN HORAS DE UNA MUESTRA
ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS
25

23

20
15

15

10

0
581

0
681

781

881

981

1081

Vida promedio en horas de bombillas de luz de 100 watts.

139 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan
entre 700 y 1000 horas.
Vida til en horas Nmero de Frecuencia Frecuencia
Bombillas
Relativa
Relativa
[Li-1

L i>
ni
hi
hi %
[620 698>
4
0,0667
6,667
[698 776>
7
0,1167
11,667
[776 854>
23
0,3833
38,333
[854 932>
15
0,2500
25,000
[932 1010>
5
0,0833
8,333
[1010 1088>
6
0,1000
10,000
Total
60
1,0000
100,000
Calculamos el nmero de observaciones pedido:
(
)
698 a 776
11,66667
78
11,6667
698 a 700
x
2
x
Para encontrar el valor 698 a 700 = 11,6666667 0,2991453 = 11,3675214
(
)
932 a 1010
8,3333
78
8,333
932 a 1000
x
68
x
Para encontrar el valor 700 y 1000 horas. = 11,368 + 38,333 + 25,000 + 7,265 =
81,966%
El 15 % ms durables en la categora A
Basta calcular el percentil 15 y el percentil 85
(
(

)
)

Ejemplo 2. En la siguiente distribucin de frecuencias relativas calcular:


a) Las desviacin cuartillita
b) Discutir el sesgo y la kurtosis
Tiempo
0 3
3 6
6 9
9 12
12 15 15 18
hi
0,04
0,06
0,40
0,38
0,10
0,02
Solucin
Tiempo
Xi
hi
Hi
xi hi
xi2 hi
0 3
1,5
0,04
0,04
0,06
0,09
3 6
4,5
0,06
0,10
0,27
1,215
6 9
7,5
0,40
0,50
3,00
22,5
9 12
10,5
0,38
0,88
3,99
41,895
12 15
13,5
0,10
0,98
1,35
18,225
15 18
16,5
0,02
1,00
0,33
5,445
Total
1
9
89,37
Directamente de la tabla: media aritmtica x xi hi 9

Varianza S 2 xi2 hi X

89,37 9 2 8,37

Desviacin estndar S = 2,89309523

140 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


a) Las desviacin cuartillita
(
)

b) Discutir el sesgo y la kurtosis


(
)
(

(
(

)
)

No podemos concluir que la distribucin sea simtrica. En efecto, como la media est a la
derecha de la moda la distribucin es sesgada a la derecha y usando el primer Coeficiente
de Pearson tenemos:

Como Sk > 0 la distribucin es ligeramente sesgada a la derecha

Como es K>0.263, puede considerarse la distribucin que es Leptocrtica


Ejemplo 3. Al investigar el nivel socioeconmico en los valores: Bajo (B), Medio (M), Alto
(A),
20 familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.
Construir la distribucin de frecuencias y trazar su grfica.

Nmero de Familias

Nivel
Frecuencia
socioeconmico Absoluta
Medio
8
Bajo
9
Alto
3
Total
20
10

Frecuencia
Relativa
40,0
45,0
15,0
100

Alto
15%

8
6
3

4
2
0
Medio

Bajo

Alto

Nivel Socioecnomico

141 Mg. Miguel Angel Macetas Hernndez

Bajo
45%

Medio
40%

Estadstica General 2012


VII.

CAPITULO Regresin y Correlacin Lineal


Regresin y Correlacin Lineal
Son dos herramientas para investigar la dependencia de una variable dependiente Y en
funcin de una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o
respuesta
X = Variable independiente, tambin se llama variable explicativa, regresor o predictor
Regresin lineal - La relacin entre X y Y se representa por medio de una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio de una curva.

La ecuacin de la recta es la siguiente:


Y b 0 b 1 X e .........Con.base.en.la. poblacin
Y b0 b1 X e...........Con.base.en.datos.de.la.muestra
*

Y b0 b1 X ................Modelo.de.regresin .estimada

El trmino de error es la diferencia entre los valores reales observados Y i y los valores
estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual
se utiliza el mtodo de mnimos cuadrados.
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el
siguiente ejemplo por claridad. Se tienen los siguientes supuestos:

1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresin


poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X
(Homoscedasticidad) en caso contrario se tiene (Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algn patrn definido.

142 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


El coeficiente de Correlacin r desarrollado por Carl Pearson es un indicador de la
fuerza de la relacin entre las variables X y Y, puede asumir valores entre -1 y 1 para
correlacin negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra
que la variable presin tiene una correlacin positiva con el rendimiento de una caldera,
se deben buscar soluciones al problema mediante acciones asociadas con la variable
presin; de lo contrario, sera necesario buscar la solucin por otro lado.

Se identifican tres medidas de desviacin como sigue:

Ejemplo: Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo


est relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos
de tiempo tomados para n = 25 servicios se muestran a continuacin:
(Yi-Y)2

Yest

Error

38.9376

364.1533

10.9199

0.9408

1.099872

0.0576

21.0021

28.3362 15.1022

31.75

7.499472

7.6176

7.3832

37.0443 28.0292

10

35.00

10.502272

3.0976

35.6075

34.1416

25.02

0.963072

0.0576

16.1026

28.3362 10.9969

16.86

51.612672

17.9776

148.1771

16.7253

14.38

91.433472

38.9376

214.7045

10.9199 11.9721

9.60

121.260672

38.9376

377.6337

10.9199

24.35

-3.558928

0.5776

21.9286

31.2389 47.4563

27.50

0.367872

0.0576

2.3495

28.3362

X Servicios

Y Tiempo

(Xi-X)*(Yi-Y)

9.95

119.076672

24.45

11

143 Mg. Miguel Angel Macetas Hernndez

(Xi-X) 2

0.7369

0.0181

1.7422

0.6991

Estadstica General 2012


4

17.08

50.679872

17.9776

142.8694

16.7253

0.1258

11

37.00

21.989472

7.6176

63.4763

37.0443

0.0020

12

41.95

48.568672

14.1376

166.8541

39.9470

4.0121

11.66

108.406272

38.9376

301.8142

10.9199

0.5477

21.65

31.303072

17.9776

54.5057

16.7253 24.2523

17.89

47.245472

17.9776

124.1620

16.7253

20

69.00

470.014272

10.30

135.625472

52.4176

350.9178

8.0172

5.2111

10

34.93

10.379072

3.0976

34.7770

34.1416

0.6216

15

46.59

118.686672

45.6976

308.2553

48.6551

4.2646

15

44.88

107.127072

45.6976

251.1337

48.6551 14.2512

16

54.12

194.676672

60.2176

629.3676

51.5578

6.5649

17

56.63

241.751472

76.7376

761.6054

54.4605

4.7068

22.13

15.462272

5.0176

47.6486

22.5307

0.1606

21.15

25.540272

10.4976

62.1385

19.6280

2.3164

206

725.82

2,027.7132

698.5600

6,105.9447

220.0926

Sxy

Sxx

Syy = SST

SSE

Y Promedio

Xi-X)*(Yi-Y)

(Xi-X)^2

(Yi-Y)^2

Sxy

Sxx

Syy

1.3564

138.2976 1,597.3771 63.1686 34.0052

X
promedio

Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera
y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que
se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:

Sxy = 2027.71
Sxx

= 698.56

Syy

= 6105.94

Las ecuaciones para el clculo manual son las siguientes:

b1 b1

( Xi X )(Yi Y ) S
S
( Xi X )

XY

= 2.902704421

XX

144 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


b0 b0

b1 X i
n

Y bX = 5.114515575

Las sumas de cuadrados son:

SST (Yi Y ) 2 6,105.9447


SSE (Yi Yi ) 2 (Yi (bo b1* X i )) 2 220.0926

SSR SST SSE 5,885.8521


El coeficiente de determinacin r2 y el coeficiente de correlacin r se calculan a
continuacin:

r2 1

SSE ( SST SSE ) SSR


= 0.9639

SST
SST
SST

El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada


por la regresin.

r r 2 = 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es
un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r
= 0 indicara correlacin nula.

El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica


para afirmar que el tiempo de atencin est relacionado con el nmero de servicios
atendidos.

145 Mg. Miguel Angel Macetas Hernndez

Estadstica General 2012


EJERCICIOS:
1. La energa consumida en un proceso depende del ajuste de mquinas que se realice,
realizar una regresin cuadrtica con los datos siguientes y responder las preguntas.
Cons_energa

Ajuste Mq.

Y
21.6
4
1.8
1
1
0.8
3.8
7.4
4.3
36.2
a. Trazar un diagrama de dispersin

X
11.15
15.7
18.9
19.4
21.4
21.7
25.3
26.4
26.7
29.1

b. Obtener la ecuacin de regresin lineal y cuadrtica y comparar


c. Estimar el consumo de energa para un ajuste de mquina de 20 con regresin
cuadrtica
d. Obtener los intervalos de prediccin y de confianza para un ajuste de mquina de 20
e. Obtener el coeficiente de correlacin y de determinacin

2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas
en una lnea area. Las quejas son por cada 100000 pasajeros.
%puntos Quejas a. Trazar un diagrama de dispersin
Aerolnea
A
B
C
D
E
F
G

X
81.8
76.6
76.6
75.7
73.8
72.2
70.8

Y
0.21
0.58
0.85
0.68
0.74
0.93
0.72

68.5

1.22

b. Obtener la ecuacin de regresin lineal


c. Estimar

las

quejas

para

un

porcentaje

de

puntualidad de 80%
d. Obtener los intervalos de prediccin y de confianza
para una altura de 63"
e. Obtener el coeficiente de correlacin y de
determinacin

146 Mg. Miguel Angel Macetas Hernndez