Vous êtes sur la page 1sur 160

MANUAL DE

ESTADSTICA GENERAL

Jorge Crdova Egocheaga


Manual de
Estadstica General
Jorge Crdova Egocheaga

1ra Edicin: Marzo del 2003

SOBRE EL AUTOR

Estudios Doctorales en Ciencias Administrativas (UNFV), Matre


en Administration des Affaires (MBA-UQAM, Canad), Magster
en Administracin (ESAN), Magster Scientiae (MSc) en
Economa (UNA), Especialista en Formulacin y Evaluacin de
Proyectos de Inversin (UNMSM), Profesor de Estadstica en la
Maestra en Administracin de la Universidad de San Martn de
Porres, Docente de Estadstica y de Informtica Aplicada en el
rea de Salud en la Escuela Universitaria de Post Grado de la
Universidad Nacional Federico Villarreal, Profesor Principal y Jefe
de la Divisin de Evaluacin y Estadsticas de la Escuela de
Sanidad Naval de la Marina de Guerra del Per, Profesor de
Estadstica y Mtodos Cuantitativos para los Negocios en el MBA
de la Universidad San Ignacio de Loyola, Consultor y Expositor
Independiente. Director Ejecutivo del Centro de Capacitacin y
Asesora de Negocios, CECAN.

Los derechos intelectuales de esta obra son de propiedad exclusiva de


Jorge Crdova Egocheaga.

Toda reproduccin total o parcial del contenido de esta obra requerir la


autorizacin del propietario de los derechos intelectuales.
CAPTULO 1
INTRODUCCIN

El pensamiento estadstico algn da ser tan necesario para la


ciudadana como la capacidad de leer y escribir...
H.G.Wells hace mas de 100 aos

OBJETIVOS
Al finalizar el Captulo 1, el participante ser capaz de:
1. Comprender los reas de aplicacin de la
Estadstica dentro de las Gestin de la Salud.
2. Comprender el pensamiento estadstico
3. Identificar las etapas de la investigacin cientfica
4. Definir las etapas del trabajo estadstico.
5. Identificar los diversos tipos de datos.
6. Diferenciar poblacin y muestra.
7. Distinguir parmetro y estimador.
8. Diferenciar estadstica descriptiva y estadstica
inferencial.
Manual de Estadstica General

1.1 SITUACIONES EN LAS QUE SE UTILIZA LA


ESTADSTICA

Ejemplos

Varias veces durante el da una enfermera toma la


temperatura a los pacientes en el Servicio de Emergencia de
un Centro Hospitalario local.
Un investigador mdico examina los efectos de un agente
cancergeno en las ratas. Tres semanas despus de
inyectado el agente en una rata, el investigador realiza una
intervencin quirrgica para extraer y pesar los tumores.
El Director de un Hospital registra el tiempo de recuperacin
por tratamiento.
El Director de un Hospital cuenta el nmero de camas a fin
de medir la tasa de ocupabilidad.
Un investigador mdico est interesado en conocer la
relacin entre el sexo y el riesgo de infarto.
El Jefe de Almacn de una Clnica revisa unos cuantos
frascos del lote de vacunas que acaba de llegar, y verifica su
fecha de expiracin.
El mdico responsable del Laboratorio Clnico del Hospital,
extrae una muestra de sangre a fin de determinar el nivel de
colesterol del paciente.

1.2 EL PENSAMIENTO ESTADSTICO

El profesional de la gestin de la salud debe de preocuparse


permanentemente en registrar informacin sobre las
caractersticas que le permitan conocer los factores que
inciden en la variabilidad del servicio y as estar en
condiciones de implementar acciones dirigidas a mejorar la
calidad del servicio que ofrece.

Debe medir

Las quejas en el Servicio de Emergencia,


Las devoluciones por da en una farmacia,

4
Jorge Crdova Egocheaga

Las demoras en la atencin en una clnica o


Las placas radiolgicas reprocesadas en un
hospital, y compararlos con los indicadores de gestin o
estndares internacionales, y as determinar la calidad
del servicio.

La implementacin del pensamiento estadstico tiene tres


fases:

Identificar los factores de variabilidad.


Conocer (o medir) la variabilidad.
Manejar (o controlar) la variabilidad

1.3 LA INVESTIGACIN CIENTFICA

1.3.1 Qu es la investigacin cientfica?

Es la bsqueda sistematizada y objetiva de nuevos


conocimientos. Investigar es un proceso de buscar,
indagar o pesquisar.

El mtodo cientfico, comprende la realizar a


investigacin en forma sistematizada y objetiva,
organizada y coherente.

1.3.2 Etapas de la investigacin cientfica

A. Planificacin: Elaboracin del proyecto. Abarca


una descripcin detallada y fundamentada de cada
una de las actividades a desarrollarse en la
investigacin.

B. Ejecucin: Es la etapa en la cual se lleva a cabo al


investigacin. Recoleccin de datos, anlisis e
interpretacin.

5
Manual de Estadstica General

C. Informe: Escrito donde se presentan los hallazgos


encontrados.

1.4 ESTRUCTURA DE UN PROYECTO DE INVESTIGACIN

1.4.1 Definicin del problema

A. Ttulo

B. Antecedentes: Se refiere al nivel actual de


conocimientos. La investigacin que se planea
realizar debe contribuir a elevar el conocimiento que
la humanidad tenga de este tema. Si no se conocen
los antecedentes, es probable que repita una
investigacin anterior. Existen antecedentes
tericos (marco terico) y antecedentes empricos
(resultados).

C. Objetivos: Enunciado de los logros alcanzables y


evaluables en el estudio.

a. Cmo voy a identificar las variables?


b. Cmo voy a medir esas variables?
c. Qu tcnica estadstica se utilizar?

D. Hiptesis: Enunciado de la relacin de la relacin


entre 2 o ms variables.

Recomendacin: al escribir el ttulo, el problema,


objetivos y las hiptesis, se debe referir a lo mismo.

1.4.2 Tipo de estudio

Casos y controles

6
Jorge Crdova Egocheaga

1.4.3 Definicin del alcance del estudio

Qu mbito abarca el estudio?. Definir el alcance


fsico, temporal, social, etc.

1.4.4 Diseo estadstico de la muestra

A) Tamao de la muestra
B) Procedimiento de seleccin

1.4.5 Definicin de variables y escalas de medicin

Depende de los objetivos y las hiptesis

1.4.6 Recoleccin de datos

Fuentes primarias y secundarias. Disear cuestionario


y fichas de observacin.

1.4.7 Procesamiento de la informacin

Definir con anticipacin los anlisis estadsticos que se


van a realizar y entre que variables: regresin,
hiptesis, entre otros.

1.4.8 Recursos y presupuesto de investigacin

Qu recursos personales y de materiales se requieren.


Cuales son los costos para llevar a cabo la
investigacin. Cmo se desembolsar (mes a mes)
estos gastos. Cmo se financiar.

1.4.9 Cronograma

Con ayuda de un Diagrama Gantt o un PERT, para


visualizar las diferentes etapas.

1.4.10 Referencias bibliogrficas

7
Manual de Estadstica General

1.5 PARTES DE UN INFORME FINAL DE INVESTIGACIN

1.5.1 Introduccin: Ttulo, antecedentes, objetivos,


hiptesis

1.5.2 Materiales y mtodos

1.5.3 Resultados analticos: fundamentar diferencias


evidenciadas

1.5.4 Discusin de resultados

1.5.5 Conclusiones: en relacin con los objetivos de la


investigacin.

1.6 QU ES ESTADSTICA?

Es una ciencia que comprende diversas tcnicas para :

RECOLECTAR

ORGANIZAR

ANALIZAR

INTERPRETAR

DATOS

8
Jorge Crdova Egocheaga

Cundo se RECOLECTAN datos ?

Cuando se registran caractersticas (medicin, observacin,


conteo).

Cundo se ANALIZAN datos ?

Cuando se ordenan para una mejor comprensin y facilitar


sus anlisis. (tablas, grficos y figuras)

Por ejemplo

Tabla de Distribucin
Edad N Pacientes

30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2

Diagrama Circular

12

10

Diagrama de 4

Barras 2

0
30-34 35-39 40-44 45-49

9
Manual de Estadstica General

Cundo se analizan datos?

Cuando se calculan promedios, medidas de variabilidad y


medidas de la forma de la distribucin.Cuando se establecen
relaciones entre ellas (regresin y correlacin).

Cundo se INTERPRETAN datos ?

Cuando se le otorga un sentido prctico a los resultados


obtenidos en el anlisis.

1.7 QU SON DATOS?

Son los registros de una caracterstica.

Ejemplo

Unidad de
Caractersticas Datos medida
Edad del paciente 27 aos
Peso del recin nacido 3,750 Kg.
Tiempo permanencia 5 das
Temperatura corporal 37,5 C
Profesin Enfermera ---

Si un DATO es til para tomar decisiones se convierte en


INFORMACIN.

Los datos ayudan a los responsables de tomar decisiones a


hacer suposiciones coherentes acerca de las CAUSAS y, por
tanto, de los EFECTOS probables de ciertas caractersticas
en situaciones dadas.

Por qu necesitamos recolectar datos?

Proporcionan la evidencia imprescindible en un estudio de


investigacin.

10
Jorge Crdova Egocheaga

Permiten medir el desempeo en el proceso de produccin


de un bien o servicio.

Ayudan a la formulacin de cursos alternativos de accin en


un proceso de toma de decisiones.

Satisfacen nuestra curiosidad innata.

1.8 QU TIPOS DE DATOS EXISTEN?

Constante

Si el registro de la caracterstica toma un slo valor en todas


las unidades elementales. Son muchos datos, pero iguales.

Ejemplo:

Sexo de las pacientes en el Servicio de Ginecologa


Especialidad de los integrantes del Colegio Mdico del
Per

Las constantes no son inters en Estadstica, puesto que ella


se ocupa del estudio de la variabilidad de los datos.

Variable

Si el registro de la caracterstica toma diversos valores en las


unidades elementales.

Ejemplo:

Edad, sexo y peso de los pacientes de una Clnica

Una misma caracterstica puede generar constantes


variables, depende del marco muestral.

Los datos variables pueden ser :

11
Manual de Estadstica General

1. Cualitativos : Registro de un atributo. Provienen de una


observacin. Las operaciones posibles son el clculo de
la tasa porcentual y de proporciones.

Pueden ser dicotmicas (slo pueden tener 2


categoras.

Ejemplo :Estado de salud: sano o enfermo. Sexo de


pacientes : masculino y femenino

80% son varones (tasa porcentual).


8 de cada 10 pacientes son varones (proporcin)

O politmicas (si tienen ms de 2 categoras)

Ejemplo : Estado civil del paciente: soltero, casado,


viudo, divorciado.

2. Cuantitativos : Registro de una caracterstica a travs de


un conteo o una medicin. Las operaciones posibles son
los promedios y las medidas de dispersin, entre otras.

Las variables cuantitativas pueden ser continuas o


discretas.

DISCRETA o DISCONTINUA: Cuando la variable slo


puede tomar determinados valores dentro de una escala
de valores. Proviene de un conteo.

Ejemplo: Nmero de consultas en un da.


Nmero de hijos

CONTINUA : Cuando la variable puede tomar cualquier


valor, dentro de una escala de valores. Provienen de
una medicin.

Ejemplo: Tiempo de duracin de una consulta.


Peso de la gestante

12
Jorge Crdova Egocheaga

DATOS

CONSTANTES VARIABLES

CUALITATIVAS CUANTITATIVAS

DISCRETAS CONTINUAS

1.9 QU SE PUEDE HACER CON LOS DATOS?

Identificar caracte- Organizarlos en tablas, grficos y figuras


rsticas de inters
para la gestin. Calcular promedios (media, mediana,
moda y percentiles) .

Calcular su dispersin (varianza,


desviacin estndar ) y forma de la curva.

Recoleccin de
Determinar una ecuacin que represente
datos
la relacin entre ellos (regresin)

Determinar el grado de asociacin entre


ellos (correlacin).
Utilizar datos para
Analizarlos dentro de un horizonte
mejorar la calidad
temporal (series cronolgicas)

13
Manual de Estadstica General

1.10 POBLACIN Y MUESTRA

Marco Poblacional

Conjunto de todas las unidades elementales (personas,


procesos o cosas) al que se circunscribe el estudio
estadstico.

Ejemplos :

Los mdicos cirujanos del mundo.


Los trabajadores asegurados en una EPS
El proceso de triaje en los Centros de Salud del Estado.
Las historias clnicas de un hospital.

MARCO POBLACIONAL(1200 pacientes de un hospital)

Poblacin Estadstica

Registro de una caracterstica EN TODOS los elementos del


marco poblacional.

Tiene tantos datos como elementos tenga el marco


poblacional.

Habrn tantas poblaciones como caractersticas se deseen


registrar en un determinado marco poblacional.

14
Jorge Crdova Egocheaga

MARCO POBLACIONAL
(1200 pacientes de un hospital)

Caractersticas
de inters Temperatura
Edad Peso Estado
corporal
Civil

Poblacin Poblacin Poblacin


Registro
de la
caracte- P1 P2 P3 ... Pn
rstica (1200 datos) (1200 datos)

Marco Muestral

Subconjunto del marco poblacional.

Comprende los elementos o estratos del marco poblacional


(es representativo).

En contraste con el marco poblacional es ms conveniente


porque se obtienen los datos en menor tiempo y reduciendo
los costos.

Ejemplo :
75 pacientes de un hospital.

15
Manual de Estadstica General

Marco Poblacional Tcnicas Marco Muestral


de muestreo
(1200 pacientes de un hospital) (75 pacientes de un hospital)

Caracterstica

Edad Peso Estado civil Temp. Corpor.

Registro
de la POBLACIN POBLACIN POBLACIN POBLACIN
carac-
terstica.

...
P1 P2 P3 Pn

Muestra

Registro de una caracterstica en todos los elementos del


marco muestral.

Tiene tantos datos como elementos el marco muestral.

Habrn tantas muestras como caractersticas se deseen


registrar en un marco muestral.

Las muestras no extraen de la poblacin, sino del marco


muestral

16
Jorge Crdova Egocheaga

MARCO POBLACIONAL Tcnicas


MARCO MUESTRAL
de muestreo
(1200 pacientes de un hospital) (75 pacientes de un hospital)

Caracterstica Edad Peso Estado


civil

Edad Peso Estado Temp.


civil corporal MUESTRA MUESTRA MUESTRA MUESTRA

m1 m2 m3 mn

75 datos

Registro
de la POBLACIN POBLACIN POBLACIN POBLACIN
carac-
terstica.

...
P1 P2 P3 Pn

1.11 PARMETRO Y ESTIMADOR

Valor representativo de una poblacin. Se simboliza por


letras griegas. Slo hay un parmetro en cada poblacin.

: Media poblacional (mu)


2 : V arianza poblacional (sigma cuadrado)
: Desviacin estndar poblacional (sigma)
: Proporcin poblacional (pi)
: Coeficiente de correlacin poblacional (rho)

Estimador

Valor representativo de una muestra. Se llama tambin


estadgrafo o estadstico. Se simboliza por letras latinas.

Existen tantos estimadores como muestras se extraigan de


una poblacin.

17
Manual de Estadstica General

Media muestral.
2
s Varianza muestra.
s Desviacin estndar muestral.
p Proporcin muestral

r Coeficiente de correlacin muestral

n1
x1

n2
x2
POBLACIN
n3
x3
. .
. .
nm
xm
PARMETRO

DIFERENTES MUESTRAS GENERAN DIFERENTES


VALORES DEL ESTIMADOR

1.12 ESTADSTICA DESCRIPTIVA E INFERENCIAL

Estadstica Descriptiva

Tcnicas que permiten describir un conjunto de datos. El


anlisis se limita a esos datos (sean muestrales o
poblacionales). Tiene como objetivo presentar los datos
obtenidos en forma resumida, clara y comprensible.

18
Jorge Crdova Egocheaga

Estadstica Inferencial

Tcnicas que permiten estimar un parmetro a partir de


datos muestrales.

Muestra POBLACIN
Estimador Parmetro

Estadstica
MUESTRA Estimador : x
o
Descriptiva
ue stre
d eM
as
c nic
T

Estadstica
POBLACIN
Inferencial

Parmetro : - = Error de muestreo

Ejemplos sobre muestra y estimador

Suponga que estamos interesados en conocer la duracin


de la evaluacin en el Servicio de Psiquiatra de las Clnicas
de Lima.

El INPE esta interesado en la relacin existente entre la


criminalidad y los hogares destruidos. Un psiclogo mide la
caracterstica en de 50 procesados.

Supngase que el equipo de investigacin, desea determinar


la proporcin de fumadores en la ciudad de Lima para

19
Manual de Estadstica General

determinar los factores de riesgo e incidencia de cncer


pulmonar.

1.13 EJERCICIO APLICATIVO

El Director de Personal de la Clnica Santa Luca desea


estimar la tardanza mensual promedio del personal que
labora en esta clnica. Con este fin elige al azar la Tarjeta de
Control de Asistencia del ltimo mes de 10 trabajadores. En
uno de las tarjetas seleccionadas se registr 140 minutos de
tardanza.

En esta situacin, identifique:

La caracterstica : Tiempo de tardanza mensual

La unidad elemental : Un trabajador de la clnica


(o unidad de anlisis)
El marco poblacional: Todo el personal que labora en
esa clnica
La poblacin : Registro de tiempo de tardanza
mensual de todo el personal que
labora en esta clnica
El marco muestral : Diez trabajadores
La muestra : Registro del tiempo de tardanza
de cada uno de los trabajadores
seleccionado
Tipo de dato : Variable cuantitativa continua

Un dato registrado : 140

La unidad de medida: minutos


El estimador : El tiempo medio de tardanza de
los 10 trabajadores x

El parmetro : El tiempo medio de tardanza de todos


los trabajadores de la clnica ()

20
Jorge Crdova Egocheaga

Ejercicio 1

El Director de un Hospital sabe que en lo que va del ao, fueron


dados de alta 1000 pacientes hospitaliza-dos y desea conocer el
tiempo medio de permanencia en el hospital. Para ello selecciona
al azar la historia clnica de 100 pacientes. Una de las historias
permiti conocer que cierto paciente haba permanecido 6 das
hospitalizado. En esta situacin identifique los siguientes
trminos (no se pide la definicin):

Caracterstica. Unidad elemental. Marco poblacional Poblacin.


Marco muestral. Tipo de muestreo. Un dato. Unidad de medida.
Un estimador. Un parmetro

21
Manual de Estadstica General

22
CAPTULO 2
1
RECOLECCIN
DE DATOS
Los datos no se recopilan como
un fin en s mismos, sino como
un medio para describir los hechos
que estn tras los datos

OBJETIVOS
1. Recopilar datos.
2. Identificar la escala adecuada para cada
caracterstica a recopilar.
3. Redondear datos cuantitativos.
4. Diferenciar mtodos y tcnicas de recoleccin de
datos.
5. Elaborar una encuesta
6. Elaborar una hojas de registro.
Manual de Estadstica General

2.1 CMO SE RECOPILAN DATOS?

Las buenas decisiones se basan en un adecuado registro


de datos, para lo cual se debe:

A. ESTABLECER OBJETIVOS CLAROS

En control de la calidad, los objetivos son:


Control del proceso de produccin
Anlisis de lo que no se ajusta a las normas o
estndares.
Inspeccin o auditoria.
Permite determinar qu tipo de datos se requiere.

B. DETERMINAR EL TIPO DE DATO

Datos para el control: se toman peridicamente para


conocer la variacin diaria dentro de un proceso; es
decir, para verificar su estado de control (estabilidad).

Ejemplo: Nmero de pacientes diarios en consultorios


externos por especialidad.

Datos para el anlisis: se registran para conocer la


situacin actual de nuestro proceso.

Ejemplo: la tasa de prescripciones que no estn


disponibles en la farmacia del hospital.

Dato para la inspeccin: se recopilan al recibir o


entregar un material. Son datos que sirven para verificar
si el producto cumple con las especificaciones.

Ejemplo: fecha de expiracin de un lote de


medicamentos, antes de su ingreso a almacn.

24
Jorge Crdova Egocheaga

C. CONSIDERAR LA CONFIABILIDAD DE LOS


REGISTROS

Tener en cuenta la adecuada calibracin de los


instrumentos de medicin y la variabilidad en
inspecciones visuales.

D. SELECCIONAR FORMAS APROPIADAS DE


RECOLECTAR DATOS.

I. Se debe registrar adecuadamente el origen de


datos (el da, la hora, quines fueron los
responsables, qu lote se uso, entre otros).

II. Los datos deben registrarse de manera que facilite


su utilizacin (hojas de registro).

2.2 ESCALAS DE MEDICIN

ESCALA NOMINAL:

Los valores son nominativos, sirven para designar. Slo se


puede realizar un conteo (frecuencias). No es factible las
operaciones aritmticas. Se analizan a travs de la
comparacin: igualdad y no igualdad ( = y ).

Ejemplo

Sexo del paciente 1: Masculino 2: Femenino


Grupo sanguneo A B AB O
Servicio mdico 1: Emergencia 2: Ginecologa
3: Traumatologa 4: Pediatra

ESCALA ORDINAL:

Los valores representan un orden. No son cuantitativos, slo


simbolizan una posicin. Se analizan a travs de la
desigualdad :mayor que o menor que (> y <).

25
Manual de Estadstica General

Ejemplo:

Calificacin : A,B,C,D A>B


Lugar (orden) : 1 , 2 , 3 1 > 2
Dolor : leve, moderado, intenso

ESCALA DE INTERVALOS:

Se utilizan nmeros cardinales. El cero es relativo o


diferencial, es decir no indica ausencia de la propiedad. Se
pueden realizar operaciones aritmticas.(+ y -). Es una
escala creada por el hombre.

Ejemplo:

Hora 00:00
Temperatura ambiental 0 C
El ao en que vivimos 2003

ESCALA DE RAZN:

Se utilizan nmeros cardinales. Tienen unidad de medida


(cms, pulgadas). El cero es absoluto, indica ausencia de la
propiedad. Se pueden realizar operaciones aritmticas
(+,-,x ,),

Ejemplo:

Pacientes no atendidos hoy : 0


N de hijos en edad de vacunacin : 0
Procesos deficientes : 0

2.3 REDONDEO DE DATOS

Durante el anlisis, muchas veces se divide un nmero por


otro obtenindose en algunas ocasiones, un nmero infinito
de decimales.

26
Jorge Crdova Egocheaga

Con el objeto de hacer ms operativo el manejo de estos


datos se redondean. Para cortar o redondear, se siguen las
siguientes reglas.

1ra REGLA:

Para la respuesta final, debemos redondear hasta dos


lugares ms de lo que haba en los datos originales. No se
debe redondear en los pasos intermedios.

Ejemplo : datos originales : enteros


resultado final : 2 decimales.

2 REGLA:

Si la cifra que sigue es mayor a 5, se aumenta 1. Si la cifra


que sigue es menor a 5, el nmero no vara.

Ejemplo: Redondeo a 2 decimales


6,176 . 6,18
4,123 . 4,12

3 REGLA:

Si la cifra que sigue es 5 y el nmero anterior es par no


se modifica. Pero si el nmero es impar, aumenta 1.

Ejemplo: Redondeo a 2 decimales


6,545 . 6,54
1,975 . 1,98

27
Manual de Estadstica General

2.4 FUENTES DE DATOS

A) FUENTES SECUNDARIAS

Datos recolectados anteriormente para alcanzar otros


objetivos. Constituye la primera fuente que se debe
analizar. La tcnica ms utilizada son las fichas.

Ejemplo:

Datos publicados (en papel o en forma electrnica) en


revistas especializadas, tesis, censos y en las hojas de
registro anteriores.

La calidad de los datos debe ser comprobada:

De donde provienen los datos?


La fuente es imparcial?
Los datos comprueban o contradicen otras evidencias
que se disponen?
Hace falta una evidencia cuya ausencia conduzca a
otra conclusin?
Cuantas observaciones se tienen?
La conclusin que obtengo es lgica?

Los principales organismos que disponen de


publicaciones son:

1. Instituto Nacional de Estadstica e Informtica (INEI)


2. Organizacin Mundial del Trabajo (OIT)
3. Organizacin Mundial de la Salud (OMS)
4. Organizacin Panamericana de la Salud (OPS)

B) FUENTES PRIMARIAS

1. Constituyen datos recolectados para el trabajo. Son


datos que no existan antes.
2. Se registran bajo dos mtodos: directo e indirecto

28
Jorge Crdova Egocheaga

2.5 MTODOS Y TCNICAS DE RECOLECCIN DE DATOS

A) MTODOS DIRECTOS

El responsable registra personalmente los valores de la


caracterstica.

Ejemplo: registro del tiempo que demora un mdico


durante una consulta.

Comprende 2 tcnicas.

(a) La observacin

1. Se registra el dato bajo condiciones normales


2. Cuando se mide el desempeo, la persona
observada no debe saber que es sujeta de
observacin
3 Se utiliza una hoja de registro.

Ejemplo
La observacin del desempeo de una enfermera
durante sus labores en el Servicio de Emergencia.

(b) La experimentacin

Se registra un dato bajo condiciones provocadas


simulando el proceso lo ms real posible.

Ejemplo:
Un mercado prueba para introducir un tipo jabn de
antisptico con fragancia .

B) MTODOS INDIRECTOS

1 Se registra la caracterstica a travs de preguntas


2. No se realiza medicin

29
Manual de Estadstica General

Ejemplo:
Se pregunta a un paciente el tiempo que esper antes
que sea atendido en el consultorio externo.

Comprende 2 tcnicas: la encuesta y la entrevista.

(a) La encuesta

1. Cuestionario de preguntas abiertas o cerradas


2. Al disearla se debe:
Elegir lo temas generales de la encuesta
Decidir forma de aplicarlo: correo, telfono
o personal
Plantear preguntas
Realizar una prueba piloto y hacer
revisiones finales

Ejemplo:
Encuesta para conocer el grado de satisfaccin de
los asegurados a una clnica.

(b) La entrevista
1. Permite recolectar datos o partir de un dialogo
2. Puede se estructurada o no estructurada
Ejemplo:
Entrevista al Director de una Clnica sobre la
aplicacin de norma de calidad.

METODOS Y TCNICAS DE RECOLECCION DE DATOS

FUENTE METODOS TECNICAS


SECUNDARIA FICHAS
DIRECTO OBSERVACION
PRIMARIA EXPERIMENTACION
INDIRECTO ENCUESTA
ENTREVISTA

30
Jorge Crdova Egocheaga

Cmo seleccionar la fuente, el mtodo y la tcnica?

No toda la informacin requerida ser recopilada de una sola


fuente, ni usando un mismo mtodo y tcnica. Casi siempre
es una combinacin de ellos, para lo cual hay que:

Definir caractersticas que interesan registrar.

Identificar la fuente de informacin apropiada para cada


caracterstica.

Seleccionar la tcnica ms conveniente.

En un estudio de investigacin de mercados para paales


desechables, interesa conocer ciertas caractersticas,

CARACTERISTICA FUENTE TECNICA


Tasa de natalidad Secundaria Fichas
Nivel socio-econmico de la familia Primaria Encuesta
Textura del producto Primaria Entrevista

2.6 EL CUESTIONARIO

Consiste en un conjunto de preguntas diseadas de acuerdo


a la necesidad de informacin.

Junto con las hojas de registro, es la tcnica ms comn


para la recopilacin de datos de fuentes primarias.

Recomendaciones para su elaboracin


Las preguntas deben ser coherentes con el objetivo de la
investigacin. No hay preguntas de carcter general.

La extensin (nmero de preguntas) depende de la


necesidad de informacin a recolectar por esta tcnica.

31
Manual de Estadstica General

El lenguaje utilizado en la redaccin de preguntas debe ser


entendible por los encuestados. Es diferente al lenguaje a
usarse en el informe final

Debe evitarse la ambigedad.

Ejemplo: En un estudio para determinar el grado de


asociacin entre la incidencia a cncer pulmonar y el hbito
a fumar, se hizo la siguiente pregunta:

Fuma usted? Si 1 No 2

No formular preguntas dirigidas. Evitar adjetivos, ya que


predisponen a una respuesta.

Ejemplo: Cree Ud. que el precio del medicamento es alto?


Si 1 No 2

Preguntas cerradas y abiertas

Preguntas cerradas
Las posibles respuestas se presentan como alternativas.

Facilita la codificacin y operatividad de los datos.

Ejemplo :
Posee Ud. un seguro mdico?
Si 1 No 2

Preguntas abiertas

Los encuestados tienen libertad para emitir su opinin.


Se utilizan cuando no se tiene precisin sobre las
posibles respuestas.
Dificulta la recoleccin de datos (incomoda al
encuestado).
Dificulta la interpretacin de datos.

32
Jorge Crdova Egocheaga

Ejemplo:
Qu opinin tiene sobre la poltica de salud del
actual Gobierno ?

2.7 LA ELABORACIN DE DATOS: EL CONTROL DE


CALIDAD

Una vez que se han recolectado los datos referidos a las


diferentes variables necesarias para la investigacin, se
debe proceder a revisarla y presentarla de manera que
facilite su anlisis. A este proceso se denomina elaboracin
de datos.

Las etapas que abarca son: edicin, tabulacin y


codificacin.

A) La edicin: Se revisan los formularios (cuestionario y


fichas de observacin) para verificar si todas las
preguntas han sido respondidas en todos los ellos. Se
debe verificar incongruencias en de las respuestas.

a) Reencuestar: Si no se respondieron todas las


preguntas y es posible identificar al encuestado (por
ejemplo, se tiene su direccin), se podra regresar y
formular aquellas preguntas que se obviaron.

b) Anular la pregunta: Si una pregunta es dejada de


contestar en muchos cuestionarios, sera
recomendable anular esa pregunta y buscar la
forma de conseguir el dato por otra fuente.
Probablemente, la pregunta fue mal formulada.

c) Anular el formulario: Si una encuesta o la ficha de


observacin tiene demasiadas preguntas en blanco,
se anular todo el cuestionario. Es posible que no
se contara con la colaboracin apropiada del
encuestado o tal vez no se aplic correctamente.

33
Manual de Estadstica General

B. La tabulacin: Consiste en etiquetar o titular con pocas


palabras, las respuestas a preguntas abiertas. Para
homogenizar el criterio, es recomendable que una
persona se encargue de este proceso. Si fueran muchos
formularios y varias preguntas abiertas, podran ser
varias personas que tabulen, pero necesariamente solo
una persona por pregunta.

C. La codificacin: Consiste en colocar un cdigo a las


respuestas, a fin de poder construir una base de datos.

2.8 LAS HOJAS DE REGISTRO (O CHECK LIST)

Son formatos preimpresos que facilitan el registro y la


organizacin de cualquier tipo de datos. Puede ser:

Para registro: Se anota sistemticamente la informacin.

Ejemplo: Tarjeta de Registro de Asistencia del personal que


labora en una Clnica

Para verificacin: Se anota informacin en determinado


tiempo, que debe cotejarse con la realidad.

Ejemplo: Registro de las recetas no atendidas por semana.

EJEMPLO 1:
Hoja de registro para la distribucin del
proceso de produccin

La medida optima es 8.300


Se acepta una variabilidad mxima 0,008
Se registra cada uno de los 55 productos elaborados en
un da, colocando una x en la casilla correspondiente.
Se construye simultneamente el histograma.

Caso: Hoja de registro para ver la distribucin en un proceso


de produccin.

34
Jorge Crdova Egocheaga

EJEMPLO 2:
Hoja de registro de tems defectuosos

Permiten identificar el tipo de defecto ms frecuente.


Un producto puede presentar ms de un defecto.
Es necesario tipificar con antelacin los defectos posibles.

Caso: Hoja de registro de inspeccin final de cierto producto


plstico moldeado.

35
Manual de Estadstica General

EJEMPLO 3
Hoja de registro de las causas del defecto

Permite una estratificacin adicional con el fin de encontrar


las causas de los defectos.

Caso: Hoja de registros de ocurrencias de los defectos en


ciertos accesorios utilizados en la elaboracin de prtesis
dental, asignables a maquinaria, trabajadores, da y tipo de
defecto.

36
Jorge Crdova Egocheaga

37
Manual de Estadstica General

38
CAPTULO 3
ORGANIZACIN
TABULAR DE
DATOS

OBJETIVOS
Al finalizar el Captulo 3, el participante ser capaz de:
1. Organizar datos a travs de una clasificacin ordenada
de datos.
2. Organizar datos a travs de un diagrama tallo-hojas.
3. Elaborar una tabla de distribucin de frecuencias para
datos univariados
4. Elaborar una tabla de distribucin de frecuencias para
datos bivariados.
Manual de Estadstica General

3.1 LA IMPORTANCIA DE LA ORGANIZACIN DE LOS


DATOS

Los datos deben organizarse, para entender mejor su


naturaleza fundamentalmente utilizando dos mtodos : el
mtodo tabular y el mtodo grfico.

Si los datos no estn organizados son de poca utilidad en


una investigacin o para una toma de decisiones.

Ejemplo

Los niveles altos de colesterol en suero, han sido por mucho


tiempo asociados con el incremento del riesgo de
enfermedades cardiovasculares. Se han efectuado
numerosos estudios en un esfuerzo por lograr una mayor
comprensin de la naturaleza de esta asociacin. Se
muestra a continuacin las concentraciones de colesterol en
suero que fueron recolectadas a una poblacin de 480
individuos aparentemente sanos. A qu conclusin llega?

40
Jorge Crdova Egocheaga

231 199 209 236 259 248 183 269 212 194 191 260 197 265 261 238
159 227 245 214 275 186 234 262 230 212 163 220 202 221 223 243
203 180 292 198 201 174 223 186 200 192 236 186 188 234 230 170
304 197 216 214 189 138 269 197 222 202 213 163 241 218 242 197
248 228 154 218 243 192 191 243 230 248 231 262 177 207 276 230
238 189 212 200 179 249 225 223 289 280 235 220 194 205 206 194
209 233 222 223 267 212 263 159 243 230 253 192 200 232 222 227
193 195 259 186 229 184 215 254 233 229 263 163 212 271 216 230
225 252 218 265 218 155 222 173 228 214 266 172 203 262 213 249
244 177 242 180 241 261 221 222 189 204 229 212 192 257 248 243
190 166 216 197 250 224 257 220 255 241 245 212 225 201 209 155
192 249 216 250 248 187 222 195 247 161 188 229 194 174 184 215
209 250 180 228 196 254 208 265 234 219 203 230 232 212 236 191
161 258 252 169 249 231 170 233 161 189 191 209 229 246 274 215
206 218 234 248 222 175 202 154 249 189 171 263 238 177 261 265
224 249 252 220 199 239 221 221 221 232 218 239 205 196 211 221
276 251 189 286 258 227 236 167 184 245 243 218 173 220 231 196
196 200 221 217 270 261 248 254 232 231 219 225 265 222 226 208
219 189 226 292 192 172 186 264 211 240 237 156 228 241 171 223
185 199 188 263 208 199 259 272 202 214 201 231 210 223 210 209
239 203 212 295 202 195 218 218 253 239 272 216 221 208 225 175
239 191 214 215 227 221 208 224 208 181 187 179 234 262 216 221
152 180 193 244 184 183 226 266 242 220 266 269 223 198 204 179
209 215 222 196 228 195 160 261 177 232 224 203 265 238 247 225
169 172 187 199 245 183 171 246 187 222 278 212 250 174 220 188
223 241 200 193 226 243 206 142 277 244 210 258 207 267 254 136
231 253 229 240 204 187 202 209 238 240 190 253 203 271 281 226
244 182 146 251 277 184 240 239 185 201 259 234 174 226 246 222
205 211 216 230 220 201 231 183 214 219 206 276 215 195 209 258
287 182 176 275 204 183 212 237 249 142 256 258 213 208 202 244

Al observar a un conjunto de datos, deseamos identificar a


las principales propiedades que definen a este conjunto.

Lamentablemente, no se puede obtener alguna conclusin


vlida. Los datos tal como se presentan no nos permiten
afirmar algo sobre ellos.

Para lograr identificar las principales medidas y propiedades


de este conjunto de datos, tenemos que organizar
previamente al conjunto de datos.

3.2 ELEMENTOS DE LA ORGANIZACIN TABULAR

Consiste en una presentacin resumida de la informacin


usando tablas o cuadros

Ejemplo: Supongamos que en una entrevista a pacientes del


lo que se busca evaluar son 2 aspectos:

41
Manual de Estadstica General

- La opinin sobre la calidad de atencin


- Nivel de instruccin de la paciente

Como son dos variables categricas, la presentacin de los


datos podra realizarse en una tabla cruzada:

NIVEL OPININ
TOTAL
EDUCATIVO Favorable Desfavorable
Analfabeta 8 2 10
Primaria 15 5 20
Secundaria 23 7 30
Superior 12 3 15
TOTAL 58 17 75

3.2.1 Ventajas

Se pueden apreciar propiedades de los datos.


Permite establecer asociaciones entre variables
Se ahorra espacio en un informe escrito.

3.2.2 Elementos:

A. El Ttulo: enunciado breve e informativo acerca del


contenido del cuadro. Un buen ttulo debe
responder a las siguientes interrogantes:

1. Qu contiene la tabla?
Ej.: La opinin de 75 pacientes sobre calidad
de atencin.
2. Cmo estamos presentando el contenido?
Ej.: Por nivel educativo de las pacientes

42
Jorge Crdova Egocheaga

3. De dnde se obtuvieron los datos?


Ej.: Del servicio de Ginecologa del Hospital
Santa Rosa. Lima.
4. Cundo se obtuvo la informacin?
Ej.: (fecha de la recoleccin de los datos)

Un buen ttulo podra ser:


Opinin de 75 pacientes por nivel educativo sobre la
calidad de atencin en el Servicio de Ginecologa
del HOSPITAL SANTA ROSA. Lima, enero del
2003.

B. La Matriz: Est constituido por el primer rengln y la


primera columna, en donde se describen los
nombres de las categoras (en datos categricos) o
los intervalos de clases (en datos cuantitativos), tan
conciso como sea posible.
Ejemplo
NIVEL DE OPININ
TOTAL
INSTRUCCIN Favorable Desfavorable

Analfabeta
Primaria
Para datos
Secundaria categricos
Superior
TOTAL

EDAD N de pacientes Tasa porcentual :%


(en aos) (fi) (hi)

39 - 46
47 - 54
55 - 62
63 - 70
71 - 78
Total

C. El cuerpo: Est conformado por espacios y


constituyen intersecciones de filas y columnas, que
a veces se denominan celdas, y donde se anotan

43
Manual de Estadstica General

las frecuencias absolutas y relativas obtenidas en la


tabulacin, incluyendo totales y subtotales.

Por ejemplo

NIVEL OPININ
TOTAL
EDUCATIVO Favorable Desfavorable

Analfabeta 8 2 10
Primaria 15 5 20
Secundaria 23 7 30
Superior 12 3 15
TOTAL 58 17 75

D. Notas aclaratorias: Estn constituidas por toda


aquella informacin adicional que es necesaria para
describir e interpretar adecuadamente el contenido
de la tabla o cuadro. Es muy importante cuando se
trata de datos proveniente de fuente secundaria. Es
un aspecto tico precisar de donde provienen los
datos, a la vez que nos liberamos de la
responsabilidad de responder por su calidad. Se
escribe con letra ms pequea.

44
Jorge Crdova Egocheaga

Tabla 1: Opinin de 75 pacientes por nivel educativo sobre la


calidad de atencin en el Servicio de Ginecologa del
HOSPITAL SANTA ROSA. Lima, enero del 2003.

NIVEL OPININ
TOTAL
EDUCATIVO Favorable Desfavorable
Analfabeta 8 2 10
Primaria 15 5 20
Secundaria 23 7 30
Superior 12 3 15
TOTAL 58 17 75
Fuente: Hospital San Rosa. Direccin de Procesos. Enero 2003.

La presentacin tabular de datos pueden realizarse bajo tres


formas, desde la ms elemental se tiene:
- Clasificacin ordenada de datos.
- Diagrama de tallos y hojas
- Tablas de distribucin de frecuencias.

3.2 CLASIFICACIN ORDENADA DE DATOS

Si ordenamos los datos sin procesar, de la observacin ms


pequea a la ms grande, la secuencia ordenada obtenida,
se denomina clasificacin ordenada.

Ejemplo: en un estudio del crecimiento de varones, se


obtuvieron estas observaciones sobre el permetro ceflico
(en centmetros) de un nio al nacer:

33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.1
35.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.3
35.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0

Ordenando los datos de manera ascendente, tenemos:

45
Manual de Estadstica General

33.1 33.7 33.9 34.2 34.2 34.3 34.6 34.7 34.9 35.2 35.6 36.1
33.4 33.7 34.0 34.2 34.2 34.5 34.6 34.7 35.1 35.2 35.8 36.5
33.6 33.8 34.1 34.2 34.3 34.5 34.6 34.8 35.1 35.3 36.0

Cules son las principales propiedades que se observa en


este conjunto de datos?

Las principales propiedades que se observan en este


conjunto de datos son:

El nmero de datos es de 35.


La menor observacin es de 33,1 cms.
La mayor observacin es de 36,5 cms.
El rango de los valores observados es de 3,5 cms. =(36,5
33,1)+ 0,1 cms.
El 51,43% (18 nios) de los datos estn alrededor de 34
cms.
Son muy pocos frecuentes los nios con permetro ceflico
mayor a 36 cms. (slo 3 nios).

Mientras mayor sea el nmero de observaciones presentes


en una serie de datos, mas laborioso es realizar la
clasificacin ordenada de los datos.

3.3 DIAGRAMA DE TALLO Y HOJAS

Un diagrama de tallo y hojas consiste en una serie de hileras


horizontales de nmeros. El nmero utilizado para designar
una hilera es un tallo, el resto de nmeros de la hilera se
denominan hojas.

Esta tcnica funciona bien, cuando el conjunto de datos no


tiene una gran dispersin

Se pueden considerar el siguiente proceso:

Elija algunos nmeros adecuados que puedan servir de


tallo. Se requieren como mnimo 5 tallos. Los tallos elegidos

46
Jorge Crdova Egocheaga

generalmente son el primer o los dos primeros dgitos de


los datos.

Nombre las hileras mediante los tallos elegidos.

Organice grficamente los datos registrando el dgito,


siguiendo el tallo.

Trazar una curva a lo largo de la parte superior del diagrama.

Determinar las principales caractersticas.

Ejemplo:

Con los datos anteriores sobre el permetro ceflico,


construir un diagrama tallo-hoja.

33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.1
35.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.3
35.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0

Dato menor: 33,1 Dato mayor: 36,5


Tallos posibles: 33, 34, 35 y 36Slo existen 4 tallos,
debiendo ser el mnimo 5 tallos, entonces los tallos
propuestos se desdoblan, de la siguiente manera:
33 (del 33,0 al 33,4)
33 (del 33,5 al 33,9)
34 (del 34,0 al 34,4)
34 (del 34,5 al 34,9)
35 (del 35,0 al 35,4)
35 (del 35,5 al 35,9)
36 (del 36,0 al 36,4)
36 (del 36,5 al 36,9)

47
Manual de Estadstica General

Luego clasificamos los datos en funcin al valor del


decimal.
33 1 4
33 7 7 9 8 6
34 2 2 2 3 2 2 1 3 0 25 datos
34 6 6 8 7 6 7 5 5 9

35 2 2 1 1 3
35 6 8
10 datos
36 0 1
36 5

Finalmente, se traza una lnea por el borde, a fin de delimitar


la forma de la distribucin.

Qu caractersticas se observan?.

Las principales propiedades de los datos :


- Son 35 casos.
- La menor observacin es de 33,1 cms.
- La mayor observacin es de 36,5 cms.
- El rango de los valores observados es de 3.5 cms. (36,5
33,1 + 0.1 cms.)
- El 51,43% (18 casos) de los datos estn alrededor de los
34 cms.
- Son muy poco frecuentes los casos mayores a 36 cms (3
casos) y menores a 33,5 cms (2 casos).
- La distribucin de datos est sesgada a la derecha (sesgo
positivo), es decir, hay una mayor concentracin de datos a
la izquierda.

48
Jorge Crdova Egocheaga

Ejercicio

Se realiza un estudio para ayudar a comprender el efecto de


fumar en los patrones de sueo. La variable es el tiempo que
tarda en quedarse dormido. La muestras de fumadores y no
fumadores producen estas observaciones :

FUMADORES NO FUMADORES
17,2 19,7 18,1 15,1 18,3 17,6 15,1 20,5 17,7 21,3 16,0 24,8
16,2 19,9 19,8 23,6 24,9 20,1 16,8 21,2 18,1 22,1 15,9 25,2
19,8 22,9 20,0 24,1 25,0 21,4 22,8 22,4 19,4 25,2 18,3 25,0
21,2 18,9 22,1 20,6 23,3 20,2 25,8 24,1 15,0 24,1 21,6 16,3
21,1 16,9 23,0 20,1 17,5 21,3 24,3 25,7 15,2 18,0 23,8 17,9
21,8 22,1 21,0 20,5 20,4 20,7 23,2 25,1 16,1 17,2 24,9 19,9
19,5 18,8 19,2 22,4 19,3 17,4 15,7 15,3 19,9 23,1 23,0 15,1

Construya un diagrama tallo-hoja para cada uno de estos


conjuntos de datos. Utilice los valores enteros del 15 al 25
(inclusive) como tallos.

Se sorprendera si alguien le dijera que no existe diferencia


en la distribucin de esta variable en los dos grupos?.
Explique.

3.4 TABLA DE DISTRIBUCIN DE FRECUENCIAS

Pueden ser simples o cruzadas

A) Tablas simples

1 Se utilizan para presentar una sola variable.


2 Pueden representar datos cualitativos o
cuantitativos.
3. Presentan por lo menos dos columnas: categora o
clase y el nmero de datos o frecuencia de clase.
4. Puede incluirse una columna de tasa porcentual.

Para datos cualitativos se siguen los pasos siguientes:

49
Manual de Estadstica General

(1) Identificar diferentes categoras.


(2) Realizar un conteo.
(3) Elaborar la tabla: titulo, cuerpo y fuente.

Ejemplo
Con la finalidad de mejorar la calidad del servicio de
emergencia en una clnica local, se ha formulado la
siguiente pregunta a 45 pacientes atendidos durante
una semana: Cmo califica la calidad de la atencin
que Ud, acaba de recibir en este Servicio de
Emergencia: muy bueno, bueno, aceptable, malo o muy
malo

Los datos recolectados se presentan a continuacin:

Muy bueno Aceptable Aceptable Muy bueno Bueno


Bueno Bueno Muy malo Bueno Bueno
Aceptable Bueno Aceptable Malo Muy bueno
Malo Aceptable Muy malo Aceptable Malo
Aceptable Muy bueno Bueno Bueno Aceptable
Bueno Malo Aceptable Muy malo Bueno
Malo Bueno Malo Bueno Aceptable
Bueno Bueno Muy malo Muy bueno Malo
Aceptable Bueno Aceptable Malo Bueno

Primero, se identifican las categoras:

Muy bueno
Bueno
Aceptable
Malo
Muy malo

50
Jorge Crdova Egocheaga

Segundo, se realiza el conteo de las frecuencias:

Muy bueno /////


Bueno ///// ///// ///// /
Aceptable ///// ///// //
Malo ///// ///
Muy malo ////

Tercero, se presenta la tabla, considerando el ttulo y la


fuente.

Cuadro 1: Calidad del Servicio de Emergencia

N m e ro d e T asa
C a t e g o ria P a c ie n t e s P o rc e n tu a l

M uy Bueno 5 1 1 ,1 1

Bu en o 16 3 5 ,5 5

A c e p ta b le 12 2 6 ,6 7

M a lo 8 1 7 ,7 8

M u y M a lo 4 8 ,8 9

T o tal 45 1 0 0 ,0 0

Fuente: Encuesta a los Pacientes, julio 2002

Para datos cuantitativos se sigue el procedimiento


siguiente:

(1) Se calcula el rango:(mayor - menor) + 1

(2) Se determina el nmero de clases, que mejor


representa a los datos (entre 4 y 20). Se realiza un
tanteo.

(3) Se determina el tamao o amplitud de clase.

51
Manual de Estadstica General

(4) Se elige el limite inferior de la primera clase.

(5) Se establecen los lmites inferiores de las


siguientes clases.

(6) Se establecen los limites superiores de cada una de


las clases.

(7) Se realiza un conteo, a fin de determinar cuantos


datos se incluyen en cada clase.

(8) Se elabora la tabla: titulo, cuerpo y fuente.

Ejemplo:

Revisemos el ejemplo sobre los niveles de colesterol en


suero presentado anteriormente.

231 199 209 236 259 248 183 269 212 194 191 260 197 265 261
159 227 245 214 275 186 234 262 230 212 163 220 202 221 223
203 180 292 198 201 174 223 186 200 192 236 186 188 234 230
304 197 216 214 189 138 269 197 222 202 213 163 241 218 242
248 228 154 218 243 192 191 243 230 248 231 262 177 207 276
238 189 212 200 179 249 225 223 289 280 235 220 194 205 206
209 233 222 223 267 212 263 159 243 230 253 192 200 232 222
193 195 259 186 229 184 215 254 233 229 263 163 212 271 216
225 252 218 265 218 155 222 173 228 214 266 172 203 262 213
244 177 242 180 241 261 221 222 189 204 229 212 192 257 248
190 166 216 197 250 224 257 220 255 241 245 212 225 201 209
192 249 216 250 248 187 222 195 247 161 188 229 194 174 184
209 250 180 228 196 254 208 265 234 219 203

Solucin
Se calcula el rango: R = Mayor menor + 1
Mayor = 317 Menor = 106
Rango = (317 106) + 1 = 212

52
Jorge Crdova Egocheaga

Se tantea el nmero de clases:


4 clases de 53 Rango corregido 212: No exceso
5 clases de 43 Rango corregido 215: Exceso 3
6 clases de 36 Rango corregido 216: Exceso 4
7 clases de 31 Rango corregido 217: Exceso 5
8 clases de 27 Rango corregido 216: Exceso 4
Se escoge 4 clases por tener el menor exceso.

La amplitud de clase es 53.

Como no hay exceso con 4 clases, el lmite inferior de la


primera clase es el menor nmero. En este caso 106.

5. Los lmites inferiores de las clases siguientes se forman


sumando al lmite inferior de la primera clase, la
amplitud. En este caso, 53

NIVELES DE Tasa
El menor PERSONAS
COLESTEROL porcentual (%)
valor
106 -

159 -
106 + 53
212 -

265 -
Total 1000 100,00

Fuente: Departamento de Salud

6. Luego se calculan los lmites superiores de cada clase.


Para la primera clase se resta 1 al lmite inferior de la
segunda clase. Para las clases siguientes, se le suma la
amplitud, en este caso 53.

53
Manual de Estadstica General

Cuadro 2: Niveles de colesterol en Lima

NIVELES DE Tasa
PERSONAS
COLESTEROL porcentual (%)
159 - 1
106 - 158

159 - 211 158 + 53

212 - 264
265 - 317
Total 1000 100,00
Fuente: Departamento de Salud

7. Finalmente se realiza el conteo de las frecuencias y se


presenta la tabla con un ttulo y fuente.

Se acostumbra presentar una columna con la


frecuencias relativas (%)

En algunas ocasiones se elaboran las tablas con clases


abiertas cuando los datos inferiores o superiores estn
muy dispersos

54
Jorge Crdova Egocheaga

Cuadro 3: Ventas diarias en la Farmacia


durante el mes de junio (en soles)
Ventas Tasa
(en soles) Dias porcentual
(%)
menos de 5000 3 10,00
5000 - 8999 7 23,33
9000 - 12999 10 33,33
13000 - 16999 8 26,67
17000 - 20999 2 6,67
Total 30 100,00
Fuente: Registro de Ventas

Ejercicio

Los siguientes datos de refieren a la estatura (en metros) de 50


pacientes que se atienden en el servicio de reumatologa de la
Clnica Sagrado Corazn. Construya una tabla de distribucin de
frecuencias.

1,68 1,72 1,70 1,67 1,76 1,82 1,59 1,66 1,82


1,70 1,66 1,70 1,68 1,65 1,74 1,80 1,57 1,64
1,80 1,68 1,72 1,74 1,72 1,69 1,78 1,84 1,61
1,69 1,84 1,74 1,73 1,75 1,75 1,72 1,81 1,87
1,64 1,70 1,86 1,74 1,75 1,77 1,76 1,72 1,81
1,87 1,64 1,72 1,87 1,77

La tabla de distribucin de frecuencias completa, tiene la


siguiente estructura

55
Manual de Estadstica General

CLASE Marca de Frecuencia Frecuencia Frec. Absoluta Frec. Relativa


Li Ls Clase: Xi absoluta: fi relativa: hi Acumulada: Fi Acumulada: Hi

Li limite inferior
Ls limite superior
Xi Marca de la clase i
fi frecuencia absoluta de la clase i.
hi frecuencia relativa de la clase i.
Fi frecuencia absoluta acumulada hasta la clase i.
Hi frecuencia relativa acumulada hasta la clase i.

Ejercicio 2:

Complete la siguiente tabla que corresponde al peso de 60


pacientes del Hospital Central.

PESO
fi Fi hi Hi
(en kilos)
48,0 52,9 6

53,0 57,9 0,30

58,0 62,9

63,0 67,9 0,25

68,0 72,9 9

Total

Ejercicio 3
La siguiente informacin se refiere al peso (en Kg.) de 60
personas. Elabore una tabla de distribucin de frecuencias.
k=6 LI1=35 LS5=64 F2=20 h3=0,213
H4=0,799 f6 = 5 f1=4

56
Jorge Crdova Egocheaga

Ejercicio 4
Complete la siguiente tabla de distribucin de frecuencias:

n = f = 30
f
Fi = fant + fact f ant --> frecuencia anterior
hi =
n
Hi = h ant + h act f act --> frecuencia actual
hi = 1.000
PESO
fi Xi Fi hi Hi
(en libras
128,6 - 135,4 2
135,5 - 142,3 7
142,4 - 149,2 10
149,3 - 156,1 8
156,2 - 163,0 3
Total

Resumamos algunos conceptos

Una distribucin de frecuencias (fi) es un conjunto de


puntuaciones ordenadas en sus respectivas clases.
Las frecuencias relativas (hi) son tasas porcentuales de
casos en cada clase.
La frecuencia acumulada (Fi o Hi) son las frecuencias que se
van acumulando en cada clase, desde la ms baja hasta la
mas alta.
La marca de clase (Xi) es el punto medio de una clase

B) Tablas cruzadas

Sirven para representar dos o ms variables cualitativas.


En cada celda se puede incluir la frecuencia absoluta y
relativa (por fila, columna y total).

57
Manual de Estadstica General

Ejemplo

Cuadro 4: Enfermedad por sexo


E n fe rm e d ad \S e x o M asculino F emenino To tal

B ro nquitis 5 12 17

C o litis 11 8 19

N efritis 15 6 21

Aler gias 4 2 6

To tal 35 25 63

Fuente: Historia Clnica, julio 2002.

58
CAPTULO 4
ORGANIZACIN
GRFICA DE
DATOS

OBJETIVOS
Al finalizar el Captulo 4, el participante ser capaz de:
1. Elaborar grficos para una sola variable: barras,
columnas, circulo.
2. Elaborar grficos para dos variables: dispersin,
lineal.
3. Elaborar grficos en tres dimensiones.
Manual de Estadstica General

Los grficos constituyen una forma muy efectiva de presentar


informacin. Su utilizacin ayuda a una mejor comprensin.

Todo grfico tiene tres partes:


El ttulo: especfico, pero completo.
El cuerpo: es el grfico en si mismo.
La fuente: especificar el origen de la informacin.

4.1 EL HISTOGRAMA

Son barras verticales presentadas una a continuacin de


otra. Permite presentar datos cuantitativos continuos. Es un
grfico muy utilizado. Propiedades:

1. El ancho de cada columna es igual en todo el grfico y


representa la amplitud de clase).

2. El ancho de cada columna es igual en todo el grfico y


representa la amplitud de clase).

CLASE Xi fi
128,6 - 135,4 132,0 2
135,5 - 142,3 138,9 7
142,4 - 149,2 145,8 10 Distribucin de frecuencias
149,3 - 156,1 152,7 8
156,2 - 163,0 159,6 3
TOTAL 30

12

10
Frecuencia

Histograma 6

0
132.0 138.9 145.8 152.7 159.6

Marca de Clase

60
Jorge Crdova Egocheaga

Ejemplo

Grfico 4: Peso de 100 Pacientes (en Kg.)


Nmero de 25
Pacientes
20

15

10

0
29.5 39.5 49.5 59.5 69.5 7 9.5 89.5 9 9.5 Peso
(Kgs)
Fuente: Encuesta, julio 2001

Cmo leer histogramas?

A) Tipo general: El valor medio est al centro, que tiene la


mayor frecuencia. Es el ms frecuente tiene forma
simtrica

61
Manual de Estadstica General

B) Tipo multimodal: Hay varios valores mayores.

C) Tipo sesgo positivo: Forma asimtrica la media est


localizada a la izquierda.

62
Jorge Crdova Egocheaga

D) Tipo precipicio a la izquierda: Forma asimtrica la


frecuencia disminuye bruscamente a la izquierda.

E) Tipo planicie: Las clases tienen ms o menos la


misma frecuencia.

63
Manual de Estadstica General

F) Tipo bimodal: Se observa claramente dos valores


mximos.

G) Tipo pico aislado: Presenta un pico aislado, adems de


un histograma general.

64
Jorge Crdova Egocheaga

4.2 EL DIAGRAMA DE BARRAS

Se utiliza para representar datos cuantitativos discretos o


datos cualitativos.

Las barras son de igual ancho.


La longitud es proporcional a la frecuencia de la
categora.
El espacio entre barras debe ser homogneo, para
evitar efecto visual.

Ejemplo:

Grfico 2: Nmero de hijos en edad escolar por mdico del


Hospital Central
N de 30
Mdicos
25

20

15

10

0
Nmero de
0 1 2 3 4 5
hijos
Fuente: Departamento de Personal (escolares)

65
Manual de Estadstica General

Ejemplo

Grfico 3: Pacientes atendidos por especialidad

20

15

10

0
Nefrologa Ginecologa Oftalmologa Neurologa Traumatologa

Fuente: Hoja de Ingreso, julio del 2002

Ejemplo

Grfico 4: Profesionales de la salud por especialidad


Especialidad
Medico

Enfermeras

Psiquiatras

Fisioterapeuta

Obstetriz
N de
profesionales
0 10 20 30 40 50 60 70 80 90 100

Fuente: Gerencia de Potencial Humano. Julio 2002

66
Jorge Crdova Egocheaga

4.3 EL POLGONO DE FRECUENCIAS

Es otra forma de conocer las distribucin de los datos. Se


construye uniendo los punto medios del lado superior de
las barras del histograma.

25

20

15

10

0
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5

Grfico N 5: Distribucin de los pesos de los Pacientes del


Servicio de cardiologa
Nmero de
Pacientes

Peso
(Kg.)
Fuente: Historia Clnica, julio del 2002

67
Manual de Estadstica General

4.4 DIAGRAMA DE DISPERSIN DE PUNTOS

Ejemplo
Grfico 6: Pacientes mensuales
400

Paciente 350
Meses s
300
Enero 120
Febrer 250
o 210
200
Marzo 180
150
Abril 320
Mayo 280 100
Junio 200 50
Julio 350
0
0 En ero Feb2rero Ma rzo Ab4ril Mayo J un
6 io Ju li o 8

Fuente: Departamento de Admisin Clnica

4.5 DIAGRAMA LINEAL

Ejemplo

Grfico 7: Pacientes mensuales

400
350
300
250
200
150
100
50
0
Enero Febrero Marzo Abril Mayo Junio Julio

Fuente: Departamento de Admisin Clnica

68
Jorge Crdova Egocheaga

4.6 LAS OJIVAS

La frecuencia acumulada son las frecuencias que se van


acumulando en cada categora, desde la ms baja hasta la
mas alta.

Las ojivas, relaciona las puntuaciones con sus respectivas


frecuencias acumuladas.

4.7 EL DIAGRAMA CIRCULAR

El circulo se divide en segmentos circulares, de tamao


proporcional a la frecuencia de la categora.

Ejemplo

Grfico 10. Pacientes atendidos en consultorios


externos
1 e r tr im .
2 d o tr im .
3 e r tr im .
4 to tr im .

Fuente: Ficha de atencin. Julio del 2002

4.8 DIAGRAMA RADAR

til para visualizar, por ejemplo, el cumplimiento de metas


(%) para la Prueba de Papanicolaou en el servicio de
ginecologa para pacientes de diferentes zonas

69
Manual de Estadstica General

Ejemplo
100
80
60
40
E ste
20
O e ste
0
N o r te
Sur

Fuente: Hoja de registro atencin, julio 2002

4.9 SUPERFICIE EN TRES DIMENSIONES

Ejemplo:

Metas alcanzadas en prestacin de servicios


mdicos

100

50
4to trim.
0 3er trim.

3er trim.
Fuente: Encuesta, julio 2002
4to trim.

70
CAPTULO 5
PROMEDIOS

Un motivo para hacer sospechar que la Estadstica es ms un


arte que una ciencia, gira en torno a la ambigedad con que se
usa el trmino promedio.

OBJETIVOS
Al finalizar el Captulo 5, el participante ser capaz de:
1. Diferenciar los diversos tipos de medidas de
resumen que se pueden aplicar a un conjunto de
datos
2. Calcular e interpretar las principales medidas de
tendencia central
Manual de Estadstica General

5.1 LA ESTADSTICA DE RESUMEN

Despus de construir tablas y grficos, a partir de una


coleccin de datos, se requieren medidas ms exactas.

La estadstica de resumen, proporciona medidas para


describir un conjunto de datos.

Existen tres tipos de medidas de resumen:

De tendencia central.
De dispersin.
De la forma de la distribucin.

(A) Las medidas de tendencia central

Se refieren al punto medio de una distribucin


Se conocen como medidas de posicin

Ejemplo: A partir del grfico siguiente, se observa que


la posicin central de la curva B est a la derecha de la
posicin central de las curvas A y C. Obsrvese que la
posicin central de la curva A es la misma que la curva
C.

72
Jorge Crdova Egocheaga

(B) Las medidas de dispersin

Se refieren a la extensin o amplitud de los datos de


una distribucin

Representan el grado de variabilidad de los datos.

Ejemplo: Observe que la curva A en el siguiente grfico


tiene una mayor dispersin que la curva B, a pesar que
la posicin central es la misma.

(C) Las medidas de la forma de la curva

Las curvas que representan a un conjunto de datos,


pueden ser analizadas de acuerdo a su:

a) Simetra b) Curtsis

Las curvas simtricas, tienen una forma tal que con una
lnea vertical que pase por el punto ms alto de la curva,
dividir el rea de esta en dos partes iguales.

73
Manual de Estadstica General

Las curvas sesgadas son aquellas cuyos valores estn


concentrados en el extremo inferior o superior de la
escala de medicin del eje horizontal. La cola indica el
tipo de sesgo.

Cuando medimos la curtsis nos referimos al grado de


agudeza. Pueden ser: leptocrtica (concentracin al
centro) mesocrtica distribuidos simtricamente) o
platicrtica (aplanada).

5.2 PROPIEDADES DE LA SUMATORIA

ra
1 Regla: La suma de los n trminos de una serie constante,
es igual a n veces la constante.
n

c
i =1
i = nc

74
Jorge Crdova Egocheaga

Ejemplo:
C = 10, n=3
3

c
i =1
= 10 + 10 + 10 = 3 (10) = 30

da
2 Regla: La suma de los productos de una constante por
una variable, es igual a la constante multiplicada por la suma
de la variable.
n n

cx
i =1
i = c x i
i =1

Ejemplo:
C = 5, X1 = 2, X2 = 4, X3 = 6
3

cx
i =1
i =
5(2) + 5(4) + 5(6) = 60
ra
3 Regla: La suma de los valores de una variable ms una
constante es igual a la suma de los valores de la variable
ms n veces esa constante.

n n
( x i + c ) = x i + nc
i=1 i =1

Ejemplo:
C =2, x1 =5, x2 =3, x3 =2
3

(xi + c) = (5 + 2) + (3 + 2) + (2 + 2) = 16
i =1

= (5 + 3 + 2) + 3(2) = 16

75
Manual de Estadstica General

5.3 LAS MEDIDAS DE TENDENCIA CENTRAL


1. En general se denominan promedios.
2. Los ms importantes son la media, la mediana y la moda.
Aritmtica
Media Geomtrica
Medidas de Mediana Armnica
tendencia central Moda

3. Tambin es til conocer los percentiles (o fractiles).

POR QU SON IMPORTANTES LAS MEDIDAS DE


TENDENCIA CENTRAL?

Porque la mayor parte de los conjuntos de datos muestran


una tendencia a agruparse alrededor de un dato central.
Las medidas de tendencia central son puntos en una
distribucin, los valores medios o centrales de sta y nos
ayudan a ubicarla dentro de la escala de medicin.

5.3.1 La Media
(A) La media aritmtica ( x )
a) Obtencin: Se obtiene sumando los valores
registrados y dividindolos entre el nmero de
datos.

Ejemplo:
La siguiente tabla muestra el nmero de reclamos y
quejas presentadas por pacientes en el Servicio
de Emergencias a lo largo de una semana.
Calcule e interprete la media.

Da/Semana Lun Mar Mier Jue Vier Sab


Reclamos/da 8 10 5 12 10 15

76
Jorge Crdova Egocheaga

Media aritmtica
8 + 10 + 5 + 12 + 10 + 15 60
=
6 6
= 10 reclamos

b) Interpretacin: Si elige al azar un da de la


semana, se espera que los pacientes del
servicio de emergencia realicen 10 reclamos en
ese da.

c) Simbologa:

Tamao Media aritmtica


Muestra n (equis barra)
Poblacin N (mu)

d) Clculos a partir de datos no agrupados, se


utilizan las siguientes formulas.

Para una muestra


donde: x : media muestral
n
Xi
Xi x = i =1
n
: suma de todos los datos

n : nmero de datos (muestra)

Para una poblacin


N
donde: : media poblacional
Xi Xi : suma de todos los datos
= i =1 N : nmero de datos (poblacin)
N

Se puede calcular la media aritmtica utilizando Excel.

77
Manual de Estadstica General

Media
aritmetica

e) Clculo a partir de datos agrupados.

El clculo de la media aritmtica, cuando los


datos disponibles se encuentran en tablas de
distribucin de frecuencias, se realiza utilizando
la formula siguiente

n
fiX i
x = i = 1n
fi
i=1

donde: x :media muestral


fi :frecuencia absoluta de la clase i
X i :marca de la clase i

Ejemplo:

La distribucin de frecuencias siguiente, representa


los puntajes obtenidos en una evaluacin del
desempeo, aplicado al personal tcnico de un
Centro de Salud. El puntaje mximo en la prueba es
50. Calcule e interprete en media.

78
Jorge Crdova Egocheaga

D esem p e o N m ero d e
(p unto s ) t c n ic o s

12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10

T O T AL 60

Primero se calcularn las marcas de clase ( Xi);


es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase x
clase ( i) absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60

x=
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10) x = 1575
4 + 8 + 15 + 23 + 10 60
x = 26.25

Interpretacin: Si se elige al azar a un trabajador tcnico


de este hospital, se espera que tenga un puntaje de
26,25 en su evaluacin de desempeo.

79
Manual de Estadstica General

f) La media aritmtica ponderada ( x p )


donde:
n

wX i i wi = factor de ponderacin
xp = i =1
n

w
i =1
i
X i = datos

Ejemplo: Una empresa comercializadora de


Seguros Mdicos dispone de 3 representantes
para la zona de Miraflores, cada uno de los
cuales cobra diferente comisin por pliza
vendida, y realiza diferente nmero de
contratos. Calcule e interprete el valor medio de
la comisin

N de polizas de Comisin
Vendedor Seguro Mdico por venta $

Pedro 30 30
Juan 25 40
Pablo 20 50

x p = 30(30) + 25(40) + 20(50) = 2900 = $38.67


30 + 25 + 20 75

Interpretacin:

Si se elige al azar un representante se espera que cobre


una comisin de $38.67 por pliza vendida.

80
Jorge Crdova Egocheaga

g) Ventajas y desventajas de la media aritmtica

Ventajas:

Concepto familiar para muchas personas


Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras

Desventajas

Se ve afectada por los datos extremos


Si la muestra es grande y los datos no
estn agrupados, su clculo es tedioso
Si los datos estn agrupados en clases
con extremos abiertos, no es posible
calcular la media.

(B) La media geomtrica ( xg )


Se utiliza para calcular tasas medias de variacin,
como la tasa media de crecimiento poblacional, la
tasa media de inflacin mensual, la tasa media de
mortalidad, entre otros.

a) Obtencin Se obtiene extrayendo la raz


ensima el producto de los n valores de una
serie.

xg = n X1 X 2 X3 .........X n
Ejemplo:

La siguiente tabla muestra la tasa de aumento


en las quejas durante los ltimos meses.
Calcule e interprete la tasa media mensual.

81
Manual de Estadstica General

Meses Enero Febrero Marzo Abril Mayo


Aumento de
2.6% 5.4% 3.8% 0.5% 1.4%
quejas

La tasa 2,6% tambin se puede expresar como


0,026 , y puesto que se refiere a un aumento a
partir de una base de 100%, el factor de
variacin ser 1,026. Para los otros datos se
opera igual.

b) Clculos

Por lo tanto, la media geomtrica se calcula:

xg = n x1, x 2 , x 3,...... x
x g = 5 (1.026) (1.054) (1.038) (1.005)(1.014)
x g = 5 1 . 143903377
x g = 1,0272540 ( Factor de crecimient o medio )
Tasa media =
(x g 1) 100
de variacin
= (1,0272540 - 1) x 100 = 2,72%

c) Interpretacin

Si se selecciona al azar un mes entre enero y


mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes
anterior.

(C) La media armnica ( xh )


Se utiliza para calcular el tiempo medio, velocidad y
aceleracin media, como por ejemplo, el tiempo
medio para realizar determinada ciruga.

82
Jorge Crdova Egocheaga

a) Obtencin: se obtiene calculando el inverso de


la media aritmtica de los inversos de una
serie.
1
xh = n 1

i =1
X
i
n
Ejemplo:

Los siguientes datos registran el tiempo que


utilizan cuatro mdicos al realizar una cierta
intervencin quirrgica. Calcule e interprete el
tiempo medio.

M d ic o A B C D
T ie m p o
45 38 52 40
(m in u t o s )

Conocer el tiempo medio permite contar con


una herramienta til en la planeacin de los
recursos, como la Sala de Operaciones.
Adems de poder comparar nuestro
desempeo con los estndares de calidad
internacionales.
xh = 1 1 4 1 1 = 1976 + 2340 +4 1710 + 2223
+ + +
45 38 52 40 88920

xh = 4 88920 = 43.117953 minutos


8249

xh = 43 minutos 7 segundos

83
Manual de Estadstica General

b) Interpretacin:

Si se selecciona al azar a uno de los


cuatro mdicos, se espera que realice
este tipo de ciruga en 43 minutos
aproximadamente.

5.3.2 La Mediana

Es la medida que divide en dos subconjuntos iguales a


datos, de tal manera que 50% de los datos es menor a
la mediana y el otro 50% es mayor a la mediana.

a) Obtencin: Se obtiene ordenando la serie de


datos (en forma ascendente o descendente) y
ubicando el dato central.

Ejemplo:

Los siguientes datos se refieren al nmero de


pacientes que llegaron a su cita, despus de la
hora programada durante los ltimos 11 das en el
Servicio de Pediatra. Calcule e interprete la
mediana.

12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:


5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17

5 datos menores 5 datos mayores


mediana

b) Interpretacin: Durante 5 das llegaron menos de 11


pacientes tarde a su cita y durante 5 das, ms de
11 pacientes llegaron tarde a su cita.

84
Jorge Crdova Egocheaga

c) Reglas

1 Si la serie es impar, la mediana ocupa el lugar


central de la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

2 Si la serie es par, la mediana se obtiene de la


semisuma de los dos valores centrales de la serie
previamente ordenada.

Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34


18 + 23
mediana = = 20 .5
2

3 Sea la serie par o impar, la mediana ocupa el


n + 1
lugar 2 ,de la serie previamente ordenada.

d) Clculo a partir de datos agrupados.


n +1
2 (F + 1)
Md = Li + c
f Md

donde:
Md : mediana
L i : limite real (o frontera) inferior de la clase
mediana.
n : nmero total de datos.
F : suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
f Md : frecuencia de la clase mediana
c : amplitud de clase

85
Manual de Estadstica General

Ejemplo: La tabla siguiente muestra la experiencia


laboral (aos) del personal de seguridad que labora
en un gran hospital. Calcule e interprete la mediana.
Lugar de la mediana:
E xp e rie nc ia N m e ro d e n + 1 69 + 1
la b o ra l tr a b a ja d o r e s = = 35o
(a o s ) d e s e g urid a d 2 2
0 - 3 4
4 - 7 12 69 + 1 (16)
C la s e
Md = 7,5 + 2 4
8 - 11 24 24
M e d ia na
12 - 15 16
16 - 19
20 - 23
10
3 = 7,5 +
35 164
69 24
Mediana = 10,5 aos

Interpretacin:

La mitad del personal de seguridad que labora en


este hospital tienen una experiencia laboral igual o
menor a 10 aos 6 meses. La otra mitad de este
personal tiene una experiencia laboral igual o mayor
a 10 aos y 6 meses.

e) Ventajas y desventajas

Ventajas:

Los valores extremos no afectan a la mediana como


en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.

Desventajas:

Como valor central, se debe ordenar primero la


serie de datos.

86
Jorge Crdova Egocheaga

Para una serie amplia de datos no agrupados, el


proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.

5.3.3 La Moda
La moda es el valor que ms se repite dentro de un
conjunto de datos.
a) Obtencin: se obtiene organizando la serie de datos
y seleccionando el o los datos que ms se repiten.

Ejemplo

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


b) Clculo a partir de datos agrupados

1
Mo = L + + c
i
1 2
donde:
M o : moda
L : limite real (o frontera) inferior de la clase
i
modal (la de mayor frecuencia)
: frecuencia de la clase modal menos la
1
frecuencia de la clase anterior
: frecuencia de la clase modal menos la
2
frecuencia de la clase siguiente
c : amplitud de clase

Las clases mediana y modal pueden coincidir pero


conceptualmente son diferentes.

87
Manual de Estadstica General

Ejemplo: La tabla siguiente muestra los errores de


facturacin durante un mes, en una Clnica. Calcule
e interprete la moda.

Er r o r e s d e
f a c tu r a c i n Da s
0 - 3 6 =6
1
Cla s e Clase moda : (4 - 7)
4 - 7 12
Mo d a l
6
8 - 11 8 =4 Mo = 3.5 + 4
6+4
2
12 - 15 3
16 - 19 1
To ta l 30 Mo = 5,9

Interpretacin: Durante un mes, el nmero ms


frecuente de errores de facturacin en esta clnica
es 6.

e) Ventajas y desventajas de la moda.

Ventajas:

Se puede utilizar tanto para datos cualitativos como


cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o
ms clases abiertas.

Desventajas:

No tiene un uso tan frecuente como la media.


Muchas veces no existe moda (distribucin
amodal).
En otros casos la distribucin tiene varias modas, lo
que dificulta su interpretacin.

5.3.4 Los Percentiles


Son los valores que dividen en 100 partes iguales a un
conjunto de datos

88
Jorge Crdova Egocheaga

a) Clculo: para datos agrupados.


Kn F + 1
i
( )
P = L + 100
K i f c
P
K

donde:
P : percentil
K
K : el percentil buscado
n : nmero de datos
Fi : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el
f percentil K
P : frecuencia absoluta de la clase donde se
K
ubica el percentil K
c : amplitud de clase

Ejemplo:

La tabla muestra la experiencia (en aos) de las


enfermeras de un gran centro hospitalario

Experiencia Trabajadores
(aos)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334

Sobre qu edad se ubica el 25% de las


enfermeras de mayor experiencia?

89
Manual de Estadstica General

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia
K = 75

Kn 75(334 )
Lugar del P75 = = = 250 ,5o (de los nmeros ordenados )
100 100

Para saber en cul clase se halla este dato, se


calcul la frecuencia acumulativa.
E xperiencia N Trabajadores F rec. A cumulada
(aos) fi Fi
0-3 18 18
4-7 42 60
F=248
8 - 11 68 128
12 - 15 120 248
En esta clase
16 - 19 40 288
se localizan del
20 - 23 34 322 249 - 288
24 - 27 12 334
334

75(334) (248 + 1)
100 P = 15.65 aos
P = 15.5 +
75 40 4 75

Interpretacin: Para que una enfermera est


comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 aos, 7 meses y 24
das.

90
CAPTULO 6
MEDIDAS DE
DISPERSIN Y
ASIMETRA

OBJETIVOS
Al finalizar el Captulo 6, el participante ser capaz de:
Calcular e interpretar las principales medidas de
dispersin:
A) Rango
B) Rango intercuartlico
C) Varianza
D) Desviacin estndar
E) Coeficiente de variabilidad
Calcular e interpretar las principales medidas de la
forma de la distribucin.
A) Coeficiente de asimetra
B) Coeficiente de curtosis
Manual de Estadstica General

6.1 LAS MEDIDAS DE DISPERSIN

Llamadas tambin medidas de variabilidad

Son tiles porque:

Permiten juzgar la confiabilidad de la medida de tendencia


central.

Los datos demasiados dispersos tienen un comportamiento


especial.

Es posible comparar dispersin de diversas muestras.

6.1.1 El rango (R)

Llamado tambin recorrido, amplitud total o alcance.

a) Obtencin: se obtiene de la influencia entre el dato


mayor y el dato menor ms una unidad significativa,
a fin de incluir ambos valores extremos.

Ejemplo:

Los siguientes datos representan el peso de 10


nios al nacer, (en Kg.). Calcule e interprete el
rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120

Rango = (4,170 - 2,860) + 0.001


Rango = 1,311 Kg.

b) Interpretacin
La diferencia entre el bebe de mayor peso y el bebe
menor peso es 1,311 Kg.

92
Jorge Crdova Egocheaga

c) Clculo
A partir de datos agrupados, se utiliza la siguiente
frmula:

R= (Ls - Li ) + 1
donde:
Ls : Limite superior de la
ltima clase
Li : Limite inferior de la
primera clase

Ejemplo:

La distribucin de frecuencias siguiente representa


el tiempo que espera un paciente para ser atendido,
en un consultorio externo. Calcule e interprete el
rango

Tiempo N de Pacientes
(minutos) (por da)
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
Total 60

Rango = (36-12) + 1

R = 25 minutos

Interpretacin: la diferencia de tiempo entre el


paciente que ms espera y el que menos espera
para ser atendido es 25 minutos.

93
Manual de Estadstica General

f) Ventajas y desventajas del rango

Ventajas

Fcil de calcular
Fcil de entender e interpretar

Desventajas

Slo considera los valores extremos


No toma en cuenta ni el nmero de datos ni el valor
de estos
No es posible calcular en tablas con extremos
abiertos.

6.1.2 El rango intercuartlico

Permite ubicar el 50% de los datos que se encuentran


en el centro de la distribucin, es decir, el 25% de los
datos son menores al primer cuartil y tambin 25% de
los datos son mayores al tercer cuartil.

94
Jorge Crdova Egocheaga

Ejemplo:

La tabla muestra la experiencia (en aos) del personal


que labora en el Hospital Central.

E xp e rie nc ia
T rab ajad o re s
(ao s )
0 -3 18
4 -7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
T o tal 334

A) Entre qu valores se encuentra el 50% intermedio


de estos datos?

B) Cul es el rango intercuartlico?

50 %
25 % 25 %

Q1 Q3

Rango
Intercuartlico
25(334 )
Lugar Q1 = P25 = 83 .5 o se ubica en la 3ra clase
100

25(334) (60 + 1)
Q = 7.5 +
100 4 Q = 8.82 aos
1 68 1

95
Manual de Estadstica General

75(334 )
Lugar Q 3 = P75 = 250 .5o se ubica en la 5ta clase
100

75(334) (248 + 1)
100
Q = 15.5 +
3 40 4

A. El 50% de los trabajadores con experiencia


intermedia se encuentran entre 8,82 y 15,65 aos.

B. El rango intercuartlico es 6 aos 10 meses


aproximadamente

6.1.3 La desviacin cuartlica

Es una medida de variabilidad fcil de calcular. Es la


mitad del rango intercuartil. Mide la dispersin del 50%
central de las observaciones respecto a la mediana.

Es imposible tener una DC negativa. Es raro, pero


podra tener un valor igual a 0, en el caso que los
percentiles sean iguales (P75 = P25). Cuando mayor
sea la diferencia entre los percentiles, mayor ser el
valor de la DC.
P75 P25
DC =
2
Ejemplo:

Si P25 = 7,2 13,4 7,2


DC = = 3,1
2
P75 = 13,4

Interpretacin:
50% central de las observaciones vara en 3,1 con
respecto a la mediana.

96
Jorge Crdova Egocheaga

6.1.3 La varianza

Es una medida de desviacin promedio con respecto a


la media aritmtica

a) Clculos a partir de datos no agrupados.

Para una muestra


n 2

2
(X x ) i

S = i =1

n 1

Para un poblacin
N

(X )
2

2 i

= i=1
N
Ejemplo:

La siguiente informacin se refiere al nmero de


radiografas reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15

Primero, elaboramos un cuadro de la forma


siguiente:

x Xi x (X i x ) 2

8 8 - 10 = 2 4
60
10 10 - 10 = 0 0 x=
5 5 - 10 = 5 25 6
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25 x = 10
X = 60 (X i x ) = 0 (X i x ) 2
= 58

97
Manual de Estadstica General

(X i x ) = 58
2

(X i x )
2

2
S = n 1

2 58
S = 6 1 = 11.6
6.1.4 La desviacin estndar

Llamada tambin desviacin tpica representa la


variabilidad (o desviaciones) promedio de los datos
con respecto a la media aritmtica. Es la raz
cuadrada de la varianza, sea poblacional o muestral.

a) Clculos a partir de datos no agrupados

Para la muestra
n

(Xi x )
2

2
S= s = i =1
n 1

para la poblacin
N
(X i )
2

= 2 = i =1
N

Ejemplo:

La siguiente informacin se refiere al nmero de


radiografas reprocesadas durante una semana.

Calcule la desviacin estndar.

8, 10, 5, 12, 10, 15

98
Jorge Crdova Egocheaga

Ya sabemos por el ejemplo anterior que S2 = 11,6


Entonces
2
S= s
S = 11,6

S = 3,4 radiografias

6.1.5 El coeficiente de variacin

Es una medida relativa de variabilidad de los datos.


Permite comparar la variabilidad de dos o ms
conjuntos de datos expresados en unidades diferentes
(peso: Kg. y libras).

a) Clculos a partir de datos no agrupados

Para la muestra:
s
CV = 100
x
Para la poblacin:

CV = 100

Ejemplo:

A continuacin se presentan las tarifas (en unidades


monetarias) de dos laboratorios de anlisis clnicos.
El laboratorio I tiene sus tarifas en soles y el
laboratorio II en dlares Cul de ellos tiene un plan
tarifario ms homogneo o estable?.

99
Manual de Estadstica General

Laboratorio I (soles) Laboratorio II (dlares)


40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviacin estndar por


cada una de los laboratorios

Laboratorio I
n
Xi 393
x = i =1

n
=
7
= 56.14

40 -1 6.1 4 2 60 .5 0
70 1 3.8 6 1 92 .1 0
60 3 .8 6 1 4.9 0
48 -8 .1 4 6 6.2 6
52 -4 .1 4 1 7.1 4
65 8 .8 6 7 8.5 0
58 1 .8 6 3 .4 6

Si (X i x ) = 632.86
2

n
(X i x )2 632 .86
S= i =1
= = 10 .27
n 1 7 1

S
CV = 100
x

10.27
CV = 100 = 18 . 29
56.14

100
Jorge Crdova Egocheaga

Laboratorio II
n

Xi 847
x = i=1 = = 105.87
n 8

70 -3 5.87 12 86.6 569


35 -7 0.87 50 22.5 569
15 0 44 .13 19 47.4 569
14 0 34 .13 11 64.8 569
82 -2 3.87 56 9.77 69
11 0 4.1 3 17 .056 9
14 0 34 .13 11 64.8 569
12 0 14 .13 19 9.65 69

Si (X i x ) = 11372 .88
n 2

i =1

n
(X i x )2 11372 ,88
S= i =1
= = 40 . 30
n 1 8 1

S 40,30
CV = 100 CV = 100 = 30 , 06
x 105,87

El Laboratorio II presenta una mayor variabilidad en


el plan tarifario.

6.2 MEDIDAS DE ASIMETRIA O SESGO

6.2.1 Coeficiente de Asimetra

Es un indicador del grado de asimetra que presenta


una distribucin.

101
Manual de Estadstica General

3 ( X Md )
S kp =
S

Valores posibles

3 asimetra negativa
S kp =
+ 3 asimetra positiva

Si Skp tiende a 3 la distribucin es asimtrica hacia la


derecha o asimetra positiva.

Si Skp tiende a -3 la distribucin es asimtrica a la


izquierda o asimetra negativa.

En distribuciones simtricas, no existe sesgo, es decir


Skp = 0.

En la prctica, el coeficiente de Asimetra de Pearson


vara entre -1 y +1

6.2.2 Coeficiente de Curtsis

Es una medida del grado de apuntalamiento,


generalmente comparada con el apuntalamiento de la
distribucin normal.

0 , 5 ( P0 , 75 P0 , 25 )
Ku =
P0 , 9 P0 ,1

Valores posibles

a) Leptocrtica (concentracin al centro): Si el grado


de apuntalamiento de una distribucin es mayor que
el de la distribucin normal. K 0,5

102
Jorge Crdova Egocheaga

b) Mesocrtica (distribuidos simtricamente): Si el


grado de apuntalamiento de una distribucin es
igual que el de la distribucin normal. K 0,25

c) Platicrtica (aplanada).Si el grado de


apuntalamiento de una distribucin es menor que el
de la distribucin normal.
K 0,25

Platicurtica Mesocurtica Leptocrtica


0,0 0,25 0,50

Ejemplo:

La tabla muestra la edad (en aos) de 70 pacientes


atendidos en el servicio de emergencia de un
hospital local.

4 67 18 15 11 3 24
3 85 15 15 14 5 26
5 6 16 15 13 7 21
6 7 17 16 10 8 22
7 7 15 17 6 12 17
25 10 13 17 4 15 16
13 12 13 13 8 17 9
2 15 14 14 14 18 9
4 16 20 16 18 20 15
5 17 14 17 20 21 12

103
Manual de Estadstica General

A) Calcular e interpretar la asimetra de la


distribucin
B) Calcular e interpretar la curtosis de la
distribucin.

Los resultados han sido obtenidos usando Microsoft


Excel

Media aritmetica 14.27 3(14,27 13,50 )


Desviacion estandar 11.42 S kp = 11,42
= 0,202

Mediana 13.50
Cuartil 1 7.00 0,5(17,00 7,00)
Cuartil 3 17.00 Ku = 23,00 4,00 = 0,263
Percentil 90 23.00
Percentil10 4.00

104
CAPTULO 7
NOCIONES DE
PROBABILIDAD

OBJETIVOS
Al finalizar el Captulo 7, el participante ser capaz de:
1. Aplicar los conceptos de experimento, espacio
muestral y evento.
2. Discutir los principios para asignar probabilidad.
3. Utilizar las reglas de probabilidad para plantear y
resolver un problema real.
Manual de Estadstica General

7.1 IMPORTANCIA DE LAS PROBABILIDADES


Las probabilidades estn presentes en nuestras vidas ms a
menudo de que podramos sospechar. Todos tenemos una
gran intuicin probabilstica.

Por ejemplo, en das lluviosos, fros y con mucha humedad


es alta la probabilidad de coger un resfro. Si ingerimos
alimentos en lugares poco higinicos, en ambulantes es muy
probable que contraigamos una infeccin estomacal.

Cmo es la probabilidad de ganar el premio mayor en


Tinka?. Muy baja, pues hay muchas alternativas en juego.
Pero an sabiendo esto, compramos uno que otro nmero.
La decisin creo yo que es racional.

Si escuchamos una prediccin de 80% que lluvia, y Ud. tiene


planeado un paseo al campo con la familia. Qu hace?. Lo
mas racional es que cancele su paseo y se quede en su
casa viendo en video.

7.2 CONCEPTOS BSICOS

(A) Experimento: Ejecucin voluntaria de un fenmeno.

Se caracteriza por:

Tener varios resultados posibles


Existir incertidumbre sobre el resultado

Ejemplos:
Lanzar una moneda
Seleccionar de un lote un frasco de medicamentos
Extraer una muestra de sangre a una persona

(B) Espacio Muestral: conjunto de todos los resultados


posibles de un experimento. Se simboliza por
(omega).

106
Jorge Crdova Egocheaga

Ejemplos:

Lanzar una moneda


= {cara, sello}
Seleccionar de un lote, un frasco de
medicamentos.
={adecuado, inadecuado}
Extraer una muestra de sangre a una persona.
= {grupo sanguneo}

Ejemplo:

Se lanzan tres monedas simultneamente. Los ochos


resultados posibles de este experimento pueden
detallarse de manera conveniente mediante un
diagrama de rbol:

Primera Segunda Tercera Resultado


Moneda Moneda Moneda Posible

C C CCC
S CCS
C
C CSC
S
S CSS
C C SCC
S SCS
S S C SSC
S SSS
={CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}

(C) Suceso: subconjunto del espacio muestral, seleccionado


de acuerdo a una condicin. Se representan por letras
latinas maysculas.

107
Manual de Estadstica General

Ejemplo:

Se lanzan dos dados. El espacio muestral de este


experimento es:

= { (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)


(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6) }

Podemos considerar los siguientes sucesos:

A: la suma de puntajes es 7, es decir


A = {(1,6) (2,5) (3,4) (4,3) (5,2) (6,1)}

B: la suma de puntajes es 11, es decir


B={(5,6) (6,5)}

C: la suma de puntajes es 7 u 11, es decir


C={(1,6) (2,5) (3,4) (4,3) (5,2) (6,1) (5,6) (6,5)}

7.3 PROBABILIDAD

(A) Concepto: Ponderacin asignada a cada punto muestral


que mide la verosimilitud de su ocurrencia.

(B) Principios para asignar probabilidad:

a) La probabilidad de cada punto muestral debe estar


entre 0 y 1

b) La suma de las probabilidades de todos los puntos


muestrales deben ser iguales a 1.

108
Jorge Crdova Egocheaga

0 0,5 1
Tan probable
Improbable Probable
como improbable

Ejemplos:
1. Se lanza una moneda

={cara, sello}
P(cara) = 0,5 P(sello) = 0,5

2. Se lanzan 3 monedas

= {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}


1/8 1/8 1/8 1/8 /8 1/8 1/8 1/8
A: obtener exactamente 2 caras
A = {CCS, CSC, SCC}
1/8 + 1/8 + 1/8
P(A) = 3/8

(C) Conclusiones: De acuerdo a la definicin de


probabilidad de un suceso, y a los dos principios,
tenemos las siguientes conclusiones:

(1) P() = 1

(2) P( ) = 0

(3) P(A) = 1 - P(A)

PROBABILIDADES - EJEMPLOS

1. Un investigador trabaja con un nuevo frmaco para


insensibilizar a los pacientes frente a picaduras de abejas.
De 200 sujetos sometidos a prueba, 180 presentaron una

109
Manual de Estadstica General

disminucin en la gravedad de los sntomas tras sufrir una


picadura, despus de ser sometidos al tratamiento.

2. Un paciente sufre de clculos renales, y no se ha


conseguido mejora alguna a partir de mtodos ordinarios. Su
medico sta plantendose el llevar a cabo una intervencin
quirrgica y debe responder a la siguiente pregunta: Cul
es la probabilidad de que la operacin sea un xito?.

PROBABILIDAD DEL PUNTO ESTADISTICO

Quien emplea la estadstica aplicada prefiere pensar en la


probabilidad como el numero de veces en las que se presentar
determinada situacin si una experiencia fuera repetida
indefinidamente en situaciones de naturaleza repetitiva o que
pudiera concebirse de esa manera

7.4 REGLAS DE PROBABILIDAD

7.4.1 Regla de la Adicin

A B

(A B)
U

U
P(AUB) = P(A) + P(B) - P(A B)

Ejemplo:

Un cliente ingresa a una farmacia. La probabilidad de


que compre (a) un antibitico es 0,60 (b) analgsico

110
Jorge Crdova Egocheaga

0,50, y c) antibitico y analgsico es 0,30 Cul es la


probabilidad de que compre un antibitico, analgsico
o ambos?.

Datos

P(P) = 0,60
P(L) = 0,50
P = 0,30
P(PUL) = P(P) + P(L)
P(PUL) = 0,60 + 0,50 - 0,30
P(PUL) = 0,80

Regla de adicin para sucesos mutuamente


excluyentesDos sucesos son mutuamente
excluyentes, si no tienen elementos comunes

A B P(AUB) = P(A) + P(B)

Si : (A B) =
U
U
Por lo tanto : P(A B) = 0
Ejemplo:

Se extrae una carta de una baraja. Cul es la


probabilidad de que sea un as o un rey?
P(AUR) = P(A) + P(R)
4 4
4 = +
P(A) = 52 52
52
8
4 =
P(R) = 52
52

111
Manual de Estadstica General

Ejemplo 1: Se dispone de 11 historias clnicas,


pertenecientes a pacientes masculinos y femeninos
agrupados por su nivel de hemoglobina.

M F
Estado (Masculino) (Blanca) Total
A (Anmico) 5 3 8
N (Normal) 1 2 3
Total 6 5 11

a) Cul es la probabilidad de extraer una historia


perteneciente a un paciente anmico?
8
P(A) =
11
b) Cul es la probabilidad de extraer una historia
correspondiente a un paciente anmico y que sea
mujer?
3
P(A I F) =
11

Dado que la historia corresponde a un paciente


anmico, cul es la probabilidad que sea mujer?

P(F
A
)= 3
8

Derivacin de la frmula:
P(F I B)
P (F )=
A P(A)

Comprobando
3
P(F ) = 811
A
11

112
Jorge Crdova Egocheaga

P (F
A
)= 3
8

Ejemplo 2

Se recolect informacin sobre el peso del recin


nacido y si la madre fum o no durante el embarazo.
Los datos se presentan a continuacin:

CONDICIN PESO R.N.


TOTAL
DE FUMADORA BAJO NORMAL
SI 30 10 40
NO 20 140 160
TOTAL 50 150 200

A. Cul es la probabilidad que el recin nacido tenga


bajo peso?
50
P(bajo) = = 0,25
200

B. Cul es la probabilidad que una gestante fume?


40
P(si) = = 0,20
200

C. Cul es la probabilidad que el nio seleccionado


tenga un peso normal?
150
P(normal) = = 0,75
200

D. Cul es la probabilidad de que un recin nacido


tenga bajo peso o sea normal?

Como son mutuamente excluyentes:

113
Manual de Estadstica General

P(bajonormal) = P(bajo) + P(normal)


50 150
= + = 1
200 200

E. Cul es la probabilidad de que el recin nacido


tenga bajo peso o la madre haya fumado durante el
embarazo?

P(bajosi ) = P(bajo ) + P( si) P(bajoysi )

50 40 30 60
= + = = 0,30
200 200 200 200

Aplicacin

La probabilidad de que el personal administrativo que


labora en una clnica local, llegue tarde el da lunes es
0,50 y la probabilidad de que llegue retrasado los das
lunes y martes es 0,20. Dado que cierto trabajador
lleg tarde el da lunes, cul es la probabilidad de
que llegue tarde el da siguiente?.

P(TL ) = 0,50 P (TM


TL
) = P(T M I TL )
P(TL )
P(T L I TM ) = 0,20
0,20
= = 0,40
0,50

7.4.3 Regla de la Multiplicacin

A partir de

P(A I B)
P( B ) =
A P(A)
Se despeja
P( A I B) = P( A) P B ( A)

114
Jorge Crdova Egocheaga

Aplicacin

Se sabe que en un lote de medicamentos de 50


frascos, hay 4 que no estn adecuadamente
empacados (defectuosos). Si se extraen al azar 2
frascos, uno a continuacin del otro, cul es la
probabilidad de que ambos sean defectuosos?.

4
P(D1 ) =
50
(
P ( D1 I D 2 ) = P ( D1 ) P D 2
D1
)
3 4 3 12
P(D 2 )= = =
D1 49 50 49 2450
Ejercicio

En una poblacin de pacientes hospitalizados, la


probabilidad de que uno de ellos, elegido
aleatoriamente tenga problemas cardiacos es 0,35. La
probabilidad de que un paciente con problemas
cardiacos sea un fumador es de 0,86. Cul es la
probabilidad de que el paciente elegido al azar de
entre la poblacin sea fumador y tenga problemas
cardiacos?.

Regla de la multiplicacin para sucesos


independientes.

Los sucesos A y B se consideran independientes


cuando la ocurrencia de uno no influye sobre la
probabilidad de ocurrencia del otro; esto significa que,
independientemente de que A haya ocurrido o no, la
probabilidad asignada a B es siempre la misma.

P (B ) = P (B)
A

Cul es la probabilidad de que en una familia con


dos hijos, ambos sean varones?

115
Manual de Estadstica General

Ejemplo 1:

La Compaa de Seguros JL ha desarrollado un


novedoso seguro mdico familiar. De acuerdo con una
investigacin hecha en el mercado, la probabilidad de
que el producto tenga xito es 0,80 si una compaa
competidora no introduce un plan similar en el
mercado, en tanto que la probabilidad de xito es 0,30
si la empresa competidora lanza al mercado un seguro
similar. Adems, la compaa JL estima que hay una
probabilidad de 0,40 de que la firma competidora
comercialice el producto.

Entonces:

P ( A I B ) = P ( A) P ( B )

Ejemplo

Cul es la probabilidad de que en una familia con


dos hijos, ambos sean varones?

P (V1 ) = 0,5 P ( V1 I V2 ) = P ( V1 ) P ( V2 )
P (V2 ) = 0,5
= (0,5) (0,5)

P ( V1 I V2 ) = 0,25

7.4.4 El teorema de Bayes

Consiste en una particin de la probabilidad total.

116
Jorge Crdova Egocheaga

Ejemplo 1:

La Compaa de Seguros JL ha desarrollado un


novedoso seguro mdico familiar. De acuerdo con una
investigacin hecha en el mercado, la probabilidad de
que el producto tenga xito es 0,80 si una compaa
competidora no introduce un plan similar en el
mercado, en tanto que la probabilidad de xito es 0,30
si la empresa competidora lanza al mercado un seguro
similar. Adems, la compaa JL estima que hay una
probabilidad de 0,40 de que la firma competidora
comercialice el producto.

Dado que el producto de la Compaa JL tuvo xito,


cul es la probabilidad de que la firma competidora
haya comercializado su novedoso plan de seguro?

Solucin:

P(C) = probabilidad de que la compaa


competidora comercialice el producto,

P(C) = probabilidad de que la compaa competidora


no comercialice el producto,

P(E) = probabilidad de que el plan de seguro familiar


de la compaa JL tenga xito.

P. Marginal P. Condicional P. Conjunta

,40 P(E/C) = 0,30 P ( C I E) = 0,40 0,30 = 0,12


=0
P( C )
P(C
) =
0,6
0 P(E/C) = 0,80 P ( C I E) = 0,60 0,80 = 0,48
'

P. Total P ( E) = 0,60

Luego, de acuerdo con el Teorema de Bayes

117
Manual de Estadstica General

P ( C I E)
P (C )=
E P ( C I E) + P ( C ' I E)

0 .12 0 .12
= = = 0 .20
0 .12 + 0 .48 0 .60

La probabilidad que la compaa de seguros haya


participado en el mercado, dado que JL tuvo xito es
de 0,20.

Ejemplo 2

El Director de la Clnica Santa Teresa est


considerando comprar un lote de 10000 equipos de
venoclisis de un proveedor nacional. El fabricante de
estos equipos estima la proporcin de equipos
defectuosas en el lote, en la siguiente forma.

Proporcin de Probabilidad
piezas defectuosas () P()

1 = 0,10 P(1) = 0,20


2 = 0,15 P(2) = 0,30
3 = 0,25 P(3) = 0,50

Esto significa que el proveedor no est seguro acerca


de la proporcin de equipos defectuosos en el lote, sin
embargo, basndose en experiencias anteriores, cree
que hay una probabilidad de 0,20 de que el lote tenga
10% de piezas defectuosas, una probabilidad de 0,30
de que tenga 15%. Y finalmente, de 0,50 de que tenga
25% de piezas defectuosas. Supongamos que elige
un equipo de venoclisis al azar en el lote:

118
Jorge Crdova Egocheaga

A) Cul es la probabilidad de qu esta sea


defectuosa?

B) Dado que el equipo resulta defectuoso, cul es


la probabilidad de que el lote tenga 25% de piezas
defectuosas?
P. Marginal P. Condicional P. Conjunta

P(D/1)= 0,10
1=0,10 P ( 1 I D) = 0,20 0,10 = 0,0200
20
0,
1)
=

P(

P(D/2)= 0,15
P(2) = 0,30 =0,15
2 P ( 2 I D) = 0,30 0,15 = 0,045
P(
3
)=
0,
50

P(D/3)= 0,25
3=0,25 P ( 3 I D) = 0,50 0,25 = 0,1250
P ( D) = 0,1900

Respuesta A:

Hay tres maneras posibles de obtener un equipo


defectuosa del lote. Por lo tanto, la probabilidad de
obtener una pieza defectuosa, cualquiera que se la tasa
porcentual de defectuosos 10, 15 25 es:

P( D) = P( 1 I D) + P( 2 I D) + P( 3 I D)

= 0,0200 + 0,0450 + 0,1250

= 0,19

119
Manual de Estadstica General

Ejercicio B

De acuerdo con el Teorema de Bayes, la probabilidad


de que el lote contenga 25% de piezas defectuosas,
dado que la pieza elegida es defectuosa, es:

P( 3 I D) 0.1250
P( 3 / D) = = = 0.6579
P(D) 0.1900

Ejercicio

Un mdico ha decidido recetar dos nuevos


medicamentos a 200 pacientes enfermos del corazn de
la manera siguiente: 50 pacientes tomarn el
medicamento A, otros 50 tomarn el medicamento B y
los otros 100 restantes tomarn ambos medicamentos

El medicamento A reduce la probabilidad de un infarto


en 0,35 , el medicamento B reduce la probabilidad de un
infarto en 0,20 y los dos medicamentos, cuando se les
toma juntos, actan de manera independiente.

Los 200 pacientes fueron escogidos entre los que tenan


0,80 de probabilidad de sufrir un infarto. Si un paciente
elegido al azar sufre un infarto, cul es la probabilidad
de que haya tomado ambos medicamentos?

120
CAPTULO 8
DISTRIBUCIONES
DE
PROBABILIDADES

OBJETIVOS
Al finalizar el Captulo 8, el participante ser capaz de:

1. Identificar las distribuciones de probabilidad que


ms se utilizan en la toma de decisiones.
2. Utilizar el concepto de valor esperado para la toma
de decisiones.
3. Mostrar cul distribucin de probabilidad utilizar, y
como encontrar sus valores.
4. Comprender las limitaciones de cada una de las
distribuciones que utilice.
Manual de Estadstica General

8.1 TECNICAS DE CONTEO

Combinacin:

Es una seleccin de objetos con independencia en su


ordenamiento.

Ejemplo:

Un bilogo dispone de 10 plantas para un experimento. Slo


ocho son necesarias para realizarlo. Las ocho plantas
necesariamente son seleccionadas aleatoriamente.

Permutacin:

Es una distribucin de objetos en un orden determinado.

Ejemplo:

El numero del DNI.

PERMUTACIN

Clculo del nmero de permutaciones para n objetos


tomados de x

n!
Pxn = donde x n
(n x)!

Ejemplo:

Los bilogos estn interesados en el orden en que cuatro


ribonucletidos adenina (A), uracilo (U), guanina (G) y
citosina (C) se combinan para formar una cadena. Cuntas
cadenas formadas por dos nucletidos pueden formarse?

122
Jorge Crdova Egocheaga

Hacer
Hacerunundiagrama
diagramade derbol
4! 4x3x2x1 rbol
P =
2
4
= = 12 para
paraindicar
indicarlas
las12
12cadenas
cadenas
(4 2)! 2 x1

COMBINACIN

Numero de combinaciones de n objetos tomadas de r

n!
C xn = donde x n
x !( n x ) !

Ejemplo:

Se realiza un estudio para determinar la opinin de los


profesores de la EPUNFV respecto al aborto; si se elige una
muestra de cuatro profesores de un total de 45. Cuntas
muestras distintas pueden seleccionarse

45! 45 x 44 x 43 x 42 x 41! 45 x 44 x 43 x 42
C 445 = = = = 148, 995
4!(45 4)! 4! x 41! 4!

8.2 LAS DISTRIBUCIONES DE PROBABILIDAD

(A) Concepto: Es una distribucin de frecuencias terica


que describe la forma en que se espera que varen los
resultados.

Resultan tiles para realizar inferencias y tomar


decisiones bajo incertidumbre.

Ejemplo:

Se seleccionan en forma consecutivas dos bebes del


servicio de Neonatologa . El nmero de varoncitos ser:

123
Manual de Estadstica General

N de Probabilidad
Resultados Probabilidad
varones 0.50
0 V,V 0,25
1 VM,MV 0,50
0.25
2 MM 0,25

0 1 2

(B) TIPOS DE DISTRIBUCIONES

DISCRETAS: La variable toma un nmero limitado de


valores. Abarca :

- Distribucin binomial
- Distribucin de Poisson
- Distribucin hipergeomtrica

CONTINUAS: La variable puede tomar cualquier valor


dentro de un intervalo dado. Abarca:

- Distribucin normal
- Distribucin normal estndar o Z
- Distribucin t
2
- Distribucin Ji-cuadrada
- Distribucin F

8.3 VARIABLES ALEATORIAS

Una variable es aleatoria si toma diferentes valores como


resultado de un experimento .

Puede ser discreta o continua

Ejemplo: Se lanzan 3 monedas

X : variable aleatoria (ej : nmero de caras)


x : valores que puede tomar la variable

(ej : 0, 1, 2, 3)

124
Jorge Crdova Egocheaga

Esperanza matemtica : E (X)

Es el promedio de la variable aleatoria, si el experimento se


repite un nmero infinito de veces.

Ejemplo : Se lanzan 3 monedas


1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8
= {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}

3 caras. 2 caras 1 cara


P(x) XP(x) ( X) = XP( x )
0 1/8 0 12
3/8 =
1 3/8 8
2 3/8 6/8
3 1/8 3/8 = 1,5
12/8
Aplicacin: uso del valor esperado y las prdidas monetarias.
Supongamos que un distribuidor de medicinas muy que
rpidamente se deterioran (vacunas) compra cada cajita a
20 u.m. y las vende a 50 u.m.. No puede especificar el
nmero de cajitas que le solicitarn diariamente, pero
dispone de los siguientes datos:

Ventas N de das Probabilidad de venta


diarias de venta de cada cantidad
10 15 0.15
11 20 0.20
12 40 0.40
13 25 0.25
100 1.00

Tipo de prdidas

125
Manual de Estadstica General

(A) Prdidas por mermas (obsolescencia):


oferta > demanda (costo contable)

(B) Prdidas de oportunidad: oferta < demanda


(costo econmico)

Posibles N Alternativas de oferta


de cajitas
pedidas/da 10 11 12 13

10 0 20 40 60
11 30 0 20 40
12 60 30 0 20
13 90 60 30 0

Clculo de la prdida esperada


Para un stocks de 10 cajitas, la prdida esperada ser:

Posibles N Probabilidad
Prdida Prdida
de cajitas que se reciban
Condicional esperada
pedidas/da estos pedidos
10 0 0.15 0.00
11 30 0.20 6.00
12 60 0.40 24.00
13 90 0.25 22.50
Prdida esperada: 52.50

Solucin ptima: analizar otros tamaos de stocks y decidir


por aqul que genere la menor perdida

126
Jorge Crdova Egocheaga

8.4 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

8.4.1 La distribucin binomial

Se utiliza para describir variables discretas.

Es una de las distribuciones mas utilizadas en la


estadstica aplicada. La distribucin se deriva de un
procedimiento llamado ensayo de Bernoulli, nombrado
as en honor del matemtico Suizo James Bernoulli
(1654 - 1785)

a) Caractersticas:
El experimento consiste en una serie de ensayos
repetidos.
Cada ensayo slo tiene dos resultados posibles:
xito y fracaso.
La probabilidad de xito, designado por p es la
misma para cada ensayo, la probabilidad de fracaso
q (igual a 1-p) es tambin constante.
1. Los ensayos sucesivos son independientes.
2. Puede ser simtrica o sesgada.
3. La informacin de la muestra se obtiene
con reposicin de una poblacin finita.

b) Frmula
n!
P(X = x) = p xq n-x
x! (n - x)!
donde:
n : nmero de ensayos
x : nmero de xitos
p : probabilidad de xitos en un ensayo
q : probabilidad de fracaso en un ensayo
n - x : nmero de fracaso en el ensayo

Se aplica a la seleccin de una muestra, slo


cuando el resultado de cada solucin es

127
Manual de Estadstica General

independiente de los resultados de las selecciones


anteriores.

c) Aplicacin:

Una muestra de 4 frascos se selecciona sin


restitucin de un lote de 5,000 frascos de cierto
laboratorio farmacutico. Suponiendo que 20% de
los frascos de lote no cumplen con las
especificaciones mdicas, cul es la probabilidad
de que la muestra contenga exactamente 2 frascos
malos?

Datos:
n=4
x=2
p = 0,20
q = 0,80
n!
P(X = x ) = p xq n-x
x! (n - x )!

4!
P(X = 2) = (0.2 )2 (0.80 )2
2! (4 - 2)!

= 0,1536

Ejercicio

La escasez de glbulos rojos puede determinarse


examinando al microscopio una muestra de sangre.
Suponiendo que un volumen pequeo contenga por
trmino medio 4 glbulos rojos en personas
normales, cul es la probabilidad de que una
muestra de personas normales:

128
Jorge Crdova Egocheaga

contenga exactamente tres glbulos rojos?


Ninguno tenga glbulos rojos?

d) La distribucin

Cierto proceso mdico se repite cuatro veces.


Suponga que existe la probabilidad de 0.50 que el
proceso resulte deficiente. En cuatro repeticiones se
puede obtener 0,1,2,3 4 procesos deficientes. Se
puede calcular la probabilidad de cada uno de estos
posibles resultados mediante la distribucin
binomial.
X
(Nmero de P(X = x )
procesos deficientes)
0 4
4! 1 1
0 = 116
0!4! 2 2
1 3
4! 1 1 4
1 = 16
1!3! 2 2
2 2
4! 1 1
2 = 6 16
2!2! 2 2
3 1
4! 1 1 4
3 = 16
3!1! 2 2
4 0
4 4! 1 1
= 116
4!0! 2 2

A estos resultados se denomina distribucin de


probabilidad.

e) La media y la desviacin estndar


Consideramos la distribucin del ejemplo anterior
(p = 1/2, n = 4)
X 0 1 2 3 4
P(X = x ) 1/16 4/16 6/16 4/16 1/16

129
Manual de Estadstica General

La media
= XP ( x)
X P(x) XP(x) 32
XP ( x ) = 16
0 1/16 0
1 4/16 4/16 = 2 procesos
2 6/16 12/16
3 4/16 12/16 Tambin:
4 1/16 4/16 = np
32/16
= 4( 1 2 ) = 2

Interpretacin: Si seleccionamos 4 procesos mdicos al


azar, se espera encontrar 2 procesos deficientes, si este
experimento se repite un nmero infinito de veces.

La desviacin estndar
= (x ) 2
P( x)

x P( x ) (x ) (x )2 ( x ) 2 P( x)
0 1/16 -2 4 4/16
1 4/16 -1 1 4/16
2 6/16 0 0 0
3 4/16 +1 1 4/16
4 1/16 +2 4 4/16
16/16
16
(X ) P( x) =
2

16
16
= (X ) 2 P( x) = = 1 proceso deficiente
16

130
Jorge Crdova Egocheaga

Tambin
= npq

= 4 ( 0,5 )( 0 ,5) = 1

La distribucin binomial (p = 1/2, n = 4) tiene una media


de 2 y una desviacin estndar de 1.

Ejemplo

La Dra. Jimnez, Directora de Control de Calidad de un


gran hospital, se encuentra realizando su revisin
mensual a los procesos de emergencia peditrica. En el
procedimiento, se seleccionan 10 procesos y se les
analiza en busca de deficiencias administrativas. A lo
largo del tiempo, slo 2% de las emergencias
peditricas registran deficiencias administrativas
(suponga que las deficiencias se presentan de manera
independiente en diferentes procesos).

Cul es la probabilidad de que la muestra del


Dra. Jimnez contenga ms de dos procesos
con deficiencias administrativas?
Cul es la probabilidad de que en ninguno de los
procesos seleccionados registre deficiencia
administrativa?

Ejemplo:

Supngase que en cierta poblacin el 52 por ciento de


todos los nacimientos que se registraron son varones. Si
aleatoriamente se escogen cinco registros de
nacimientos dentro de esa poblacin, cul es la
probabilidad de que exactamente tres de ellos
pertenezcan a varones?.

131
Manual de Estadstica General

P = 0.52
q = 1 - 0.52 = 0.48
n=5 5!
P(3,5) = 0.523 0.48(5 3) = 0.32 32%
r=3 3!(5 3)!

Uso de Tablas

Solucionando el problema anterior usando la tabla de


probabilidades binomiales

ta bla de proba bilida de s binom ia le s


p
n r 0.37 0.38 0.39 0.40 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 0.49 0.50 r n

5 0 0.0380 5
1 0.1755 4
2 0.3240 3
3 0.2990 2
4 0.1380 1
5 0.0255 0 5

n r 0.63 0.62 0.61 0.60 0.59 0.58 0.57 0.56 0.55 0.54 0.53 0.52 0.51 0.50 r n
p

La probabilidad de tener 3 inscritos varones de 5


registros realizados es del 0.324 o 32.4%.

8.4.2 Distribucin de Poisson:

Es una distribucin muy usada en medicina y biologa.


Se deriva del proceso de Poisson en honor al
matemtico francs Simeon Denis Poisson (1781-
1840).

Debe cumplir las siguientes condiciones:


La ocurrencia de los eventos son independientes.
El nmero promedio de veces (l) que ocurre un
xito por cada unidad de tiempo o de espacio es
constante.

132
Jorge Crdova Egocheaga

La probabilidad de un suceso es una unidad de


tiempo o de espacio muy pequea.Ejemplos de
aplicaciones de Poisson:
Pacientes que llegan a la sala de urgencias de un
hospital durante un cierto da.
Defectos de un rollo de gasa.
Accidentes por hora en cierta parte de una
carretera.
Clientes que llegan a la caja registradora de una
farmacia en un determinado horario.

Si el tamao de la muestra es bastante grande (n>50) y


la probabilidad de un evento particular es muy pequeo
(p < 0,1) y se desea hallar la probabilidad de un nmero
determinado de xitos, se puede aplicar la distribucin
de Poisson, dada por la siguiente ecuacin.

P(X = x ) =
x e
x!

donde
(lambda): media = np = variancia
e : base de logaritmos naturales =2.71828
x!

Ejemplo:

Supongamos que estamos investigando la seguridad de


una peligrosa interseccin de calles, los registros
policacos indican un media de 5 accidentes mensuales
en esta interseccin. El nmero de accidentes esta
distribuido de acuerdo con una distribucin de Poisson y
el departamento de seguridad vial desea que
calculemos la probabilidad de que en cualquier mes
ocurra exactamente 3 accidentes.

133
Manual de Estadstica General

X = 3 acc/mes 53 2.71835
P( x =3) = = 0.14042 14.04%
= 5 acc/mes 3!

Uso de Tablas

Solucionando el problema anterior usando la tabla de


distribucin de probabilidades de Poisson:


x 4 .1 ......... 4 .5 .......... 4 .9 5

0 0 .0 0 6 7

1 0 .0 3 3 7

2 0 .0 8 4 2

3 0 .14 0 4

4 0 .17 5 5

5 0 .17 5 5

La probabilidad de tener exactamente 3 accidentes en


un mes cualquiera es 0.1404

Aplicacin

La probabilidad de nmero equivocado a pesar de


haber marcado correctamente es 0,03. Si se toma una
muestra de 100 llamadas, cul es la probabilidad de
tener 2 nmero equivocado?

Solucin:
p = 0.03 3 2 ( 2.71828) 3
n = 100 P(X = 2 ) =
2!

= 02240
=3

134
Jorge Crdova Egocheaga

La aproximacin de Poisson a la distribucin Binomial

Consideremos una distribucin binomial con p=0.02 y


n = 100. Supongamos que nos interesa calcular la
probabilidad de que X = 3 utilizando la formula binomial,
podemos encontrar la probabilidad exacta de la forma
siguiente:

100!
P(X = 3) = ( 0,02 ) 3 ( 0,98 ) 97
3! 97!

= 0,1823

Los clculos son muy tediosos. Cuando p es pequeo y


n es lo suficientemente grande, la formula binomial
puede aproximarse mediante una distribucin de
Poisson con = np

Luego, utilizando una distribucin de Poisson


encontramos que la probabilidad de que X=3 es:

x e
P(X = 3) =
x!
= np = 100 (0,02) = 2

( 2 ) 3 ( 2 , 71828 ) 2 8
= = = 0 ,1805
3! 6 ( 2 , 71828 ) 2

La respuesta es muy prxima a la encontrada con la


distribucin binomial. La aproximacin se considera
vlida cuando

p 0.05 y n 20

135
Manual de Estadstica General

8.4.3 La distribucin hipergeomtrica

Se utiliza para describir variables discretas

a) Caractersticas

La informacin de la muestra se obtiene sin


reposicin de una poblacin finita, por lo tanto la
probabilidad de xito vara.

b) FormulaDonde
donde:
M N M M : nmero de xitos en la poblacin
k : nmero de xitos en la muestra
P(X = k ) =
k n k
N : tamao de la poblacin
N N-M: nmero de fracasos en la poblacin
n : tamao de la muestra
n n-k : nmero de fracasos en la muestra

c) Aplicacin

Calcular la probabilidad de obtener 10 tubos


defectuosos en una muestra de 20 tubos de radio
tomados sin reemplazo de un lote de 30 tubos, de lo
cuales 15 son defectuosos.

Datos:
k = 10
n = 20
N= 30
M= 15
15 30 15

P(X = 1 0) = 10 20 10

30

20
( 3003 )( 3003 ) 9018009
= = = 0 ,3001
30045015 30045015

136
Jorge Crdova Egocheaga

Si errneamente se usa la distribucin binomial con


n = 20 y p =15/30 = 1/2 para calcular la probabilidad
de tener 10 defectuosos, el resultado ser:

P(X = x ) =
20!
( )( )
1
10! (20 - 10)! 2
10
1
2
10

184756
= = 0 ,1762
1048576

Una probabilidad considerablemente menor que la


probabilidad real.

d) Forma

Puede ser simtrica o sesgada. Cada vez que p =


0.5, la distribucin hipergeomtrica ser simtrica
sin tener en cuenta qu tan grande o pequeo sea
el valor de n; sin embargo, cuando p 0,5 la
distribucin ser sesgada. El grado de sesgo
variar, dependiendo de la proximidad del p a 0,5 y
del tamao de n.

e) La media y la desviacin estndar

La media:

La desviacin estndar:
N n
= np (1 p )
N 1

N n
Donde
N 1

137
Manual de Estadstica General

es un factor de correccin de poblacin finita que se


produce debido al proceso de muestreo sin
reposicin de poblaciones finitas.

9.4 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

9.4.1 La distribucin normal

Tambin conocida como campana de Gauss en honor


al matemtico Karl Gauss ( siglo 19).

Es importante por:

Es muy aplicable para inferencia estadstica


Se ajusta (casi) a las distribuciones de frecuencias
reales observadas.

Se utiliza para describir el comportamiento de una


variable continua.

(a) Caractersticas

Tiene un slo pico (unimodal). Forma acampanada.


La media cae en el centro
La media, media y moda coinciden
Es asinttica al eje horizontal

138
Jorge Crdova Egocheaga

b) Frmula

La funcin de densidad: f(x), para la distribucin


normal tiene la siguiente formula:
donde:
e : constante matemtica: 2.71828
p :constante matemtica: 3.14159
m : media de la poblacin
s : desviacin estndar de la poblacin
x : cualquier valor de la variable aleatoria
continua

Areas debajo de la curva normal

No importa cuales son los valores de m y s, para una


distribucin de probabilidad normal el rea total bajo
la curva es 1.00, de manera que podemos pensar en
reas bajo la curva como si fuesen probabilidades.
Matemticamente es verdad que:

1: Aproximadamente 68% de todos los valores de una


poblacin normalmente distribuida se encuentra
datos 1 desviacin estndar de la media .

6 8 % d a to s

2: Aproximadamente 95.5% de todos los valores de


una poblacin normalmente distribuida se encuentra
datos 2 desviacin estndar de la media.

139
Manual de Estadstica General

2 + 2

94.6% datos

3: Aproximadamente 99.7% de todos los valores de


una poblacin normalmente distribuida se encuentra
datos 3 desviacin estndar de la media

3 + 3

9 9 % d a to s

8.5.2 La distribucin normal estndar (Z)

La distribucin normal tiene diferente y para


calcular probabilidades habra que integrar la funcin
de densidad. Por este motivo se estandariza la
variable.

La estandarizacin es un proceso estadstico que


consiste en restar la media a la variable y el resultado
dividirlo por la desviacin estndar.

140
Jorge Crdova Egocheaga

x
Z=

La tabla de distribucin normal estndar, es la siguiente:

z 0 .0 0 0 .0 1 0 .0 2 0 .0 3 0 .0 4 0 .0 5 0 .0 6 0 .0 7 0 .0 8
0 .0 0 .0 0 0 0 0 .0 0 4 0 0 .0 0 8 0 0 .0 1 2 0 0 .0 1 6 0 0 .0 1 9 9 0 .0 2 3 9 0 .0 2 7 9 0 .0 3 1 9
0 .1 0 .0 3 9 8 0 .0 4 3 8 0 .0 4 7 8 0 .0 5 1 7 0 .0 5 5 7 0 .0 5 9 6 0 .0 6 3 6 0 .0 6 7 5 0 .0 7 1 4
: : : : : : : : : :
: : : : : : : : : :
1 .1 0 .3 6 4 3 0 .3 6 6 5 0 .3 6 8 6 0 .3 7 0 8 0 .3 7 2 9 0 .3 7 4 9 0 .3 7 7 0 0 .3 7 9 0 0 .3 8 1 0
1 .2 0 .4 0 3 2 0 .4 0 4 9 0 .4 0 6 6 0 .4 0 8 2 0 .4 0 9 9 0 .4 1 1 5 0 .4 1 3 1 0 .4 1 4 7 0 .4 1 6 2
:
:
2 .4
2 .5
:

Cuando Z=1.27 entonces el rea vale: .....

= 2.5

= 10 15

141
Manual de Estadstica General

Ejercicio:

Un terapista fsico piensa que los puntajes en una


prueba de destreza manual tiene una distribucin
aproximadamente normal, con una media de 10 y una
desviacin estndar de 2,5. Si a un individuo, elegido
aleatoriamente, se le aplica el examen, cul es la
probabilidad de que logre un puntaje de 15 o mas
puntos?.

Obtenemos la siguiente informacin:

= 10 = 2.5 = 2.5
x 15 10
Calculando Z: z= = =2
2.5
= 10 15
Para Z=2, buscamos en la tabla cual es la
probabilidad (o rea) que le corresponde:
rea = .4772
= 2.5
Como deseamos conocer esta rea:
P ( x 15) = 0.5 0.4772 = 0.0228 2.28%

= 10 15

Cul es la probabilidad de que se logre un pontaje


entre 11 y 14?

Calculando Z:

11 10
Cuando x = 11 z = = 0.4 A = 0.1554
2.5
14 10
Cuando x = 14 z = = 1.6 A = 0.4452
2.5
11 14

142
Jorge Crdova Egocheaga

El rea sombreada se encuentra restando del rea


mayor (0.4452) el rea menor (0.1554)

P (11 x 14) = 0.4452 0.1554 = 0.2898 28.98%

Aplicaciones

Una empresa aplica un programa de entrenamiento


diseado para mejorar la habilidades de supervisin en
los diferentes procesos que se desarrollan en un
hospital. Debido a que el programa es autoadministrado,
los supervisores requieren un nmero diferente de horas
para concluirlo Un estudio de los participantes anteriores
indica que el tiempo medio que se lleva completar el
programa es de 500 horas y que esta variable aleatoria
normalmente distribuida tiene una desviacin estndar
de 100 horas.

Pregunta 1. Cul es la probabilidad de que un


participante elegido al azar requiera ms de 500 horas
para completar el programa?

Solucin:
En la figura, podemos ver que la
mitad del rea bajo la curva est
P(X>500)=0.5
localizada a ambos lados de la
media de 500 horas. Por lo tanto
podemos deducir que la
probabilidad de que la variable
aleatoria tiene un valor mayor a
500 es el rea sombreada, es
decir, 0.5.

Pregunta 2:Cul es la probabilidad de que un


supervisor elegido al azar se tome entre 500 y 650
horas para completar el programa de entrenamiento.

143
Manual de Estadstica General

Solucin:
La grfica se muestra la
respuesta como zona
P(500 X 650)=0.4332 sombreada, representada por
el rea entre la media (500
horas) y el valor de X, en el
cual estamos interesados
(650 horas). Estandarizando
la variable tenemos un valor
para Z

x
Z=

650 500
Z= = 1.5
100

Si buscamos Z = 1.5 en la tabla, encontraremos una


probabilidad de 0,4332. En consecuencia, la
probabilidad de que un candidato escogido al azar
requiera entre 500 y 650 horas para terminar el
programa de entrenamiento es ligeramente mayor a 0,4

Pregunta 3:Cul es la probabilidad de que un


supervisor elegido al azar se tome ms de 400 horas en
completar el programa?

Solucin:

Estamos interesados en el rea a la derecha de 700.

Estandarizamos

x P(X >700)= 0..0228


Z=

700 500
Z = =2
100

144
Jorge Crdova Egocheaga

Tabla: si Z = 2.0 Area: 0.4772

En consecuencia, la probabilidad mayor a 700 ser


0,5 - 0,4772 = 0,0228

Por lo tanto hay un poco ms de 2 oportunidades en 100


de que un participante elegido al azar se lleve ms de
700 horas en completar el curso.

Pregunta 4:Suponga que el director del programa desea


saber la probabilidad de que un participante escogido al
azar requiera entre 550 y 650 horas para completar el
trabajo requerido en el programa.

Solucin:

Primero calculamos el valor de Z para 650


x
Z=

650 500 P(550 X 650)
Z= = 1 .5
100
A este valor le
corresponde un rea
de 0,4332

Despus calculamos un valor de Z para 550

x
Z=

550 500
Z= = 0.5
100

Correspondindole un rea de 0,1915

145
Manual de Estadstica General

Para responde la pregunta debemos


estar restar las reas:

Probabilidad de que la variable aleatoria 0,4332


est entre la media y 650 horas

(-) Probabilidad de que la variable aleatoria


0,1915
est entre la media y 550 horas

(=) Probabilidad de que la variable aleatoria 0,2417


est 550 y 650 horas

As pues, la probabilidad de que un supervisor elegido al


azar se tome entre 550 y 650 horas para completar el
programa de entrenamiento es un poco menor de 1
entre 4

Ejemplo

Supngase que la estancia promedio de internacin en


un hospital es de 5,5 das con una desviacin estndar
de 1,8 das. Si se supone que la duracin de la
internacin se distribuye normalmente, encuentre la
probabilidad de que un paciente seleccionado al azar de
dicho grupo, tenga una duracin de internacin :

de ms de 6 das
entre 4 y 7 das

8.5.3 La distribucin t

a) Caractersticas

Al igual que la normal, tambin es simtrica es algo


ms plana que la distribucin normal hay una
distribucin t para cada tamao de muestra cuando
el tamao de la muestra es mayor a 30, la

146
Jorge Crdova Egocheaga

distribucin t se asemeja tanto a la normal que se


prefiere utilizar sta.

CUANDO UTILIZAR Z o t

SI
SE CONOCE ? USAR Z

NO

SI
es n 30? USAR Z

NO

USAR t

147
Manual de Estadstica General

TABLA DE DISTRIBUCION t DE STUDENT


d.f. t .90 t .95 t .975 t .99 t .995
d.f. Grados de libertad 1 3.08 6.31 12.7 31.8 63.7
2 1.89 2.92 4.3 6.97 9.92
d. f . = n 1
3 1.64 2.35 3.18 4.54 5.84
Ejemplo: :
n= 28 N.C. = 95%
:
t=?
:
:
d.f. = 28 - 1 = 27
26 1.32 1.71 2.06 2.48 2.78
t = 2,0518
27 2.31 1.7 2.05 2.47 2.77
28 1.31 1.7 2.05 2.47 2.76
:
:
:

b) Frmula
x
t=
s
n

c) Grados de libertad

Se definen como el nmero de valores que


podemos escoger libremente.

8.5.4 La distribucin Ji-Cuadrada

a) Caractersticas

Es una distribucin asimtrica a la izquierda


Slo considera valores positivos

148
Jorge Crdova Egocheaga

b) Definicin

La distribucin Ji-cuadrada esta definida por


n
= Z i2
2

i =1
c) Aplicaciones

Las aplicaciones ms importantes estn en la


prueba de bondad de ajuste la prueba de
independencia estadstica

d) Distribucin

8.5.4 La Distribucin F

Caractersticas
Es una distribucin asimtrica a la derecha
Slo tiene valores positivos
Se utiliza para comparar variancias de dos
poblaciones, con distribucin normal

149
Manual de Estadstica General

Frmula
2
S mayor
F= 2
S menor
Existe una familia de distribuciones F.

Cada miembro de la familia est determinado por dos


parmetros: los grados de libertad (gl) en el
numerador y los grados de libertad en el denominador.

El valor de F no puede ser negativo y es una


distribucin continua.

La distribucin F tiene sesgo positivo.

Sus valores varan de 0 a . Con forme F la


curva se aproxima al eje X.

150
CAPTULO 9
MUESTREO Y
DISTRIBUCIONES
DE MUESTREO

OBJETIVOS
Al finalizar el Captulo 9, el participante ser capaz de:
1. Determinar el tamao de una muestra
2. Asegurarse que las muestras que se extraigan sean
representativas de la poblacin de la que provienen
3. Comprender las distribuciones del muestreo
4. Comprender la relacin entre el costo del tomar
muestras ms grandes y la precisin adicional que
esto le proporcione a las decisiones tomadas a
partir de ellas
Manual de Estadstica General

9.1 IMPORTANCIA DEL MUESTREO

En lugar de levantar un censo completo se realiza un


muestreo, debido a que un censo:

Requiere demasiado tiempo


Es muy costoso
Muy laborioso e ineficiente

9.2 TIPOS DE MUESTREO

A) MUESTREO NO PROBABILSTICO: No permite


inferencia estadstica.

M. de Juicio: Abarca el juicio del experto, opiniones de


especialista
M. de Cuotas: Se decide la estructura del marco
muestral, sin tener en cuenta la estructura del marco
poblacional.
M. de Trozo: La eleccin de los racimos no se hace al
azar.

B) MUESTREO PROBABILSTICO: Permite inferencia


estadstica. Cada elemento del marco poblacional tiene
una probabilidad conocida diferente de cero de
conformar o ser parte de la muestra.

1. Muestreo Aleatorio Simple (MAS):

Concepto: Todas las unidades elementales tienen la


misma probabilidad de conformar la muestra. Dicho
de otro modo, significa que cada una de las
posibles muestras de tamao n, tenga a la misma
probabilidad: 1/N CN de ser seleccionada
(muestreo sin sustitucin). Es el caso de un sorteo.

152
Jorge Crdova Egocheaga

Tamao de la muestra: Depende de:

La magnitud del mximo error permisible (e) y, el


grado de confianza de que el error en la estimacin
no exceda del mximo error permisible (1- )

A. Para estimar una media poblacional:


Se calcula a partir de la formula siguiente

Z S 2e
n = 2
2

A mayor variabilidad de la muestra s 2e , mayor


varianza. A mayor varianza mayor tamao muestral
representa el error de muestreo, llamado error de
estimacin o precisin de la estimacin. El valor
debe ser asumido por el investigador. En este caso
= ( x)
Para poblaciones finitas (se conoce N), el tamao
final (nf) queda definido por la siguiente relacin

Ejemplo 1:

A fin de conocer el gasto mensual en medicinas por


familia, el Gerente de Marketing de un laboratorio
farmacutico desea determinar el tamao de la
muestra que le proporcione un nivel de confianza de
0,95 (Z = 1,96). Adems conoce por estudios
anteriores que las compras medias por familia eran
de S/. 120 mensuales, con una desviacin estndar
de 30. El Gerente busca un tamao de muestra que
le permita estimar el nivel de gasto con un error de
10.

153
Manual de Estadstica General

Z S 2e
n = 2
2

(1,96 )2 (3 0 )2
n=
(1 0 )2

n = 36

Ejemplo 2

En cierta poblacin se 1200 escolares, se desea


estimar el nivel promedio de Hb con 0,95 de
confianza. Al realizar un estudio piloto se encontr
que x = 12,3 y S = 1,6. Si los investigadores
estn dispuestos a asumir un = 0,5 .Calcular n
Z 2 = 1,96
N = 1200
Se = 1,6 n=
Z 2 2 s 2e
=
(1,96 )2 (1,6 )2 = 39,33
= 0 ,5
2
(0,5 )2

n 39,33
nf = = = 38,08 39
n 39,33
1+ 1+
N 1200

Interpretacin

El nmero mnimo necesario de escolares para


realizar el estudio es de 39, si se desea estimar el
nivel promedio de Hb en la poblacin con una
precisin de 0,5.

154
Jorge Crdova Egocheaga

Ejemplo 3

En cierta poblacin se 1200 escolares, de 9 11


aos se desea estimar el nivel promedio de hierro
srico. Con este fin se va a seleccionar una muestra
probabilistica. Si en un estudio similar se obtuvo
una media aritmtica de 60,6 mg/dl y S = 22,4
mg/dl. Calcular el tamao mnimo de la muestra si
la estimacin del parmetro se va a realizar con
0,95 de confianza y se asume un = 5

Z = 1,96
(1,96 )2 (22,4 )2
2
Z 2 2 s 2e
N = 1200 n= = = 77,10
Se = 22,4
2
(5 )2
= 5

n 77,10
nf = = = 72,44 73
n 77,10
1+ 1+
N 1200

Interpretacin :

El nmero mnimo necesario de escolares para


realizar el estudio es 73, si se desea estimar el nivel
promedio de hierro srico en la poblacin con una
precisin 5

B. Para estimar una proporcin poblacional:

Z 2 2 p e q e
n =
2

155
Manual de Estadstica General

donde:

pe = proporcin estimada de sujetos con la


caracterstica de inters. Se puede obtener de
revisin bibliogrfica, estudio piloto o asumiendo
pe = qe= 0,50

qe = proporcin estimada de sujetos sin la


caracterstica de inters.

= Error absoluto de muestreo o precisin. Debe


ser asumido por el investigador. = ( p )

Si se conoce N:

n
nf =
n
1+
N

Ejemplo 1:

En una poblacin grande, se desea estimar la


prevalencia de DM con 0,95 de confianza. De la
literatura se sabe que p = 0,10 si se asume un error
muestral de 5%, calcular n

Datos
Z 2 2 p e q e
n =
2

Z 2 = 1,96
n =
(1,96 )2 (0 ,1 )(0 ,9 )
p e = 10 % = 0,10
qe = 90 % = 0,90
(0 ,05 )2
= 0,05 0 ,345744
n = = 138 , 3 139
0 , 0025

156
Jorge Crdova Egocheaga

Interpretacin:

Si se desea estimar la prevalencia poblacional con


0,95 de confianza y un de 5% se deber evaluar
139 sujetos.

2. M. Sistemtico: Las unidades elementales son


seleccionadas dentro de un intervalo (I) de
igual tamao. Se extrae la muestra de acuerdo
a la lista de pacientes atendidos

I1 I2 I3 I4

X1

3. M. Estratificado: El marco poblacional se divide en


grupos homogneos (estratos); de cada uno se
extrae una submuestra, proporcional al tamao del
estrato. Muestreo por tipo de servicio

4. M. por Conglomerado: El marco poblacional se


encuentra agrupado en conglomerados o racimos
Se selecciona en forma aleatoria, el o los racimos.
Todos los pacientes que ingresaron un determinado
da.
ALEATORIO SIMPLE
SISTEMTICO
PROBABILISTCO
ESTRATIFICADO
POR CONGLOMERADO

MUESTREO

DE JUICIO

NO PROBABILSTICO DE CUOTAS

DE TROZO

157
Manual de Estadstica General

El error estndar

Es una medida de dispersin de una distribucin muestral. Es


equivalente a la desviacin estndar.

Desviacin estndar de la Error estndar


distribucin de medias de muestra de la media

Desviacin estndar de la Error estndar distribucin


de proporciones de muestra de la proporcin

9.2 DISTRIBUCIONES DE MUESTREO

La totalidad de datos de una poblacin, constituye la


distribucin de poblacin original (PO)

PO
X1 Media :
X2
:x
2
X3 Varianza
.
. x-
z=
. x
XN

De la PO se extraen muestras de tamao n. A cada una se


calcula su media. El conjunto de ese total de medias se
denomina poblacin derivada de medias (PDM)

158
Jorge Crdova Egocheaga

PO PDM
x1
X1
X2 x2
X3
n x3
.
.
..
XN
.
Media : xm
x
Varianza : 2x 2
x2 =
n
x x
x - =
z = x
x n

Si se busca comparar dos poblaciones, se deriva de cada


poblacin una poblacin de medias y luego se comparan

PO1 PDM1 PO2 PDM2 PDDM


X1 x1 X1 x1 ( x1 x2 )
X2 x2 X2 x2 (x x )
X3 X3
x3 x3 (x x )
. .
. . . . .
. . . . .
XN XN
xm xm ( )
Media 1 x 1
2 x 2
d = 1 2
12 22
Varianza x21 x2 =+
n1 n2
( x x ) (1 2 )
z = 1 22
1 2 2
+
n1 n2

159
Manual de Estadstica General

9.3 EL TEOREMA DEL LMITE CENTRAL

Muestra la relacin entre la forma de la distribucin de la


poblacin y la forma de la distribucin de muestro. Se basa
en dos aspectos:

(1) La media de la PDM ser igual a la media de la PO, sin


importar el tamao de la muestra(n) incluso si la poblacin
no es normal

x = x
(2) Al incrementarse el tamao de la muestra, la PDM se
acercar a la normalidad, sin importar la forma de la
distribucin de la poblacin.

El teorema del lmite central nos permite utilizar las


propiedades de la distribucin normal en muchos casos en
los que los datos subyacentes pueden no estar distribuidos
normalmente.

160