Estadística aplicada para la toma de decisiones

Ec.QuispeG.
JimmyJavier

UNI VERSI DAD ESTATAL PENI NSULA DE SANTA ELENA

FACULTAD DE CI ENCI AS ADMI NI STRATI VAS
Es cu ela d e I n gen ier a Com er cia l

I NGENI ERI A EN MARKETI NG

ESTADI STI CA
APLI CADA
Segu n d o A o

Au t or :
Ec. Qu is p e Gon za ba y J im m y J a vier
e-m a i l: ec. j i m m y qu i s p e@gm a i l. com

A o Aca d m ico:
20 10 -20 11
Ec.QuispeG.JimmyJavier
INTRODUCCIN

La estadstica tiene sus orgenes en 1662 cuando John Graunt public el artculo Natural and Political
Observations Made upon Bills of Mortality. Las observaciones del autor eran el resultado de un estudio y
anlisis de la publicacin religiosa semanal llamada Bill of Mortality, la cual inclua nacimientos, bautizos y
muertes junto con sus causas. Graunt se dio cuenta de que Bill of Mortality representaba apenas una fraccin
de los nacimientos y muertes en Londres. Sin embargo, utiliz los datos para llegar a conclusiones relativas
al impacto de las enfermedades, como la peste, en la poblacin. Su lgica constituye un ejemplo de inferencia
estadstica. Su anlisis e interpretacin de los datos marcan el inicio de la estadstica. Actualmente, hay una
amplia gama de aplicaciones de la estadstica en la administracin, marketing, economa, enfermera,
deportes, etc Un ejemplo prctico seran las cuatro compaas estadounidenses con mayores ingresos:
ExxonMobil, General Motors, Ford y Chevron (ao 2005 en www.industryweek.com)

No se puede gestionar lo que no se mide. Las mediciones son la clave. Si usted no puede medirlo, no puede
controlarlo. Si no puede controlarlo, no puede gestionarlo. Si no puede gestionarlo, no puede mejorarlo. La
falta sistemtica o ausencia estructural de estadsticas en las organizaciones impide una administracin
cientfica de las mismas. Dirigir slo en base a datos financieros del pasado, realizar predicciones basadas
ms en la intuicin o en simples extrapolaciones, y tomar decisiones desconociendo las probabilidades de
xito u ocurrencia, son slo algunos de los problemas o inconvenientes ms comunes hallados en las
empresas.

Carecer de datos estadsticos en cuanto a lo que acontece tanto interna como externamente, impide decidir
sobre bases racionales, y adoptar las medidas preventivas y correctivas con el suficiente tiempo para evitar
daos, en muchos casos irreparables, para la organizacin.

En otras pocas disponer de los datos y luego analizarlos resultaba una labor costosa y agotadora, pues ella se
basaba en la labor manual de los directivos. Pero hoy se cuenta con computadoras y software que facilitan el
clculo, por lo cual las empresas que utilicen dicho potencial obtendrn una fuerte diferencia competitiva en
relacin a sus adversarios, pero ms an podrn mejorar continuamente la performance en los diversos ratios
y mediciones que hacen a los procesos y actividades de la empresa.

Las empresas que no hagan uso de estas nuevas potencialidades y afronten debidamente stas nuevas
exigencias, no slo perdern capacidad competitiva, sino que quedarn desplazados ante los continuos
cambios del entorno, poniendo en serio riesgo su propia continuidad.

En otras pocas con lentos procesos de cambios, los cuales resultaban casi imperceptibles en el tiempo, se
poda administrar una empresa con pocos datos estadsticos. Hoy, en un mundo de profundos y veloces
cambios en todo mbito ya no es posible actuar con indiferencia. Hoy un empresario necesita predecir a
tiempo los niveles de demanda de sus productos, necesita reconocer a tiempo los cambios de tendencia, debe
no slo saber en qu se gasto, sino como se gasto en el tiempo y en que conceptos.

Para negociar, para tomar decisiones, para corregir problemas de calidad, para aumentar la productividad,
para fijar precios, para mejorar el mantenimiento y disponibilidad de las mquinas e instalaciones, para
mejorar la concesin y cobranza de los crditos se requiere s o s contar con datos estadsticos.

Toda decisin, todo anlisis, todo presupuesto, est prcticamente en el aire si no se cuenta con datos
estadsticos suficientes y fiables.

No slo a nivel empresa, sino tambin a nivel pas, los que ms han avanzado han sido aquellos que hicieron
de las estadsticas una herramienta fundamental. W. Edwards Deming, un pionero en mtodos estadsticos
para el control de calidad, seal que en Japn se pone mucho nfasis en las estadsticas para directores de
empresa.

En parte fue la aplicacin de las tcnicas estadsticas enseadas por Deming lo que hizo que Japn pasara de
ser un fabricante de imitaciones baratas a lder internacional en productos de primera calidad.

Sin estadsticas una empresa carece de capacidad para reconocer que actividades o productos le generan
utilidades, y cuales slo prdidas.

No contar con datos e interpretarlos correctamente es para los administradores como caminar en la oscuridad.
Contar con los datos les ilumina, les permite ver lo que est aconteciendo y en consecuencia tomar las
medidas ms apropiadas.

Un empresario conocedor de estadsticas podra contestar para su empresa:

Qu clientes les generan los mayores beneficios?
Qu zonas o regiones son las que generan mayores ventasen unidades monetarias y volmenes? (en total y
por producto)
Cules son las reparaciones que ms se han producido en el ltimo trimestre?
En qu da de trabajo de cada mes logra llegar al punto de equilibrio?
Qu tipo de reparaciones han generado mayores egresos?

Si posee un restaurante Cules son los platos ms pedidos durante el ao y por temporada?
Cules son los vinos ms pedidos y cules los ms vendidos?

SI dirige una librera Cules son los temas ms vendidos? Cul es la rentabilidad que le aporta cada tema?
Cmo contribuye cada tema a lograr el punto de equilibrio?

Si dirige un hotel, Cul es el tiempo promedio de estada? La cantidad de clientes por zona o regin?La
facturacin por profesin, zona, motivo de su visita ( turismo, negocios, salud, profesionales, capacitacin,
otros)?

Las estadsticas nos ayudan sobre manera a tomar las decisiones ms correctas en bsqueda del beneficio
empresarial y de sus clientes. Nos ayuda por ejemplo a:

Adoptar a tiempo las medidas correctivas;
Confeccionar un presupuesto viable y efectivo;
Administrar eficazmente su flujo de fondos;
Evitar los excesos de stock y la obsolescencia de inventarios;
Conocer cuando est mejorando la productividad;
Negociar un incremento de precios;
Prediccin de ventas por canales de comercializacin.
Estudios e investigacin de mercado.
Tiempos promedios, mximos y mnimos de reparaciones por tipo de averas.
Coeficientes de correlacin.

La Gestin Moderna Basada en Estadsticas (GMBE) seguro que ayudar a profesionales administradores de
empresas

En conclusin:
Hoy en da se hace indispensable tener conocimientos bsicos de estadstica para la toma de decisiones
ptimas en nuestras empresas, que nos permita tener la capacidad de generar ideas nuevas que al aplicarse
den los resultados que se pretende en el negocio.

La presente gua ha sido diseada de una manera sencilla que permita al alumno que guste o no de las
matemticas entender las estadsticas. Por otro lado los ejercicios y problemas estn tomados en su mayora
de la realidad diaria donde nos desenvolvemos.
Se recomienda que antes de iniciar este curso el alumno debe tener conocimientos bsicos de Excel y tener la
predisposicin de hacer de las estadsticas su pasin. Suerte!

OBJETIVOS GENERALES

Describir las caractersticas principales de los datos agrupados y no agrupados basndose en la informacin
recopilada e histrica para que mediante la aplicacin de Excel y spss se analice probabilidades de
fenmenos de estudio con variables discretas y continuas.

Analizar informacin mediante un modelo de regresin lineal y pruebas de hiptesis aplicando Excel y spss
para la toma de decisin ms ptima previa al lanzamiento de productos o servicios al mercado.

COMPETENCIAS

Competencias Generales de la carrera

Analizar y sintetizar
Aplicar los conocimientos a la prctica
Trabajar de forma cooperativa en equipo
Capacidad de liderazgo

METODOLOGA
La presente gua est diseada de manera que contribuya al desarrollo de competencias en los alumnos,
mediante mtodos adecuados el docente favorece el aprendizaje en los estudiantes, las modalidades
organizativas dentro y fuera del aula ayudan para que el alumno construya el conocimiento a travs del
desarrollo de ejercicios y problemas prcticos, adems el estudio de casos en algunas unidades asiste para
que los valores entre compaeros se fortalezcan.

Se recomienda que cada alumno vaya desarrollando la clase paso a paso con ejerciciso y problemas y al final
de cada captulo se autoevale con la responsabilidad que caracteriza a un alumno universitario.

Las modalidades y mtodos que se proponen son los siguientes:

Modalidades Organizativas:
Seminarios - Talleres
Clases prcticas (Laboratorio)
Trabajo en grupo
Tutoras
Trabajo autnomo

Trabajo Autnomo:
Preparacin de actividades acadmicas dirigidas
Consultas bibliogrficas
Investigaciones
Proyectos
Tareas a corto y largo plazo

Mtodos de aprendizaje
Resolucin de ejercicios y problemas
Aprendizaje basado en problemas
Estudio de Casos
Aprendizaje Cooperativo
Aprendizaje orientado a proyectos

EVALUACIN

El ao acadmico tendr cuatro perodos, cada uno ser evaluado en las siguientes estrategias evaluativas:

ESTRATEGIA EVALUATIVA 1: Deberes %
Instrumento de evaluacin Criterios 10%
1
Pruebas de ejecucin de tareas reales a
corto plazo
Presentacin de trabajo 2
2 Desarrollo 6
3 Resultados 2

ESTRATEGIA EVALUATIVA 2: Proyecto de Investigacin %
1
Trabajo de campo
Encuesta 5
2 Contenido de trabajo y trabajo en equipo 10
3 Presentacin de trabajo 5

ESTRATEGIA EVALUATIVA 3: Pruebas %
1
Pruebas escritas / Situacin problmica
Razonamiento 3
2 Deduccin conocimientos 3
3 Interpretacin de resultados 4

ESTRATEGIA EVALUATIVA 4: Talleres grupales %
1
Talleres en equipo
Comprensin 2
2 Desarrollo de tema 4
3 Interpretacin de resultados 4

PRUEBA FINAL %
1
Prueba al final de cada perodo
Valores de honestidad, limpieza y responsabilidad 5
2 Desarrollo correcto de temas 20
3 Interpretacin de resultados correctos 25

BIBLIOGRAFA
Estadstica aplicada a los negocios y economa: Lind-Marchall;2008.
Estadstica para administracin y economa; Anderson; 2005
Muestreo Estadstico, Cesar Prez Lpez; Pearson, Prentice Hall, 2005
Estadstica para administracin, Berenson Levine, Prentice Hall, 2001
Probabilidad y Estadstica para Ingeniera y Ciencias, Mendenhall Sincich, Prentice Hall, 1997

Internet:
http://www.vitutor.com/estadistica.html
www.spssfree.com/indice.html
http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm
www.youtube.com (videos estadsticos en Excel y spss)
http://www.monografias.com/trabajos34/estadistica-negocios/estadistica-negocios.shtml
http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_9.htm

Biblioteca Virtual UPSE
http://site.ebrary.com/lib/upsesp/search.action?p00=probabilidad

De esta direccin seleccionar los siguientes textos:
Matemtica-Probabilidades, Colegio24hs
Problemario de Probabilidad, Escalona Ivn
Manual: Teora de Probabilidades, Ramrez Snchez, Waldo
Estadstica, Matus, R. Hernndez y Martha Garca E.

INDICE

UNIDADES Pginas
Unidad I: Introduccin a Estadstica, Frecuencias y Grficas.
1.1 Conceptos bsicos de Estadstica.
1.2 Tipos de estadstica y su aplicacin en el marketing.
1.3 Recopilacin de datos: Encuestas (directas y por internet) y niveles de medicin
1.4 Tabla de frecuencias para conjunto de datos cualitativos.- Definicin y grficos
1.5 Distribucin de frecuencias para conjunto de datos cuantitativos.- Definicin y grficos
1.6 Representacin grfica de datos en Excel y SPSS.

Unidad II: Estadgrafos y anlisis de Datos
2.1. Medidas de localizacin: Media aritmtica, ponderada y geomtrica, mediana y moda.
2.2. Medidas de dispersin: Rango, desviacin media, varianza y desviacin estndar.
2.3. Media, mediana, moda y desviacin estndar para datos agrupados.
2.4. Descripcin de datos
2.4.1. Diagrama de puntos
2.4.2. Cuartiles, deciles y percentiles
2.4.3. Diagramas de caja
2.5. Asimetra y Curtosis
2.6. tica e informe de resultados.
2.7. Aplicacin en Excel y SPSS.

Unidad III: Introduccin a la Probabilidad
3.1. Definicin y enfoques
3.2. Experimento, Resultado, Evento y Espacio Muestral
3.3. Reglas de Conteo
3.4. Reglas de adiccin
3.5. Reglas de la multiplicacin
3.6. Tablas de Contingencia y Diagramas de rbol
3.7. Probabilidad Condicional
3.8. Regla de Bayes
3.9. Aplicacin en Excel

Unidad IV: VARIABLES ALEATORIAS DISCRETAS
4.1. Definicin y su distribucin de probabilidad
4.2. Media, Varianza y Desviacin Estndar de una v.a.d.
4.3. Distribucin de Probabilidad Binomial
4.4. Distribucin de Probabilidad de Poisson
4.5. Distribucin de Probabilidad Hipergeomtrica
4.6. Aplicacin en Excel y SPSS.

Unidad V: VARIABLES ALEATORIAS CONTINUAS
5.1. Definicin y su Distribucin de Probabilidad
5.2. Distribucin de Probabilidad Uniforme
5.3. Distribucin de Probabilidad Exponencial, aplicacin en Excel y spss
5.4. Distribucin de Probabilidad Normal y aplicacin en Excel y spss
5.5. Aproximacin de la Binomial a la Normal y aplicacin en Excel y spss

8
8
9
10
12
15

19
20
22
25

29
30
30

31
31
33
34
35
36
37
39
42

43
44
44
47
48
50

51
51
52
53
59


Unidad VI: MUESTREO Y ESTIMACIN
6.1 Muestreo
6.1.1. Definicin y clasificacin
6.1.2. Mtodos de Muestreo
6.1.2.1. Muestreo Aleatorio Simple
6.1.2.2. Muestreo Sistemtico
6.1.2.3. Muestreo Estratificado Simple
6.1.2.4. Muestreo por Conglomerados
6.1.3. Error de Muestreo
6.1.4. Distribucin Muestral de la Media
6.1.5. Teorema del Lmite Central
6.1.6. Aplicacin de la distribucin muestral de las medias
6.2. Estimacin
6.2.1. Estimadores puntuales e intervalos de confianza de una media
6.2.1.1. Desviacin estndar de la poblacin conocida
6.2.1.2. Desviacin estndar poblacional desconocida
6.2.2. Intervalo de confianza de una proporcin
6.2.3. Intervalo de confianza de una varianza
6.2.4. Factor de correccin de una poblacin finita
6.2.5. Eleccin del tamao adecuado de una muestra

Unidad VII: PRUEBA DE HIPTESIS
7.1. Definicin, elementos y Tipos de error
7.2. Pasos para probar una hiptesis
7.3. Prueba de significancia de una y dos colas; y Valor p
7.4. Prueba de la media con desviacin poblacional conocida y desconocida
7.5. Prueba de hiptesis de la proporcin
7.6. Error tipo II
7.7. Prueba de Hiptesis para dos muestras: Muestras independientes
7.8. Prueba de proporciones de dos muestras
7.9. Prueba de medias con desviaciones poblacionales desconocidas
7.10. Prueba ANOVA
7.11. Prueba de bondad de ajuste: frecuencias esperadas iguales y desiguales
7.12. Aplicacin en Excel y SPSS

Unidad VIII: REGRESIN LINEAL SIMPLE Y MLTIPLE
8.1. Regresin Lineal Simple
8.1.1. Supuestos y elementos
8.1.2. Mtodo de Mnimos Cuadrados
8.1.3. Interpretacin de la pendiente de la recta
8.1.4. Error estndar de estimacin
8.1.5. Coeficiente de correlacin y de determinacin
8.1.6. Intervalos de Confianza y de Prediccin
8.1.7. Aplicacin en Excel y SPSS
8.2. Regresin Lineal Mltiple en spss
8.2.1. Ecuacin de regresin mltiple
8.2.1.1. Error estndar de estimacin y Coeficiente de determinacin mltiple
8.2.2. Evaluacin de supuestos
8.2.3. Regresin por pasos

TRABAJO AUTNOMO

TABLAS

62
63

67
67
67
67
68
68

69
70
71
71

72
72
73
74
77
78
82
83
84
85
86
87

90
90
90
92
93
94
95
95
95
96
96
96

99

117


UNIDAD I: INTRODUCCIN A LA ESTADSTICA, FRECUENCIAS
Y GRFICAS

Objetivos: Caracterizar conjunto de variables cualitativas y cuantitativas mediante distribucin de frecuencias
para su representacin grfica en programas estadsticos.

Competencias especficas:

Capacidad de identificar variables cualitativas y cuantitativas.
Tabular datos informativos en spss.
Representacin honesta de los datos en grficas.

1.1 Conceptos bsicos de Estadstica.

Estadstica.- Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de propiciar la toma
de decisiones ms eficaz.

Tipos de Variables:
a) Variable cualitativa.- La caracterstica de la variable que se estudia es de naturaleza no numrica, se
agrupa en categoras. Ejemplos: el gnero, la filiacin religiosa, color de ojos, etc.
b) Variable cuantitativa.- La variable que se estudia aparece en forma numrica. Se divide en:
Discretas y Continuas.
Variables Discretas.- Adoptan slo ciertos valores y existen vacos entre ellos. Ejemplos: Nmero
de camas en una casa, nmero de autos que pasan por un semforo tal, nmero de alumnos del curso
que reciben estadstica aplicada, etc.
Variables continuas.- Toman cualquier valor dentro de un intervalo especfico. Ejemplo: Presin
del aire en la llanta de un auto, peso de una caja de tomates, duracin de un viaje Salinas-Guayaquil,
etc. Por lo general las variables continuas son el resultado de mediciones.
Poblacin.- Conjunto de individuos u objetos de inters o medidas obtenidas a partir de todos los individuos
u objetos de inters, se representa con la letra N.

Muestra.- Porcin o parte de la poblacin de inters, se representa con la letra n.

1.2 Tipos de estadstica y su aplicacin en el marketing.

Tipos de Estadstica:
Estadstica Descriptiva.- Mtodo para organizar, resumir y presentar datos de manera informativa.

Estadstica Inferencial.- Mtodos empleados para determinar, predecir o inferir una propiedad de una
poblacin con base en la informacin de una muestra.

La estadstica en el marketing es fundamental pues por medio de esta ciencia se recopila informacin sobre
clientes, empresas, productos o servicios, etc., de manera que se puede aplicar estrategias de marketing
apropiadas para el mejoramiento del negocio. Ejemplo:

La empresa de publicidad con sede en Atlanta, Brandon and Associates, solicit a una muestra de 1 960
consumidores que probaran un platillo de pollo recin elaborado por Boston Market. De las 1 960 personas
de la muestra, 1 176 dijeron que compraran el

La empresa implement esta nueva lnea de negocio en base a la informacin recopilada en la encuesta
porque el platillo fue un xito en la muestra.


1.3 Recopilacin de datos: Encuesta y niveles de medicin

Niveles de medicin
Los datos se clasifican por niveles de medicin. El nivel de medicin de los datos rige los clculos que se
llevan a cabo con el fin de resumir y presentar los datos, adems determina las pruebas estadsticas que se
deben realizar. Se clasifican desde la medicin ms baja hasta la ms alta que es el nivel de razn.

Datos de nivel nominal.-
Las observaciones acerca de una variable cualitativa slo se clasifican y cuentan. No existe una forma
particular para ordenar las etiquetas. Ejemplo:
Suponga que hace un conteo de las personas que asisten a un bar de la localidad e informa cuntos son
hombres y cuntas son mujeres. Podra primero presentar a los hombres o a las mujeres, la medicin consiste
en contar.

Asisten al Bar Nmero Porcentaje
Hombres 45 60.81
Mujeres 29 39.19
Total 74 100.00

Las categoras de datos se encuentran representadas por etiquetas o nombres. An cuando las etiquetas se
codifiquen con nmeros, las categoras de datos no tienen ningn orden lgico

Datos de nivel ordinal.-
Los datos se ordenan de acuerdo a caractersticas de la variable. Sus propiedades son:
Las clasificaciones de los datos se encuentran representadas por conjuntos de etiquetas o nombres (alto,
medio, bajo), las cuales tienen valores relativos.
En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.

Ejemplo:
Los estudiantes de segundo ao evaluaron al docente de matemticas contestando la siguiente pregunta:
Cmo califica las clases del profesor de matemticas? Los resultados se muestran a continuacin:

Calificacin Frecuencia
Excelente 5
Muy bueno 29
Bueno 14
Regular 6
Deficiente 1
Total 55

La calificacin muestra el uso de la escala de medicin ordinal, una calificacin es ms alta o mejor que la
siguiente. La calificacin excelente es mejor que la calificacin muy bueno pero no se sabe en qu grado es
mejor calificacin, es decir no es posible distinguir la magnitud de las diferencias entre los grupos.

Datos de nivel de intervalo
Incluye las caractersticas del nivel ordinal, pero adems, la diferencia entre valores constituye una magnitud
constante y no necesariamente la razn entre categoras distintas. Sus propiedades son:
Las clasificaciones de datos se ordenan de acuerdo con el grado que posea la caracterstica en cuestin.
Diferencias iguales en la caracterstica representan diferencias iguales en las mediciones.
Ejemplo: La temperatura, las tallas de ropa

Datos de nivel de razn
Todos los datos cuantitativos son registrados en el nivel de razn de la medicin. Posee todas las
caractersticas del nivel de intervalo, aunque, adems el punto 0 tiene sentido y la razn entre entre dos
nmeros es significativa. Sus propiedades son:
Las clasificaciones de datos se ordenan de acuerdo con la cantidad de caractersticas que poseen.
10
Diferencias iguales en la caracterstica representan diferencias iguales en los nmeros asignados a las
clasificaciones.
El punto cero representa la ausencia de caractersticas y la razn entre dos nmeros es significativa.

Ejemplo: Los salarios, peso, altura, ventas, etc.

La siguiente muestra los salarios anuales de 5 profesionales dedicados al rea administrativa:

Profesional Salario ($)
Castro Alex 3 000
Revello Gabriela 3 600
Roldn Tamara 4 200
Santos Andrs 4 800
Zambrano Ins 6 000

1.4 Tabla de frecuencias para conjunto de datos o variables cualitativas.- Definicin y grficos

Frecuencia.-
Nmero de ocurrencia de una observacin en particular (f).

Tabla de frecuencias.-
Agrupacin de datos cualitativos en clases mutuamente excluyentes que muestra el nmero de observaciones
en cada clase.

Frecuencia relativa de clase.-
Fraccin del nmero total de observaciones en cada clase, es decir, es la divisin entre la totalidad de
elementos de una clase y el nmero total de observaciones (f.r.).

Frecuencia relativa porcentual.-
Resulta de multiplicar la frecuencia relativa por 100%.

Ejemplo: La siguiente tabla contiene informacin sobre las preferencias de lugares de visitas de un grupo de
personas en sus vacaciones.

Tabla no. Tabla de frecuencias sobre visita a lugares tursticos.

Representacin grfica de datos cualitativos
Los instrumentos ms comunes para representar una variable cualitativa en forma grfica son la grfica de
barra (horizontal o vertical) y el grfico de pastel.

Grfica de barras.-
En un sistema de ejes X y Y, se encuentra en un eje la variable de inters y en el otro eje la cantidad, nmero
o fraccin de cada uno de los posibles resultados. Una caracterstica distintiva de este tipo de grfico es que
existe una distancia o espacio entre barras, adems el ancho de cada rectngulo es uniforme y la altura
corresponde a la frecuencia de clase (alturas proporcionales a las frecuencias de clase).
Respecto al ejemplo sobre lugares de preferencia se presenta un grfico de barras horizontales de frecuencia.

LUGARES Personas que visitan (f) f. r.
SALINAS 50 0.43
QUITO 25 0.22
PLAYAS 15 0.13
OLON 25 0.22
Total 115 1.00
11

Interpretacin.-
De acuerdo a la grfica de barras, de las 115 personas encuestadas, 43% prefieren visitar Salinas, 22%
personas prefieren visitar Quito al igual que Oln.

Grfica de Pastel.-
Grfica circular que muestra la parte o porcentaje que representa cada clase del total de nmeros de
frecuencias. Para construir una grfica de pastel las frecuencias de cada clase se transforman a frecuencia
porcentual (en porcentajes) y se inicia colocando el porcentaje de la primera categora en el circulo, iniciando
a las 12 en punto y el resto de categoras se van sumando de manera acumulada, luego se avanza conforme
las manecillas del reloj hasta completar el 100%,

Ejemplo:
SkiLodges.com realiza una prueba de mercado de su nuevo sitio web y le interesa saber con qu facilidad se
navega en su diseo de pgina web. Selecciona al azar 200 usuarios frecuentes de internet y les pide que
lleven a cabo una tarea de investigacin en la pgina web, solicitndoles que califiquen la relativa facilidad
para navegar como mala, buena, excelente o sobresaliente. Los resultados aparecen en la siguiente tabla:

Facilidad de navegar f. f. p. (%)
Sobresaliente 102 51%
Excelente 58 29%
Buena 30 15%
Mala 10 5%
Total 200 100%

0 10 20 30 40 50 60
SALINAS
QUITO
PLAYAS
OLON
Lugaresdepreferencia
(variabledeinters)
Sobresalie
nte
51%
Excelente
29%
Buena
15%
Mala
5%
12
Interpretacin.-
De las 200 personas encuestadas, el 51% calific de sobresaliente navegar en la pgina web de la compaa
SkyLodge.com, un 29% calific de excelente y slo un 5% calific como mala navegar en la web, tambin se
puede concluir que el 80% ha calificado como excelente y sobresaliente navegar en la web de la compaa.

1.5 Distribucin de frecuencias para conjunto de datos cuantitativos.- Definicin y grficos
Para representar variables cuantitativas aprenderemos sobre los histogramas y polgonos de frecuencia.
Primero analizaremos cmo agrupar datos.

Distribucin de frecuencia.-
Agrupacin de datos en clases mutuamente excluyentes, que muestra el nmero de observaciones que hay en
cada clase.
Cmo crear una distribucin de frecuencias?
Cuando tenemos datos desorganizados se llaman datos no agrupados o datos en bruto, se los agrupa de la
siguiente manera:

1.- Defina el nmero de clases mediante la relacin 2
k
, se escoge el valor mnimo de k que da como resultado
un valor mayor al nmero de observaciones.

2.- Determine el intervalo o ancho de clase que debe ser el mismo para todas las clases y deben cubrir todos
los datos.

Se emplea la frmula: i
H-L
K

Donde:
i es el intervalo de clase.
H es el mximo valor observador (valor mayor)
L el mnimo valor observado
k el nmero de clases

3.- Establezca los lmites de cada clase de manera que al tabular los datos no repetimos datos, para el
presente curso se trabajar con la modalidad por ejemplo: 1500 a 1600; 1600 a 1700, etc. Esto indica que la
primera clase abarca datos desde 1500 hasta 1599, la segunda clase datos desde 1600 hasta 1699 y as
sucesivamente. No olvidar que la ltima clase debe contener la observacin mayor caso contrario hay que
volver a establecer el ancho del intervalo redondeando a un nmero un poco mayor.

4.- Tabule las observaciones para cada clase.

5.- Cuente el nmero de elementos que se repiten en cada clase (frecuencia de clase), debe ser el mismo de
las observaciones no agrupadas.

Ejemplo:
Los datos originales que se presentan a continuacin son los cargos por electricidad y gas durante un mes,
para una muestra aleatoria de 50 departamentos de 3 recmaras en Manhattan. Elabore una distribucin de
frecuencia.

1. 2
6
= 64, valor superior mnimo a las observaciones. Es decir trabajaremos con 6 clases.

96 171 202 178 147 102 153 127 82 197
157 185 90 116 172 111 148 130 165 213
141 149 206 172 123 128 144 109 167 168
95 163 150 154 130 143 187 139 149 166
108 119 183 151 114 135 191 129 158 137
13
2. i
213-82
6
= 21.8S, es decir que el ancho del intervalo ser de 22 (redondeado)

3. Los lmites de clases seran:
No. Intervalos
1 82 a 104
2 104 a 126
3 126 a 148
4 148 a 170
5 170 a 192
6 192 a 214

Nos damos cuenta que todos los datos se encuentran dentro de los lmites de clases establecidos, sino fuera
as entonces se debe ampliar un poco ms el valor i.

4.- Tabule
No. Intervalos Tabulacin f f. r
1 82 a 104 ///// 5 0,10
2 104 a 126 /////// 7 0,14
3 126 a 148 //////////// 12 0,24
4 148 a 170 ////////////// 14 0,28
5 170 a 192 //////// 8 0,16
6 192 a 214 //// 4 0,08
Total 50 1,00

Representacin grfica de una distribucin de frecuencias

Histogramas.-
Grfica en la que las clases se sealan en el eje horizontal y las frecuencias de clase en el eje vertical. Las
frecuencias de clase se representan por medio de las alturas de las barras, stas se dibujan de manera
adyacente.

Ejemplo:
Con los datos del ejercicio anterior presente la informacin mediante un histograma de frecuencia.

Interp
De ac
14 de
se pue
de ele

Polgo
Es sim
inters
Ejemp

pretacin.-
cuerdo al histo
ellas tienen c
ede concluir q
ectricidad y ga
ono de frecuen
milar a un h
ecciones de lo
plo con los mi
1
1
1
1
F
r
e
c
u
e
n
c
i
a
ograma, de la
cargos entre 1
que slo 4 rec
as.
ncias.-
histograma, co
os puntos med
ismos datos d
No.
1
2
3
4
5
6
0
2
4
6
8
10
12
14
16
93
Histogram
0
2
4
6
8
10
12
14
16
71
f
r
e
c
u
e
n
c
i
a
as 50 recmar
48 y 170 dla
maras cancel
onsiste en seg
dios de clase y
el ejercicio an
Interva
82 a 10
104 a 1
126 a 1
148 a 1
170 a 1
192 a 2
Total
115
Ca
madefrecue
93 1
Cargos
14
ras encuestada
ares, 12 de ell
lan $192 o m
gmentos de r
y las frecuenci
nterior.
alos Punto
04
26
48
70
92
14
l
137
argosporelec
enciadecarg
115 137
porelectricid
as en Manhatt
los tienen carg
s y 5 cancela
recta que con
ias de clase.
o medio de cla
93
115
137
159
181
203
159
ctricidadygas
gosporelect
159 181
dadygasend
Ec
tan por cargo
gos entre 126
an valores men
nectan los pu
ase f
5
7
12
14
8
4
50
181
s($)
tricidadyga
203 2
dlares
c.QuispeG.Jimm
s de electricid
y 148 dlares
nores a $104 p
untos formado

203
as
225
myJavier

dad y gas;
s, tambin
por cargos
os por las
15
1.6 Representacin grfica en spss y Excel

16
Primero se ingresan los datos en la ventana vista de variables con todas sus caractersticas correspondientes
como si son cualitativas o cuantitativas, segn esto se deber llenar el cuadro valores o no, adems de esto
depender el nivel de medicin.
Para graficar se sigue lo siguiente:
Paravariablescuantitativas:
17
Histograma para variables cuantitativas
Paravariablescualitativas:
18
Grfica para variable cualitativa

19
UNIDAD 2: ESTADGRAFOS Y ANLISIS DE DATOS

Objetivos: Describir los diferentes tipos de estadgrafos de localizacin y dispersin a travs de datos
agrupados y no agrupados para el anlisis de la informacin.

Describir estadgrafos
Clculo de estadgrafos a mano y computadora
Anlisis tico de datos

2.1. Medidas de localizacin: Media aritmtica, ponderada y geomtrica, mediana y moda.

Cuando recolectamos informacin de variables cuantitativas, a las medidas de localizacin o ubicacin se las
llama a menudo como promedios. Analizaremos las siguientes medidas:
Media Poblacional.- Cuando los datos no han sido agrupados se puede calcular la media aritmtica
poblacional sumando todos los valores en la poblacin divididos para el nmero de valores de la poblacin.
Cualquier caracterstica medible de una poblacin recibe el nombre de parmetro, la media de una
poblacin es un parmetro.
p =
x
N

Media de una muestra.- Cuando los datos no han sido agrupados, la media aritmtica de una muestra se
obtiene sumando los valores de la muestra divididos para el nmero de valores de la media. Cualquier
caracterstica medible a partir de una muestra recibe el nombre de estadstico, la media de una muestra es un
estadstico.
x =
x
n

Media ponderada.- Para datos no agrupados la media ponderada es un caso especial de la media aritmtica.
Para obtener la media ponderada se multiplica cada observacin por el nmero de veces que se repite,
dividido para la suma de las ponderaciones.

x
w
=
(w. x)
w

Media geomtrica.- Resulta til para determinar el cambio promedio de porcentajes, razones, ndices o tasas
de crecimiento, la media geomtrica siempre es menor o igual (nunca mayor que) que la media aritmtica.
Todos los datos deben ser positivos.

0H = (x
1
)(x
2
) (x
n
)
n

Mediana.- Punto medio de un conjunto de datos (no agrupados) una vez que se han ordenado de menor a
mayor o viceversa. Es ms confiable que el valor de la media en casos cuando existen valores extremos en
los datos. Si el nmero de datos es impar, la mediana es el valor que ocupa la posicin central. Si el nmero
de datos es par, la mediana es igual a la media de los dos datos centrales.

X =
n+1
2
;

Este valor significa la ubicacin de la mediana en el conjunto de datos que ha sido previamente ordenado.
20
Si son pares los datos hay que sumar los datos centrales y dividir para dos para obtener el valor de la
mediana.

Moda.- Valor de la observacin que aparece con mayor frecuencia. Si existen dos valores que se repiten con
la misma frecuencia decimos que el conjunto de datos es bimodal.

Ejemplo:

Con los siguientes dos conjuntos de datos, ambos con tamao de muestra n=7.
Lote 1: 10 2 3 2 4 2 5
Lote 2: 20 12 13 12 14 12 15

Calcule:
a.- Media, mediana y moda para ambos conjuntos.
MEDIA
x
1
=
1u +2 +S +2 +4 +2 +S
7
=
28
7
= 4
X
2
=
2u +12 +1S +12 +14 +12 +1S
7
=
98
7
= 14

MEDIANA
LOTE 1: 2 2 2 3 4 5 10 LOTE 2: 12 12 12 13 14 15 20

MEDIANA= 3 MEDIANA= 13

LOTE 1: 2 2 2 3 4 5 10 LOTE 2: 12 12 12 13 14 15 20

MODA=2 MODA=12
b.- Compare los resultados entre ambos conjuntos.
Los datos son similares tomando en cuenta que existe una diferencia de diez entre ambos conjuntos. De ah
que se parezcan las respuestas, en cada resultado de los estadgrafos la diferencia es 10.

2.2. Medidas de dispersin: Rango, desviacin media, varianza y desviacin estndar.

Estudiamos dispersin para conocer cuan dispersos se encuentran los datos alrededor de la media aritmtica.
Una medida grande de dispersin indica que la media no es confiable y una medida de dispersin pequea
indica que los datos se acumulan con proximidad a la media aritmtica.

Rango.- Representa la diferencia entre los valores mximo y mnimo de un conjunto de datos. Se aplica en
controles de procesos estadsticos por su facilidad de clculo.
21

Rango = Valor mximo Valor mnimo

Desviacin media.- Es la media aritmtica de los valores absolutos de las desviaciones con respecto a la
media aritmtica. Es la media de las desviaciones de la media. En el caso de una muestra, la MD es.

H =
|X -X|
n

Donde:

X= es el valor de cada observacin
X= es la media aritmtica de los valores
n= el nmero de observaciones de la muestra

Varianza.- Media aritmtica de las desviaciones de la media elevadas al cuadrado. Nunca es un valor
negativo y es cero si todas las observaciones son las mismas. La varianza nos muestra como varan los datos
al cuadrado respecto a la media. Esto no es fcil de interpretar por lo que se debe calcular su raz cuadrada
para su anlisis.

Desviacin estndar.- Es la raz cuadrada de la varianza. Muestra cuanto se desvan los datos respecto a su
media.

Frmulas:

Varianza Poblacional: o
2
=
(x-)
2
N

Varianza Muestral: s
2
=
(x-x)
2
n-1

Desviacin Poblacional: o = o
2

Desviacin Muestral: s = s
2

Ejemplo:
Examinando los registros de cuentas mensuales de una compaa que vende libros por correo, un empresario
toma una muestra de 20 de esas cuentas no pagadas. Los adeudados a la compaa eran: (en dlares)
4 18 11 7 7 10 5 33 9 12
3 11 10 6 26 37 15 18 10 21

Calcule el rango, varianza y desviacin estndar de la muestra e interprete los resultados.
Media = 13.65
Rango: R= 37 3 = 34
Varianza:
2
=
(3-13.65)
2
+(4-13.65)
2
+(5-13.65)
2
+(6-13.65)
2
+(7-13.65)
2
+
20-1

2
= 88.03
s = o s = 88.uS s = 9.38
22
Podemos darnos cuenta que el promedio de las deudas a la compaa es de $13.65 y la desviacin estndar
muestral de $9.88 nos indica que las deudas se desvan en 9.38 dlares.

Interpretacin y uso de la desviacin estndar:

Teorema de Chebyshev:
En cualquier conjunto de observaciones (muestra o poblacin), la proporcin de valores que se encuentran a
k desviaciones estndares de la media es de por lo menos 1- 1/k
2
, siendo k cualquier constante mayor que 1.

Regla emprica:
En cualquier distribucin de frecuencias simtrica con forma de campana, se cumple lo siguiente:

El 68% de las observaciones se encuentran entre: x _1o
El 95% de las observaciones se encuentran entre. x _2o
El 99.7% de observaciones se encuentran en: x _So

Cabe recalcar que los valores de la regla emprica son como su nombre indica empricos, ms adelante
conoceremos valores ms exactos.

Para el ejemplo anterior podramos decir:

El 68% de las cuentas adeudadas a la compaa se encuentran entre $4.26 y $23.03, es decir que la
cuenta adeudada ms baja es de $4.26 y la cuenta ms alta es $23.03: Esto se calcul de la siguiente
manera:

x _1o
1S.6S _1 - (9.S8)
(1S.6S.9.S8; 1S.6S +9.S8)
(4.26; 2S.uS)Jolorcs

El 95%de la informacin de las deudas a la compaa se encuentran entre los valores de -$5.11 y
$32.41, pero como nos damos cuenta el lmite inferior ($-$5.11) es imposible, por lo que el intervalo
real que contiene al 95% de cuentas adeudadas se encuentra entre $0.00 y $32.41.

El 99.7% de la informacin contiene a las cuentas entre $0.00 y $ 37.00 (revisar clculos)

En Excel se utilizan las siguientes funciones estadsticas:

Media aritmtica: funcin promedio
Mediana: funcin Mediana
Moda: funcin moda
Desviacin estndar de la muestra: funcin DESVEST
Varianza de la muestra: VAR

Calcular parmetros (valores poblacionales) no es sencillo porque no se posee informacin a la mano o no es
fcil su acceso por lo que siempre podemos encontrar informacin para obtener estadsticos.

2.3. Media, mediana, moda y desviacin estndar para datos agrupados.
Cuando los datos se han agrupado en intervalo de clases, los estadgrafos siguientes se obtienen de la
siguiente manera, la aplicacin de Excel y dominar conceptos facilita su clculo:

Media.
Xm.]
n
i
n

23
Descripcin de las abreviaturas de la Media

X
m
= Punto medio, Valor medio de la clase.
f
i
= Frecuencia de la clase
n= Total de datos de la muestra.

Mediana Hc = x
-1
+[
n
2-P-1
,
P-P-1
Ci
Descripcin de las abreviaturas de la Mediana
X
i-1
=Limite real inferior
n
2
, = Posicion ue la meuiana
F
i
= Frecuencia acumulada donde se encuentra la mediana.
F
i-1
= Frecuencia acumulada absoluta menor a Fi
C
i
= Ancho del intervalo.
Moda verdadera aproximada
Ho = x
-1
_
-
-1
(
-
-1
) +(
-
+1
)
_ Ci

Descripcin de las abreviaturas de la Moda
X
i-1
=Limite real inferior del intervalo donde se encuentra la moda.
F
i
-F
i+1
=Diferencia entre la frecuencia del intervalo modal y la frecuencia inmediato superior.
F
i
-F
i-1
= Diferencia entre la frecuencia del intervalo modal y la frecuencia inmediato inferior.
C
i
= Ancho del intervalo.
Ejemplo:
Calcule la media, mediana y moda para los siguientes datos agrupados:
Das Frecuencia f
i
X
m
X
m
*f
i
F
i

0-1 2 0.495 0.990 2
1-2 4 1.495 5.980 6
2-3 6 2.495 14.970 12
3-4 7 3.495 24.465 19
4-5 5 4.495 22.475 24
5-6 3 5.495 16.485 27
6-7 1 6.495 6.495 28
TOTAL 28 91.86

24
Media.-
X=
Xm.fI
n
X =
91.86
28
= 3.28 Das

Mediana.- Hc = x
-1
+
n
2
-P
i-1
P-P-1
Ci
Para encontrar la mediana nos ubicamos en la columna de Frecuencia Acumulada y analizamos en que clase
se encuentra n/2, esa clase ser nuestro Fi.
Me = 3 +
14-12
19-12
*1
Me= 3 +
2
7
1 = 3.28 DIAS
Moda.-
Ho = x
-1
_
-
-1
(
-
-1
) +(
-
+1
)
_ Ci
Para calcular la moda nos ubicamos en la columna de la frecuencia y observamos la clase con mayor
frecuencia (moda) esta clase ser nuestro fi.
Mo = 3 +
7-6
(7-6) +(7-5)
- 1
Me = 3 +
1
3
1 = 3.33 DIAS

En la siguiente distribucin de frecuencia que muestra la altura en pulgadas de 20 atletas, calcular la media y
la moda para los datos agrupados.

Altura Frecuencia fi X
m
X
m
-f
i
F
i

60 - 62 5 61 305 5
63 - 65 1 64 64 6
66 - 68 6 67 402 12
69 - 71 5 70 350 17
72 - 74 3 73 219 20
TOTAL 20 1340

Media
X=
Xm.fI
n
X =
1340
20
= 67 pulgadas

Moda
Mo = 66 +
6-1
(6-1) +(6-5)

66+
5
5
2 = 68 pulgadas

25

Desviacin estndar de la muestra
s =
_
. (x
m
-x)
2
n -1

2.4. Descripcin de datos

Los diagramas siguientes proporcionan una idea adicional del lugar en el que los valores se concentran, as
como de la forma general de los datos.

Diagrama de puntos.- Agrupa los datos lo menos posible y evita la prdida de identidad de cada observacin.
Cada observacin se representa con un punto. Si existen observaciones idnticas o cercanas los puntos se
apilan permitiendo ver donde se encuentran datos similares. Los diagramas de puntos son ms tiles para
conjunto de datos pequeos mientras que los histogramas para conjunto de datos grandes.

Diagrama de tallo y hojas.- Tcnica estadstica que divide a cada observacin en dos partes: un tallo y varias
hojas si es el caso. El tallo se coloca en orden de manera vertical mientras que las hojas se van apilando de
acuerdo al tallo.

Ejemplo:
Las siguientes calificaciones fueron obtenidas por 25 estudiantes en la asignatura de estadstica. Clasifique
los datos mediante un diagrama de puntos; diagrama de tallo y hojas y diagrama de caja.

51 60 71 82 90
77 89 77 75 73
76 84 82 83 68
76 92 77 75 71
54 62 57 62 63

Diagrama de puntos: (Grfica de spss)

50.00 60.00 70.00 80.00 90.00
calificaciones de 25 estudiantes de estadistica
0
1
2
3
R
e
c
u
e
n
t
o
$ $ $ $
$
$ $
$
$
$ $
$
$
$ $ $ $ $
26
En spss los datos con frecuencia no los presenta un punto sobre otro punto sino que se sobreentiende que el
eje y (recuento) nos indica aquello.

Diagrama de tallo y hojas a mano y en spss

Tallo Hojas
tallo
5
6
7
8
9
1 4 7
0 2 2 3 8
1 3 5 5 6 6 7 7 7
2 2 3 4 8 9
0 2

calificaciones de 25 estudiantes de estadstica Stem-and-Leaf Plot

Frequency Stem & Leaf

2.00 5 . 14
1.00 5 . 7
4.00 6 . 0223
1.00 6 . 8
3.00 7 . 113
7.00 7 . 5566777
4.00 8 . 2234
1.00 8 . 9
2.00 9 . 02

Stem width: 10.00
Each leaf: 1 case(s)

Nos podemos dar cuenta que en spss hay tres columnas, la primera muestra la frecuencia de los datos (hojas),
la segunda columna nos muestra el tallo (stem) en este caso existe dos 5, dos 6, dos 7 y dos 8, cada uno el
software lo ha asumido como el primer 5 corresponde a las hojas desde 0 hasta 5, el segundo 5 a las hojas
desde 6 hasta 9, etc. En la tercera columna podemos darnos cuenta que estn las hojas (datos analizados)

Cuartiles, deciles y percentiles.-
Son medidas de dispersin, mtodos que determinan la ubicacin de los valores que dividen un conjunto de
observaciones en partes iguales, se estudiarn los cuartiles (dividen al conjunto de datos en 4 partes iguales),
deciles (dividen al conjunto de datos en 10 partes iguales) y los percentiles (dividen al conjunto de datos en
100 partes iguales).

Cuartiles:
1
: Signiico quc cl 2S% Jc los Jotos son incriorcs o mcnorcs o csc :olor o cl 7S% cs moyor.
2
: El Su% Jc los Jotos son mcnorcs o csc :olor o cl Su% moyorcs, cs lo mcJiono.
3
: El 7S% Jc los Jotos son mcnorcs o csc :olor o cl 2S% cs moyor.

Frmulas
1
=
n +1
4

2
=
n +1
2

27
3
=
S(n +1)
4

Ejemplo:
Con los datos del ejemplo anterior encuentre los caurtiles Q
1
, Q
2
y Q
3
.

Localizacin de un percentil:

L
P
= (n +1)
P
1uu

Donde:
n= es el nmero de observaciones
P= representa al percentil que se busca

Para hallar el cuartil uno es lo mismo que hallemos el precentil 25, la frmula quedara:

L
25
= (2S +1)
25
100
= 6.50 ubicacin de los datos que previamente han sido ordenados

Nos podemos dar cuenta que esta frmula nos ayuda para calcular cuartiles y deciles tambin.
En spss apreciamos que el cuartil Q
1
, es el Percentil 25 dando como resultado 62.50, esto significa que el
25% de alumnos obtuvo como calificacin mxima 62.50 puntos ( en otras palabras el 25% de alumnos
obtuvo 62,50 puntos o menos), podemos concluir tambin que el 75% de estudiantes obtuvo 62,50 puntos o
ms (obtuvieron 62,50 puntos como mnimo)

Estadsticos

calificaciones de 25 estudiantes de estadistica
N Vlidos
25
Perdidos
0
Mnimo
51.00
Mximo
92.00
Percentiles 25
62.5000
50
75.0000
75
82.0000

No olvidemos que los precentiles 25, 50 y 75 son los cuartiles primero, segundo y tercero.

Diagramas de caja.- Es la representacin grfica, basada en cuartiles, que ayuda a exhibir un conjunto de
datos: Para construir un diagrama de caja se necesita conocer 5 estadsticos: Valor mnimo, Q
1
, la mediana,
Q
3
, y el valor mximo. A la distancia entre el tercer y primer cuartil se denomina rango intercuartl.

28

Los datos tienen un sesgo positivo (la distancia entre el cuartil 1 y el mnimo es mayor a la distancia entre el
cuartil 3 y el mximo. Adems la mediana est ms cercana al cuartil 3, por otro lado el 50% de
calificaciones de los alumnos (desde el cuartil 1 al 3) estn entre 62,50 puntos y 82 puntos.

Para calcular los datos atpicos se utilizan dos frmulas:

. A. <
1
-1.S (
3
-
1
)
. A. >
3
+1.S (
3
-
1
)

La primera frmula sirve para verificar o calcular si un dato que es menor al conjunto de datos recopilados se
lo podra considerar atpico, es decir un dato extremo.

La segunda frmula nos ayuda a saber si un dato que est por encima del conjunto de datos es o no un dato
extremo.
Hay que tener cuidado con los signos de mayor o menor que.

Ejemplo:

Si las edades de un grupo de jvenes es el siguiente conjunto:
14 15 15 16 17 16 15
18 19 18 19 15 16 15
18 19 17 20 12 12 13

Q
1
= 15 Aos
Q
2
= 16 Aos
Q
3
= 18 Aos

29
A partir de qu edad se considerara dato extremo?

Como el dato es extremo superior, entonces se utiliza la segunda frmula:

. A. >
3
+1.S (
3
-
1
)

. A. > 18 +1.S (18 -1S)

. A. > 18 +4.S

. A. > 22.S oos

Este valor significa que una edad de 23 aos se considerara atpica o extrema.

2.5. Asimetra y Curtosis
Asimetra.- Nos indica si los datos se distribuyen de manera normal o con algn sesgo (izquierda o derecha)
que significa que los datos se concentran por debajo o por encima de la media.

Asimetra (sesgo positivo) grfica simtrica Asimetra (sesgo negativo)

Curtosis.-l coeficiente de curtosis analiza el grado de concentracin que poseen los datos alrededor de la
zona central.

S
2
< 1
Curvaleptocrtica.Losdatosestnmuy
concentradosalrededordelamedia.
S
2
> 1
Curvaplaticrtica.Indicaquelosdatos
estnmuydispersos,esdecirnoestnmuy
concentradosalrededordelamedia.
30

2.6. tica e informe de resultados.-
Conforme se avanza en el estudio de la estadstica es muy importante no perder la objetividad en nuestras
conclusiones ni tampoco principios ticos de manera la comunicacin de los resultados sean expuestos de
manera honesta, clara y verdadera.
Dar un mal informe podra ocasionar una toma de decisin no eficaz que podra terminar en el cierre de una
empresa o hasta la propia imagen del investigador verse mancillada.

2.1 Aplicacin en Excel y spss

Del ejercicio anterior en Excel:

S
2
= 1
Curvamesocrtica.Ocurvanormal.Estn
losdatosdistribuidosdemaneranormal.
31
UNIDAD 3: INTRODUCCIN A PROBABILIDAD

Objetivo: Determinar el espacio muestral de sucesos mediante reglas y tablas de contingencia para el clculo
de posibilidades de ocurrencia de un fenmeno de estudio.

Identificar reglas de probabilidad
Clculo de probabilidades a mano y a computadora
Toma de decisin a partir de posibilidades de sucesos en fenmenos

3.1 Definicin y enfoques
3.2 Experimento, Resultado, Evento y Espacio Muestral

Probabilidad.- Valor entre cero y uno, inclusive, que describe la posibilidad de ocurrencia de un evento.

Experimento.- Proceso que induce a que ocurra una y slo una de varias posibles observaciones. Tiene dos o
ms posibles resultados y no se sabe cual ocurrir.

Resultado.- Un resultado particular de un experimento.

Evento.- Conjunto de uno o ms resultados de un experimento. Se denotan con letras maysculas.

Eventos simples.- Cuando se desea o se va a observar una sola caracterstica o propiedad de un
experimento.

Eventos compuestos.- Cuando en un experimento se observa dos o ms propiedades.

Espacio Muestral.- Elementos que conforma un evento. Se denota con S.

Ejemplo:

Experimento: Lanzamiento de un dado
Resultado: Son varios, por ejemplo: Se observa un 1, un 2, un 3, un 4, un 5, un 6.

Eventos Simples:
Evento A: Se observa un nmero par,
Evento B: Se observa un nmero mayor que 4,

Eventos Compuestos:
Evento C: Se observa un 2 o un nmero mayor.
Evento D: Se observa un nmero par y mayor que 4.

Espacio Muestral:
El espacio Muestral del evento D sera: S= {4,6}

Enfoques.- Hay dos enfoques: Subjetivo y Objetivo.

Probabilidad Subjetiva.- Posibilidad de un evento en particular que asigna un individuo a partir de cualquier
informacin que encuentre disponible. Ejemplos:

Calcular la posibilidad de que Barcelona ser campen este ao. (La informacin que posee es que est
ganando sus partidos actualmente)
Calcular la probabilidad de que contraiga matrimonio antes de los 30.

Probabilidad Objetiva.- Se divide en dos: Probabilidad Clsica y Probabilidad Emprica.

32
Probabilidad Clsica.- Parte del supuesto de que los resultados de un experimento son igualmente posibles.
Viene dada por la frmula:

P(A) =
X
N

Donde:
P(A): Probabilidad de un evento
X: Nmero de resultados favorables
N: Nmero total de posibles resultados

Nota:
La probabilidad de un evento(A) siempre est entre 0y 1. Es decir: 0 p(A) 1

Ejemplo:
Considere el experimento de lanzar un dado. Cul es la probabilidad del evento cae un nmero par de
puntos?
A: Se observa un nmero par.
P (A): Probabilidad de obtener un nmero par al lanzar un dado.
X: Hay 3 nmeros pares (esto es favorable para lo que deseo observar)
P(A) =
X
N

P(A) =
S
6
= u.S

Evento Mutuamente Excluyente.- Cuando un evento se presenta significa que ninguno de los dems eventos
puede ocurrir al mismo tiempo. Ejemplo:
Si vive en Salinas no puede vivir en La Libertad, si al lanzar una moneda se obtiene cara no puede salir sello,
una persona encuestada es hombre o mujer pero no ambos.

Evento Colectivamente Exhaustivo.- Por lo menos uno de los eventos debe ocurrir cuando se lleva a cabo un
experimento. Ejemplo:
Al lanzar un dado se observar resultados par o impar, hay eventos colectivamente exhaustivos porque al
lanzar el dado saldr un nmero par o impar, otro resultado no es posible. (es decir no caer el dado en un
vrtice.

Probabilidad Emprica.- Se llama tambin frecuencia relativa, se basa en el nmero de veces que ocurre el
evento como proporcin del nmero de intentos conocidos.

P(A) =
N

Y: Nmero de veces que el evento ocurre.
N: Nmero total de observaciones.

Ejemplo:
En un curso de estadstica hay 32 estudiantes: 14 Mujeres y 18 Hombres. Cul es la probabilidad de que sea
mujer? Sea hombre?

Evento A: Sea Mujer
P(A): Probabilidad de que sea Mujer
X: Nmero de mujeres en el curso.
33
N: Nmero total de observaciones: Se cont 32 alumnos de un curso.

Mujeres: Hombres:
P(A) =
14
32
= u,4S7S = u.44 P(B) =
18
32
= u.S62S = u.S6

3.3 Reglas de Conteo

Tambin se conocen como principios de conteo, son reglas que mediante frmulas facilitan contar, se
analizarn tres: Frmula de la multiplicacin, de las permutaciones y de las combinaciones.

Frmula de la multiplicacin.- Si hay m formas de hacer una cosa y n formas de hacer otra cosa, hay
entonces m x n formas de hacer ambas cosas.
Nmero total de hacer de disposiciones = (m)(n)

La frmula se puede generalizar para ms de dos eventos. Ejemplo: Si fueran tres eventos m, n y o.

Nmero total de disposiciones = (m)(n)(o)

Ejemplo:
Un distribuidor de automviles quiere anunciar que por $20 000 usted puede adquirir tres modelos de autos:
un sedn dos puertas, un modelo de cuatro puertas o un auto deportivo, cada modelo est disponible en dos
colores: blanco o negro. Cuntas modelos diferentes puede ofrecer el distribuidor?

Nmero total de hacer de disposiciones = (m)(n)

m: nmero de modelos de autos = 3
n: nmero de colores de autos = 2

Nmero total de hacer de disposiciones a ofrecer = (3)(2) = 6 modelos diferentes a ofrecer.

Permutacin.- Cualquier distribucin de r objetos seleccionados de un solo grupo de n posibles
objetos.

La frmula de la multiplicacin se aplica para determinar el nmero de posibles disposiciones de dos o ms
grupos. En cambio la frmula de las permutaciones se aplica para determinar el nmero posible de
disposiciones cuando slo hay un grupo de objetos. En las permutaciones no importa el orden de los objetos.

Frmula de las permutaciones: P
n
=
n!
(n-)!

n: representa el total de objetos
r: representa el total de objetos seleccionados

Si se va a colocar en una repisa un grupo de seis libros de texto, pero solo hay lugar para cuatro de ellos.
En cuntas formas se puede colocar en l estn estos libros?

n= numero de objetos o elementos distintos
r = objetos seleccionados

Frmulas de las combinaciones.- Si el orden de los objetos seleccionados no es importante,
cualquier seleccin se conoce como combinacin. La frmula para contar el nmero de r
combinaciones de objetos de un conjunto de n objetos es:

nCr =
n!
!(n-)!

34
En las combinaciones por lo general el nmero posible de disposiciones es menor a las permutaciones
Ejemplo:

Un estudiante tiene 7 libros que le gustara colocar en un portafolio, pero solo caben cuatro. Sin tener en
cuenta como los ordeno de cuantas formas hay de colocar cuatro libros en el portafolio?

7
C
4
=
7!
4!(7-4)!
=
5040
26(6)
=
5040
144
= SS moncros posiblcs Jc colocor los libros

3.4 Reglas de adicin

a) Los eventos son mutuamente excluyentes.- Es decir que cuando un evento ocurre, ninguno de los
dems eventos puede ocurrir al mismo tiempo. Esta regla de la adicin conocida como regla
especial de la adicin indica la probabilidad de que ocurra uno u otro evento pero no ambos.
P (A o B) = P (A) + P (B)

b) Los eventos no son mutuamente excluyentes.- Los resultados de un experimento pueden suceder al
mismo tiempo. Es decir, esta regla de la adicin conocida como regla general de la adicin indica
la probabilidad de que suceda el evento A o el evento B o ambos.
P (A o B) = P (A) + P (B) P (A y B)

La letra o indica unin U, es decir suma de eventos tomando en cuenta si son o no mutuamente
excluyentes.
A la probabilidad de un evento simple se conoce como probabilidad marginal o simple de ese evento, y a la
probabilidad de eventos compuestos (es decir, la probabilidad de dos o ms eventos) se conoce como
probabilidad conjunta.
Al complemento de un evento simple se denota por: A
C
y a la probabilidad de un evento complemento se
denota por: P (A
C
)
Esto nos lleva a la regla del complemento que viene dada por la frmula:

P(A) +P(A
c
) = 1
Diagrama de Venn

Ejemplo:
La siguiente tabla nos indica el nmero de alumnos por paralelos de una carrera de segundo ao que reciben
estadsticas aplicadas.

Paralelos Evento No alumnos Probabilidad de que
ocurra el evento
1 A 40 0.26
2 B 30 0.20
3 C 45 0.30
4 D 35 0.23
Total 150 1.00

Como se observa en esta tabla existen 4 eventos simples con sus respectivas probabilidades. Si se quiere
obtener la probabilidad de seleccionar un alumno del paralelo B, sera:

Evento B: Alumnos del paralelo 2
P (A): Probabilidad de seleccionar un alumno del paralelo 2. (Probabilidad simple)

A
A
C
35
P (B) =
Su
1Su
= u.2

Cul sera la probabilidad de seleccionar un alumno del paralelo 2 o 4?

P(B o ) = P(B) +P() =
30
150
+
35
150
= u.2u +u.2S = u.4S

A esta probabilidad se denomina probabilidad conjunta, los eventos son mutuamente excluyentes pues un
alumno no puede ser del paralelo 2 y del 4 al mismo tiempo.

Nota.-
Cuando se trate de ejercicios de cartas (barajas) se consideran 52 cartas, de las cuales 26 son negras y 26
rojas.

3.5 Reglas de la multiplicacin
En esta parte se estimar la probabilidad de ocurrencia de dos eventos de manera simultnea. Hay dos reglas:

a) Regla especial de la multiplicacin.- Requiere que dos eventos, A y B, sean independientes, y lo son
si el hecho de que uno ocurra no altera la probabilidad de que el otro suceda, es decir que el
muestreo es con reposicin.

Independencia.- Si un evento ocurre, no tiene ningn efecto sobre la probabilidad de que otro evento
acontezca.
Frmula: P (A y B) = P(A) P (B)

En el caso de tres eventos, la frmula es: P (A y B y C) = P(A) P (B) P(C)

Regla general de la multiplicacin.- Si dos eventos no son independientes, se dice que son dependientes. En
esta regla se aplica un muestreo sin reposicin. Por ejemplo: si hay tres naranjas en la refrigeradora y se toma
una, en la refrigeradora quedan dos y la probabilidad de ser seleccionada una segunda naranja ya vari (a
0.50).

Frmula: P (A y B) = P (A/B) P (B)

Con las reglas de adicin se analizaron las probabilidades simples y conjuntas, en cambio con las reglas de la
multiplicacin se analizar la probabilidad condicional.

Probabilidad condicional.- Probabilidad de que un evento en particular ocurra, dado que otro evento ha
acontecido.
De la regla multiplicativa se obtiene la probabilidad condicional como:

P(A B) =
P(A y B)
P(B)

Ejemplos:
En un recipiente hay dos tubos defectuosos y cinco buenos. Se seleccionan al azar, dos tubos del depsito, sin
reposicin.
a) Cul es la probabilidad de que ambos tubos sean defectuosos?
2 tubos defectuosos
+ 5 tubos buenos
7

Evento A
d
: 1 tubo defectuoso
Evento B
d
: 2 tubo defectuoso

P (A
d
y B
d
)= P(A
d
) P(B
d
/A
d
)
=
2
7

1
6
=
2
42
=
1
21

36

El 2/7 significa que hay dos tubos defectuosos de un total de 7, el trmino 1/6 significa que seleccionaremos
otro tubo defectuoso pero de 6, dado que ya sali un defectuoso.

b) Cul es la probabilidad de que el primer tubo seleccionado sea defectuoso y que el segundo sea bueno?

Evento A
d
: tubo defectuoso
Evento B
b
: tubo bueno

P (A
d
y B
b
) = P (A
d
) P (B
b
/A
d
)
=
2
7
5
6
=
10
42
= 0,24
otro tubo pero esta vez un tubo bueno de los 5, pero que ahora son 6 en total dado que ya sali un tubo del
recipiente.

c) Suponga que ahora el muestreo es con reposicin, Cul es la probabilidad de que el primer tubo
seleccionado sea defectuoso y que el segundo sea bueno?

Evento A
d
: tubo defectuoso
Evento B
b
: tubo bueno

P (A
d
y B
b
) = P (A
d
) P (B
b
/A
d
)
=
2
7
5
7
=
10
49
= 0,21

otro tubo pero esta vez es un tubo bueno de los 5, sin embargo el haber seleccionado un primer tubo NO
afecta la probabilidad de seleccionar un segundo debido a que se ha realizado un muestreo con reposicin.

La formula puede ser tambin:

P (A
d
y B
b
) = P (A
d
) P (B
b
)
=
2
7
5
7
=
10
49
= 0,21

Esta frmula que se aplica para eventos donde el muestreo es con reposicin:

3.6 Tablas de Contingencia y Diagramas de rbol

Tabla de contingencia.- Tabla utilizada para clasificar observaciones (datos) de una muestra, de acuerdo con
dos o ms caractersticas identificables, se la conoce tambin como tablas cruzadas o de doble entrada. En
esta tabla se puede obtener la probabilidad simple o marginal (que est en los mrgenes o subtotales de la
misma) y la probabilidad conjunta que se encuentra dentro de la tabla misma.
Para elaborar tablas de contingencia en Excel y en spss, podemos revisar en las siguientes direcciones:
http://www.youtube.com/watch?v=awBkfxyk1fM (Excel)
http://www.youtube.com/watch?v=VFnPhbM_6T4 (spss)

Diagramas de rbol.- Es una grfica til para organizar clculos que implican varias etapas. Cada segmento
del rbol constituye una etapa del problema. Las ramas del rbol se ponderan por medio de probabilidades.
En las primera ramas se encuentra las probabilidades simples, y en las sub ramas de cada rama se encuentran
las probabilidades condicionales, al final (diramos el fruto) se encuentran las probabilidades conjuntas.

Ejemplo resumen:

En una amplia rea metropolitana se selecciono una muestra de 500 entrevistados para determinar diversas
informaciones relacionadas con el comportamiento del consumidor. Entre las preguntas realizadas se
encontraba: Disfruta ir de compras? De 240 hombres; 136 contestaron que s. De 260 mujeres; 224
contestaron que s.
a.- Elabore una tabla cruzada y un diagrama de Venn para evaluar las probabilidades

37
Eventos
Si disfruta ir de
compras
No disfruta ir de
compras
Total
Hombres
Mujeres
136
224
104
36
240
260
TOTAL 360 140 500

Con los valores subrayados son los que se obtienen las probabilidades conjuntas, se divide cada valor para el
total de la tabla.
Cada subtotal de filas y columnas son valores con los que se obtienen probabilidades simples o marginales
dividido cada valor para el total de la tabla.

Esta tabla presenta 4 eventos simples: 2 estn en las filas y 2 eventos ms estn en las columnas, adems
presenta 4 eventos compuestos que resultan de las intersecciones de las filas con las columnas.

3.7 Probabilidad Condicional
Como ya se mencion la probabilidad condicional de un evento viene dado por:

P(A B) =
P(A y B)
P(B)

P(A/B) significa Probabilidad del evento A dado el evento B.
Esto quiere decir:
* Que primero debi haber sucedido el evento B para que ocurra el evento A.
* Si sucede B ocurre A.
* Si sucede B entonces ocurre A.
* Sucede A dado que ocurri B

Ejemplo resumen:
Tomando el ejemplo anterior sobre hombres/mujeres y si disfrutan o no ir de compras, desarrolle:

a.- Escriba los eventos simples y dos eventos compuestos
38
Eventos simples:
A: Si disfruta ir de compras
A
c
: No disfruta ir de compras
B: Mujer
B
c
: Hombre

Eventos compuestos:

A y B: Mujer que disfruta ir de compras.
A y B
C
: Hombre que disfruta ir de compras.

Probabilidad simple:
b.- Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria: Sea Hombre?, disfrute ir
de compras?
P(B
c
) = 240/500 = 0.48
P(A) = 360/500 = 0.72

c.- Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria: Sea Mujer?, no disfrute
ir de compras?
P(B) = 260/500 = 0.52
P(A
c
) = 140/500 = 0.28

Probabilidad conjunta:
d.- Qu probabilidad hay de que un entrevistado seleccionado al azar: Sea mujer y disfrute ir de compras?
Sea hombre y no disfrute ir de compras?
P(BA) = 224/500= 0,448
P(B
c
r A
c
) = 104/500 = 0.21

e.- Qu probabilidad hay de que un entrevistado seleccionado al azar: Sea hombre y disfrute ir de compras?

P (B
c
r A) = 136/500 = 0.27

Probabilidad condicional:

f.- Supngase que el entrevistado seleccionado sea mujer Entonces cul es la probabilidad de que no disfrute
ir de compras?
Primero debe ser mujer el seleccionado y luego que no disfrute ir de compras:

P (A
c
B) =
P (A
c
rB)
P(B)
=
36
S00
260
S00
= 0.14

g.- Supngase que el entrevistado disfrute ir de compras Entonces cul es la probabilidad de que sea
hombre?
P (B
c
A) =
P (B
c
rA)
P(A)
=
136
S00
360
S00
= 0.38

Diagrama de rbol donde se aprecian las tres probabilidades, simple o marginal, condicional y conjunta.

39

Regla de Adicin:
h.- Cual es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea mujer o disfrute ir de
compras?

P (BUA)= P(B) + P(A) P(BA)
[
260
500
+ [
360
500
[
224
500
=
396
500
= 0.79

i.- Cual es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea hombre o no disfrute ir
de compras?
P (B
c
u A
c
) = P (B
c
) + P ( A
c
) P (B
c
r A
c
)
[
240
500
+ [
140
500
[
104
500
=
276
500
= 0.55

j.- Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea hombre o mujer?
P (B
c
u B) = P (B
c
) + P (B) P (B
c
r B)
_
24u
Suu
] + _
26u
Suu
] -u =
Suu
Suu
= 1

3.8 Regla de Bayes

El Teorema o Regla de Bayes nos brinda un mtodo para contestar algunas preguntas muy importantes. En su
esencia, esta regla nos indica cul informacin es necesaria tener y el mtodo para invertir la condicin
cuando calculamos una probabilidad condicional: si A y B son eventos y conocemos:
P(A | B), P(B), P(A | B
c
)
Entonces podemos calcular P(B | A). La necesidad de calcular este ltimo valor a partir de la informacin
disponible es imprescindible para entender las consecuencias de algunas de nuestras decisiones.

Teorema.-
Sea {A
1
,A
2
,...,A
n
} un conjunto de sucesos mutuamente excluyentes y exhaustivos, y tales que la probabilidad
de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se conocen las probabilidades
condicionales P(B | A
i
). Entonces, la probabilidad P(A
i
| B) viene dada por la expresin:

40
p(A
1
B) =
P(A
1
)P(BA
1
)
P(A
1
)P(BA
1
) +P(A
2
)P(BA
2
) +...P(A
n
)P(BA
n
)

donde:
P(A
i
) son las probabilidades a priori (probabilidades basadas en el nivel de informacin actual)
P(B | A
i
) es la probabilidad de B en la hiptesis A
i
.
P(A
i
| B) son las probabilidades a posteriori (probabilidades revisadas a partir de informacin adicional)

Ejemplos:
1.- Considera una fbrica de botellas que cuenta con dos mquinas para producir sus botellas. En esa fbrica
se producen 10,000 botellas al da. La mquina A produce 6,500 botellas diarias de las cuales el 2% son
defectuosas. La mquina B produce 3,500 botellas cada da de las cuales el 1% son defectuosas.

El inspector de calidad de la compaa selecciona una botella al azar y encuentra que est defectuosa.
Cul es la probabilidad de que la botella haya sido producida por la mquina A?

Para visualizar mejor los datos, los organizamos en un diagrama de rbol. Denotamos por A el evento de que
la botella seleccionada haya sido producida por la mquina A y por B el evento de que haya sido producida
por la mquina B. El evento de que la botella seleccionada sea defectuosa se denota por D, su complemento
D
c
representa una botella que no es defectuosa.

La probabilidad de que una botella cualquiera haya sido producida por la mquina A es .65, pues de las
10,000 producidas, 6,500 son producidas por A. Nos interesa calcular P(A | D), la cual no se puede obtener
de forma directa de los datos o del rbol que los representa. Para esto recurrimos directamente a la definicin
de probabilidad condicional: P( A | D) = P(A y D) / P(D).
Las cantidades P(AD) y P(A) se pueden obtener del rbol. Para que una botella seleccionada al azar sea una
defectuosa producida por la mquina A, debemos seleccionar primero la mquina A y de las botellas
producidas all seleccionar una defectuosa. Tenemos que P(A y D) = P(A) P( D | A), lo que equivale a hacer
la travesa en el rbol desde su raz o comienzo hasta la hoja donde obtenemos el resultado A y D.
As P(A y D) = .65 x 0.02.

Para encontrar P(D) debemos darnos cuenta que una botella defectuosa puede ser producida de la mquina A
o de la B. Si examinamos las hojas del rbol, vemos que hay dos lugares donde obtenemos una botella
defectuosa, A y D o B y D. Esto equivale a hacer una travesa por uno de caminos en el rbol. Estos caminos
41
son mutuamente excluyentes, pues si caminamos por uno no podemos estar caminando por el otro. Segn se
muestra en la figura de al lado, el evento D = (A y D) o (B y D) y su probabilidad es entonces calculada:
P(D) = P(A y D) + P(B y D).

Complete el Diagrama de Venn para este problema:

El primero de estos trminos P(A y D) ya haba sido calculado. El segundo se obtiene de forma similar.
Obtenemos entonces que P( B y D) = P(B) P(D | B). Uniendo estos resultados tenemos que:
P(D) = P(A) P( D | A) + P(B) P(D | B). Finalmente podemos calcular la probabilidad deseada:

P (A/D)=
P(A)P(A)
P(A)P(A)+P(B)P(B)

P(A/D)=
(0.65)(0.02)
(0.65)(0.02)+(0.35)(0.01)
=
0.013
0.013+0.0035
= u.788

Esto quiere decir que una vez sabemos que una botella seleccionada al azar est defectuosa, la probabilidad
de que haya sido producida por la mquina A es 0.788. Dicho de otra manera, de todas las botellas
defectuosas producidas, aproximadamente el 79% son producidas por la mquina A.

Pregunta:
Cmo se puede explicar que la mquina A produzca el 79% de las botellas defectuosas?
Este hecho se debe a dos factores. El primero es que la mquina A produce casi el doble de botellas que la
mquina B. An si la tasa de botellas defectuosas fuera la misma para ambas mquinas, por el mero hecho de
producir un mayor nmero de botellas, la mquina A producira casi el doble de defectuosas de la mquina B.
El segundo factor es que la tasa de produccin de defectuosas de la mquina A es el doble de la
correspondiente de la mquina B. En este caso, an si ambas mquinas produjeran la misma cantidad de
botellas, las producidas por la mquina A contendran el doble de botellas defectuosas que las que vienen de
la mquina B.

2.- El gerente de Ventas de una fbrica de juguetes est planeando introducir al mercado un nuevo juguete.
En el pasado el 40% de los juguetes creados por la compaa han tenido xito y el 60% no ha sido exitoso.
Antes de que se llegue a comercializar realmente el juguete se lleva a cabo una investigacin de mercado y se
prepara un informe, favorable o desfavorable. En el pasado el 80% de los juguetes exitosos recibieron
informes favorables. Al gerente de mercadotecnia le agradara conocer la probabilidad de que el nuevo
juguete tendr xito si recibe un informe favorable.
Eventos:
E: Exitoso F: Favorable
E
c
: No Exitoso F
c
: Desfavorable

P(E) = 0.40 P(F/E) = 0.80 P(E/F) = ?
P(Ec) = 0.60 P(F/Ec) = 0.30
P (E/F)=
P(PL)P(L)
P(PL)P(L)+P(PL)P(Lc)

P(E/F)=
(0.80)(0.40)
(0.80)(0.40)+(0.30)(0.60)
=
0.32
0.32+0.18
=
0.32
0.50
= u.64

42
3.- Una estacin de televisin querra medir la habilidad de su meteorlogo. La informacin recopilada
seala lo siguiente:
La probabilidad de que se predijera un da de sol en das soleados es 0.80
La probabilidad de que se predijera da de sol en das no soleados es 0.40
La probabilidad de un da de sol es 0.60
Encuentre la probabilidad de que:

a.- Sea un da soleado, sabiendo que se ha pronosticado un da de sol
Eventos:
S: Das Soleados
R: Pronstico de un da de sol
S
c
: Das no soleados
R
c
: Pronstico de un da no soleado

P(S)=0,60 P(R/S)=0,80 P(R/S
c
)=0,40

P(S/R)=
P(RS)P(S)
P(RS)P(S)+P(RS)P(S
c
)

P(S/R)=
(0,80)(0.60)
(0,80)(0,60)+(0,40)(0,40)
=
0,48
0,64
= u,7S

b.- Predecir un da soleado
P(R)=0,64

3.9 Aplicacin en Excel

Revisar las direcciones en youtube sobre como armar tablas de contingencia y diagramas de rbol. En la
siguiente hoja de clculo se muestra dos de las tres reglas de conteo analizadas en clases:

43

UNIDAD 4: VARIABLES ALEATORIAS DISCRETAS

Objetivos: identificar variables aleatorias discretas mediante sus distribuciones de probabilidad para el
anlisis del comportamiento poblacional

Identificar distribuciones de probabilidad
Aplicar distribuciones en computadora
Capacidad de analizar poblaciones y su distribucin

En los captulos anteriores se mencionaba el trmino distribucin de frecuencias relativas para describir un
pasado de ocurrencia, ahora en cambio distribucin de probabilidad describe la probabilidad de que un
evento ocurra en el futuro.

Supongamos que el jefe de control de calidad selecciona 4 artculos cualesquiera de 240 en total para
determinar si estn o no defectuosos, en la unidad anterior vimos que el jefe podra seleccionar los 4 artculos
de varias maneras, en este caso 4 de 120, pero por otro lado el jefe de control de calidad querr saber de esos
cuatro, cuntos estn defectuosos y cuntos estn buenos, por lo que existen artculos que pueden tener 0
defecto, 1 defecto, 2 defectos, 3 defectos o 4 defectos, si nos damos cuenta el hecho de que el artculo pueda
tomar varios valores numricos lo convierten en una variable aleatoria que para nosotros ser x. En este caso,
los valores que puede tomar x son: 0,1, 2, 3 y 4.

4.1 Definicin y su distribucin de probabilidad

Variable Aleatoria.- Cantidad que resulta de un experimento que, por azar (aleatorio), puede adoptar
diferentes valores.

Variable Aleatoria Discreta.- Variable aleatoria que adopta slo valores claramente separados.

Distribucin de probabilidad.- Listado de todos los resultados de un experimento y la probabilidad asociada
con cada resultado. Es decir, cada resultado tiene una probabilidad de ocurrencia.

Ejemplo.- Usted lanza dos monedas y desea observar al menos una cara en los lanzamientos. Cul es la
distribucin de probabilidad del nmero de caras?
Los resultados posibles son los siguientes:
C: Cara
Cr: Cruz
Resultado
posible
Primer
lanzamiento
Segundo
lanzamiento
Nmero
de caras
1 C C 2
2 C Cr 1
3 Cr C 1
4 Cr Cr 0

La distribucin de probabilidad para el nmero de caras es:
Nmero de
caras: X
Probabilidad del
resultado: P(x)
2
1
0
Total 1

4.2 Media, Varianza y Desviacin Estndar de una v.a.d.
44

Media de una v.a.d..- Es el valor promedio de larga duracin de la variable aleatoria. Se conoce como valor
esperado o esperanza matemtica.

Medta = = |x
t
. P(x
t
)]

Varianza de una v.a.d.- Describe el grado de dispersin en una distribucin, es decir la variacin.

Vartanza = n
2
= |(x
t
-)
2
P(x
t
)]
La siguiente distribucin corresponde a las ventas de automviles de una empresa durante los das sbados.
Calcule la media y la desviacin estndar de la distribucin de probabilidad discreta.
Media Empresa A:
Nmero de autos
vendidos: X
P(X) X. P(x)
0 0.50 0.00
1 0.20 0.20
2 0.15 0.30
3 0.10 0.30
4 0.05 0.20
Total 1.00

Varianza Empresa A

X P(x
i
) (X
i
-) (Xi-)
2
* P(X
i
)
0 0,50 (0-1) 1 * 0,50= 0,50
1 0,20 (1-1) 0 * 0,20= 0,00
2 0,15 (2-1) 1 * 0,15= 0.15
3 0,10 (3-1) 4 * 0,10= 0,40
4 0,05 (4-1) 9 * 0,05= 0,45
Total 1.50

La media fue 1 auto vendido en promedio los sbados con una desviacin de 1.23 autos vendidos. (La
desviacin estndar se obtiene al extraer la raz cuadrada de la varianza)

4.3 Distribucin de Probabilidad Binomial

En la distribucin binomial se presentan slo dos posibles resultados: xito resultados: xito y fracaso, los
eventos son mutuamente excluyentes.
La distribucin binomial inicia con n pruebas idnticas de distribucin de bernoulli que tiene un xito () y
un fracaso (1- ), es decir:

Distribucin de Bernoulli.-
P (xito) + P(fracaso) = 1

Frmula:
P (x) =
x
. (1- )
1-x

Donde:
X: Variable aleatoria discreta
45
: Probabilidad de xito
1- : Probabilidad de fracaso.

Sin embargo la distribucin de bernoulli nos ayuda para un solo experimento, por lo que la distribucin
binomial es ms general y aplicativa. Nota: Lo que se desea observar en el experimento (el resultado) se
convierte en l xito.

Distribucin Binomial
Caractersticas de un experimento de probabilidad binomial.-

2- Es el resultado de (n) pruebas de bernoulli idnticas.
3- El resultado de cada prueba de clasifica en una de dos categoras mutuamente excluyentes: xito o
fracaso.
4- La variable aleatoria permite contar el nmero de xitos en una cantidad fija de pruebas.
5- Las probabilidad de xito y fracaso permanecen constantes o iguales en todo el experimento
(prueba).
6- Las pruebas son independientes, es decir el resultado de una prueba no influye en el resultado de
otra prueba.

Frmula:
P (x) =
n
C
x
. n
x
. (1 -n)
n-x

x: variable aleatoria discreta Binomial
: Probabilidad de xito
1-: Probabilidad de fracaso
n
C
x
: Combinacin n de x. (Revisar Reglas de conteo)

Media de una distribucin binomial.-

= n

Varianza de una distribucin binomial.-

2
= n (1 - )

Para fortalecer los conocimientos en Excel se recomienda ingresar a la Biblioteca virtual (pgina 5) y
seleccionar le texto: Manual: Teora de Probabilidades, Ramrez Snchez, pginas 24 a 30.

Ejemplo:
En la base a experiencias anterior, la impresora principal del centro de cmputo de cierta universidad
funciona adecuadamente el 90% del tiempo si se hace una muestra aleatoria de 10 inspecciones.

a.- Cul es la probabilidad de que la impresora principal funcione en forma apropiada:
1.- Exactamente nueve veces? (es decir 9 veces ni ms ni menos)
n = 10
= 0.90
P (x = 9) = ?
x= Nmero de veces que funcione de forma apropiada la impresora principal.

P(x = 9) = 1uC9 (u.9u)
9
u.1u
1

P(x = 9) = 1uxu.S8742u489xu.1u
P(x = 9) = u.7S61es la probabilidad de que la impresora 9 veces funcione correctamente.

2.- Por lo menos nueve veces? (es decir mnimo 9 veces)
P(x 9) =.
P(x 9) = P(x = 9) +P(x = 1u)
P(x 9) = 1uC9(u.9u)
9
(u.1u)
1
+1uC1u(u.9u)
10
(u.1u)
0

P(x 9) = u.S8742u489 +u.S467844
P(x 9) = u.7S61es la probabilidad de que la impresora funcione correctamente 9 veces o ms.
46

3.- Cuando ms nueve veces? (es decir mximo 9 veces)
P(x 9) =.
P(x 9) = P(x = 9) +P(x = 8) +P(x = 7) +P(x = 6) +P(x = S) +P(x = 4) +P(x = S)
+P(x = 2) +P(x = 1) +P(x = u)

P(x 9) = 1uC9(u.9u)
9
(u.1u)
1
+1uC8(u.9u)
8
(u.1u)
2
+1uC7(u.9u)
7
(u.1u)
3
+1uC6(u.9u)
6
(u.1u)
4
+1uCS(u.9u)
5
(u.1u)
5
+1uC4(u.9u)
4
(u.1u)
6
+1ucS(u.9u)
3
(u.1u)
7+
1uC2(u.9u)
2
(u.1u)
8+
1uC1(u.9u)
1
(u.1u)
9
1uCu(u.9u)
0
(u.1u)
10

P(x 9) = u.S8742u489 +u.19S71u244 +u.uS7S9S626 +u.u1116u261 +u.uu1488uS48
+u.uuu1S7781 +u.uuuuuuuuu1
p(x 9) = u.6S1S

Una manera sencilla de calcular este tipo probabilidades y probabilidades y evitar un clculo a mano muy
extenso es usando la regla del complemento (captulo anterior), es decir, en lugar de calcular la probabilidad
de xitos menores o iguales a 9, calculamos los xitos de su complemento (en este caso es 10)

P(x 9) = 1 -P(x > 9)= 1 P(x = 10) = 1 0.3487844 = 0.651215 es la probabilidad de que la
impresora funciones correctamente 9 veces o menos.

Se recomienda revisar desigualdades, especficamente sobre el conjunto solucin de una desigualdad lineal.
Repaso de signos y desigualdades:

Expresin
Equivalencia
en intervalo y
palabras
Conjunto solucin de la
desigualdad nmeros
reales positivos ms el
cero

Otros significados

Complemento

X > 3

(3, )
No incluye al 3

4, 5, 6, 7

Valores mayores a 3,
ms de 3

X 3
0, 1, 2, 3

X 3

[3, )
Si incluye al 3
o
Desde el 3

3, 4, 5, 6, 7
Valores mayores o
iguales a 3, 3 o ms,
mnimo 3, por lo menos
3, al menos 3, cuando
menos 3

X < 3
0, 1, 2

X < 3

(, 3)
No incluye al 3

0, 1, 2

Valores menores a 3,
menos de 3

X 3
3, 4, 5, 6, 7

X 3

(, 3]
Si incluye al 3
o
Hasta el 3

0, 1, 2, 3
Valores menores o
iguales a 3, 3 o menos,
mximo 3, mximo 3,
cuando ms 3, a lo
mucho 3

X > 3
4, 5, 6, 7

4.- mas de nueves veces?
P(x > 9) =.
P(x > 9) = P(x = 1u)
P(x > 9) = u.S487es la probabilidad de que ms de 9 impresoras funciones correctamente.

5.- menos de nueve veces?
p(x < 9) =.
p(x < 9) = p(x = 8) +p(x = 2) +p(x = 1) +p(x = u)
47
p(x < 9) = 1uC8(u.9u)

8
(u.1u)
2
+1uC7(u.9u)
7
(u.1u)
3
+1uC6(u.9u)
6
(u.1u)
4
+1uCS(u.9u)
5
(u.1u)
5
+1uC4(u.9u)
4
(u.1u)
6
+1uCS(u.9u)
3
(u.1u)
7
+1uC2(u.9u)
2
(u.1u)
8
+1uC1(u.9u)
1
(u.1u)
9
+1uCu(u.9u)
0
(u.1u)
10

p(x < 9) = u.19S71u244 +u.uS7S9S628 +u.u1116u261 +u.uu1488uS48 +u.uuu1S7781
+u.uuuuu8748 +u.uuuuuuS64S +u.uuuuuuuuu9 +u.uuuuuuuu1
p(x < 9) = u.26S9 es la probabilidad de que menos de 9 impresoras funciones correctamente.

Se puede obtener la respuesta mediante la regla del complemento.

b.- Cuntas veces se puede esperar que funcione en forma apropiada la impresora principal? Se aplica valor
esperado.

= n. p
=10(0.90)
= 9 veces se esperara que funcione correctamente la impresora.

4.4 Distribucin de Probabilidad de Poisson

Describe el nmero de veces que se presenta un evento durante un intervalo especfico. El intervalo puede ser
de tiempo, distancia, rea o volumen. La distribucin se basa en dos supuestos. El primero consiste en que la
probabilidad es proporcional a la longitud del intervalo y el segundo consiste en que los intervalos son
independientes. Es decir, cunto ms grande sea el intervalo, mayor ser la probabilidad, y el nmero de
veces que se presenta un evento en un intervalo no influye en los dems intervalos. La distribucin de
probabilidad de Poisson es el promedio esperado de de xitos

Caractersticas de un experimento de probabilidad de Poisson:
1- La variable aleatoria es el nmero de veces que ocurre un evento durante un intervalo definido.
2- La probabilidad de que ocurra el evento es proporcional al tamao del intervalo.
3- El numero de eventos que ocurren son independiente entre si.

l numero de medio o esperado de eventos en cada unidad se denota por (lambda).
Frmula:

P(x) =
x
x
.c
-
x!

= Nmero esperado de xitos.
c = Constante equivalente a 2,71828(base uel sistema ue logaiitmos napeiianos)
x= Nmero de xitos por unidad.
P(x) = Probabilidad para un valor especfico de x.
! = factorial

Repaso de factorial: n!= n x (n 1) x (n 2)(n (n 1))
Ejemplos:
8!=8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 =40.320
0! = 1
1! = 1
Ejemplos de distribucin de Poisson:
1- El nmero de palabras mal escritas por pgina del reglamento de una empresa.
2- El nmero de llamadas por hora que recibe una empresa de Publicidad.
3- El nmero de autos vendidos por da en Automotores Continental.

Cada ejemplo tiene palabra clave: por.

Ejemplo:
1.- El nmero promedio de estudiantes de estudiantes que no asistan a clases de estadstica es de 8 alumnos
por una hora clase.
= 8 (en una hora clase)
48
x= Estudiantes que no asisten a clases

a) Cul es la probabilidad de que en una hora clase cualquiera no asistan 10?
p (x=10) =
c
-8
.8
10
10!
= 0.099

b) Cul es el promedio de alumnos que no asisten a una hora clase?
= 8 estudiantes no asisten a una hora clase

c) Cul es el promedio de alumnos que no asisten a dos horas clase?
= 16 estudiantes no asisten a dos horas clase

2.- Una empresa de publicidad observa que el nmero de clientes que desean promocionar su negocio es una
variable aleatoria de Poisson. Si el nmero promedio de clientes que desean publicidad durante un mes es de
8
= 8 durante un mes
x= clientes que desean publicidad
a) Cul es la probabilidad de que en un mes se acerquen 10 clientes?
p (x=10) =
c
-8
.8
10
10
!
= 0.09926
b) Cul es la probabilidad de que en una semana por lo menos se acerquen 3 clientes?
= 2 por semana
p (x3) = 1 p (x<3)
1 p (x=2) + p (x=1) + p (x=0)
1
c
-2
.2
2
2
!
+
c
-2
.2
1
1
!
+
c
-2
.2
0
0
!
= 0.2706 + 0.2706 + 0.1353
1 0.6765 = 0.3235
c) Cul es la probabilidad de que en una semana se acerquen a lo mucho 2 clientes?
p (x 2) = p (x=2)+ p (x=1)+ p (x=0)
c
-2
.2
2
2
!
+
c
-2
.2
1
1
!
+
c
-2
.2
0
0
!
= 0.2706 + 0.2706 + 0.1353
La probabilidad de que en una semana se acerquen a lo mucho 2 clientes es 0.6765.

4.5 Distribucin de Probabilidad Hipergeomtrica

En esta distribucin se extrae una muestra n de una poblacin N, PERO en esa seleccin de la muestra
existen x xitos de r xitos de la poblacin. Es decir, Cul es la probabilidad de que en la seleccin de la
muestra existan xitos dado que en la poblacin hay xitos? Recordemos que la variable aleatoria
hipergeomtrica X es l xito en n (muestra). Observe y analice el grfico:

Caractersticas:
1- Los resultados de cada prueba de un experimento se clasifican en dos categoras exclusivas: xito o
fracaso.
2- Las pruebas no son independientes.
3- Las muestras se realizan con la poblacin finita sin reemplazos y n/N > u.uS. Por lotanto, la
probabilidad de xito cambia en cada prueba.
49

Formula:

P (X) =
(
r
C
x
)(
N-r
C
n-x
)
N
C
n

Donde:
N: Nmero de la Poblacin
n: Nmero de la muestra
r: Nmero de xitos en la poblacin
x: Nmero de xitos en la muestra
C: Combinacin

Media:
p =
n. r
N

Varianza:
o
2
=
r. (N -r). n. (N -n)
N
2
. (N -1)

Ejemplo:
De un inventario de 48 celulares NOKIA (con radio) que se embarcan a distribuidores locales, 12 tienen
radios defectuosos.

a) Cul es la probabilidad de que ciertos distribuidores reciban ocho celulares y:
1.- Todos tengan radios defectuosos?

La variable x es igual a celulares que tengan radios defectuosos y como el propsito de mi investigacin es
encontrar la probabilidad de celulares nokia con radios defectuosos; la variables x se convierte en mi xito.

N = 48
n = 8
r = 12
x = 8

P (x = 8)=
C C
C
=
C C
C
=
495 . 1
377348994
=
495
377348994
= u.uuuuu1S11 es la probabilidad de que en una
muestra de 8 celulares del total (48) se seleccionan 8 celulares con radios defectuosos.

PoblacinN
conrxitos
Muestran
conxxitos
50
Si nos damos cuenta la suma de las dos combinaciones del numerador debe ser igual a la combinacin del
denominador. (
48
C
8
)

2.- Ningn celular tenga radio defectuoso?

P (x = 0)=
C C
C
=
1 . C
3773
=
1 . 30260
377348994
=
30260
377348994
= u.u8u1919 probabilidad de que al seleccionar una
muestra de 8 celulares, ninguno salga con radio defectuoso.

3.- Por lo menos un celular tenga el radio defectuoso?

Usamos la regla del complemento:

P (x 1) = 1 - P (x < 1) = 1 - P (x = 0) = 1 - 0.08019 = 0.9198 es la probabilidad de que al menos o por lo
menos un celular salga con la radio defectuosa, al decir por lo menos uno significa que pueden salir 1,2,3
hasta 8 con la radio defectuosa.

b) Cuntos celulares con radios defectuosos se esperara recibir?

=
n
N
=
8 . 12
48
=
96
48
= 2 celulares con radios defectuosas se esperara sean seleccionados si se repite este
experimento varias veces.

4.6 Aplicacin en Excel y SPSS.

La siguiente hoja de clculo muestra los tres primeros literales del ltimo ejercicio, las dems distribuciones
siguen similares pasos.

51
UNIDAD 5: VARIABLES ALEATORIAS CONTINUAS

Objetivo: identificar variables aleatorias continuas mediante sus distribuciones de probabilidad para el
anlisis del comportamiento poblacional.

Identificar distribuciones de probabilidad
Aplicar distribuciones en computadora
Capacidad de anlisis de poblaciones y su comportamiento

5.1 Definicin y su Distribucin de Probabilidad

Variable aleatoria continua.- Variable aleatoria que adopta una infinidad de valores dentro de un intervalo.

Si la variable aleatoria es continua entonces se realiza una distribucin de probabilidad (unidad anterior)
donde se liste los posibles resultados con sus respectivas probabilidades.

La diferencia entre una distribucin de probabilidad y una variable aleatoria se halla en que la variable
aleatoria representa el resultado particular de un experimento; en cambio, la distribucin de probabilidad
representa todos los posibles resultados, as como la correspondiente probabilidad.

5.2 Distribucin de Probabilidad Uniforme

Esta distribucin tiene la forma rectangular, se la describe completamente con los valores mnimo y mximo
de la distribucin para calcular la media y la desviacin estndar. Los valores mnimo y mximo ayudan a
calcular cualquier probabilidad de sucesos que se encuentren dentro de este intervalo pues fuera del mismo la
probabilidad siempre ser cero.
a

La distribucin de probabilidad uniforme viene dada por la frmula:

P(x) =
1
b -o
si o x b y; u cncuolquicr otro punto

Media de una distribucin Uniforme.- Se localiza en la mitad del intervalo (a, b).

p =
o +b
2

Desvi

Ejemp

El vol
500 li
Es de
est e
El val
Es dec

5.3 D
En es
0 cuya

El val

iacin estnda
plo:
lumen de prec
itros por metro
ecir, que el vo
ntre 401 y 402
lor medio espe
cir, la precipit
Distribucin d
tadstica la di
a funcin de d
lor esperado y

ar.-
cipitaciones e
o cuadrado. C
olumen de pre
2 litros, otro 1
erado es:
tacin media e
de Probabilid
istribucin exp
densidad es:
y la varianza d
stimado para
Calcular la fun

ecipitaciones e
1%, etc.

estimada en S
dad Exponenc
ponencial es u

de una variable
52
el prximo a
cin de distrib
est entre 400
Sevilla para el
cial
una distribuci
e aleatoria X c

o en la ciuda
bucin y la pre
0 y 401 litros
prximo ao
n de probabi
con distribuci
Ec
ad de Sevilla v
ecipitacin m
tiene un 1%
es de 450 litro
ilidad continu
n exponencia
c.QuispeG.Jimm
va a oscilar en
media esperada
de probabilid
os.
ua con un par
al son:
myJavier
ntre 400 y
a:
dades; que
metro >
53
5.4 Distribucin de Probabilidad Normal

Distribucin de probabilidad normal.- Es una distribucin continua en forma de campana con una media qie
divide la distribucin en dos partes iguales. Adems la curva normal se extiende indefinidamente en
cualquier direccin y nunca toca el eje x (es decir, solo se aproxima al eje x. La distribucin queda definida
por su media y desviacin estndar.

P(x) =
1
o2n
c
-
1
2
j
x-
c
[
2

Caractersticas:
1- Tiene forma de campana.
2- Es simtrica.
3- La distribucin es asinttica (asntota en y=0) y el eje X va desde - , +.
4- La localizacin de una distribucin normal se determina a travs de la media . La dispersin o
propagacin de la distribucin se determina por medio de la desviacin estndar, .
5- La media, mediana y moda son iguales.
6- Hay 3 desviaciones a la derecha y 3 desviaciones a la izquierda aproximadamente.

Curva normal con misma media y varianzas diferentes

Curva normal con misma
2
y diferentes .

54

Para facilitar el clculo de las probabilidades con la distribucin normal se aplica la siguiente fmrula que
est estandarizada:
(z) =
1
2 II
c
-(
1
2
)z
2

Distribucin de probabilidad normal estndar.- Cualquier distribucin normal puede convertirse en una
distribucin normal estndar al restar la media de cada observacin y dividir esta diferencia entre la
desviacin estndar como se aprecia en la f+ormula anterior. Los resultados reciben el nombre de valores z o
valores tipificados que se obtiene a partir del uso de la tabla de distribucin normal (est al final de la gua)
o aplicando Excel y/o spss. La curva normal estandarizada quedara as:

En el grfico se puede comparar los valores z que ya estn estandarizados y los valores de =16 horas y de
=2 horas de estudio que un alumno a la semana destina para los deberes.

Valor z.- Distancia con signo (+ o -) entre un valor seleccionado, designado x, y la media, , dividida entre la
desviacin estndar, . El rea sombreada es la probabilidad de un valor cualquiera.

Frmula del valor normal estndar:
z =
x-
c

Parte de la tabla de la distribucin normal estndar

X 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5723
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

La tabla que se utilizar es de frecuencia acumulada, se lee de la siguiente manera:

La columna de la izquierda indica el valor cuya probabilidad acumulada queremos conocer. La primera fila
nos indica el segundo decimal del valor que estamos consultando.
55

Ejemplo: queremos conocer la probabilidad acumulada en el valor 0,45.Entonces buscamos en la columna de
la izquierda el valor 0,4 y en la primera fila el valor 0,05. La casilla en la que se interseccionan es su
probabilidad acumulada (0,6736, es decir 67.36%), en Excel se aplica el mismo anlisis.

Atencin: la tabla nos da la probabilidad acumulada, es decir, la que va desde el inicio de la curva por la
izquierda hasta dicho valor. No nos da la probabilidad concreta en ese punto. En una distribucin continua en
el que la variable puede tomar infinitos valores, la probabilidad en un punto concreto es prcticamente
despreciable (es decir es cero).

En Excel en cambio se trabaja con la funcin estadstica distr.norm.estand (valor de z) que nos da
exactamente el valor acumulado como se explic en la tabla.

Ejemplos de clculo de probabilidades con distribucin normal estndar, diferentes casos:

Supongamos que X es una variable aleatoria que se distribuye segn una distribucin N con media = 70 y
varianza = 36. Calcular:

a) P (x 80)

z =
x -p
o

z =
8u -7u
6

Calcular la probabilidad anterior es lo mismo que decir: P (z 1.67) = 0.95254 (rea sombreada)

b) P (x > 80)

z =
8u -7u
6

Calcular la probabilidad anterior es lo mismo que decir: P (z > 1.67) = 0.04745 (que se obtuvo
restando 1 0.95254)

c) P (x 60)
z =
6u -7u
6

56

Calcular la probabilidad anterior es lo mismo que decir: P (z -1.67) = 0.04745 (probabilidad igual al
anterior literal)

d) P (x > 60)
z =
6u -7u
6

Calcular la probabilidad anterior es lo mismo que decir: P (z > -1.67) = 0.04745, cuya probabilidad
igual al literal a).

e) P (50 < x 80)
z
1
=
Su -7u
6
= -S.SS

z
2
=
8u -7u
6
= 1.67

Calcular la probabilidad anterior es lo mismo que decir: P (-3.33 < z 1.67) = 0.95210. Para este tipo
de ejercicios siempre se obtiene el valor deseado restando la probabilidad del nmero positivo
menos la probabilidad del nmero negativo. En este caso: 0.95254 0.000432 = 0.952106

f) (50 < x 60)

z
1
=
Su -7u
6
= -S.SS

z
2
=
6u -7u
6
= -1.67
57

Calcular la probabilidad anterior es lo mismo que decir: P (-3.33 < z -1.67) = 0.04702. Para este tipo
de ejercicios siempre se obtiene el valor deseado restando la probabilidad del nmero negativo ms
cercano al cero (es decir el mayor) menos la probabilidad del nmero negativo ms pequeo (es decir ms
alejado del cero). En este caso: 0.047459 0.0004342 = 0.04702

g) P (80 < x 90)

z
1
=
8u -7u
6
= 1.67

z
2
=
9u -7u
6
= S.SS

Calcular la probabilidad anterior es lo mismo que decir: P (1.67 < z 3.33) = 0.04702 (probabilidad igual
al anterior literal). Para este tipo de ejercicios siempre se obtiene el valor deseado restando la probabilidad
del nmero positivo mayor menos la probabilidad del nmero positivo menor. En este caso: 0.99956
0.95254 = 0.047025

Problemas:

1.- El salario medio de los empleados de una empresa se distribuye segn una distribucin normal, con media
5 mil dlares y desviacin tpica de mil dlares. Calcular el porcentaje de empleados con un sueldo inferior a
7 mil dlares.

Lo primero que haremos es transformar esa distribucin en una normal tipificada, para ello se crea una nueva
variable (z) que ser igual a la anterior (X) menos su media y dividida por la desviacin tpica:

z =
x -p
o

En el ejemplo, la nueva variable sera:

z =
x -S
1

Esta nueva variable se distribuye como una normal tipificada. La variable z que corresponde a una variable X
de valor 7 es:

58
z =
7 -S
1
= 2

Ya podemos consultar en la tabla la probabilidad acumulada para el valor 2 (equivalente a la probabilidad de
sueldos inferiores a 7 mil dlares). Esta probabilidad es 0,97725

Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 mil dlares es del 97,725%.

2.- La vida media de los habitantes de un pas es de 68 aos, con una varianza de 25. Se hace un estudio en
una pequea ciudad de 10.000 habitantes:

a) Cuntas personas superarn previsiblemente los 75 aos?

Es decir nos piden cuantas personas vivirn (previsiblemente) ms de 75 aos, para eso calculamos el valor
de la normal tipificada equivalente a 75 aos.

z =
7S -68
S
= 1.4

Por lo tanto

P (X > 75) = (z > 1,4) = 1 - P (z < 1,4) = 1 - 0,9192 = 0,0808

Luego, el 8,08% de la poblacin (808 habitantes) vivirn ms de 75 aos.

b) Personas que vivirn (previsiblemente) menos de 60 aos

Calculamos el valor de la normal tipificada equivalente a 60 aos

z =
6u -68
S
= -1.6

Por lo tanto

P (X < 60) = (z < -1,6) = 0,0548
Es decir, el 5,48% de la poblacin (548 habitantes) no llegarn probablemente a esta edad.

3.- La renta media de los habitantes de un pas es de 4 mil dlares/ao, con una varianza de 1,5. Se supone
que se distribuye segn una distribucin normal. Calcular:

a) Porcentaje de la poblacin con una renta inferior a 3 mil dlares.

Lo primero que tenemos que hacer es calcular la normal tipificada:

z =
S -4
1,22
= -u,816

P (X < 3) = P (z < -0,816)

Ahora tenemos que ver cul es la probabilidad acumulada hasta ese valor. Por lo tanto:

P (z < -0,816) = 0,2072

Luego, el 20,72% de la poblacin tiene una renta inferior a 3 mil dlares.

59

b) Renta a partir de la cual se sita el 10% de la poblacin con mayores ingresos.

En este tipo de problemas primero vemos en la tabla el valor de la variable tipificada (z) cuya probabilidad
acumulada es el 0,9 (90%), lo que quiere decir que por encima se sita el 10% superior.

Ese valor corresponde a z = 1,282 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de
la normal tipificada:

1,282 =
x -4
1,22

Despejando X, su valor es 5,57. Por lo tanto, aquellas personas con ingresos superiores a 5,57 mil dlares
constituyen el 10% de la poblacin con renta ms elevada.

c) Ingresos mnimo y mximo que engloba al 60% de la poblacin con renta media.

Volvemos a buscar en la tabla el valor de la variable normalizada z cuya probabilidad acumulada es el 0,8
(80%). Como sabemos que hasta la media la probabilidad acumulada es del 50%, quiere decir que entre la
media y este valor de z hay un 30% de probabilidad. Dentro de la tabla se busca el valor 0.30.

Por otra parte, al ser la distribucin normal simtrica, entre -z y la media hay otro 30% de probabilidad. En
definitiva, el segmento (-z, z) engloba al 60% de poblacin con renta media.

El valor de Y que acumula el 80% de la probabilidad es 0,842 (aprox.), por lo que el segmento viene definido
por (-0,842, +0,842). Ahora calculamos los valores de la variable X correspondientes a estos valores de Y.

u,842 =
x -4
1,22
y -u,842 =
x -4
1,22

Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos superiores a 2,97 mil dlares e
inferiores a 5,03 mil dlares constituyen el 60% de la poblacin con un nivel medio de renta.

5.4.- Aproximacin de la Binomial a la Normal y aplicacin en Excel y spss
Antes de entrar al tema brevemente veamos lo que dice el Teorema Central del Lmite: Si tenemos un
grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribucin
(cualquiera que ste sea), la suma de ellas se distribuye segn una distribucin normal.
La distribucin normal constituye una buena aproximacin a la normal si n y n(1-) son ambos por lo
menos 5. Sin embargo antes de aplicar esta aproximacin es importante reconocer si la distribucin es
binomial (revisar unidad anterior)

Como la distribucin binomial es discreta y la distribucin normal es continua es necesario aplicar un factor
de correccin de continuidad o de yates que consiste en restar o sumar 0,5 segn los siguientes 5 casos:

1.- Para la probabilidad especfica de un valor cualquiera, se utiliza el rea por debajo (x-0.5) y por encima
(x+0.5)
2.- Para la probabilidad de que por lo menos ocurra x, se utiliza el rea por encima de (x-0.5)

3.- Para la probabilidad de ocurra ms que x, se utiliza el rea por encima de (x+0.5)

4.- Para la probabilidad de que ocurra x o menos, se utiliza el rea debajo de (x+0.5)

5.- Para la probabilidad de que ocurra menos que x, se utiliza el rea debajo de (x-0.5)

Otra manera de entenderlo y con ejemplos sencillos es la siguiente:

60
D. BINOMIAL D. NORMAL
1) P (x = k) P(k -u.S < x < k +u.S)
EJEMPLO
P (x = S) P(2.S < x < S.S)

2) P (x k) P(x < k -u.S)
EJEMPLO
P (x S) P(x 2.S)

3) P (x > k) P(x < k +u.S)
EJEMPLO
P (x > S) es lo mismo que decir P(x 4) P(x > S.S)

4) P (x k) P(x k +u.S)
EJEMPLO
P (x S) P(x S.S)

5) P(x < k) P(x < k -u.S)
EJEMPLO
P (x < S) es lo mismo que decir P(x 4) P(x < S.S)

La distribucin binomial B(n,p) se puede aproximar mediante una distribucin normal de la siguiente
manera:

N (n, nn(1 -n), entonces la distribucin normal estndar luego de aplicar el factor de correccin de
continuidad tendra la siguiente frmula:

z =
x -nn
nn(1 -n)

Ejemplo:
Una prueba consta de 200 preguntas de verdadero o falso, para un sujeto que respondiese al azar Cul sera
la probabilidad de que acertase?

a) 50 preguntas o menos.
b) Ms de 50 y menos de 100.
c) Ms de 120 preguntas.

Solucin.
El nmero de preguntas acertadas seguir una distribucin Binomial con n = 200 y = 0,5. Ahora bien, como
el nmero de pruebas es elevado esta distribucin se puede aproximar por una Normal de media 2000,5 =
100 y de varianza 2000,50,5 = 50 o lo que es lo mismo con desviacin tpica 7,07, luego:

a) P(x 50) P(x 50,5) =
61
z =
Su,S -1uu
7,u7
= -7
Al buscar en la tabla o aplicando en Excel nos damos cuenta que la probabilidad de que una persona acierte
50 preguntas o menos es 0.

b) P(50 < x < 100) P(50.5 < x < 99.5) =
Su,S -1uu
7,u7
< z <
99,S -1uu
7,u7

-7 < z < -u.u7 = u.472u9 -u = u.472u9
La probabilidad de que un alumno conteste entre 50 y 100 preguntas correctas es de 0.47209.

c) P(x > 120) P(x > 120.5) = P(z >2.9)
z =
12u,S -1uu
7,u7
= 2.9
La probabilidad de que una persona conteste acertadamente ms de 120 preguntas es de 1- 0.99813 =
0.00186, es decir casi imposible.
Para calcular probabilidades en Excel se trabaja de la siguiente manera, la presente hoja de clculo presenta
los resultados para los ejercicios de la pgina 55:

62

UNIDAD 6: MUESTREO Y ESTIMACIN
Objetivo:Estimarparmetrosmedianteaplicacindemtodosdemuestreoparadeterminacindeintervalosde
confianzaparalamediamuestral.
Competenciasespecficas:
Capacidaddemuestrearunapoblacin
Determinacindeintervalosdeconfianzaamanoyacomputadora
Anlisisdeintervalos

6.1 Muestreo
6.1.1 Definicin y clasificacin

La inferencia estadstica es el proceso de hacer uso de los resultados mustrales para obtener conclusiones
sobre las caractersticas de una poblacin.
Un importante objetivo del anlisis de datos es el uso de estadsticas como la media y la proporcin de la
muestra, a fin de estimar los valores reales correspondientes en la poblacin. El proceso de generalizar estos
resultados muestrales a la poblacin se conoce inferencia estadstica
La muestra se obtiene por observacin o experimentacin. La necesidad de obtener un subconjunto reducido
de la poblacin es obvia si tenemos en cuenta los costes econmicos de la experimentacin o el hecho de que
muchos de los mtodos de medida son destructivos.
Toda inferencia inductiva exacta es imposible ya que disponemos de informacin parcial, sin embargo es
posible realizar inferencias inseguras y medir el grado de inseguridad si el experimento se ha realizado de
acuerdo con determinados principios.

Propsito de la inferencia Estadstica
Es el de conseguir tcnicas para hacer inferencias inductivas y medir el grado de incertidumbre de tales
inferencias. La medida de la incertidumbre se realiza en trminos de probabilidad.
La inferencia estadstica realiza un estudio sobre una o varias muestras extradas de una poblacin o universo
y las conclusiones a las que se arriban son aplicables a todos los elementos de dicha poblacin. Estas
conclusiones se aplican a todos los elementos de la poblacin pero ello no quiere decir que todos
(absolutamente todos) tienen que cumplir con las caractersticas determinadas. Para ello se utiliza la teora de
probabilidades, en el trabajo estadstico de un estudio las pruebas se disean de modo que se puede
determinar con qu grado de probabilidad se encontrarn las caractersticas determinadas en la muestra, entre
los elementos que componen la poblacin.

Los estadgrafos muestrales son los valores de la caracterstica estudiada en la muestra y que se pueden
considerar coinciden con los de la poblacin con una determinada probabilidad de error.

63

Existe un concepto mucho ms refinado para el trabajo con poblaciones y es lo que se conoce como
poblacin objetivo. Desde el punto de vista de la metodologa de la investigacin la poblacin objetivo
podemos considerarla como aquella poblacin que est limitada por los objetivos de la investigacin que
queremos realizar.

Muestreo.- Herramienta para inferir algo sobre una poblacin, el comportamiento de los datos de la
poblacin, para esto debemos recordar que la muestra debe ser representativa, y para que esto suceda
veremos cuatro mtodos de muestreo que nos ayudarn a realizar un muestreo confiable, para esto:

1.- Analizaremos las caractersticas de cada mtodo y en qu circunstancias se deberan aplicar.
2.- Construiremos una distribucin de la media de la muestra para entender como las medias tienden a
acumularse en torno a la media de la poblacin.
3.- Demostraremos que para cualquier poblacin, la forma de esta distribucin de muestreo tiende a seguir la
distribucin de probabilidad normal.

6.1.2 Mtodos de Muestreo
6.1.2.1 Muestreo Aleatorio Simple
Muestreo aleatorio simple: Es aquel en que cada elemento de la poblacin tiene la misma probabilidad de ser
seleccionado para integrar la muestra. Una muestra simple aleatoria es aquella en que sus elementos son
seleccionados mediante el muestreo aleatorio simple.

En la prctica no nos interesa el individuo elemento de la poblacin seleccionado en general, sino solo una
caracterstica que mediremos u observaremos en l y cuyo valor ser el valor de una variable aleatoria que en
cada individuo o elemento de la poblacin puede tomar un valor que ser un elemento de cierto conjunto de
valores. De modo que una muestra simple aleatoria x
1
, x
2
, x
n
se puede interpretar como un conjunto de
valores de n variables aleatorias independientes, cada una de las cuales tiene la misma distribucin que es
llamada distribucin poblacional.

Existen dos formas de extraer una muestra de una poblacin: con reposicin y sin reposicin.

Muestreo con reemplazo.-
Es aquel en que un elemento puede ser seleccionado ms de una vez en la muestra para ello se extrae un
elemento de la poblacin se observa y se devuelve a la poblacin, por lo que de esta forma se pueden hacer
infinitas extracciones de la poblacin aun siendo esta finita.

Muestreo sin reemplazo.-
No se devuelve los elementos extrados a la poblacin hasta que no se hallan extrados todos los elementos de
la poblacin que conforman la muestra.

Cuando se hace una muestra probabilstica debemos tener en cuenta principalmente dos aspectos:

El mtodo de seleccin.
El tamao de la muestra

1.- Mtodo de seleccin.-

Un procedimiento de extraer una muestra aleatoria de una poblacin finita es el de enumerar todos los
elementos que conforman la poblacin, escribir esos nmeros en papelitos y colocarlos en una funda o
nfora, mezclarlos bien y sacar uno a uno tantos como lo indique el tamao de la muestra. En este caso los
elementos de la muestra lo constituirn los elementos de la poblacin cuyos nmeros coincidan con los
extrados de la funda.

Otro procedimiento para obtener una muestra de una poblacin ya sea el muestreo con reemplazo o sin
reemplazo es mediante la utilizacin de la tabla de nmeros aleatorios pero solamente para poblaciones
finitas, la utilizacin de estas tablas puede realizarse de diferentes modos.

Existen diferentes tablas de nmeros aleatorios (incluso en Excel mediante la funcin aleatorio o random se
puede aplicar) en el presente trabajo se utilizar como referencia la tabla de M. G. Kendall y B. Babington
64
Smith que se encuentra en el texto de tablas estadsticas, la misma est constituida por 4 bloques de 1000
nmeros aleatorios dispuestos en 25 filas y 40 columnas.

Veamos cmo se procede para la utilizacin de la tabla. Consideremos que se desea extraer de una poblacin
de tamao N una muestra de tamao n se selecciona el bloque, la fila y la columna de la tabla que se va a
comenzar, a partir de esta seleccin (que la hace el investigador) se toman tantas columnas como dgitos tiene
N. Comenzando por el primer nmero de las columnas seleccionadas se irn incluyendo en la muestra
aquellos individuos que en la lista de la poblacin ( ya sea de forma horizontal o vertical) ocupa la posicin
de los n nmeros de las columnas seleccionadas que resultan menores que N, en los caso que al seleccionar
un nmero en la tabla de nmeros aleatorios sea mayor que N se divide este por N y el resto de la divisin
que ser un nmero entre 0 y N-1 ser la posicin del individuo a seleccionar tomando el convenio de que el
resto 0 corresponde a la posicin N. Para la aplicacin de este procedimiento requiere que se fije previamente
el mayor mltiplo de N que se considerar, para as garantizar que todos los restos desde 0 a N -1 tengan la
misma probabilidad de ser seleccionados, por ejemplo si N = 150 y tomando 3 columnas se consideraran slo
aquellos nmeros menores o iguales que 900, los nmeros mayores que 900 no sern analizados en la
seleccin de la muestra.

Ejemplo: Dada la siguiente poblacin formada por la edad del hijo mayor de 200 ncleos familiares de una
cierta regin.

Seleccione una muestra aleatoria de tamao 10 (use la tabla de nmeros aleatorios, escoja la tercera fila,
tercera columna del segundo bloque de a 1000) numere la poblacin horizontalmente.

La siguiente tabla es una fraccin de la tabla completa:

48 49 50 51 50 46 47 56 47 38
53 50 47 46 48 47 48 46 46 50
42 51 51 49 47 51 48 47 42 49
46 48 50 47 48 47 51 56 45 49
45 54 61 46 48 46 46 47 50 34
46 46 51 39 53 55 52 49 47 46
33 40 52 46 44 52 44 54 41 33
48 49 52 42 42 49 47 47 38 48
44 43 44 40 44 45 49 44 43 42
49 49 48 41 51 51 52 42 40 47
37 48 45 46 50 45 47 53 43 47
44 40 46 46 45 48 47 42 47 46
52 53 47 49 46 47 49 42 43 42
43 38 52 50 44 52 44 53 43 45
41 57 47 48 52 53 40 49 40 50
45 42 44 53 57 46 62 47 50 47
45 51 43 45 39 39 41 44 35 41
65
54 48 51 53 54 42 48 51 37 38
42 37 52 50 45 55 51 46 38 43
53 43 42 39 46 52 53 39 51 40

Para extraer la muestra lo primero que hacemos es disponer tres columnas en las cuales la primera se
ubicarn los nmeros aleatorios, es decir los nmeros extrados de la tabla de nmeros aleatorios; en la
segunda columna pondremos los nmeros aleatorios rectificados que sern aquellos nmeros aleatorios
menores que N =200 y los restos de las divisiones de los nmeros aleatorios mayores que N =200 y menores
que el mayor mltiplo de N es decir 800 y en la tercera columna se encontrarn los valores de la muestra.

En la tabla de nmeros aleatorios la tercera fila, tercera columna del segundo bloque de a 1000 le
corresponde al nmero 3 pero como tenemos que coger el nmero aleatorio de tres dgitos el primer nmero
aleatorio sera el 017, los dems serian, 984, 955, 130, 850, 374, 665, 910, 288, 753, 765, 691, 496, 001,
hemos escogido 14 nmeros de la tabla de nmeros aleatorios debido a que hay 4 que son mayores que 800.

Veamos a continuacin como extraemos la muestra de la poblacin:
Para el primer nmero aleatorio 017 se busca en la poblacin el valor que ocupa la posicin 017 leda la
poblacin horizontalmente que sera la edad de 48 aos, el nmero aleatorio 984 no se contempla dentro del
anlisis ya que es mayor que 800, al igual que el nmero 955, el nmero 130, le corresponde la edad de 52
aos, al nmero 850 no se contempla dentro del anlisis, el 374 como es mayor que 200 se divide por 200 y
se obtiene reto 174 y este es el nmero aleatorio rectificado correspondindole la edad de 53 aos, al nmero
665 se divide por 200 y se obtiene resto 65 que es el nmero aleatorio rectificado correspondindole la edad
de 44 aos en la poblacin, a continuacin presentaremos la tabla de las tres columnas a la cual nos referimos
anteriormente como una va fcil y prctica para obtener la muestra deseada.

Nmero aleatorio Nmero aleatorio rectificado
muestra
017 017 48
984 --
955 --
130 130 42
850 --
374 174 53
665 065 53
910 --
288 088 44
753 153 44
765 165 39
691 091 49
496 096 51
001 001 48

Nota: obsrvese que en la muestra existen edades que se repiten esto puede pasar si el muestreo es con
reemplazo si el muestreo es sin reemplazo debemos seguir buscando de la misma manera en la tabla de
nmeros aleatorios seguido del nmero 001, hasta lograr tener la muestra con 10 valores de la poblacin no
repetidos.

Este muestreo se puede realizar utilizando Excel siguiendo los pasos siguientes:
1.- Se instala la opcin de anlisis de datos para ello se va a herramienta luego a complemento y se activa en
la ventana complemento la opcin herramienta para anlisis.
2.- Se abre una hoja Excel y se introducen los datos de la poblacin en columna.
3.- Se va a herramienta y se elige anlisis de datos y en esta ventana se selecciona la opcin muestra.
66
4.- En la ventana muestra se introduce el rango de entrada que sera seleccionar todos los valores de la
poblacin, si al suministrar en la hoja Excel los datos de la poblacin al inicio se le designan a estos alguna
variable o comentario debe activarse la opcin rtulo de lo contrario no debe ser activada, se activa la casilla
de muestreo aleatorio y se introduce el tamao de muestra deseado.
5.- Se selecciona el rango de salida que consiste en seleccionar una celda en la hoja Excel que no est
afectada por ninguna informacin ni hacia abajo ni a la derecha de la misma.
6.- Se selecciona aceptar en esta ventana y saldr el resultado deseado que sera las muestras elegidas por el
programa en la poblacin.

2.- El tamao de la muestra:
Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de unidades de
anlisis que se necesitan para conformar una muestra n?

Ms adelante se analizar la frmula para la determinacin del tamao de muestra.

6.1.2.2 Muestreo Sistemtico

Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo. Primero hay
que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una
constante, que se denomina coeficiente de elevacin K= N/n; donde N es el tamao del universo y n el
tamao de la muestra. Determinar en qu fecha se producir la primera extraccin, para ello hay que elegir al
azar un nmero entre 1 y K; de ah en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente,
es conveniente tener en cuenta la periodicidad del fenmeno.

Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin y queremos escoger
de esa poblacin un nmero ms pequeo el cual es la muestra, dividimos el nmero de la poblacin por el
nmero de la muestra que queremos tomar y el resultado de esta operacin ser el intervalo, entonces
escogemos un nmero al azar desde uno hasta el nmero del intervalo, y a partir de este nmero escogemos
los dems siguiendo el orden del intervalo.

6.1.2.3 Muestreo Estratificado

Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con
respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una
cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada
estrato se suele usar la tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la
prctica.

Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos
tcnicas de muestreo estratificado:

Asignacin proporcional.- El tamao de la muestra dentro de cada estrato es proporcional al tamao del
estrato dentro de la poblacin.

Asignacin ptima.- La muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad.
Para ello es necesario un conocimiento previo de la poblacin.

Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las opiniones de
hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta
homogeneidad. As, si la poblacin est compuesta de un 55% de mujeres y un 45% de hombres, se tomara
una muestra que contenga tambin esos mismos porcentajes de hombres y mujeres.

Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados con este
procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos
conocidos N
1
, N
2
,..., N
h
tal que las unidades en cada estrato sean homogneas respecto a la caracterstica en
cuestin. La media y la varianza desconocidas para el i-simo estrato son denotadas por m
i
y s
1
2
,
respectivamente.

67
6.1.2.4 Muestreo por Conglomerados

se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se supone que
contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la caracterstica a
elegir, pueden seleccionarse slo algunos de estos grupos o conglomerados para la realizacin del estudio.

Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las personas a
encuestar, y podra aplicrsele el instrumento de medicin a todas las unidades, es decir, los miembros del
grupo, o slo se le podra aplicar a algunos de ellos, seleccionados al azar. Este mtodo tiene la ventaja de
simplificar la recogida de informacin muestral.

Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la muestra,
el diseo se llama muestreo bietpico. Las ideas de estratos y conglomerados son, en cierto sentido,
opuestas. El primer mtodo funciona mejor cuanto ms homognea es la poblacin respecto del estrato,
aunque ms diferentes son stos entre s. En el segundo, ocurre lo contrario. Los conglomerados deben
presentar toda la variabilidad, aunque deben ser muy parecidos entre s.

6.1.3 Error de Muestreo
Es la diferencia entre el estadstico de una muestra y el parmetro de la poblacin correspondiente.

6.1.4 Distribucin Muestral de la Media
Es la distribucin de probabilidad de todas las posibles medias de las muestras de un determinado tamao
muestra de la poblacin. Adems es importante saber que las medias varan de muestra en muestra.

Desarrollemos el siguiente ejercicio de fcil entendimiento tomado del libro de Lind Marchall, Estadstica
aplicada a los negocios y a la Economa, pgina 271. (Revisar previamente combinaciones)

6.1.5 Teorema del Lmite Central
Si todas las muestras de un tamao en particular se seleccionan de cualquier poblacin, la distribucin
muestral de la media se aproxima a una distribucin normal. Esta aproximacin mejora con muestras ms
grandes.

El error estndar de la media o desviacin estndar de la distribucin muestral de medias es:
o
x
=
o
n

6.1.6 Aplicacin de la distribucin muestral de las medias
La mayora de decisiones tomadas en los negocios se basan en muestreos. Ejemplo:

Una compaa desea cerciorarse de que su detergente para lavandera contiene realmente 100 onzas
lquidas como indica la etiqueta. Los registros de los procesos de llenado indican que la cantidad
media por recipiente es de 100 onzas lquidas y que la desviacin estndar es de 2 onzas lquidas. A
las 10 de la maana el tcnico de control de calidad realiza la verificacin de 40 recipientes y
encuentra que la cantidad media por recipiente es de 99.8 onzas lquidas, Debe interrumpir el
proceso de llenado o el error de muestreo es razonable?

Para calcular el valor z cuando se desconoce la desviacin poblacional se aplica:

z =
x -p
o
n

68
6.2 Estimacin
6.2.1 Estimadores puntuales e intervalos de confianza de una media

Un estimador puntual es un estadstico calculado a partir de informacin de la muestra para estimar el
parmetro poblacional.

Intervalo de confianza es un conjunto de valores formados a partir de una muestra de datos de forma que
exista la posibilidad de que el parmetro poblacional ocurra dentro de dicho conjunto con una probabilidad
especfica. La probabilidad especfica recibe el nombre de nivel de confianza.

6.2.1.1 Desviacin estndar de la poblacin conocida

A partir del valor z y del error estndar de la media podemos calcular un intervalo de confianza para la media
poblacional con una conocida:

x _z
o
n

Para este intervalo el valor z define el nivel de confianza que se desee obtener, ese nivel de confianza debe
dividirse para 2 debido a que el intervalo tiene 2 lmites, uno inferior y otro superior.

Ejemplo:
El gerente de control de calidad de una fbrica de focos necesita estimar la vida promedio de un gran
embarque. Se sabe que la desviacin estndar del proceso es de 100 horas. Una muestra aleatoria de 50 focos
mostr una vida promedio de 350 horas.
Estime un intervalo de confianza del 95% de vida promedio real de los focos en este embarque
= 100 horas
x = 350 horas
n = 50 focos
x Zo
2

c
n

350 Z
0.025

100
50

350 1.96
100
7.07

350 1.96 (14.144)

(322.27; 377.72) La vida promedio real de los focos se encuentra entre 322.67 y 377.72 horas

6.2.1.2 Desviacin estndar poblacional desconocida
Cuando desconocemos la desviacin poblacional entonces aplicamos el siguiente distribucin conocida como
distribucin t student:
t =
x -p
s
n

Esto nos permite calcular el siguiente intervalo de confianza para la media con desviacin estndar
poblacional desconocida:
x _t
s
n

Para trabajar con el valor t se debe conocer el nivel de confianza deseado en el intervalo de confianza, ese
valor dividirlo para 2 segn el caso (depende de la tabla t) y buscar en la tabla de distribucin t.

Ejemplo:
Los siguientes datos son el nmero de kilmetros al ao que es manejado el automvil por una muestra de 25
propietarios de automviles:

69
26597 23873 23719 23471 22977

20700 22974 25048 26798 27147
29174 23815 16818 24352 20340
19405 29588 25620 19455 25566
32501 18091 22581 30104 29236

Construya un intervalo de confianza del 99% para estimar el nmero promedio de kilmetros al ao que es
manejado un automvil
x = 24398
s = 3972,98
n = 25
x to
2

s
n

24398 2.7969
3972.98
25

24398 2.7969
3972.98
5

24398 2.7969 (794.6)

(22175.58; 26620.42)

Entre 22175.58 y 26620.42 km al ao es manejado un vehculo.

6.2.2 Intervalo de confianza de una proporcin

Proporcin es una fraccin, razn o porcentaje que indica la parte de la muestra de la poblacin que posee un
rasgo de inters particular. La proporcin muestral viene dada por:

p =
x
n

Recordemos que es el porcentaje de xito en la distribucin binomial y p es similar al concepto de .

El intervalo de confianza para la proporcin de una poblacin es:

p _z
_
p(1 -p)
n

Ejemplo:
Supongamos que en el paralelo 35 de 42 alumnos aprueban el examen de estadstica. Estime un intervalo de
confianza para la proporcin de la poblacin del 5%.

p =
cxto
totuI
=
p
n

p =
35
42
= u.8S

0.831.96_
(0.83)(0.17)
42
=

0.83 1.96 u.uuSSS9

0.83 0.113595

(0.71; 0.94) es el intervalo de confianza para la proporcin, es decir que entre el 71% y 94% aprobaron el
examen, con un nivel de confianza del 95%.

70
6.2.3 Intervalo de confianza de una varianza

El intervalo de confianza para la varianza poblacional viene dado por:
_
(n -1)s
2
_
1-
u
2
2
;
(n -1)s
2
_

u
2
2
_
_
1-
2

_
1-
2

X
2
/2
X
2
1/2

Donde
2
se lee chi cuadrado o ji cuadrado y se trabaja con n-1 grado de libertad. Para hallar el valor se
aplica tabla chi cuadrada o en Excel con funcin estadstica distr.chi.

Grfico chi cuadrado de una y dos colas

Ejemplo:
Los siguientes datos representan las edades que tenan al momento de morir por enfermedad una muestra de
20 personas de un pueblo:

80 90 85 82 75 58 70 84 87 61
73 84 85 70 78 95 77 52 81 87

Hallar un intervalo de confianza del 95% para la varianza poblacional de la edad de muerte:

_
(2u -1)122.S7
_
0.975
2
;
(2u -1)122.S7
_
0.025
2
_

_
(2u -1)122.S7
S2.8S2S
;
(2u -1)122.S7
8.9u6S
_
(7u.62SS; 26u.Su7)
Si quisiramos encontrar un intervalo de confianza para la desviacin se le extrae la raz cuadrada a cada
valor.

71

6.2.4 Factor de correccin de una poblacin finita

Cuando el nmero de elementos de una poblacin es conocida se dice que la poblacin es finita y se debe
aplicar la siguiente frmula para ajustar los errores muestrales.

FPC =
_
N -n
N -1

Si se desea encontrar un intervalo de confianza para la media con desviacin desconocida y poblacin finita,
entonces tendramos:

x _t
s
n
_
N -n
N -1

6.2.5 Eleccin del tamao adecuado de una muestra
En la prctica una de las frmulas que se aplica para determinar el tamao de muestra para determinar el
comportamiento poblacional es la siguiente:

n =
z
2
Nn(1 -n)
c
2
(N -1) +z
2
n(1 -n)

Donde:
z : es el valor que obtiene de la tabla o en Excel a partir del nivel de confianza
N: poblacin conocida o finita
: probabilidad de xito (si no se conoce este valor se trabaja con 0.5)
e: error mximo permitido

72
UNIDAD 7: PRUEBA DE HIPTESIS

Objetivo:Analizarparmetrosmediantepruebasdehiptesisparasuvalidacinenlainferenciaestadstica.
Competenciasespecficas:
Capacidaddeplantearhiptesis
Validarunahiptesisdeunparmetroamanoyacomputadora
Plantearhiptesisensuprofesin
7.1 Definicin, elementos y Tipos de error

Se entiende por hiptesis afirmacin relativa a un parmetro de la poblacin sujeta a verificacin, puede
definirse como una proposicin cuya verdad o validez no se cuestiona en un primer momento, pero que
permite iniciar una cadena de razonamientos que luego puede ser adecuadamente verificada. As, un
razonamiento por hiptesis es aquel que comienza suponiendo la validez de una afirmacin, sin que sta
se encuentre fundamentada o sea universalmente aceptada.

Prueba de hiptesis.- Procedimiento basado en evidencia de la muestra y la teora de la probabilidad para
determinar si la hiptesis es una afirmacin razonable.

Elementos de una prueba de hiptesis.
a) Hiptesis Nula: H
o
(Queremos comprobar)
b) Hiptesis Alternativa: H
a
(Aceptaremos si rechazamos H
o
)
c) Z
c
valor crtico que determina validez o rechazo de hiptesis nula

Tipos de errores.

Decisin Ho es cierta Ho es falsa
Mantener Ho
Decisin acertada
Probabilidad (1 )
Error de tipo II
Aceptar H
o
cuando es falsa
Probabilidad ()
Rechazar Ho
Error de tipo I Rechazar H
o

cuando es verdadera
Probabilidad ()
Decisin acertada
Probabilidad (1-)

Si la probabilidad de cometer un error de tipo I est unvocamente determinada, su valor se suele denotar por
la letra griega , y en las mismas condiciones
Si la probabilidad de cometer un error de tipo I est unvocamente determinada, su valor se suele denotar por
la letra griega , y en las mismas condiciones, se denota por la probabilidad de cometer el error de tipo II,
esto es:

7.2 Pasos para probar una hiptesis:

1. Se establece la hiptesis nula (Ho).
2. Seleccione un nivel de significancia
3. Se establece el estadstico de prueba.
4. Se formula la regla de decisin
5. Se toma una decisin

73
7.3 Prueba de significancia de una y dos colas; y Valor p

Pruebas de una cola (a la izquierda):

Eo: 0 0o

Eo: 0 < 0o

Pruebas de una cola (a la derecha):

Eo: 0 0o

Eo: 0 > 0o

De manera ms especfica (sin olvidar el orden los grficos anteriores) la prueba de significancia de una cola
consiste en calcular un estadstico de prueba (z o t) y que ste valor sea mayor (en este caso) al valor crtico
hallado en la tabla o en algn software, de manera que la hiptesis nula no se rechace. La regin pintada es la
regin de rechazo y la otra regin es la de aceptacin. El nivel de confianza depende del investigador, el ms
comn es el 95%, el nivel de significancia en cambio es el complemento (5%) y se denota por la letra en
pruebas de una cola.
Si el estadstico de prueba cae en la regin de rechazo implica que se rechaza la hiptesis nula y se acepta la
alternativa.

Pruebas de dos colas:
Eo: 0 = 0o

Eo: 0 = 0o

La prueba de significancia de dos colas es similar al de una cola con la nica diferencia que en cada cola est
repartida el nivel de significancia (), es decir /2 se coloca en cada cola y lo que est dentro de stas reas
son las regiones de rechazo y lo interior es la regin de aceptacin. Recuerde: para que se rechace una
hiptesis nula el estadstico de prueba z debe ser mayor o estar dentro de la zona de rechazo, caso contrario
no se rechaza Ho.
74

Valor p.- Es la probabilidad de observar un valor muestral tan extremo o ms que el valor observado, si la
hiptesis nula es verdadera. Se lo encuentra a partir del estadstico de prueba y no a partir del nivel de
confianza, es decir el valor del estadstico de prueba lo busco en la tabla o en software. El siguiente grfico
muestra el valor p para una prueba de una cola, cuando la prueba es de dos colas entonces se suman ambos
valores p (probabilidad sombreada)

Interpretacin de la importancia de la evidencia en contra de Ho si el valor p es menor que:
a) 0.10, hay cierta evidencia de que Ho no es verdadera.
b) 0.05, hay evidencia fuerte de que Ho no es verdadera.
c) 0.01, hay evidencia muy fuerte de que Ho no es verdadera.
d) 0.001, hay evidencia extremadamente fuerte de que Ho no es verdadera.

Se debe tener en cuenta adems que si el valor p es menor que el nivel de significancia () entonces se
rechaza Ho, si es mayor que el nivel de significancia no se rechaza Ho.

Las pruebas de hiptesis planteadas en la presente gua tienen la siguiente forma:

7.4 Prueba de la media con desviacin poblacional conocida y desconocida

Prueba de hiptesis para cuando se conoce la desviacin poblacional (muestra grande)

Prueba de una cola
H
o
:
o
Ho:
o

H
a
: >
o
Ha: <
o

Prueba de dos colas
Ho: =
Ha: o
75

Estadstico de prueba
Z =
X -
cn

Ejemplo:
En los folletos de propaganda, una empresa asegura que las bombillas que fabrican tiene una duracin media
de 1600 horas. A fin de contrastar este dato, se tomo una muestra aleatoria de 100 bombillas, obtenindose
una Duracin media de 1570 horas, con una desviacin tpica de 120 horas. Puede aceptarse la informacin
de los folletos con un nivel de confianza del 95%?
Datos
n = 100
y = 1600
= 120 Ho: = 1600
= 95% Ha: 1600

z =
x -
s n

z =
1S7u -16uu
12u 1uu
= -2.S

Se rechaza la hiptesis nula, el estadgrafo de prueba se encuentra en la regin de rechazo, es decir, que la
duracin media de las bombillas es diferente a 1600 con un nivel de confianza del 95%.
Pruebas de hiptesis de la media poblacional con desviacin desconocida (Distribucin t Student)

Prueba de una cola
76
H
o
:
o
Ho:
o

H
a
: >
o
Ha: <
o

Prueba de dos colas
Ho: =
Ha: o


t =
-
sn

Ejemplo:
Se obtiene una muestra de 16 estudiantes con una x = 68 y una desviacin de 9 en un examen de estadstica.
Hay evidencia suficiente que apoye que la media poblacional de las calificaciones de estadstica es mayor de
70 con = 02
Datos
n = 16
y = 70
s= 9 Ho: 70
= 98% Ha: < 70
t =
x -
s n

t =
68 -7u
9 16
= -2.67
77

Se rechaza la hiptesis nula, el estadstico de prueba se encuentra en la regin de rechazo. es decir, la media
poblacional de calificaciones de estadstica es menor a 70 con un nivel de confianza del 98%.

7.5 Prueba de hiptesis de la proporcin

Prueba de una cola
H
o
: p
o
H
o
: p
o

H
a
: < p
o
H
a
: > p
o


Z =
p-a
_
a(1-a)
n

Prueba de dos colas

Ho: = p
0

Ha: p
0

78
Ejemplo:
En una muestra de 1000 nacimientos el numero de varones ha sido 542 Puede considerarse con un nivel de
significacin del 10% que en general nacen ms nios que nias?
E
0
: u.S
E
u
: > u.S
n = 1uuu
x= S42
n = u.S p =
542
1000
= u.S42

Z =
u.S42 -u.S
_
(u.S)(u.S)
1uuu
=
u.u42
_
u.2S
1uu
=
u.u42
u.uuu24
=
u.u42
u.u16
= 2.6S

Se rechaza la hiptesis nula, debido a que cae en la regin de rechazo, es decir se puede concluir que en
general nacen ms nios que nias en esa localidad con un nivel de confianza del 90%.

7.6 Error tipo II

Recordemos que la probabilidad de que se rechace la hiptesis nula cuando es verdadera es , y se llama
error tipo I, Tambin hay la probabilidad () de aceptar la hiptesis nula cuando en realidad es falsa (error
tipo II).

Con el fin de calcular la probabilidad de que esto ocurra es til considerar la probabilidad como el rea bajo
la distribucin muestral, con base en la media verdadera de la poblacin superpuesta a la distribucin
muestral supuesta en la hiptesis nula, y en la regin de no rechazo.

79
La probabilidad del error Tipo II se calcula asumiendo que la hiptesis nula es falsa, ya que sta se define
como la probabilidad de no rechazar una hiptesis nula falsa.

El procedimiento para calcular el error Tipo II, para un valor especfico de supuesto en H
0
es el siguiente:

1. Establecer la regin de no rechazo para H
0
, utilizando la media supuesta en H
0
y los datos del problema.
2. Usar la tabla z o Excel (spss) para determinar los puntos crticos correspondientes a (Z
c
),
3. Determinar los valores o valor de correspondientes a los valores crticos, utilizando la igualdad
x = Z
o
n
+
0

.

4. Dibujar la distribucin de la media verdadera (correspondiente a H
a
verdadera o H
0
falsa). (Vase figura
inferior)
5. Determinar los valores crticos correspondientes a los valores de , calculados en el paso 3.
igualdad
z
[
=
x -
u
o n

.

6. 6. Usar la tabla z o Excel (spss) para determinar el valor de .

Ejemplo:
Suponga que el sueldo de los profesionales administrativos por hora es de $5. Suponga que realiza una
muestra a 36 personas de algunas entidades pblicas y concluye que la media de las horas laboradas es de
$5.22 con una desviacin estndar de $.06. A un nivel de significancia de 0.01 puede concluirse que las horas
laborables de los profesionales administrativos es superior a $5?
X
z
X
80

Eo: S; Eo: > S
z =
x -
s n

z =
S.22 -S
u.6 S6
= 2.2

Conclusin: No se rechaza la hiptesis nula, es decir que no hay pruebas suficientes que indiquen que las
horas de trabajo de los profesionales administrativos son superiores a $5 con un nivel de confianza del 99%.

Si nos damos cuenta no rechazamos la hiptesis nula, lo que nos llevara a cometer tal vez un error tipo II
(Aceptar la hiptesis nula cuando en realidad es falsa)

Ejemplo: Cul es la probabilidad del error Tipo II si la hora/trabajo verdadero es de $5.10?

1. Distribucin de H
0
Verdadera y regin crtica.
2. z de tabla z o Excel (spss) correspondiente a un nivel de significancia de 0.01.
3. Clculo de:

x = Z
o
n
+
0

x = 2.S26
u.6
S6
+S = S.2S26

Se calcula con la media poblacional original (=5) y el valor resultante se reemplaza en la frmula del
numeral 4.

4. Distribucin de H
0
Falsa y ubicacin de .

5. Clculo de z

z
[
=
x -
u
o n

z
[
=
S.2S26 -S.1u
u. 6u S6
= 1.S26
81
6. El valor de (de tabla z, Excel o spss) es 0.9082, que es la probabilidad de cometer error tipo II.

Ejemplo: Cul es la probabilidad del error Tipo II si la hora/trabajo es de $5.50?

1. Distribucin de H
0
Verdadera y regin crtica.
2. z de tabla, Excel o spss correspondiente a . Cuyo valor crtico Zc es 2.326
3. Clculo de
x = Z
o
n
+
0

x = 2.S26
u.6
S6
+S = S.2S26

4. Distribucin de H
0
Falsa y ubicacin de .

5. Clculo de
z
[
=
x -
0
o n

z
[
=
S.2S26 -S.S
u.6u S6
= -2.674
6. El valor de (de tabla, Excel o spss) es 0.0035, esta es la probabilidad de cometer un error tipo II.

01 . 0 =
82

En los siguientes tres tems (7.7, 7.8 y 7.9) se pretende probar que cuando se obtienen muestras aleatorias de
dos poblaciones distintas, sus medias o proporciones de la poblacin son o no iguales. Veremos solo tres
casos:
7.7 Prueba de Hiptesis para dos muestras: Muestras independientes y desviaciones conocidas.
Supuestos:
Las dos muestras no deben estar relacionadas, es decir, deben ser independientes.
Debe conocerse la desviacin estndar para las dos poblaciones.

Prueba de hiptesis:

Prueba de una cola
H
o
:
1

2
Ho:
1

2

H
a
:
1
>
2
Ha:
1
<
2

Prueba de dos colas
Ho:
1
=
2
Ha:
1

2

Los grficos siguen la misma direccin anteriormente explicado.

Estadstico de prueba de dos medias de muestras independientes y desviaciones conocidas:

z =
x
1
-x
2
_
o
1
2
n
1
+
o
2
2
n
2

Ejemplo:
Se realiz un estudio para comparar las ventas de una industria durante dos aos: 2005 y 2006. Con un nivel
de significancia de .01 Podemos concluir que las ventas del ao 2006 son mayores a las del 2005?

83
Caracterstica 2005 2006

Media de la muestra (en miles) 25.6 30.4
Desviacin Estndar de la muestra (en miles) 2.9 3.6
Tamao de la muestra (empresas) 40 45

Paso 1:

H
o
:
2

1
H
a
:
2
>
1

Paso 2: Rechace H
0
si z > 2.33
Paso 3:

z =
Su.4 -2S.6
_
S.6
2
4S
+
2.9
2
4u
= 6.8

Paso 4: Como z = 6.80 > 2.33, H
0
se rechaza, es decir que las ventas en esa industria reportan mayor venta en
el ao 2006 con un nivel de confianza del 99%.

7.8 Prueba de proporciones de dos muestras

Prueba de hiptesis:

Prueba de una cola
H
o
:
1

2
Ho:
1

2

H
a
:
1
>
2
Ha:
1
<
2

Prueba de dos colas
Ho:
1
=
2
Ha:
1

2

Estadstico de prueba de dos medias de muestras independientes y desviaciones conocidas:

z =
p
1
-p
2
_
p
c
(1 -p
c
)
n
1
+
p
c
(1 -p
c
)
n
2

Proporcin conjunta:
p
c
=
X
1
+X
2
n
1
+n
2

Ejemplo:
Una muestra de 250 trabajadores casados indic que 22 faltaron ms de 5 das el ao pasado, mientras que
una muestra de 300 trabajadores solteros indic que 35 faltaron ms de 5 das. Utilice .05 de nivel de
significancia. Es ms probable que los trabajadores solteros falten ms que los trabajadores casados?

Si poblacin #1 = trabajadores solteros.

Prueba de una cola
H
o
:
1

2

H
a
:
1
>
2

84

p
c
=
SS +22
Suu +2Su
= u.1uS6

z =
u.1167 -u.u88
_
u.1uS6(1 -u.1uS6)
Suu
+
u.1uS6(1 -u.1uS6)
2Su
= 1.u99

El z crtico es 1.645, por lo que H
0
no se rechaza, es decir no hay pruebas suficientes de que la proporcin de
los trabajadores solteros falten ms de 5 das que la proporcin de trabajadores casados que tambin faltan
ms de 5 das al trabajo.

El valor p es: P{ z > 1.1} = 0.1357, como es mayor que el nivel de significancia entonces no rechazamos Ho.

7.9 Prueba de medias con desviaciones poblacionales desconocidas

La prueba de hiptesis es:

Prueba de dos colas

Eo: o
1
2
= o
2
2

Eo: o
1
2
= o
2
2

Estadstico de prueba:
F =
S
1
2
S
2
2

En esta prueba de hiptesis se trabaja con la distribucin F, se busca en la tabla F o Excel 8spss), en Excel
mediante la funcin: distr.f.inv (probabilidad /
2
; grados de libertad 1; grados de libertad 2)

Como la prueba es de dos colas, entonces hay que dividir el nivel de significancia para dos y con ese valor se
analiza.

Colin, agente de bolsa del Critical Securities, report que la tasa media de retorno en una muestra de 10
acciones de software fue 12.6% con una desviacin estndar de 3.9%. La tasa media de retorno en una
muestra de 8 acciones de compaas de servicios fue 10.9% con desviacin estndar de 3.5%. Para 0.05 de
nivel de significancia, Puede Colin concluir que hay diferencia en las variaciones de acciones de software y
de compaas de servicio?

Eo: o
s
2
= o
c
2

Eo: o
s
2
= o
c
2

85

F =
S
s
2
S
c
2
=
u.uS9
2
u.uSS
2
=
u.uu1S21
u.uu122S
= 1.2416

No se rechaza Ho, debido a que el estadstico de prueba no cae en la regin de rechazo, es decir no hay
pruebas suficientes que indiquen que existen diferencias entre las desviaciones de las dos acciones con un
nivel de confianza del 95%.

7.10 PruebaANOVA
La distribucin F tambin se usa para probar la igualdad de ms de dos medias poblacionales con una tcnica
llamada anlisis de variancia (ANOVA). Se requiere las siguientes condiciones:

La poblacin que se muestrea tiene una distribucin normal.
Las poblaciones tienen desviaciones estndar iguales
Las muestras se seleccionan al azar y son independientes

Pasos:
1.- Formule las hiptesis nula y alternativa:

Hiptesis nula: las medias de las poblaciones son iguales.

H
o
:
1
=
2
=
3
=

4

Hiptesis alterna: al menos una de las medias es diferente.

Ha: No todas las medias son iguales

Si no se rechaza la hiptesis nula se concluye que no hay diferencia en las medias para las diferentes
poblaciones. Si rechaza Ho se concluye que hay una diferencia en al menos un par de medias poblacionales,
pero en este punto no se sabe cual par o cuantos pares difieren.

2.- Seleccione el nivel de significancia.

3.- Determine el estadstico de prueba.

Estadstico de prueba: F = (variancia entre muestras) / (variancia dentro de muestras).

4.- Formule la regla de decisin.
Para esto es necesario tener el valor crtico de F, se lo obtiene teniendo en cuenta:

Grados de libertad en el numerador = k 1
86
Grados de libertad en el denominador = n - k

5.- Seleccione la muestra, realice los clculos y tome una decisin.
Se recomienda resumir todos los clculos en una tabla ANOVA para facilitar el clculo.

Fuente de variacin Suma de
cuadrados
Grados de
libertad
Media Cuadrtica F
Tratamientos SST k 1 SST/(k-1) = MST MST/MSE
Error SSE n k SSE/(n-k) = MSE
Total SSTotal n - 1

De la tabla anterior definamos:

Variacin total: Suma de las diferencias elevadas al cuadrado entre cada observacin y la media global.

SSIotol = (X -X
)
2

X: Cada observacin de la muestra
X
: Media global o total

Variacin aleatoria: Suma de las diferencias elevadas al cuadrado entre cada observacin y su media de
tratamiento.

SSE = (X -X
C
)
2

X
C
: Media muestral para el tratamiento c.

Variacin de tratamiento: Suma de las diferencias elevadas al cuadrado entre la media de cada tratamiento y
la media total o global.

SSI = SSIotol -SSE

Regla de decisin: , la hiptesis nula se rechaza si F (calculada) para un nivel de significancia es mayor que
F (en tablas) con grados de libertad en el numerador y en el denominador.

7.11 Prueba de bondad de ajuste: frecuencias esperadas iguales.

La prueba de Bondad de Ajuste es una de las pruebas estadsticas de uso ms comn. Se analizar el caso de
frecuencias esperadas iguales.

1.- Formule la hiptesis nula y alternativa.
La hiptesis nula es que no hay diferencia entre el conjunto de frecuencias observadas y el conjunto de
frecuencias esperadas.

La hiptesis alternativa es que hay diferencia entre los conjuntos observado y esperado de frecuencias. Si
rechaza Ho y acepta Ha, significa que las frecuencias observadas no se distribuyen de igual forma entre todas
las categoras.

2.- Seleccione el nivel de significancia.

3.- Seleccione el estadstico de prueba.
87
El estadstico de prueba sigue la distribucin ji cuadrada,

2
.

_
2
= _
(
o
-
c
)
2
c
_
Con k 1 grados de libertad, donde:

k es el nmero de categoras.
f
o
es una frecuencia observada en una categora particular.
f
e
es una frecuencia esperada en una categora particular.

4.- Formule la regla de decisin

5.- Calcule el valor de ji cuadrado y tome una decisin

Ejemplo:
La seora Patio es la gerente de marketing de un fabricante de tarjetas deportivas. Ella planea iniciar la
venta de una serie de fotografas y estadsticas de juegos de jugadores de ftbol que participaron en el ltimo
mundial. Uno de los problemas es la seleccin de jugadores. En una exhibicin de tarjetas de ftbol en el
Paseo Shopping el pasado fin de semana, instal un puesto y ofreci tarjetas de los siguientes seis jugadores:
Lionel Mesi, Diego Forln, Iker Casillas, Rafael Mrquez, Cristiano Ronaldo y Kak. Al final del da vendi
120 tarjetas. La seora Patio puede concluir que las ventas no son iguales por cada jugador?

El nmero de tarjetas vendidas es la siguiente:

Jugador Tarjetas vendidas
Lionel Messi 13
Diego Forln 33
Iker Casillas 14
Rafael Mrquez 7
Cristiano Ronaldo 36
Kak 17
Total 120

Desarrollo:

Eo: No boy Jicrcncio cntrc con]untos Jc rccucncios obscr:oJos y cspcroJos

Eo: Eoy uno Jicrcncio cntrc con]untos Jc rccucncios obscr:oJos y cspcroJos

7.12 Aplicacin en escel y spss

88

En la tabla chi cuadrada podemos darnos cuenta que con 5 grados de libertad el valor chi cuadrado crtico es
11.070, por lo tanto con un nivel de significacin del 0.05, se rechaza la Hiptesis nula y aceptar la hiptesis
alternativa. Es decir, las diferencias entre las frecuencias observadas y esperadas no se debe a la casualidad
sino que las diferencias son bastante grandes. Por lo que se concluye que es improbable que las ventas de
tarjetas sean las mismas entre los seis jugadores.

En la hoja de clculo podemos darnos cuenta que se hall el valor p que al ser menor que el valor alfa se
concluye que se rechaza la hiptesis nula.

La distribucin chi cuadrada puede cambiar de figura dependiendo del nmero de grados de libertas, adems
nunca toma valores negativos. Observemos el siguiente grfico (v son los diferentes grados de libertad):

89

.

90

Unidad VIII: REGRESIN LINEAL SIMPLE Y MLTIPLE

Objetivo: Analizar datos histricos o recopilados mediante un modelo de regresin lineal o mltiple para la
prediccin del comportamiento poblacional.

Predecir comportamiento de variables
Aplicar modelos de regresin simple en Excel y regresin mltiple en spss
Anlisis crtico de situacin empresarial actual y futura

8.1. Regresin Lineal Simple
8.1.1. Supuestos y elementos

El objetivo es analizar el grado de la relacin existente entre variables utilizando modelos matemticos y
representaciones grficas. As pues, para representar la relacin entre dos o ms variables desarrollaremos
una ecuacin que permitir estimar una variable en funcin de la otra.
Por ejemplo, en qu medida, un aumento de los gastos en publicidad hace aumentar las ventas de un
determinado producto?, cmo representamos que la bajada de temperaturas implica un aumento del
consumo de la calefaccin?,...
A continuacin, estudiaremos dicho grado de relacin entre dos variables en lo que llamaremos anlisis de
correlacin. Para representar esta relacin utilizaremos una representacin grfica llamada diagrama de
dispersin y, finalmente, estudiaremos un modelo matemtico para estimar el valor de una variable
basndonos en el valor de otra, en lo que llamaremos anlisis de regresin.

Supuestos:

1. Los valores de la variable independiente X son fijos, medidos sin error.
2. La variable Y es aleatoria
3. Para cada valor de X, existe una distribucin normal de valores de Y (subpoblaciones Y)
4. Las variancias de las subpoblaciones Y son todas iguales.
5. Todas las medias de las subpoblaciones de Y estn sobre la recta.
6. Los valores de Y estn normalmente distribuidos y son estadsticamente independientes
El modelo de regresin lineal simple es:
y = [
0
+[
1
x +e
Elementos:

y : variable dependiente

x : variable independiente

E(y) : [
0
+[
1
x es el componente determinstico (la ecuacin de una recta)
e : componente de error aleatorio
0
: ordenada al origen de la lnea, es decir el punto en el que la lnea intercepta el eje y.
[
1
: Pendiente de la lnea, es decir, magnitud del incremento (o decremento) del componente
determinstico de y por cada unidad de incremento en x.

8.1.2. Mtodo de Mnimos Cuadrados
Para poder estimar los parmetros
0
y
1
se aplicar el mtodo de mnimos cuadrados. Como se va a estimar
los parmetros mencionados, entonces la ecuacin de regresin lineal queda de la siguiente manera:

y = b
1
+bx
Las frmulas para encontrar los valores a y b son:

91
b
1
=
n xy -x y
n xi
2
-(xi)
2

b
0
= y -b
1
x

El presente tema se desarrollar con el siguiente ejemplo:

El Analista de una fbrica estadounidense de automviles querra desarrollar un modelo estadstico para
predecir el tiempo de entrega (los das entre la compra del automvil y la entrega real del mismo) de
automviles nuevos de fabricacin especial. El cree que hay relacin lineal entre las opciones del automvil
ordenado y su tiempo de entrega. Se selecciona una muestra aleatoria de 16 automviles; los resultados se
presentan a continuacin:

Automvil
Nmero de opciones
ordenadas X
Tiempo de entrega Y (en
das)
1 3 25
2 4 32
3 4 26
4 7 38
5 7 34
6 8 41
7 9 39
8 11 46
9 12 44
10 12 51
11 14 53
12 16 58
13 17 61
14 20 64
15 23 66
16 25 70
Total 192 748

a) Prepare un diagrama de dispersin.-
El diagrama de dispersin contribuye para conocer la tendencia de la relacin entre la variable
independiente y dependiente.

25
35
45
55
65
75
5 10 15 20 25
92
b) Suponiendo una relacin lineal, use el mtodo de mnimos cuadrados para calcular los coeficientes
de regresin b
1
b
0

y =
748
16
= 46.8
x =
192
16
= 12
b =
n xy -x y
n xi
2
-(xi)
2

b
1
=
16(1uS91) -(192)(748)
16 (2988) (192)
2

b
1
=
1662S6 -14S616
478u8 -S6864

b
1
=
2264u
1u994

b
1
= 2.u687

b
0=
y - b
1
x
b
0=
46.8 -2.u7 (12)
b
0=
21.92
y = 21. 9 +2. 7x

8.1.3. Interpretacin de la pendiente de la recta b
1
y prediccin

c) Interprete el significado de la pendiente b
1

Por cada auto adicional que se pida, la empresa se demora 2.07 das para entregarlo
d) Si se orden un automvil que tena 16 opciones Se puede predecir cuantos das se necesitarn para
su entrega?
Y
= h
+h
1
(x|)

= 21.96 +2.u7 (16)

= SS.u8

93
8.1.4. Error estndar de estimacin.-

e) Calcule el error estndar del estimador
Sxy =
_
y
2
- h

y - h
1
x. y
n -2

Sxy =
_
S8u26 (21.92S4)(748) - (2.u687)(1uS91)
16 -2

Sxy =
_
S8u26 -164uu.86 -2149S.86
14

Sxy =
_
129.9S
14

Sxy = S.u4
Este valor es la variabilidad alrededor de la lnea de regresin ajustada.

8.1.5. Coeficiente de correlacin y de determinacin.-

f) Calcule el coeficiente de determinacin r
2

SSR = h

Y| +h
1
X|Y| -
(Y|)
2
n

21.9254 (748) + 2.0687 (10391)
(748)
2
16

16400,19 + 21495,86
559504
16

16400,19 + 21495,86 34969 = 2927,76
SSE = Y|
2
h
Y| - h
1
X|Y|
38026 21.9254 (748) 2.0687 (10391)
38026 16400,19 21495,86 = 129,95

SST = SSR + SSE
r
2
=
SSR
SSI

2927,76
2927,76+129,95
= 0,9575
94
El coeficiente de determinacin, el 95.75% se puede explicar por la variabilidad por el nmero de opciones o
autos pedidos.
g) Calcule el coeficiente de correlacin
r = r
2
= u.9S7S = 0.9785 = 97,85%
El coeficiente de correlacin es igual a 97,85% lo que indica que existe una fuerte relacin entre las variables
Nmero de opciones ordenadas (autos) y el tiempo de entrega.

8.1.6. Prueba de hiptesis

h) Al nivel de significancia de 0.05 Hay relacin lineal entre las opciones y el tiempo de entrega?
E
0
: [
1
= u
E
u
: [
1
= u
t =
b
1
-[
1

Sb
1

Sb
1
=
Sxy
_
Xi
2
-
(xi)
2
n

2,S4
_
2988 -
(192)
2
16

2,S4
2988 - 2Su4

2,54
684
=
254
26,15
= u.u9711
t =
2,07 -0
0,09711
= 21,S1

Se rechaza la hiptesis nula debido a que el estadstico de prueba cae en la regin de
rechazo, es decir, que hay alguna relacin entre las variables das de entrega y #de pedidos
de autos con un nivel de confianza del 95%

95

8.1.7. Aplicacin en Excel y SPSS

8.2. Regresin Lineal Mltiple en spss
8.2.1. Ecuacin de regresin mltiple

Dispone de una ecuacin con dos variables independientes adicionales:

Se puede ampliar para cualquier nmero "m" de variables independientes:

Para poder resolver y obtener a, b1 y b2 en una ecuacin de regresin mltiple el clculo se presenta muy
tediosa porque se tiene atender 3 ecuaciones que se generan por el mtodo de mnimo de cuadrados:
96

Para poder resolver se puede utilizar programas informticos como SPSS, Minitab y/o Excel.

8.2.1.1. Error estndar de estimacin mltiple
El error estndar de la regresin mltiple S
xy.

Es una medida de dispersin la estimacin se hace ms precisa conforme el grado de dispersin alrededor del
plano de regresin se hace mas pequeo.
Para medirla se utiliza la formula:

Y: Valores observados en la muestra
y: Valores estimados a partir a partir de la ecuacin de regresin
n : Nmero de datos
m : Nmero de variables independientes

8.2.1.2. Coeficiente de determinacin mltiple
Mide la tasa porcentual de los cambios de Y que pueden ser explicados por x
1,
x
2 y
x
3
, simultneamente.

8.2.2. Evaluacin de supuestos
8.2.2.1. Linealidad
Existe una relacin lineal, es decir, existe una relacin directa entre la variable dependiente y el conjunto de
variables independientes.

8.2.2.2. Homoscedasticidad
La variacin en los residuos es la misma tanto para valores grandes como pequeos de y. En otras palabras,
(y -y) no est relacionada, ya sea que y sea grande o pequea.

8.2.2.3. Normalidad
Los residuos siguen la distribucin de probabilidad normal, recordemos que el residuo es la diferencia entre
(y -y). Estos residuos debern seguir de manera aproximada una distribucin normal. Adems, la media de
los residuos deber ser 0.

8.2.2.4. Multicolinealidad
Las variables independientes no debern estar correlacionadas, es decir, conviene seleccionar un conjunto de
variables independientes que no estn correlacionadas entre s.

8.2.2.5. Independencia
Los residuos son independientes, esto significa que las observaciones sucesivas de las variables dependientes
no estn correlacionadas. Esta suposicin con frecuencia se viola cuando se comprende el tiempo con las
observaciones meustreadas.

8.2.3. Regresin por pasos
Mediante el siguiente problema podremos ilustrar la aplicacin de Regresin Multiple:
En la Facultad de Ingeniera de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere
entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al
97
azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de
Datos y Programacin como se muestran en el siguiente cuadro.
Alumno PHP Algoritmos Base de Datos Programacin

1 13 15 15 13
2 13 14 13 12
3 13 16 13 14
4 15 20 14 16
5 16 18 18 17
6 15 16 17 15
7 12 13 15 11
8 13 16 14 15
9 13 15 14 13
10 13 14 13 10
11 11 12 12 10
12 14 16 11 14
13 15 17 16 15
14 15 19 14 16
15 15 13 15 10
Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada
en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Base de Datos y
Programacin.
Se presentara la siguiente ecuacin a resolver:

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los coeficientes de regresin o
utilizando Regresin de Anlisis de datos, en la Hoja de clculo de Excel podemos calcular tambin los
coeficientes de regresin:
98

Por lo tanto podemos construir la ecuacin de regresin que buscamos:

El Error Estndar de Regresin Mltiple
Mediante esta medida de dispersin se hace ms preciso el grado de dispersin alrededor del plano de
regresin, se hace ms pequeo.
Para calcularla se utiliza la formula siguiente:

En los resultados de Excel se llama error tpico y para explicar la relacin del aprendizaje de PHP que se
viene desarrollando es de 0.861
El coeficiente de determinacin mltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las variables mltiples, utilizando la
si siguiente formula:

IV.- CONCLUSIONES
El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las
asignaturas de Algoritmos, Base de Datos y Programacin.
99
Trabajo Autnomo

Cada ejercicio o problema debe ser resuelto en computadora (Excel o spss segn el caso) y a calculadora de
manera que se desarrolle competencias y agilidad en el desarrollo y anlisis de temas estadsticos.

Unidad 1: Introduccin a Estadsticas, Frecuencias y Grficas

1. Cul es el nivel de medicin de cada una de las siguientes variables?
a) Coeficientes intelectuales de los alumnos.
b) La distancia que viajan los estudiantes para viajar a clases.
c) Las calificaciones de los estudiantes en el primer examen de estadstica.
d) Una clasificacin de alumnos por fechas de nacimiento.
e) Una clasificacin de estudiantes que cursan primero, segundo, tercero o ltimo grado.
f) Nmero de alumnos que los alumnos estudian a la semana.

2. En los siguientes casos determine si el grupo representa una muestra o una poblacin.
a) Los participantes en el estudio de un nuevo frmaco contra el colesterol.
b) Los conductores que recibieron una multa por exceso de velocidad en la ciudad de Salinas en la ltima
temporada.
c) Beneficiarios del programa de asistencia social en Cook Country (Chicago), Illinois.
d) Las 30 acciones que forman parte del promedio industrial Dow Jones.

3. En un estudio de mercado, se pidi a 100 consumidores que seleccionaran el mejor reproductor musical
digital entre iPod, iRiver y Magic Star MP3. Con la finalidad de resumir las respuestas de los consumidores
en una tabla de frecuencias, Cuntas clases tendra la tabla de frecuencias?

4. Se pregunt a un total de 1.000 residentes de Minnesota qu estacin del ao preferan. Los resultados fueron
que: A 100 les gustaba ms el invierno; a 300, la primavera; a 400, el verano y a 200 el otoo. Si se
resumieran los datos en una tabla de frecuencias, Cuntas clases seran necesarias? Cules seran las
frecuencias relativas de cada clase? Presente los datos mediante una grfica de frecuencias de barras.

5. Se pregunt a 2.000 viajeros de negocios frecuentes de Midwestern qu ciudad de la regin central de
Estados Unidos preferan: Indianpolis, San Luis, Chicago o Milwaukee. A 100 les gustaba Indianpolis; a
450 San Luis; a 1.300 Chicago y el resto prefera Milwakee. Elabore una tabla de frecuencias y una tabla de
frecuencias relativas para resumir esta informacin. Presente la informacin con una grfica de pastel.

6. MARK S.A. produce y comercializa fundas de reposicin para telfonos celulares en una variedad de
colores. A la compaa le gustara circunscribir sus planes de produccin a 5 diferentes colores. La compaa
mont un quiosco en el Paseo Shopping por varias horas y pregunt a personas elegidas de forma aleatoria,
que color de fundas era su favorito. Los resultados fueron los siguientes:

Blanco Brillante 130
Negro Metlico 104
Lima Magntico 325
Naranja Tangerina 455
Rojo Fusin 286

a) Qu nombre recibe la tabla?
b) Elabore una grfica de barras para la tabla y una grfica de pastel.
c) Si Mark S.A. tiene planes de producir un milln de fundas para telfono celular, Cuntas de cada color
debera producir?

7. La siguiente tabla muestra informacin de una empresa de publicidad que posee 78 clientes en la Provincia
de Santa Elena. Presente los datos mediante una grfica de barras de frecuencia relativa y de pastel.

Salinas 12
La Libertad 45
Santa Elena 21
100

8. La siguiente distribucin de frecuencias muestra el nmero de millas de viajero frecuente, expresado en miles
de millas, de empleados Servi Plus durante el primer trimestre de 2007.

Millas de viajero
frecuente (miles)
Nmero de
empleados
0 a 3 5
3 a 6 12
6 a 9 23
9 a 12 8
12 a 15 2
Total 50
a) Cuntos empleados se estudiaron?
b) Cul es el punto medio de la primera clase?
c) Si un empleado recorre 3.000 millas frecuentemente, Dnde se agrupa la observacin? Explique.
d) Construya un histograma e interprete
e) Dibuje un polgono de frecuencias, Cules son las coordenadas de la marca correspondiente a la
primera clase?
f) Construya un polgono de frecuencias e interprete.
g) Interprete las millas de viajero frecuente acumuladas mediante un polgono de frecuencias
acumulativas.

9. A continuacin se muestra el nmero de minutos que le lleva a un grupo de estudiantes de la UPSE viajar en
automvil de su casa al trabajo.

28 25 48 37 41 19 32 26 16 23 23 29 36
31 26 21 32
25
31 43 35 42 38 33 28

a) Cuntas clases recomienda? Qu intervalo de clase sugiere? Cul sera el lmite inferior para la
primera clase?
b) Organice los datos en una distribucin de frecuencias.
c) Presente los datos en un polgono de frecuencias e interprete.

10. Los siguientes datos proporcionan las cantidades semanales que gasta en abarrotes una muestra de casas.

$271 $373 $159 $76 $227 $337 $50 $319 $250 $474 $278 $162 $434 $41 $335
279 116 205 100 279 151 266 240 199 279 297 295 232 123 320
192 429 181 294 321 570 309 342 246 177 235 170 188 303 325

a) Cuntas clases recomendara? Qu intervalo de clase sugerira?
b) Cul sera el valor del lmite inferior para la primera clase?
c) Organice los datos en una distribucin de frecuencias
d) Presente los datos mediante un histograma y polgono de frecuencias acumulativas. Interprete.

11. Usted tiene los registros de ventas mensuales de la boletera del ltimo ao en una sala de cine. Para
representar este conjunto de datos grficamente, construira usted un grfico de barras o un histograma?
Por qu es esa alternativa mejor que la otra? Utilizando los siguientes datos, construya el grfico que usted
seleccion e indique 3 interpretaciones en porcentajes.

12. Usted juega en un equipo local de ftbol, y durante los ltimos tres aos, ha registrado los goles marcados
por cada uno de los 12 jugadores del equipo. Es ms apropiado crear un grfico de barras o un histograma
para representar la situacin? Utilizando los siguientes datos, disee el grfico apropiado e indique 3
interpretaciones en porcentajes.
Mes Ene
ro
Febre
ro
Mar
zo
Abr
il
Ma
yo
Jun
io
Juli
o
Agos
to
Septiem
bre
Octu
bre
Noviem
bre
Diciem
bre
Vtas.bol
etos
25 30 15 20 30 35 40 20 25 15 20 30
101

13. En una epidemia de escarlatina, se ha recogido el nmero de muertos en 40 ciudades de un pas, obtenindose
la siguiente tabla:
No. de muertos 0 1 2 3 4 5 6 7
Ciudades 7 11 10 7 1 2 1 1
a) Representar grficamente estos datos mediante cualquier grfica.
b) Obtener la distribucin acumulada y representarla grficamente.

14. Las siguientes calificaciones corresponden al tercer perodo del ao 2009-2010 de la carrera de Ingeniera en
Marketing en la asignatura de Estadstica Aplicada.
a) En base a los datos, Debera construir una tabla de frecuencias o una distribucin de frecuencias?
b) Agrupe los datos (en bruto) en clases con sus respectivas frecuencias.
c) Encuentre las frecuencias relativas acumulativas.
d) Presente los datos mediante una grfica de barras de frecuencia relativa o un histograma de frecuencia
relativa. (Analice que tipos de datos han sido recopilados)
15. La tabla siguiente muestra la composicin por edad, sexo y trabajo de un grupo de personas con tuberculosis
pulmonar en la provincia de Vizcaya (Espaa) en el ao 1979:
a) Representar grficamente la distribucin de frecuencias de aquellas personas trabajadoras que padecen
tuberculosis.
b) Graficar la distribucin de frecuencias de los varones no trabajadores que padecen tuberculosis.
c) Graficar la distribucin de frecuencias del nmero total de mujeres que padecen tuberculosis.
d) Cul es la edad en la que se observa con mayor frecuencia que no trabajan los varones? Y las
mujeres? Determinar as mismo la edad ms frecuente (sin distincin de sexos ni ocupacin).
e) Por debajo de qu edad est el 50% de los varones? Por encima de qu edad se encuentra el 80% de
las mujeres?

Jugador 1 2 3 4 5 6 7 8 9 10 11 12
Goles anotados 12 3 24 6 19 12 10 17 4 22 16 8
47 73 68 76 60 35 10 41 46 90 65 61 77 10
0
90 19 72 64 83 56 73
66 78 79 79 94 84 88 94 72 10
0
78 86 73 9 61 36 89 84 68 49
Edad Trabajadores No trabajadores Totales
Varn Mujer Total Varn Mujer Total Varn Mujer Total
14-19 2 1 3 25 40 65 27 41 68
19-24 10 4 14 20 36 56 30 40 70
24-29 32 10 42 15 50 65 47 60 107
29-34 47 12 59 13 34 47 60 46 106
34-39 38 8 46 10 25 35 48 33 81
39-44 22 4 26 7 18 25 29 22 51
102

Unidad 2: Estadgrafos y anlisis de datos

1. Con los siguientes dos conjuntos de datos, ambos con tamao de muestra n=7. Calcule estadgrafos de
localizacin y de dispersin. Analice resultados

2. Un entrenador de pista debe decidir a cul de dos corredoras debe elegir para la prxima carrera de 100
metros planos. El entrenador basar su decisin en los resultados de 5 carreras entre las dos atletas realizadas
en un perodo de una hora con descanso de 15 minutos. Se registraron los siguientes datos en las 5 carreras
(en segundos):

Con base en los datos, A cul de las dos corredoras debe elegir el entrenador? Por qu?

b) Debera ser diferente la seleccin si el entrenador supiera que Kelly se cay al principio de la cuarta
carrera? Por qu? Adems, comente las diferencias entre los conceptos media y mediana como medidas de
tendencia central y su relacin con los literales a) y b).

3. El precio de un departamento sencillo en un da entre semana en diversos hoteles en Salinas fue:

a) Cul es el precio mediano de un departamento de hotel en Salinas? Cul es el precio medio?
b) Cul es la variabilidad de los precios de departamento en Salinas?
c) Qu provecho podra obtener el Gerente Marketing de un reconocido hotel de la localidad con esta
informacin?

4. Los ltimos 10 das de junio, el tren Costa Especial lleg tarde a su destino en los siguientes nmeros de
minutos (un nmero negativo significa que el tren lleg con anticipacin en ese nmero de minutos):
Si el ferrocarril lo contratara a Ud. Para conocer si el tren ofrece un buen servicio, Qu medidas de medicin
utilizara? Cul es la varianza?

5. Una compaa de exportacin de pecado desea conocer el promedio de ventas y costos durante sus ltimos
10 aos; de manera que el Departamento de Mercadeo establezca las estrategias para la crisis financiera del
pas. Los valores estn en miles de dlares.

a) Qu puede concluir sobre las ventas y costos de la compaa de acuerdo a su variabilidad?
b) Qu estrategias recomendara?Sus recomendaciones estaran soportadas sobre sus ventas o sus
costos?

Lote 1: 10 2 3 2 4 2 5
Lote 2: 20 12 13 12 14 12 15
Carrera
Atletas 1 2 3 4 5
Kelly 12.1 12.0 12.0 16.8 12.1
Tamara 12.3 12.4 12.4 12.5 12.4
14,50 21,00 11,00 13,50 9,00 12,50
12,00 10,50 12,40 11,80 12,20 13,00
-3 6 4 10 -4 124 2 -1 4 1
Ao 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Vtas.($) 200 150 160 170 200 220 250 250 300 320
Ctos.($) 140 130 135 140 145 150 170 190 180 185
103
6. Para estimar el suministro de agua que la comunidad de Falling Rock requerir en la siguiente dcada, el
alcalde pidi al administrador de a ciudad que determinara cunta agua utiliza una muestra de familias en
esos momentos. La muestra compuesta por 15 familias utiliz los siguientes galones (en miles) el ao
anterior:
11.2 21.5 16.4 19.7 14.6 16.9 32.2 18.2
13.1 23.8 18.3 15.5 18.8 22.7 14.0

a) Cul es la cantidad promedio de agua utilizada por familia? Cul la mediana? Cul el rango medio?
b) Supngase el alcalde espero que dentro de 10 aos haya en la ciudad 45.000 familias. Cuntos galones
de agua se requerirn al ao si la tasa de consumo por familia permanece igual?

7. Los gastos en publicidad constituyen un elemento significativo del costo de los artculos vendidos. Enseguida
aparece una distribucin de frecuencias que muestra los gastos en publicidad de 60 compaas fabricantes
ubicadas en el suroeste de USA. Calcule la media, mediana, moda y la desviacin estndar de los gastos de
publicidad. Determine la asimetra y curtosis de los datos. Interprete.

8. Una empresa mayorista distribuidora de aparatos elctricos desea estudiar sus cuentas por cobrar para dos
meses sucesivos. Se seleccionan dos muestras independientes de 50 cuentas para cada uno de los meses. Los
resultados son los que se resumen en la siguiente distribucin de frecuencias:

Monto f de marzo f de abril
0 a menos de 2 6 10
2 a menos de 4 13 14
8 a menos de 10 4 0
Totales 50 50

a) Calcule la media, mediana, moda y desviacin estndar para cada conjunto de datos. Interprete.
b) Ubique los estadgrafos respectivos en cada histograma de frecuencia.
c) Presente en un solo grfico los dos conjuntos de datos. (Sugerencia: Utilice Polgono de
frecuencias). Interprete.
d) Determine la asimetra y curtosis de los datos.

9. Una empresa distribuidora de combustible para calefaccin domstica desea comparar el tiempo requerido
para cobrar las facturas del combustible en dos ciudades. Se eligi una muestra aleatoria de 50 pagars de
Quito y 100 de Guayaquil, y se registr el nmero de das entre la fecha de entrega y la fecha de pago, y son
los que se muestran a continuacin:

Gastos en publicidad
(millones $)
Nmero de
compaas
25 a 35 5
35 a 45 10
45 a 55 21
55 a 65 16
65 a 75 8
Totales 60
Nmero de das f en Quito f en Gquil.
0-4 4 6
5-9 14 21
10-14 16 24
15-19 10 30
20-24 5 7
25-29 1 6
29-34 0 6
Totales 50 50
104

a) Calcule la media, mediana, moda y desviacin estndar para cada conjunto de datos. Interprete.
b) Ubique los estadgrafos respectivos en cada histograma de frecuencia
c) Determine la asimetra y curtosis de los datos.

10. La siguiente distribucin de frecuencias muestra los resultados de un censo realizado a una localidad y donde
se observa las edades de las personas con su frecuencia.

a) Calcule la media; mediana, moda y desviacin estndar. Determine si existe sesgo en los datos.
b) Grafique los datos en un histograma y localice los estadgrafos.

11. La siguiente tabla muestra el nmero de autos vendidos en los ltimos 24 meses en una concesionaria.

23 27 30 27 32 31 12 32 35 33 26 28
28 39 32 29 35 36 33 25 15 37 40 30

a) Dibuje un diagrama de puntos. Presente los datos en un diagrama de tallo y hojas.
b) Dibuje un diagrama de caja

12. La siguiente tabla muestra las visitas que 40 personas hacen a familias de una provincia. En la lista de abajo,
en orden de menor a mayor, aparece la cantidad de visitas de la semana pasada.

38 40 41 45 48 48 50 50 51 51 52 52 52 53 54 55 55 55 56 56
57 59 59 59 62 62 62 63 64 65 66 66 67 67 69 69 71 77 78 79

a) Realice un diagrama de tallos y hojas
b) Determine la cantidad mediana de llamadas. Determine el primer y noveno decil, el 33percentil.
c) Dibuje un diagrama de caja

13. El siguiente diagrama de tallo y hojas muestra el nmero de unidades producidas por da en una fbrica.

a) Cuntos das se registraron? Cuntas observaciones hay en la primera clase?
b) Cul es el valor mnimo y el valor mximo?
c) Elabore una lista de los valores reales de la cuarta fila.
d) Cuntos valores son menores que 70? Cuntos valores son mayores a 80 o ms? Cuntos valores
se encuentran entre 60 y 89, inclusive?
e) Cul es la mediana? Cul es el primer y tercer cuartil? Dibuje un diagrama de puntos y de caja.
Das f
0 4 6
5 9 30
10 14 22
15 19 18
20 24 14
25 29 10
30 34 6
3 8
4
5 6
6 0 1 3 3 5 5 9
7 0 2 3 6 7 7 8
8 5 9
9 0 0 1 5 6
10 3 6
105

Unidad 3: Introduccin a Probabilidad

1. Qu es probabilidad? Cite tres ejemplos para cada uno de los siguientes enfoques de la teora de
probabilidad:

9 Enfoque clsico a priori
9 Enfoque clsico de frecuencia relativa
9 Enfoque subjetivo

2. Si se lanza una moneda una vez, tres veces, diez veces, Cuntos resultados diferentes son posibles?

3. Si se lanza un dado una vez, dos veces, cuatro veces, Cuntos resultados diferentes son posibles?

4. Si se va a colocar en una repisa un grupo de seis libros de texto, pero solo hay lugar para cuatro de ellos En
cuntas formas se pueden colocar en el estante estos libros?

5. Si se va a colocar en una repisa un grupo de seis libros de texto, Cul es el nmero de formas en que se
pueden colocar los seis libros?

6. Un jardinero dispone de siete surcos en su hortaliza para sembrar tomates, berenjenas, pimientos, pepinos,
frjoles, lechugas y calabazas. A cada verdura se le asignar un solo surco. De cuntas formas puede colocar
estas verduras en su jardn?

7. Los cinco individuos que componen la direccin de una pequea empresa manufacturera sern sentados
juntos en un banquete. Determinar el nmero de diferentes posiciones posibles de los asientos para los cinco
individuos.

8. En relacin al ejemplo anterior, supongamos que slo a tres de los cinco directivos se les pedir representar a
la compaa en el banquete. Cuntas diferentes posiciones sern posibles en la mesa considerando que
pueden ser elegidos tres cualesquiera de los cinco individuos?

9. Una trifecta en el hipdromo local consiste en seleccionar el orden correcto de llegada de los tres primeros
caballos en la novena carrera, Si en la novena carrera de hoy compiten 12 caballos Cuntos resultados para
la trifecta hay?

10. La gerente marketing de una tienda de ropa para damas desea determinar la relacin entre el tipo de clientes y
la forma de pago. Ha recopilado la siguiente informacin:

a) D un ejemplo de evento simple
b) D un ejemplo de un evento compuesto
c) Cul es el complemento del pago de contado?
d) Por qu es un evento compuesto el cliente habitual que paga de contado?
e) Dibuje el diagrama de Venn

11. Para curar una enfermedad se ha aplicado un nuevo tratamiento a una serie de individuos, obtenindose los
resultados reflejados en la tabla.

Pago
Clientes Pago a crdito Pago de contado
Habituales 70 50
No habituales 40 40
Curados C No Curados NC
Tratamiento Nuevo TN 60 21
Tratamiento Antiguo TA 43 36
106

a) Se ha curado Qu tipo de evento es? Por qu?
b) La persona se ha curado con el tratamiento Nuevo? Qu tipo de evento es? Por qu?
c) Dibuje el diagrama de Venn

12. De 39 alumnos de una clase, 16 alumnos escogieron como idioma el francs y 27 el ingls. Nueve alumnos
eligieron ambos idiomas y el resto no escogi ninguno de ellos.

a) Escriba los eventos simples y dos eventos compuestos
b) Con la informacin dada construya un diagrama de Venn
c) Presente los datos en una tabla de contingencia

13. La asociacin de estadstica de una universidad estatal grande deseara determinar si hay una relacin entre el
inters de un estudiante en la estadstica y su habilidad para las matemticas. Se selecciona una muestra
aleatoria de 200 estudiantes y se les pregunta si su habilidad para las matemticas e inters en las estadsticas
es bajo, promedio o alto. Los resultados fueron los siguientes:

a) Cite tres ejemplos de eventos simples
b) Cite tres ejemplos de eventos compuestos

14. En una amplia rea metropolitana se seleccion una muestra de 500 entrevistados para determinar diversas
informaciones relacionadas con el comportamiento del consumidor. Entre las preguntas realizadas se
encontraba: Disfruta ir de compras? De 240 hombres; 136 contestaron que si. De 260 mujeres; 224
contestaron que si.

a) Elabore una cruzada y un diagrama de Venn para evaluar las probabilidades.
b) Escriba un ejemplo de evento simple y de evento compuesto
c) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria: Sea hombre?,
Disfrute ir de compras?
d) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria: Sea mujer? No
disfrute ir de compras?
e) Qu probabilidad hay de que un entrevistado seleccionado al azar: Sea mujer y disfrute ir de
compras? Sea hombre y no disfrute ir de compras?
f) Qu probabilidad hay de que un entrevistado seleccionado al azar Sea hombre y disfrute ir de
compras?
g) Supngase que el entrevistado seleccionado sea mujer: Cul es entonces la probabilidad de que no
h) Supngase que el entrevistado disfruta ir de compras Cul es entonces la probabilidad de que sea
un hombre?
i) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea mujer o disfrute
ir de compras?
j) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea hombre o no
k) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea hombre o mujer?

15. De 250 empleados de una compaa tabacalera, un total de 130 personas fuman. Hay 150 hombres trabajando
en esa compaa; 85 de ellos fuman.

Habilidad para las matemticas
Inters en la estadstica Bajo Promedio Alto
Bajo 60 15 15
Promedio 15 45 10
Alto 5 10 25
107
a) Elabore una cruzada y un diagrama de Venn para evaluar las probabilidades.

b) Escriba un ejemplo de evento simple y de evento compuesto
c) Cul es la probabilidad de que el empleado seleccionado en forma aleatoria: Sea hombre?, Fume?
d) Cul es la probabilidad de que el empleado seleccionado en forma aleatoria: Sea mujer? No fume?
e) Qu probabilidad hay de que un empleado seleccionado al azar: Sea mujer y fume? Sea hombre y
no fume?
f) Qu probabilidad hay de que un empleado seleccionado al azar: Sea mujer y no fume?
g) Supngase que se conoce a una empleada de la compaa: Cul es entonces la probabilidad de que
no fume?
h) Supngase que se conoce a un empleado de una compaa: Cul es entonces la probabilidad de que
fume?
i) Cul es la probabilidad de que un empleado seleccionado en forma aleatoria sea hombre o fume?
j) Cul es la probabilidad de que un empleado seleccionado en forma aleatoria sea mujer o no fume?
k) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria fume o no?

Ingresar a la Biblioteca Virtual de la UPSE y mediante la direccin que aparece en la pgina 5, seleccione el
texto Matemticas Probabilidades y resuelva:

16. Ejercicios: 1, 2 (pgina 20)
17. Ejercicios: 1, 3 y 6 (pgina 36)
18. Ejercicios: 1 (pgina 40) y 2 (pgina (41)

Regla Multiplicativa.-

19. En una papelera hay en exhibicin 20 marcadores. Seis de ellos son rojos y 14 azules. Se tienen que
seleccionar, al azar, dos marcadores del grupo de 20. Cul es la probabilidad de qu ambos marcadores
escogidos sean rojos? (supngase que se realiza primero un muestreo sin reposicin y luego un muestreo con
reposicin)
20. En un recipiente hay dos tubos defectuosos y cinco buenos. Se seleccionan, al azar, dos tubos del depsito,
sin reposicin.

a) Cul es la probabilidad de que ambos tubos sean defectuosos?
b) Cul es la probabilidad de que el primer tubo seleccionado sea defectuoso y que el segundo sea
bueno?

21. Una caja con nueve guantes de bisbol contiene dos para jugadores zurdos y siete para derechos.

a) Se seleccionan al azar dos guantes de la caja, sin reposicin y luego con reposicin, Cul es la
probabilidad de que:
a.1 ambos guantes seleccionados sean para jugadores derechos?
a.2 se escogiera un guante para jugador derecho y uno para zurdo?
b) Si se seleccionan 3 guantes, Cul es la probabilidad de que los 3 sean para jugadores zurdos?

22. Un nfora que contiene veinte nombres, cinco nombres de hombres y quince de mujeres.

a) Si se seleccionan dos nombres del nfora, sin reposicin, Cul es la probabilidad de qu:
a.1 Los nombres seleccionados sean de mujeres?
a.2 El primer nombre sea de un hombre y el segundo de una mujer?
a.3 El primer nombre seleccionado sea el de una mujer y el segundo de un hombre?

b) Compare las respuestas de a.1 y a.2. Existe alguna diferencia? Por qu?

rboles de decisin.-

23. Represente mediante un rbol de decisin la siguiente tabla de contingencia para variables del color de la
cara de naipes. Defina como Evento A (Es As) y como evento B (Es negro)
108

24. Represente mediante un rbol de decisin la siguiente tabla cruzada para cocina moderna y bao moderno de
una encuesta realizada a 233 familias. Defina como evento A (Existencia de cocina moderna) y como evento
B (Existencia de bao moderno)

25. Una encuesta poltica realizada entre 1.500 votantes registrados del estado de Nueva York produjo la
siguiente calificacin, de acuerdo a la afiliacin partidaria sindical. Represente la informacin mediante un
rbol de decisin con sus respectivas probabilidades.
Sindicalizados
Afiliacin partidaria Si No Desempleados
Demcrata 371 19 208
Independiente 263 88 93
Republicano 89 222 147

Rojo Negro
As 2 2
No es as 24 24
Existencia de bao moderno Carencia de bao moderno
Existencia de cocina moderna 72 8
Carencia de cocina moderna 7 146
109

Unidad 4: Variables aleatorias discretas

1. Con las siguientes distribuciones de probabilidad:

Distribucin C Distribucin D
x P(x) X P(x)
0 0.20 0 0.10
1 0.20 1 0.20
2 0.20 2 0.40
3 0.20 3 0.20
4 0.20 4 0.10

a) Calcule la media para cada distribucin.
b) Calcule la desviacin estndar para cada distribucin.
c) Compare los resultados.

2. Con los registros de la compaa de los ltimos 500 das hbiles, el gerente de Silverman Motors, una
distribuidora suburbana de automviles, ha resumido en la siguiente tabla los automviles vendidos cada da:

Nmero de
automviles
vendidos por da
0 1 2 3 4 5 6 7 8 9 10 11 Total
Frecuencia de
ocurrencia
40 100 142 66 36 30 26 20 16 14 8 2 500

a) Elabore la distribucin de probabilidad para la variable aleatoria discreta X, el nmero de automviles
vendidos por da.
b) Calcule la media o cantidad esperada de venta de automviles por da.
c) Calcule la desviacin estndar.
d) Cul es la probabilidad de que vendan en determinado da:
1) Menos de cuatro automviles
2) Cuando ms cuatro automviles
3) Por lo menos cuatro automviles
4) Ms de cuatro automviles

3. Se lanza dos veces una moneda balanceada y se observa el nmero y de caras. Calcule la distribucin de
probabilidad para y. Grafique un histograma de frecuencia relativa terica para y.

4. El director de sistemas de una fbrica pequea de computadoras personales cree que la distribucin de
probabilidad discreta que se muestra en la siguiente figura caracteriza a y, el nmero de PC nuevas que la
empresa arrendar el siguiente ao.

a.- Muestre la distribucin de probabilidad en forma tabular.
110
b.- Qu probabilidad hay de que se arrendarn exactamente 9 PC? De que se arrendarn menos de 12 PC?

5. Sea X una variable aleatoria discreta cuya funcin de probabilidad es:

X 0 1 2 3 4 5
P(X) 0.1 0.2 0.1 0.4 0.1 0.1

a) Calcular y representar grficamente la funcin de distribucin.
b) Calcular las siguientes probabilidades:
1) p (X < 4.5)
2) p (X 3)
3) p (3 X < 4.5)

texto Probabilidad Problemario y resuelva:

6. Ejercicios: 1, 2, 4 y 5 (pgina 11)



9. En los siguientes literales encuentre la probabilidad respectiva:
a) Si n= 4 y p=0.12, entonces P(x=0)= ?
b) Si n=10 y p=0.40, entonces P(x=9)= ?
c) Si n=15 y p=0.50, entonces P(x=8)= ?
d) Si n= 9 y p=0.90, entonces P(x=9)= ?

10. La probabilidad de que un paciente no se recupere de una operacin en particular es 0.1.

a) Cul es la probabilidad de que exactamente dos de los siguientes ocho pacientes que sufran esta operacin
no se recuperen?
b) Cul es la probabilidad de que slo un paciente de los ocho no se recupere?

11. En base a experiencias pasadas, el 7% de todos los comprobantes de gastos de almuerzos estn equivocados.
Si se selecciona una muestra aleatoria de cinco comprobantes Cul es la probabilidad de que:
a) exactamente uno est equivocado?
b) por lo menos dos estn equivocados?
c) no ms de dos estn equivocados?

12. Se sabe que el 30% de las piezas defectuosas en un proceso de manufactura pueden quedar bien mediante un
trabajo de reprocesado.

a) Cul es la probabilidad de que en un lote de seis piezas defectuosas se puedan reprocesar satisfactoriamente
por lo menos tres de ellas?
b) Cul es la probabilidad de que ninguna de ellas se pueda reprocesar?
c) Cul es la probabilidad de que todas se puedan reprocesar?

13. En base a experiencia anterior, la impresora principal del centro de cmputo de cierta universidad funciona
adecuadamente el 90% del tiempo. Si se hace una muestra aleatoria de 10 inspecciones.

a) Cul es la probabilidad de que la impresora principal funcione en forma apropiada:
1.- Exactamente nueve veces?
2.- por lo menos nueve veces?
3.- cuando ms nueve veces?
4.- ms de nueve veces?
5.- menos de nueve veces?
b) Cuntas veces se puede esperar que funcione en forma apropiada la impresora principal?
111


14. Ejercicios: 1, 2, 3, 4 y 6 (pgina 15)

15. Ejercicios: 15 y 16 (pgina 12)


17. Determine lo siguiente:
a) Si N=10, r=5; n=4, entonces P(y=3) es?
b) Si N= 6, r=3; n=4, entonces P(y=1) es?
c) Si N= 5, r=3; n=3, entonces P(y1) es?

18. Determine la distribucin de probabilidad, la media y varianza de las siguientes variables aleatorias
hipergeomtrica:

a) Si N=12, r=5; n=3
b) Si N=8, r=3; n=2

19. El decano de la Facultad de Ciencias Administrativas desea crear un comit ejecutivo de cinco personas
seleccionadas entre los 40 miembros de la facultad. La seleccin debe ser aleatoria y en la facultad hay ocho
miembros de la carrera de Ingeniera en Marketing.
a) Cul es la probabilidad de que en el comit haya
1) ninguno de marketing?
2) al menos uno de marketing?
3) no mas de uno de marketing?
b) Cuntos miembros de la carrera de marketing se podra esperar que participen?

20. Con base en datos suministrados por el Departamento de Salud y Recursos Humanos de Estados Unidos, se
estima que uno de cada cinco trasplantes de rin falla en menos de un ao. Suponga que exactamente 3 de
los siguientes 15 trasplantes de rin fallarn en menos de un ao. Considere una muestra aleatoria de tres de
estos 15 pacientes.

a) Calcule la probabilidad de que los tres trasplantes muestreados fallen en menos de un ao.
b) Calcule la probabilidad de que por lo menos uno de los tres trasplantes muestreados fallen en menos de un
ao.

21. De un inventario de 48 automviles que se embarcan a distribuidores locales, 12 tienen instalados radios
defectuosos.

a) Cul es la probabilidad de que cierto distribuidor reciba ocho automviles y:
1) todos tengan radios defectuosos?
2) ninguno tenga radio defectuoso?
3) por lo menos uno tenga el radio defectuoso?

b) Cuntos automviles con radios defectuosos se esperara recibir?

22. La Direccin de la carrera de Ingeniera en Marketing desea estimar el porcentaje de estudiantes que fuman
cigarrillos durante el receso de clases en el horario nocturno. En la carrera existen 450 alumnos, se sabe por
estudios anteriores que el 30% fuma y se decide realizar una encuesta piloto a 100 estudiantes. Si Ud. es
designado como parte del equipo estadstico, determine:

a) La probabilidad de que diez alumnos fumen en el receso nocturno.
b) La probabilidad de que treinta alumnos fumen.
c) Cul es el promedio de estudiantes que se esperan fumen?

112

Unidad 5: Variables Aleatorias Continuas




3. Supongamos que X es una variable aleatoria que se distribuye segn una distribucin N con media = 70 y
varianza = 36. Calcular:

a) P (x 80); P (x 89); P (x < 75)

b) P (x > 80); P (x > 89); P (x 75)

c) P (x 60); P (x 65); P (x 50)

d) P (x > 60); P (x > 65); P (x > 50)

e) P (75 < x 80); P (80 < x 90); P (70 < x 80)

f) P (60 < x 70); P (55 < x 65); P (45 < x 50)

g) P (50 < x 90); P (60 < x 80); P (60 < x 85)

4. Supongamos que Z es una variable aleatoria que se distribuye segn una distribucin N(0, 1). Calcular:

a) P (z 1.47); P (z 1.9); P (z < 2.9)

b) P (z > 1.47); P (z > 2.8); P (z 0.5)

c) P (z 1.47); P (z 1.95); P (z 0.7)

d) P (z > - 1.47); P (z > - 3.0); P (z > - 1.02)

e) P (0.45 < z 1.47); P (1.45 < z 2.47); P (1.5 < z 1.6)

f) P (1.47 < z 0.45); P (1.7 < z 0.1); P (2.47 < z 1.45)

g) P (-1.47 < z 0.45); P (-1.71 < z 1.5); P (-2.33 < z 2.33)

5. Halle el valor de z para cada probabilidad, ejemplo: P (z > z
o
) = 0.05, entonces z
o
= ?

a) p = 0.75; p = 0.63; p = 0.99; p = 0.80

b) p= 0.25; p = 0.49; p = 0.10; p = 0.05

c) P (z > z
o
) = 0.05; P (z > z
o
) = 0.40; P (z > z
o
) = 0.90

d) P (z < z
o
) = 0.80; P (z < z
o
)= 0.20; P (z < z
o
) = 0.10


113


9. Se supone que los resultados de un examen siguen una distribucin normal con media 78 y varianza 36. Se
pide:
a) Cul es la probabilidad de que una persona que se presenta el examen obtenga una calificacin
superior a 72?
b) Si se sabe que la calificacin de un estudiante es mayor que 72 cul es la prioridad de que su
calificacin sea, de hecho, superior a 84?

10. Las precipitaciones anuales en una regin alcanzan, de media, los 2000 mm, con una desviacin tpica de
300mm. Calcula, suponiendo que siguen una distribucin normal, la probabilidad de que en un ao
determinado la lluvia:

a) No supere los 1200 mm
b) Supere los 1500 mm.
c) Est entre 1700 y 2300 mm.

11. Un profesor de matemticas ha observado que las notas obtenidas por sus alumnos en los exmenes de
Estadstica siguen una distribucin N (6; 2,5). Se han presentado al ltimo examen 32 alumnos, cuntos
sacaron al menos un 7?

12. Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por la experiencia de pruebas
anteriores, se sabe que las puntuaciones siguen una distribucin normal de media 80 y desviacin tpica 25.
Qu porcentaje de candidatos obtendr entre 75 y 100 puntos?

13. El tiempo necesario para dar servicio a un automvil en la estacin de servicios Miller est distribuido
normalmente con media = 4.5 minutos y desviacin estndar = 1.1 minutos.

a) Cul es la probabilidad de que un automvil seleccionado aleatoriamente requiera ms de 6 minutos de
servicio o menos de 5?
b) Cul es el tiempo de servicio de modo que slo el 5% de todos los automviles requieran ms tiempo?

14. La distribucin de la demanda (en nmero de unidades por unidad de tiempo) de un producto a menudo
puede aproximarse con una distribucin de probabilidad normal. Por ejemplo, una compaa de
comunicacin por cable ha determinado que el nmero de interruptores terminales de botn solicitados
diariamente tiene una distribucin normal con una media de 200 y una desviacin de 50.
a) En qu porcentaje de los das de demanda ser de menos de 90 interruptores?
b) En qu porcentaje de los das de demanda estar entre 225 y 275 interruptores?
c) Con base en consideraciones de costes, la compaa ha determinado que su mejor estrategia consiste en
producir una cantidad de interruptores suficiente paras atender plenamente la demanda en 94% de todos los
das. Cuntos interruptores terminales deber producir la compaa cada da?




18. Ejercicios: 13 (pgina 42) y 14 (pgina 43)

114

Unidad 6: Muestreo y Estimacin

1. Suponga que un centro de cmputo regional desea evaluar el desempeo de su sistema de memoria en disco.
Una medida del desempeo es el tiempo medio entre fallas de su unidad de disco. A fin de estimar este valor,
el centro registr el tiempo entre fallas para una muestra aleatoria de 45 fallas de la unidad de disco. Se
obtuvo:
y=1.762 horas y =215 horas
Estime el verdadero tiempo medio entre fallas con un intervalo de confianza de 90%.

2. Queremos estimar la diferencia entre los salarios inciales medios de graduados recientes en Ingeniera en
Sistemas e Ingeniera en Desarrollo Comunitario de la UPSE. Se cuenta con la siguiente informacin:

* Una muestra aleatoria de 59 salarios inciales de graduados en Ingeniera en Sistemas de la UPSE arroj
una media de muestra de $3.267 y una desviacin estndar de 5443.
* Una muestra aleatoria de 30 salarios inciales de graduados en Ingeniera en Desarrollo Comunitario de la
UPSE arroj una media de muestra de $2.746 y una desviacin estndar de $428.

3. El departamento de informtica de la UPSE realiza un informe cada ao de las computadoras que tienen
algn defecto de manera que se pueda proyectar la compra de nuevos equipos para el ao lectivo venidero.
En el ao 2007 se realiz una muestra a 12 computadoras de las cuales dio como resultado una media de 7
mquinas defectuosas con una desviacin de 1.02. En el ao 2008 se muestre a 25 mquinas con una media
de 15 equipos con defectos y una desviacin de 2.05. Establezca un intervalo de confianza de 95% para la
diferencia entre las medias de computadoras con defectos en la UPSE. Intrprete e intervalo.







9. Resolver ejercicios propuestos en el texto gua de Lind Marchall: pginas: 309, 312 y 314.

115

Unidad 7: Pruebas de Hiptesis


1. Ejercicios: 1, 2, 3 y 4 (pgina 85)



4. Ejercicios: 10, 12 y 13 (pginas 88 y 89)

5. Analice las siguientes pruebas estadsticas sobre proporciones:

a) E
0
: p = u.6
E
u
: p = u.6 = u.6S, n = 1uu, y = u.u1

b) E
0
: p = u.29
E
u
: p = u.29 = u.26, n = 9u, y = u.u1

c) E
0
: p = u.S6
E
u
: p < u.S6 = u.S4, n = 6Su, y = u.uS

d) E
0
: p = u.2
E
u
: p > u.2 = u.24S, n = 4uu, y . = u.u1

e) E
0
: p = u.SS
E
u
: p < u.SS, = 17S, n = Suu, y . = u.uS

f) E
0
: p = u.2
E
u
: p. u.2, = 2SS, n = 1uuu, y . = u.u2

6. Un manufacturero de juguetes Tailands reclama que solo un 10% de los osos de juguete hechos para hablar
estn defectuosos. Cuatrocientos de estos juguetes se sometieron a prueba de forma aleatoria y se encontr
que 50 estaban defectuosos. Pruebe el reclamo del manufacturero con un nivel de significacin del 5%.

7. Una agencia de empleos afirma que el 80% de todas las solicitudes hechas por mujeres con nios prefieren
trabajos a tiempo parcial. En una muestra aleatoria de 200 solicitantes mujeres con nios, se encontr que
110 prefirieron trabajos a tiempo parcial. Pruebe la hiptesis de la agencia con un nivel de significancia de
5%.

8. Nacionalmente, un 16% de los hogares tiene una computadora personal. En una muestra aleatoria de 80
hogares en Baltimore, solo 13 posean una computadora personal. Con un nivel de significancia de 5%,
pruebe si el porciento de hogares en Baltimore que tienen computadoras personales es menor que el
porcentaje nacional.

9. Se requiere determinar si la proporcin de personas que toman un medicamento para el dolor de cabeza y que
obtienen alivio es del 90%, como afirma la publicidad. Se tiene una muestra aleatoria de 100 individuos de
los cuales, 88 obtuvieron alivio al tomar el medicamento. Pruebe con un nivel de confianza del 95%.

116
Unidad 8: Regresin Lineal Simple y Mltiple





4. Ejercicios: 12, 13, 14 y 15 (Pginas 114)


6. Resolver problemas propuestos por el docente del texto gua, pginas: 548 a 560

117
Distribucin z (Probabilidad acumulada)

X 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5723
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7090 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7813 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8416 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900

118
Distribucin t Student
Puntosdeporcentajedeladistribucint

r
0,25 0,2 0,15 0,1 0,05 0,025 0,01 0,005 0,0005
1
1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 636,578
2
0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,600
3
0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924
4
0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5
0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
6
0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
7
0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8
0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9
0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073
16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015
17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850
21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,768
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,689
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,660
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646
40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551
60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,460
12
0

0,6770,67
4
0,8450,84
2
1,0411,03
6
1,2891,28
2
1,6581,64
5
1,9801,96
0
2,3582,32
6
2,6172,57
6
3,3733,29
0

119
Distribucin chi cuadrada

Probabilidad de un valor superior - Al f a ()
Grados
libertad
0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
20 28,41 31,41 34,17 37,57 40,00
21 29,62 32,67 35,48 38,93 41,40
22 30,81 33,92 36,78 40,29 42,80
23 32,01 35,17 38,08 41,64 44,18
24 33,20 36,42 39,36 42,98 45,56
25 34,38 37,65 40,65 44,31 46,93
26 35,56 38,89 41,92 45,64 48,29
27 36,74 40,11 43,19 46,96 49,65
28 37,92 41,34 44,46 48,28 50,99
29 39,09 42,56 45,72 49,59 52,34
30 40,26 43,77 46,98 50,89 53,67
40 51,81 55,76 59,34 63,69 66,77
50 63,17 67,50 71,42 76,15 79,49
60 74,40 79,08 83,30 88,38 91,95
70 85,53 90,53 95,02 100,43 104,21
80 96,58 101,88 106,63 112,33 116,32
90 107,57 113,15 118,14 124,12 128,30
100 118,50 124,34 129,56 135,81 140,17

Estadística aplicada para la toma de decisiones

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estadística aplicada para la toma de decisiones

Transféré par

Droits d'auteur :

Formats disponibles

Ec.QuispeG.

1.6 Representacin grfica en spss y Excel

Histograma para variables cuantitativas

Grfica para variable cualitativa

UNIDAD 2: ESTADGRAFOS Y ANLISIS DE DATOS

Descripcin de las abreviaturas de la Media

A partir de qu edad se considerara dato extremo?

UNIDAD 3: INTRODUCCIN A PROBABILIDAD

N: Nmero total de observaciones: Se cont 32 alumnos de un curso.

p(x < 9) = 1uC8(u.9u)

x= Estudiantes que no asisten a clases

UNIDAD 5: VARIABLES ALEATORIAS CONTINUAS

5.4 Distribucin de Probabilidad Normal

6.1.2.4 Muestreo por Conglomerados

26597 23873 23719 23471 22977

6.2.3 Intervalo de confianza de una varianza

UNIDAD 7: PRUEBA DE HIPTESIS

7.1 Definicin, elementos y Tipos de error

7.3 Prueba de significancia de una y dos colas; y Valor p

Caracterstica 2005 2006

Grados de libertad en el denominador = n - k

: Media global o total

El estadstico de prueba sigue la distribucin ji cuadrada,

= 21.96 +2.u7 (16)

8.1.4. Error estndar de estimacin.-

Alumno PHP Algoritmos Base de Datos Programacin

a) Elabore una cruzada y un diagrama de Venn para evaluar las probabilidades.

7. Ejercicios: 8 y 11 (pgina 37)

Unidad 8: Regresin Lineal Simple y Mltiple

Distribucin z (Probabilidad acumulada)

Distribucin chi cuadrada

Vous aimerez peut-être aussi