Académique Documents
Professionnel Documents
Culture Documents
JimmyJavier
UNI VERSI DAD ESTATAL PENI NSULA DE SANTA ELENA
FACULTAD DE CI ENCI AS ADMI NI STRATI VAS
Es cu ela d e I n gen ier a Com er cia l
I NGENI ERI A EN MARKETI NG
ESTADI STI CA
APLI CADA
Segu n d o A o
Au t or :
Ec. Qu is p e Gon za ba y J im m y J a vier
e-m a i l: ec. j i m m y qu i s p e@gm a i l. com
A o Aca d m ico:
20 10 -20 11
Ec.QuispeG.JimmyJavier
INTRODUCCIN
La estadstica tiene sus orgenes en 1662 cuando John Graunt public el artculo Natural and Political
Observations Made upon Bills of Mortality. Las observaciones del autor eran el resultado de un estudio y
anlisis de la publicacin religiosa semanal llamada Bill of Mortality, la cual inclua nacimientos, bautizos y
muertes junto con sus causas. Graunt se dio cuenta de que Bill of Mortality representaba apenas una fraccin
de los nacimientos y muertes en Londres. Sin embargo, utiliz los datos para llegar a conclusiones relativas
al impacto de las enfermedades, como la peste, en la poblacin. Su lgica constituye un ejemplo de inferencia
estadstica. Su anlisis e interpretacin de los datos marcan el inicio de la estadstica. Actualmente, hay una
amplia gama de aplicaciones de la estadstica en la administracin, marketing, economa, enfermera,
deportes, etc Un ejemplo prctico seran las cuatro compaas estadounidenses con mayores ingresos:
ExxonMobil, General Motors, Ford y Chevron (ao 2005 en www.industryweek.com)
No se puede gestionar lo que no se mide. Las mediciones son la clave. Si usted no puede medirlo, no puede
controlarlo. Si no puede controlarlo, no puede gestionarlo. Si no puede gestionarlo, no puede mejorarlo. La
falta sistemtica o ausencia estructural de estadsticas en las organizaciones impide una administracin
cientfica de las mismas. Dirigir slo en base a datos financieros del pasado, realizar predicciones basadas
ms en la intuicin o en simples extrapolaciones, y tomar decisiones desconociendo las probabilidades de
xito u ocurrencia, son slo algunos de los problemas o inconvenientes ms comunes hallados en las
empresas.
Carecer de datos estadsticos en cuanto a lo que acontece tanto interna como externamente, impide decidir
sobre bases racionales, y adoptar las medidas preventivas y correctivas con el suficiente tiempo para evitar
daos, en muchos casos irreparables, para la organizacin.
En otras pocas disponer de los datos y luego analizarlos resultaba una labor costosa y agotadora, pues ella se
basaba en la labor manual de los directivos. Pero hoy se cuenta con computadoras y software que facilitan el
clculo, por lo cual las empresas que utilicen dicho potencial obtendrn una fuerte diferencia competitiva en
relacin a sus adversarios, pero ms an podrn mejorar continuamente la performance en los diversos ratios
y mediciones que hacen a los procesos y actividades de la empresa.
Las empresas que no hagan uso de estas nuevas potencialidades y afronten debidamente stas nuevas
exigencias, no slo perdern capacidad competitiva, sino que quedarn desplazados ante los continuos
cambios del entorno, poniendo en serio riesgo su propia continuidad.
En otras pocas con lentos procesos de cambios, los cuales resultaban casi imperceptibles en el tiempo, se
poda administrar una empresa con pocos datos estadsticos. Hoy, en un mundo de profundos y veloces
cambios en todo mbito ya no es posible actuar con indiferencia. Hoy un empresario necesita predecir a
tiempo los niveles de demanda de sus productos, necesita reconocer a tiempo los cambios de tendencia, debe
no slo saber en qu se gasto, sino como se gasto en el tiempo y en que conceptos.
Para negociar, para tomar decisiones, para corregir problemas de calidad, para aumentar la productividad,
para fijar precios, para mejorar el mantenimiento y disponibilidad de las mquinas e instalaciones, para
mejorar la concesin y cobranza de los crditos se requiere s o s contar con datos estadsticos.
Toda decisin, todo anlisis, todo presupuesto, est prcticamente en el aire si no se cuenta con datos
estadsticos suficientes y fiables.
No slo a nivel empresa, sino tambin a nivel pas, los que ms han avanzado han sido aquellos que hicieron
de las estadsticas una herramienta fundamental. W. Edwards Deming, un pionero en mtodos estadsticos
para el control de calidad, seal que en Japn se pone mucho nfasis en las estadsticas para directores de
empresa.
En parte fue la aplicacin de las tcnicas estadsticas enseadas por Deming lo que hizo que Japn pasara de
ser un fabricante de imitaciones baratas a lder internacional en productos de primera calidad.
Sin estadsticas una empresa carece de capacidad para reconocer que actividades o productos le generan
utilidades, y cuales slo prdidas.
Ec.QuispeG.JimmyJavier
No contar con datos e interpretarlos correctamente es para los administradores como caminar en la oscuridad.
Contar con los datos les ilumina, les permite ver lo que est aconteciendo y en consecuencia tomar las
medidas ms apropiadas.
Un empresario conocedor de estadsticas podra contestar para su empresa:
Qu clientes les generan los mayores beneficios?
Qu zonas o regiones son las que generan mayores ventasen unidades monetarias y volmenes? (en total y
por producto)
Cules son las reparaciones que ms se han producido en el ltimo trimestre?
En qu da de trabajo de cada mes logra llegar al punto de equilibrio?
Qu tipo de reparaciones han generado mayores egresos?
Si posee un restaurante Cules son los platos ms pedidos durante el ao y por temporada?
Cules son los vinos ms pedidos y cules los ms vendidos?
SI dirige una librera Cules son los temas ms vendidos? Cul es la rentabilidad que le aporta cada tema?
Cmo contribuye cada tema a lograr el punto de equilibrio?
Si dirige un hotel, Cul es el tiempo promedio de estada? La cantidad de clientes por zona o regin?La
facturacin por profesin, zona, motivo de su visita ( turismo, negocios, salud, profesionales, capacitacin,
otros)?
Las estadsticas nos ayudan sobre manera a tomar las decisiones ms correctas en bsqueda del beneficio
empresarial y de sus clientes. Nos ayuda por ejemplo a:
Adoptar a tiempo las medidas correctivas;
Confeccionar un presupuesto viable y efectivo;
Administrar eficazmente su flujo de fondos;
Evitar los excesos de stock y la obsolescencia de inventarios;
Conocer cuando est mejorando la productividad;
Negociar un incremento de precios;
Prediccin de ventas por canales de comercializacin.
Estudios e investigacin de mercado.
Tiempos promedios, mximos y mnimos de reparaciones por tipo de averas.
Coeficientes de correlacin.
La Gestin Moderna Basada en Estadsticas (GMBE) seguro que ayudar a profesionales administradores de
empresas
En conclusin:
Hoy en da se hace indispensable tener conocimientos bsicos de estadstica para la toma de decisiones
ptimas en nuestras empresas, que nos permita tener la capacidad de generar ideas nuevas que al aplicarse
den los resultados que se pretende en el negocio.
La presente gua ha sido diseada de una manera sencilla que permita al alumno que guste o no de las
matemticas entender las estadsticas. Por otro lado los ejercicios y problemas estn tomados en su mayora
de la realidad diaria donde nos desenvolvemos.
Se recomienda que antes de iniciar este curso el alumno debe tener conocimientos bsicos de Excel y tener la
predisposicin de hacer de las estadsticas su pasin. Suerte!
Ec.QuispeG.JimmyJavier
OBJETIVOS GENERALES
Describir las caractersticas principales de los datos agrupados y no agrupados basndose en la informacin
recopilada e histrica para que mediante la aplicacin de Excel y spss se analice probabilidades de
fenmenos de estudio con variables discretas y continuas.
Analizar informacin mediante un modelo de regresin lineal y pruebas de hiptesis aplicando Excel y spss
para la toma de decisin ms ptima previa al lanzamiento de productos o servicios al mercado.
COMPETENCIAS
Competencias Generales de la carrera
Analizar y sintetizar
Aplicar los conocimientos a la prctica
Trabajar de forma cooperativa en equipo
Capacidad de liderazgo
METODOLOGA
La presente gua est diseada de manera que contribuya al desarrollo de competencias en los alumnos,
mediante mtodos adecuados el docente favorece el aprendizaje en los estudiantes, las modalidades
organizativas dentro y fuera del aula ayudan para que el alumno construya el conocimiento a travs del
desarrollo de ejercicios y problemas prcticos, adems el estudio de casos en algunas unidades asiste para
que los valores entre compaeros se fortalezcan.
Se recomienda que cada alumno vaya desarrollando la clase paso a paso con ejerciciso y problemas y al final
de cada captulo se autoevale con la responsabilidad que caracteriza a un alumno universitario.
Las modalidades y mtodos que se proponen son los siguientes:
Modalidades Organizativas:
Seminarios - Talleres
Clases prcticas (Laboratorio)
Trabajo en grupo
Tutoras
Trabajo autnomo
Trabajo Autnomo:
Preparacin de actividades acadmicas dirigidas
Consultas bibliogrficas
Investigaciones
Proyectos
Tareas a corto y largo plazo
Mtodos de aprendizaje
Resolucin de ejercicios y problemas
Aprendizaje basado en problemas
Estudio de Casos
Aprendizaje Cooperativo
Aprendizaje orientado a proyectos
Ec.QuispeG.JimmyJavier
EVALUACIN
El ao acadmico tendr cuatro perodos, cada uno ser evaluado en las siguientes estrategias evaluativas:
ESTRATEGIA EVALUATIVA 1: Deberes %
Instrumento de evaluacin Criterios 10%
1
Pruebas de ejecucin de tareas reales a
corto plazo
Presentacin de trabajo 2
2 Desarrollo 6
3 Resultados 2
ESTRATEGIA EVALUATIVA 2: Proyecto de Investigacin %
Instrumento de evaluacin Criterios 20%
1
Trabajo de campo
Encuesta 5
2 Contenido de trabajo y trabajo en equipo 10
3 Presentacin de trabajo 5
ESTRATEGIA EVALUATIVA 3: Pruebas %
Instrumento de evaluacin Criterios 10%
1
Pruebas escritas / Situacin problmica
Razonamiento 3
2 Deduccin conocimientos 3
3 Interpretacin de resultados 4
ESTRATEGIA EVALUATIVA 4: Talleres grupales %
Instrumento de evaluacin Criterios 10%
1
Talleres en equipo
Comprensin 2
2 Desarrollo de tema 4
3 Interpretacin de resultados 4
PRUEBA FINAL %
Instrumento de evaluacin Criterios 50%
1
Prueba al final de cada perodo
Valores de honestidad, limpieza y responsabilidad 5
2 Desarrollo correcto de temas 20
3 Interpretacin de resultados correctos 25
BIBLIOGRAFA
Estadstica aplicada a los negocios y economa: Lind-Marchall;2008.
Estadstica para administracin y economa; Anderson; 2005
Muestreo Estadstico, Cesar Prez Lpez; Pearson, Prentice Hall, 2005
Estadstica para administracin, Berenson Levine, Prentice Hall, 2001
Probabilidad y Estadstica para Ingeniera y Ciencias, Mendenhall Sincich, Prentice Hall, 1997
Internet:
http://www.vitutor.com/estadistica.html
www.spssfree.com/indice.html
http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm
www.youtube.com (videos estadsticos en Excel y spss)
http://www.monografias.com/trabajos34/estadistica-negocios/estadistica-negocios.shtml
http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_9.htm
Biblioteca Virtual UPSE
http://site.ebrary.com/lib/upsesp/search.action?p00=probabilidad
De esta direccin seleccionar los siguientes textos:
Matemtica-Probabilidades, Colegio24hs
Problemario de Probabilidad, Escalona Ivn
Manual: Teora de Probabilidades, Ramrez Snchez, Waldo
Estadstica, Matus, R. Hernndez y Martha Garca E.
Ec.QuispeG.JimmyJavier
INDICE
UNIDADES Pginas
Unidad I: Introduccin a Estadstica, Frecuencias y Grficas.
1.1 Conceptos bsicos de Estadstica.
1.2 Tipos de estadstica y su aplicacin en el marketing.
1.3 Recopilacin de datos: Encuestas (directas y por internet) y niveles de medicin
1.4 Tabla de frecuencias para conjunto de datos cualitativos.- Definicin y grficos
1.5 Distribucin de frecuencias para conjunto de datos cuantitativos.- Definicin y grficos
1.6 Representacin grfica de datos en Excel y SPSS.
Unidad II: Estadgrafos y anlisis de Datos
2.1. Medidas de localizacin: Media aritmtica, ponderada y geomtrica, mediana y moda.
2.2. Medidas de dispersin: Rango, desviacin media, varianza y desviacin estndar.
2.3. Media, mediana, moda y desviacin estndar para datos agrupados.
2.4. Descripcin de datos
2.4.1. Diagrama de puntos
2.4.2. Cuartiles, deciles y percentiles
2.4.3. Diagramas de caja
2.5. Asimetra y Curtosis
2.6. tica e informe de resultados.
2.7. Aplicacin en Excel y SPSS.
Unidad III: Introduccin a la Probabilidad
3.1. Definicin y enfoques
3.2. Experimento, Resultado, Evento y Espacio Muestral
3.3. Reglas de Conteo
3.4. Reglas de adiccin
3.5. Reglas de la multiplicacin
3.6. Tablas de Contingencia y Diagramas de rbol
3.7. Probabilidad Condicional
3.8. Regla de Bayes
3.9. Aplicacin en Excel
Unidad IV: VARIABLES ALEATORIAS DISCRETAS
4.1. Definicin y su distribucin de probabilidad
4.2. Media, Varianza y Desviacin Estndar de una v.a.d.
4.3. Distribucin de Probabilidad Binomial
4.4. Distribucin de Probabilidad de Poisson
4.5. Distribucin de Probabilidad Hipergeomtrica
4.6. Aplicacin en Excel y SPSS.
Unidad V: VARIABLES ALEATORIAS CONTINUAS
5.1. Definicin y su Distribucin de Probabilidad
5.2. Distribucin de Probabilidad Uniforme
5.3. Distribucin de Probabilidad Exponencial, aplicacin en Excel y spss
5.4. Distribucin de Probabilidad Normal y aplicacin en Excel y spss
5.5. Aproximacin de la Binomial a la Normal y aplicacin en Excel y spss
8
8
9
10
12
15
19
20
22
25
29
30
30
31
31
33
34
35
36
37
39
42
43
44
44
47
48
50
51
51
52
53
59
Ec.QuispeG.JimmyJavier
Unidad VI: MUESTREO Y ESTIMACIN
6.1 Muestreo
6.1.1. Definicin y clasificacin
6.1.2. Mtodos de Muestreo
6.1.2.1. Muestreo Aleatorio Simple
6.1.2.2. Muestreo Sistemtico
6.1.2.3. Muestreo Estratificado Simple
6.1.2.4. Muestreo por Conglomerados
6.1.3. Error de Muestreo
6.1.4. Distribucin Muestral de la Media
6.1.5. Teorema del Lmite Central
6.1.6. Aplicacin de la distribucin muestral de las medias
6.2. Estimacin
6.2.1. Estimadores puntuales e intervalos de confianza de una media
6.2.1.1. Desviacin estndar de la poblacin conocida
6.2.1.2. Desviacin estndar poblacional desconocida
6.2.2. Intervalo de confianza de una proporcin
6.2.3. Intervalo de confianza de una varianza
6.2.4. Factor de correccin de una poblacin finita
6.2.5. Eleccin del tamao adecuado de una muestra
Unidad VII: PRUEBA DE HIPTESIS
7.1. Definicin, elementos y Tipos de error
7.2. Pasos para probar una hiptesis
7.3. Prueba de significancia de una y dos colas; y Valor p
7.4. Prueba de la media con desviacin poblacional conocida y desconocida
7.5. Prueba de hiptesis de la proporcin
7.6. Error tipo II
7.7. Prueba de Hiptesis para dos muestras: Muestras independientes
7.8. Prueba de proporciones de dos muestras
7.9. Prueba de medias con desviaciones poblacionales desconocidas
7.10. Prueba ANOVA
7.11. Prueba de bondad de ajuste: frecuencias esperadas iguales y desiguales
7.12. Aplicacin en Excel y SPSS
Unidad VIII: REGRESIN LINEAL SIMPLE Y MLTIPLE
8.1. Regresin Lineal Simple
8.1.1. Supuestos y elementos
8.1.2. Mtodo de Mnimos Cuadrados
8.1.3. Interpretacin de la pendiente de la recta
8.1.4. Error estndar de estimacin
8.1.5. Coeficiente de correlacin y de determinacin
8.1.6. Intervalos de Confianza y de Prediccin
8.1.7. Aplicacin en Excel y SPSS
8.2. Regresin Lineal Mltiple en spss
8.2.1. Ecuacin de regresin mltiple
8.2.1.1. Error estndar de estimacin y Coeficiente de determinacin mltiple
8.2.2. Evaluacin de supuestos
8.2.3. Regresin por pasos
TRABAJO AUTNOMO
TABLAS
62
63
67
67
67
67
68
68
69
70
71
71
72
72
73
74
77
78
82
83
84
85
86
87
90
90
90
92
93
94
95
95
95
96
96
96
99
117
Ec.QuispeG.JimmyJavier
UNIDAD I: INTRODUCCIN A LA ESTADSTICA, FRECUENCIAS
Y GRFICAS
Objetivos: Caracterizar conjunto de variables cualitativas y cuantitativas mediante distribucin de frecuencias
para su representacin grfica en programas estadsticos.
Competencias especficas:
Capacidad de identificar variables cualitativas y cuantitativas.
Tabular datos informativos en spss.
Representacin honesta de los datos en grficas.
1.1 Conceptos bsicos de Estadstica.
Estadstica.- Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de propiciar la toma
de decisiones ms eficaz.
Tipos de Variables:
a) Variable cualitativa.- La caracterstica de la variable que se estudia es de naturaleza no numrica, se
agrupa en categoras. Ejemplos: el gnero, la filiacin religiosa, color de ojos, etc.
b) Variable cuantitativa.- La variable que se estudia aparece en forma numrica. Se divide en:
Discretas y Continuas.
Variables Discretas.- Adoptan slo ciertos valores y existen vacos entre ellos. Ejemplos: Nmero
de camas en una casa, nmero de autos que pasan por un semforo tal, nmero de alumnos del curso
que reciben estadstica aplicada, etc.
Variables continuas.- Toman cualquier valor dentro de un intervalo especfico. Ejemplo: Presin
del aire en la llanta de un auto, peso de una caja de tomates, duracin de un viaje Salinas-Guayaquil,
etc. Por lo general las variables continuas son el resultado de mediciones.
Poblacin.- Conjunto de individuos u objetos de inters o medidas obtenidas a partir de todos los individuos
u objetos de inters, se representa con la letra N.
Muestra.- Porcin o parte de la poblacin de inters, se representa con la letra n.
1.2 Tipos de estadstica y su aplicacin en el marketing.
Tipos de Estadstica:
Estadstica Descriptiva.- Mtodo para organizar, resumir y presentar datos de manera informativa.
Estadstica Inferencial.- Mtodos empleados para determinar, predecir o inferir una propiedad de una
poblacin con base en la informacin de una muestra.
La estadstica en el marketing es fundamental pues por medio de esta ciencia se recopila informacin sobre
clientes, empresas, productos o servicios, etc., de manera que se puede aplicar estrategias de marketing
apropiadas para el mejoramiento del negocio. Ejemplo:
La empresa de publicidad con sede en Atlanta, Brandon and Associates, solicit a una muestra de 1 960
consumidores que probaran un platillo de pollo recin elaborado por Boston Market. De las 1 960 personas
de la muestra, 1 176 dijeron que compraran el
La empresa implement esta nueva lnea de negocio en base a la informacin recopilada en la encuesta
porque el platillo fue un xito en la muestra.
Ec.QuispeG.JimmyJavier
1.3 Recopilacin de datos: Encuesta y niveles de medicin
Niveles de medicin
Los datos se clasifican por niveles de medicin. El nivel de medicin de los datos rige los clculos que se
llevan a cabo con el fin de resumir y presentar los datos, adems determina las pruebas estadsticas que se
deben realizar. Se clasifican desde la medicin ms baja hasta la ms alta que es el nivel de razn.
Datos de nivel nominal.-
Las observaciones acerca de una variable cualitativa slo se clasifican y cuentan. No existe una forma
particular para ordenar las etiquetas. Ejemplo:
Suponga que hace un conteo de las personas que asisten a un bar de la localidad e informa cuntos son
hombres y cuntas son mujeres. Podra primero presentar a los hombres o a las mujeres, la medicin consiste
en contar.
Asisten al Bar Nmero Porcentaje
Hombres 45 60.81
Mujeres 29 39.19
Total 74 100.00
Las categoras de datos se encuentran representadas por etiquetas o nombres. An cuando las etiquetas se
codifiquen con nmeros, las categoras de datos no tienen ningn orden lgico
Datos de nivel ordinal.-
Los datos se ordenan de acuerdo a caractersticas de la variable. Sus propiedades son:
Las clasificaciones de los datos se encuentran representadas por conjuntos de etiquetas o nombres (alto,
medio, bajo), las cuales tienen valores relativos.
En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.
Ejemplo:
Los estudiantes de segundo ao evaluaron al docente de matemticas contestando la siguiente pregunta:
Cmo califica las clases del profesor de matemticas? Los resultados se muestran a continuacin:
Calificacin Frecuencia
Excelente 5
Muy bueno 29
Bueno 14
Regular 6
Deficiente 1
Total 55
La calificacin muestra el uso de la escala de medicin ordinal, una calificacin es ms alta o mejor que la
siguiente. La calificacin excelente es mejor que la calificacin muy bueno pero no se sabe en qu grado es
mejor calificacin, es decir no es posible distinguir la magnitud de las diferencias entre los grupos.
Datos de nivel de intervalo
Incluye las caractersticas del nivel ordinal, pero adems, la diferencia entre valores constituye una magnitud
constante y no necesariamente la razn entre categoras distintas. Sus propiedades son:
Las clasificaciones de datos se ordenan de acuerdo con el grado que posea la caracterstica en cuestin.
Diferencias iguales en la caracterstica representan diferencias iguales en las mediciones.
Ejemplo: La temperatura, las tallas de ropa
Datos de nivel de razn
Todos los datos cuantitativos son registrados en el nivel de razn de la medicin. Posee todas las
caractersticas del nivel de intervalo, aunque, adems el punto 0 tiene sentido y la razn entre entre dos
nmeros es significativa. Sus propiedades son:
Las clasificaciones de datos se ordenan de acuerdo con la cantidad de caractersticas que poseen.
Ec.QuispeG.JimmyJavier
10
Diferencias iguales en la caracterstica representan diferencias iguales en los nmeros asignados a las
clasificaciones.
El punto cero representa la ausencia de caractersticas y la razn entre dos nmeros es significativa.
Ejemplo: Los salarios, peso, altura, ventas, etc.
La siguiente muestra los salarios anuales de 5 profesionales dedicados al rea administrativa:
Profesional Salario ($)
Castro Alex 3 000
Revello Gabriela 3 600
Roldn Tamara 4 200
Santos Andrs 4 800
Zambrano Ins 6 000
1.4 Tabla de frecuencias para conjunto de datos o variables cualitativas.- Definicin y grficos
Frecuencia.-
Nmero de ocurrencia de una observacin en particular (f).
Tabla de frecuencias.-
Agrupacin de datos cualitativos en clases mutuamente excluyentes que muestra el nmero de observaciones
en cada clase.
Frecuencia relativa de clase.-
Fraccin del nmero total de observaciones en cada clase, es decir, es la divisin entre la totalidad de
elementos de una clase y el nmero total de observaciones (f.r.).
Frecuencia relativa porcentual.-
Resulta de multiplicar la frecuencia relativa por 100%.
Ejemplo: La siguiente tabla contiene informacin sobre las preferencias de lugares de visitas de un grupo de
personas en sus vacaciones.
Tabla no. Tabla de frecuencias sobre visita a lugares tursticos.
Representacin grfica de datos cualitativos
Los instrumentos ms comunes para representar una variable cualitativa en forma grfica son la grfica de
barra (horizontal o vertical) y el grfico de pastel.
Grfica de barras.-
En un sistema de ejes X y Y, se encuentra en un eje la variable de inters y en el otro eje la cantidad, nmero
o fraccin de cada uno de los posibles resultados. Una caracterstica distintiva de este tipo de grfico es que
existe una distancia o espacio entre barras, adems el ancho de cada rectngulo es uniforme y la altura
corresponde a la frecuencia de clase (alturas proporcionales a las frecuencias de clase).
Respecto al ejemplo sobre lugares de preferencia se presenta un grfico de barras horizontales de frecuencia.
LUGARES Personas que visitan (f) f. r.
SALINAS 50 0.43
QUITO 25 0.22
PLAYAS 15 0.13
OLON 25 0.22
Total 115 1.00
Ec.QuispeG.JimmyJavier
11
Interpretacin.-
De acuerdo a la grfica de barras, de las 115 personas encuestadas, 43% prefieren visitar Salinas, 22%
personas prefieren visitar Quito al igual que Oln.
Grfica de Pastel.-
Grfica circular que muestra la parte o porcentaje que representa cada clase del total de nmeros de
frecuencias. Para construir una grfica de pastel las frecuencias de cada clase se transforman a frecuencia
porcentual (en porcentajes) y se inicia colocando el porcentaje de la primera categora en el circulo, iniciando
a las 12 en punto y el resto de categoras se van sumando de manera acumulada, luego se avanza conforme
las manecillas del reloj hasta completar el 100%,
Ejemplo:
SkiLodges.com realiza una prueba de mercado de su nuevo sitio web y le interesa saber con qu facilidad se
navega en su diseo de pgina web. Selecciona al azar 200 usuarios frecuentes de internet y les pide que
lleven a cabo una tarea de investigacin en la pgina web, solicitndoles que califiquen la relativa facilidad
para navegar como mala, buena, excelente o sobresaliente. Los resultados aparecen en la siguiente tabla:
Facilidad de navegar f. f. p. (%)
Sobresaliente 102 51%
Excelente 58 29%
Buena 30 15%
Mala 10 5%
Total 200 100%
0 10 20 30 40 50 60
SALINAS
QUITO
PLAYAS
OLON
Lugaresdepreferencia
(variabledeinters)
Sobresalie
nte
51%
Excelente
29%
Buena
15%
Mala
5%
Ec.QuispeG.JimmyJavier
12
Interpretacin.-
De las 200 personas encuestadas, el 51% calific de sobresaliente navegar en la pgina web de la compaa
SkyLodge.com, un 29% calific de excelente y slo un 5% calific como mala navegar en la web, tambin se
puede concluir que el 80% ha calificado como excelente y sobresaliente navegar en la web de la compaa.
1.5 Distribucin de frecuencias para conjunto de datos cuantitativos.- Definicin y grficos
Para representar variables cuantitativas aprenderemos sobre los histogramas y polgonos de frecuencia.
Primero analizaremos cmo agrupar datos.
Distribucin de frecuencia.-
Agrupacin de datos en clases mutuamente excluyentes, que muestra el nmero de observaciones que hay en
cada clase.
Cmo crear una distribucin de frecuencias?
Cuando tenemos datos desorganizados se llaman datos no agrupados o datos en bruto, se los agrupa de la
siguiente manera:
1.- Defina el nmero de clases mediante la relacin 2
k
, se escoge el valor mnimo de k que da como resultado
un valor mayor al nmero de observaciones.
2.- Determine el intervalo o ancho de clase que debe ser el mismo para todas las clases y deben cubrir todos
los datos.
Se emplea la frmula: i
H-L
K
Donde:
i es el intervalo de clase.
H es el mximo valor observador (valor mayor)
L el mnimo valor observado
k el nmero de clases
3.- Establezca los lmites de cada clase de manera que al tabular los datos no repetimos datos, para el
presente curso se trabajar con la modalidad por ejemplo: 1500 a 1600; 1600 a 1700, etc. Esto indica que la
primera clase abarca datos desde 1500 hasta 1599, la segunda clase datos desde 1600 hasta 1699 y as
sucesivamente. No olvidar que la ltima clase debe contener la observacin mayor caso contrario hay que
volver a establecer el ancho del intervalo redondeando a un nmero un poco mayor.
4.- Tabule las observaciones para cada clase.
5.- Cuente el nmero de elementos que se repiten en cada clase (frecuencia de clase), debe ser el mismo de
las observaciones no agrupadas.
Ejemplo:
Los datos originales que se presentan a continuacin son los cargos por electricidad y gas durante un mes,
para una muestra aleatoria de 50 departamentos de 3 recmaras en Manhattan. Elabore una distribucin de
frecuencia.
1. 2
6
= 64, valor superior mnimo a las observaciones. Es decir trabajaremos con 6 clases.
96 171 202 178 147 102 153 127 82 197
157 185 90 116 172 111 148 130 165 213
141 149 206 172 123 128 144 109 167 168
95 163 150 154 130 143 187 139 149 166
108 119 183 151 114 135 191 129 158 137
Ec.QuispeG.JimmyJavier
13
2. i
213-82
6
= 21.8S, es decir que el ancho del intervalo ser de 22 (redondeado)
3. Los lmites de clases seran:
No. Intervalos
1 82 a 104
2 104 a 126
3 126 a 148
4 148 a 170
5 170 a 192
6 192 a 214
Nos damos cuenta que todos los datos se encuentran dentro de los lmites de clases establecidos, sino fuera
as entonces se debe ampliar un poco ms el valor i.
4.- Tabule
No. Intervalos Tabulacin f f. r
1 82 a 104 ///// 5 0,10
2 104 a 126 /////// 7 0,14
3 126 a 148 //////////// 12 0,24
4 148 a 170 ////////////// 14 0,28
5 170 a 192 //////// 8 0,16
6 192 a 214 //// 4 0,08
Total 50 1,00
Representacin grfica de una distribucin de frecuencias
Histogramas.-
Grfica en la que las clases se sealan en el eje horizontal y las frecuencias de clase en el eje vertical. Las
frecuencias de clase se representan por medio de las alturas de las barras, stas se dibujan de manera
adyacente.
Ejemplo:
Con los datos del ejercicio anterior presente la informacin mediante un histograma de frecuencia.
Interp
De ac
14 de
se pue
de ele
Polgo
Es sim
inters
Ejemp
pretacin.-
cuerdo al histo
ellas tienen c
ede concluir q
ectricidad y ga
ono de frecuen
milar a un h
ecciones de lo
plo con los mi
1
1
1
1
F
r
e
c
u
e
n
c
i
a
ograma, de la
cargos entre 1
que slo 4 rec
as.
ncias.-
histograma, co
os puntos med
ismos datos d
No.
1
2
3
4
5
6
0
2
4
6
8
10
12
14
16
93
Histogram
0
2
4
6
8
10
12
14
16
71
f
r
e
c
u
e
n
c
i
a
as 50 recmar
48 y 170 dla
maras cancel
onsiste en seg
dios de clase y
el ejercicio an
Interva
82 a 10
104 a 1
126 a 1
148 a 1
170 a 1
192 a 2
Total
115
Ca
madefrecue
93 1
Cargos
14
ras encuestada
ares, 12 de ell
lan $192 o m
gmentos de r
y las frecuenci
nterior.
alos Punto
04
26
48
70
92
14
l
137
argosporelec
enciadecarg
115 137
porelectricid
as en Manhatt
los tienen carg
s y 5 cancela
recta que con
ias de clase.
o medio de cla
93
115
137
159
181
203
159
ctricidadygas
gosporelect
159 181
dadygasend
Ec
tan por cargo
gos entre 126
an valores men
nectan los pu
ase f
5
7
12
14
8
4
50
181
s($)
tricidadyga
203 2
dlares
c.QuispeG.Jimm
s de electricid
y 148 dlares
nores a $104 p
untos formado
203
as
225
myJavier
dad y gas;
s, tambin
por cargos
os por las
Ec.QuispeG.JimmyJavier
15
Ec.QuispeG.JimmyJavier
16
Primero se ingresan los datos en la ventana vista de variables con todas sus caractersticas correspondientes
como si son cualitativas o cuantitativas, segn esto se deber llenar el cuadro valores o no, adems de esto
depender el nivel de medicin.
Para graficar se sigue lo siguiente:
Paravariablescuantitativas:
Ec.QuispeG.JimmyJavier
17
Paravariablescualitativas:
Ec.QuispeG.JimmyJavier
18
Ec.QuispeG.JimmyJavier
19
N
Media de una muestra.- Cuando los datos no han sido agrupados, la media aritmtica de una muestra se
obtiene sumando los valores de la muestra divididos para el nmero de valores de la media. Cualquier
caracterstica medible a partir de una muestra recibe el nombre de estadstico, la media de una muestra es un
estadstico.
x =
x
n
Media ponderada.- Para datos no agrupados la media ponderada es un caso especial de la media aritmtica.
Para obtener la media ponderada se multiplica cada observacin por el nmero de veces que se repite,
dividido para la suma de las ponderaciones.
x
w
=
(w. x)
w
Media geomtrica.- Resulta til para determinar el cambio promedio de porcentajes, razones, ndices o tasas
de crecimiento, la media geomtrica siempre es menor o igual (nunca mayor que) que la media aritmtica.
Todos los datos deben ser positivos.
0H = (x
1
)(x
2
) (x
n
)
n
Mediana.- Punto medio de un conjunto de datos (no agrupados) una vez que se han ordenado de menor a
mayor o viceversa. Es ms confiable que el valor de la media en casos cuando existen valores extremos en
los datos. Si el nmero de datos es impar, la mediana es el valor que ocupa la posicin central. Si el nmero
de datos es par, la mediana es igual a la media de los dos datos centrales.
X =
n+1
2
;
Este valor significa la ubicacin de la mediana en el conjunto de datos que ha sido previamente ordenado.
Ec.QuispeG.JimmyJavier
20
Si son pares los datos hay que sumar los datos centrales y dividir para dos para obtener el valor de la
mediana.
Moda.- Valor de la observacin que aparece con mayor frecuencia. Si existen dos valores que se repiten con
la misma frecuencia decimos que el conjunto de datos es bimodal.
Ejemplo:
Con los siguientes dos conjuntos de datos, ambos con tamao de muestra n=7.
Lote 1: 10 2 3 2 4 2 5
Lote 2: 20 12 13 12 14 12 15
Calcule:
a.- Media, mediana y moda para ambos conjuntos.
MEDIA
x
1
=
1u +2 +S +2 +4 +2 +S
7
=
28
7
= 4
X
2
=
2u +12 +1S +12 +14 +12 +1S
7
=
98
7
= 14
MEDIANA
LOTE 1: 2 2 2 3 4 5 10 LOTE 2: 12 12 12 13 14 15 20
MEDIANA= 3 MEDIANA= 13
LOTE 1: 2 2 2 3 4 5 10 LOTE 2: 12 12 12 13 14 15 20
MODA=2 MODA=12
b.- Compare los resultados entre ambos conjuntos.
Los datos son similares tomando en cuenta que existe una diferencia de diez entre ambos conjuntos. De ah
que se parezcan las respuestas, en cada resultado de los estadgrafos la diferencia es 10.
2.2. Medidas de dispersin: Rango, desviacin media, varianza y desviacin estndar.
Estudiamos dispersin para conocer cuan dispersos se encuentran los datos alrededor de la media aritmtica.
Una medida grande de dispersin indica que la media no es confiable y una medida de dispersin pequea
indica que los datos se acumulan con proximidad a la media aritmtica.
Rango.- Representa la diferencia entre los valores mximo y mnimo de un conjunto de datos. Se aplica en
controles de procesos estadsticos por su facilidad de clculo.
Ec.QuispeG.JimmyJavier
21
Rango = Valor mximo Valor mnimo
Desviacin media.- Es la media aritmtica de los valores absolutos de las desviaciones con respecto a la
media aritmtica. Es la media de las desviaciones de la media. En el caso de una muestra, la MD es.
H =
|X -X|
n
Donde:
X= es el valor de cada observacin
X= es la media aritmtica de los valores
n= el nmero de observaciones de la muestra
Varianza.- Media aritmtica de las desviaciones de la media elevadas al cuadrado. Nunca es un valor
negativo y es cero si todas las observaciones son las mismas. La varianza nos muestra como varan los datos
al cuadrado respecto a la media. Esto no es fcil de interpretar por lo que se debe calcular su raz cuadrada
para su anlisis.
Desviacin estndar.- Es la raz cuadrada de la varianza. Muestra cuanto se desvan los datos respecto a su
media.
Frmulas:
Varianza Poblacional: o
2
=
(x-)
2
N
Varianza Muestral: s
2
=
(x-x)
2
n-1
Desviacin Poblacional: o = o
2
Desviacin Muestral: s = s
2
Ejemplo:
Examinando los registros de cuentas mensuales de una compaa que vende libros por correo, un empresario
toma una muestra de 20 de esas cuentas no pagadas. Los adeudados a la compaa eran: (en dlares)
4 18 11 7 7 10 5 33 9 12
3 11 10 6 26 37 15 18 10 21
Calcule el rango, varianza y desviacin estndar de la muestra e interprete los resultados.
Media = 13.65
Rango: R= 37 3 = 34
Varianza:
2
=
(3-13.65)
2
+(4-13.65)
2
+(5-13.65)
2
+(6-13.65)
2
+(7-13.65)
2
+
20-1
2
= 88.03
s = o s = 88.uS s = 9.38
Ec.QuispeG.JimmyJavier
22
Podemos darnos cuenta que el promedio de las deudas a la compaa es de $13.65 y la desviacin estndar
muestral de $9.88 nos indica que las deudas se desvan en 9.38 dlares.
Interpretacin y uso de la desviacin estndar:
Teorema de Chebyshev:
En cualquier conjunto de observaciones (muestra o poblacin), la proporcin de valores que se encuentran a
k desviaciones estndares de la media es de por lo menos 1- 1/k
2
, siendo k cualquier constante mayor que 1.
Regla emprica:
En cualquier distribucin de frecuencias simtrica con forma de campana, se cumple lo siguiente:
El 68% de las observaciones se encuentran entre: x _1o
El 95% de las observaciones se encuentran entre. x _2o
El 99.7% de observaciones se encuentran en: x _So
Cabe recalcar que los valores de la regla emprica son como su nombre indica empricos, ms adelante
conoceremos valores ms exactos.
Para el ejemplo anterior podramos decir:
El 68% de las cuentas adeudadas a la compaa se encuentran entre $4.26 y $23.03, es decir que la
cuenta adeudada ms baja es de $4.26 y la cuenta ms alta es $23.03: Esto se calcul de la siguiente
manera:
x _1o
1S.6S _1 - (9.S8)
(1S.6S.9.S8; 1S.6S +9.S8)
(4.26; 2S.uS)Jolorcs
El 95%de la informacin de las deudas a la compaa se encuentran entre los valores de -$5.11 y
$32.41, pero como nos damos cuenta el lmite inferior ($-$5.11) es imposible, por lo que el intervalo
real que contiene al 95% de cuentas adeudadas se encuentra entre $0.00 y $32.41.
El 99.7% de la informacin contiene a las cuentas entre $0.00 y $ 37.00 (revisar clculos)
En Excel se utilizan las siguientes funciones estadsticas:
Media aritmtica: funcin promedio
Mediana: funcin Mediana
Moda: funcin moda
Desviacin estndar de la muestra: funcin DESVEST
Varianza de la muestra: VAR
Calcular parmetros (valores poblacionales) no es sencillo porque no se posee informacin a la mano o no es
fcil su acceso por lo que siempre podemos encontrar informacin para obtener estadsticos.
2.3. Media, mediana, moda y desviacin estndar para datos agrupados.
Cuando los datos se han agrupado en intervalo de clases, los estadgrafos siguientes se obtienen de la
siguiente manera, la aplicacin de Excel y dominar conceptos facilita su clculo:
Media.
Xm.]
n
i
n
Ec.QuispeG.JimmyJavier
23
-
-1
(
-
-1
) +(
-
+1
)
_ Ci
Descripcin de las abreviaturas de la Moda
X
i-1
=Limite real inferior del intervalo donde se encuentra la moda.
F
i
-F
i+1
=Diferencia entre la frecuencia del intervalo modal y la frecuencia inmediato superior.
F
i
-F
i-1
= Diferencia entre la frecuencia del intervalo modal y la frecuencia inmediato inferior.
C
i
= Ancho del intervalo.
Ejemplo:
Calcule la media, mediana y moda para los siguientes datos agrupados:
Das Frecuencia f
i
X
m
X
m
*f
i
F
i
0-1 2 0.495 0.990 2
1-2 4 1.495 5.980 6
2-3 6 2.495 14.970 12
3-4 7 3.495 24.465 19
4-5 5 4.495 22.475 24
5-6 3 5.495 16.485 27
6-7 1 6.495 6.495 28
TOTAL 28 91.86
Ec.QuispeG.JimmyJavier
24
Media.-
X=
Xm.fI
n
X =
91.86
28
= 3.28 Das
Mediana.- Hc = x
-1
+
n
2
-P
i-1
P-P-1
Ci
Para encontrar la mediana nos ubicamos en la columna de Frecuencia Acumulada y analizamos en que clase
se encuentra n/2, esa clase ser nuestro Fi.
Me = 3 +
14-12
19-12
*1
Me= 3 +
2
7
1 = 3.28 DIAS
Moda.-
Ho = x
-1
_
-
-1
(
-
-1
) +(
-
+1
)
_ Ci
Para calcular la moda nos ubicamos en la columna de la frecuencia y observamos la clase con mayor
frecuencia (moda) esta clase ser nuestro fi.
Mo = 3 +
7-6
(7-6) +(7-5)
- 1
Me = 3 +
1
3
1 = 3.33 DIAS
En la siguiente distribucin de frecuencia que muestra la altura en pulgadas de 20 atletas, calcular la media y
la moda para los datos agrupados.
Altura Frecuencia fi X
m
X
m
-f
i
F
i
60 - 62 5 61 305 5
63 - 65 1 64 64 6
66 - 68 6 67 402 12
69 - 71 5 70 350 17
72 - 74 3 73 219 20
TOTAL 20 1340
Media
X=
Xm.fI
n
X =
1340
20
= 67 pulgadas
Moda
Mo = 66 +
6-1
(6-1) +(6-5)
66+
5
5
2 = 68 pulgadas
Ec.QuispeG.JimmyJavier
25
Desviacin estndar de la muestra
s =
_
. (x
m
-x)
2
n -1
2.4. Descripcin de datos
Los diagramas siguientes proporcionan una idea adicional del lugar en el que los valores se concentran, as
como de la forma general de los datos.
Diagrama de puntos.- Agrupa los datos lo menos posible y evita la prdida de identidad de cada observacin.
Cada observacin se representa con un punto. Si existen observaciones idnticas o cercanas los puntos se
apilan permitiendo ver donde se encuentran datos similares. Los diagramas de puntos son ms tiles para
conjunto de datos pequeos mientras que los histogramas para conjunto de datos grandes.
Diagrama de tallo y hojas.- Tcnica estadstica que divide a cada observacin en dos partes: un tallo y varias
hojas si es el caso. El tallo se coloca en orden de manera vertical mientras que las hojas se van apilando de
acuerdo al tallo.
Ejemplo:
Las siguientes calificaciones fueron obtenidas por 25 estudiantes en la asignatura de estadstica. Clasifique
los datos mediante un diagrama de puntos; diagrama de tallo y hojas y diagrama de caja.
51 60 71 82 90
77 89 77 75 73
76 84 82 83 68
76 92 77 75 71
54 62 57 62 63
Diagrama de puntos: (Grfica de spss)
50.00 60.00 70.00 80.00 90.00
calificaciones de 25 estudiantes de estadistica
0
1
2
3
R
e
c
u
e
n
t
o
$ $ $ $
$
$ $
$
$
$ $
$
$
$ $ $ $ $
Ec.QuispeG.JimmyJavier
26
En spss los datos con frecuencia no los presenta un punto sobre otro punto sino que se sobreentiende que el
eje y (recuento) nos indica aquello.
Diagrama de tallo y hojas a mano y en spss
Tallo Hojas
tallo
5
6
7
8
9
1 4 7
0 2 2 3 8
1 3 5 5 6 6 7 7 7
2 2 3 4 8 9
0 2
calificaciones de 25 estudiantes de estadstica Stem-and-Leaf Plot
Frequency Stem & Leaf
2.00 5 . 14
1.00 5 . 7
4.00 6 . 0223
1.00 6 . 8
3.00 7 . 113
7.00 7 . 5566777
4.00 8 . 2234
1.00 8 . 9
2.00 9 . 02
Stem width: 10.00
Each leaf: 1 case(s)
Nos podemos dar cuenta que en spss hay tres columnas, la primera muestra la frecuencia de los datos (hojas),
la segunda columna nos muestra el tallo (stem) en este caso existe dos 5, dos 6, dos 7 y dos 8, cada uno el
software lo ha asumido como el primer 5 corresponde a las hojas desde 0 hasta 5, el segundo 5 a las hojas
desde 6 hasta 9, etc. En la tercera columna podemos darnos cuenta que estn las hojas (datos analizados)
Cuartiles, deciles y percentiles.-
Son medidas de dispersin, mtodos que determinan la ubicacin de los valores que dividen un conjunto de
observaciones en partes iguales, se estudiarn los cuartiles (dividen al conjunto de datos en 4 partes iguales),
deciles (dividen al conjunto de datos en 10 partes iguales) y los percentiles (dividen al conjunto de datos en
100 partes iguales).
Cuartiles:
1
: Signiico quc cl 2S% Jc los Jotos son incriorcs o mcnorcs o csc :olor o cl 7S% cs moyor.
2
: El Su% Jc los Jotos son mcnorcs o csc :olor o cl Su% moyorcs, cs lo mcJiono.
3
: El 7S% Jc los Jotos son mcnorcs o csc :olor o cl 2S% cs moyor.
Frmulas
1
=
n +1
4
2
=
n +1
2
Ec.QuispeG.JimmyJavier
27
3
=
S(n +1)
4
Ejemplo:
Con los datos del ejemplo anterior encuentre los caurtiles Q
1
, Q
2
y Q
3
.
Localizacin de un percentil:
L
P
= (n +1)
P
1uu
Donde:
n= es el nmero de observaciones
P= representa al percentil que se busca
Para hallar el cuartil uno es lo mismo que hallemos el precentil 25, la frmula quedara:
L
25
= (2S +1)
25
100
= 6.50 ubicacin de los datos que previamente han sido ordenados
Nos podemos dar cuenta que esta frmula nos ayuda para calcular cuartiles y deciles tambin.
En spss apreciamos que el cuartil Q
1
, es el Percentil 25 dando como resultado 62.50, esto significa que el
25% de alumnos obtuvo como calificacin mxima 62.50 puntos ( en otras palabras el 25% de alumnos
obtuvo 62,50 puntos o menos), podemos concluir tambin que el 75% de estudiantes obtuvo 62,50 puntos o
ms (obtuvieron 62,50 puntos como mnimo)
Estadsticos
calificaciones de 25 estudiantes de estadistica
N Vlidos
25
Perdidos
0
Mnimo
51.00
Mximo
92.00
Percentiles 25
62.5000
50
75.0000
75
82.0000
No olvidemos que los precentiles 25, 50 y 75 son los cuartiles primero, segundo y tercero.
Diagramas de caja.- Es la representacin grfica, basada en cuartiles, que ayuda a exhibir un conjunto de
datos: Para construir un diagrama de caja se necesita conocer 5 estadsticos: Valor mnimo, Q
1
, la mediana,
Q
3
, y el valor mximo. A la distancia entre el tercer y primer cuartil se denomina rango intercuartl.
Ec.QuispeG.JimmyJavier
28
Los datos tienen un sesgo positivo (la distancia entre el cuartil 1 y el mnimo es mayor a la distancia entre el
cuartil 3 y el mximo. Adems la mediana est ms cercana al cuartil 3, por otro lado el 50% de
calificaciones de los alumnos (desde el cuartil 1 al 3) estn entre 62,50 puntos y 82 puntos.
Para calcular los datos atpicos se utilizan dos frmulas:
. A. <
1
-1.S (
3
-
1
)
. A. >
3
+1.S (
3
-
1
)
La primera frmula sirve para verificar o calcular si un dato que es menor al conjunto de datos recopilados se
lo podra considerar atpico, es decir un dato extremo.
La segunda frmula nos ayuda a saber si un dato que est por encima del conjunto de datos es o no un dato
extremo.
Hay que tener cuidado con los signos de mayor o menor que.
Ejemplo:
Si las edades de un grupo de jvenes es el siguiente conjunto:
14 15 15 16 17 16 15
18 19 18 19 15 16 15
18 19 17 20 12 12 13
Q
1
= 15 Aos
Q
2
= 16 Aos
Q
3
= 18 Aos
Ec.QuispeG.JimmyJavier
29
30
2.6. tica e informe de resultados.-
Conforme se avanza en el estudio de la estadstica es muy importante no perder la objetividad en nuestras
conclusiones ni tampoco principios ticos de manera la comunicacin de los resultados sean expuestos de
manera honesta, clara y verdadera.
Dar un mal informe podra ocasionar una toma de decisin no eficaz que podra terminar en el cierre de una
empresa o hasta la propia imagen del investigador verse mancillada.
2.1 Aplicacin en Excel y spss
Del ejercicio anterior en Excel:
S
2
= 1
Curvamesocrtica.Ocurvanormal.Estn
losdatosdistribuidosdemaneranormal.
Ec.QuispeG.JimmyJavier
31
32
Probabilidad Clsica.- Parte del supuesto de que los resultados de un experimento son igualmente posibles.
Viene dada por la frmula:
P(A) =
X
N
Donde:
P(A): Probabilidad de un evento
X: Nmero de resultados favorables
N: Nmero total de posibles resultados
Nota:
La probabilidad de un evento(A) siempre est entre 0y 1. Es decir: 0 p(A) 1
Ejemplo:
Considere el experimento de lanzar un dado. Cul es la probabilidad del evento cae un nmero par de
puntos?
A: Se observa un nmero par.
P (A): Probabilidad de obtener un nmero par al lanzar un dado.
X: Hay 3 nmeros pares (esto es favorable para lo que deseo observar)
P(A) =
X
N
P(A) =
S
6
= u.S
Evento Mutuamente Excluyente.- Cuando un evento se presenta significa que ninguno de los dems eventos
puede ocurrir al mismo tiempo. Ejemplo:
Si vive en Salinas no puede vivir en La Libertad, si al lanzar una moneda se obtiene cara no puede salir sello,
una persona encuestada es hombre o mujer pero no ambos.
Evento Colectivamente Exhaustivo.- Por lo menos uno de los eventos debe ocurrir cuando se lleva a cabo un
experimento. Ejemplo:
Al lanzar un dado se observar resultados par o impar, hay eventos colectivamente exhaustivos porque al
lanzar el dado saldr un nmero par o impar, otro resultado no es posible. (es decir no caer el dado en un
vrtice.
Probabilidad Emprica.- Se llama tambin frecuencia relativa, se basa en el nmero de veces que ocurre el
evento como proporcin del nmero de intentos conocidos.
P(A) =
N
Y: Nmero de veces que el evento ocurre.
N: Nmero total de observaciones.
Ejemplo:
En un curso de estadstica hay 32 estudiantes: 14 Mujeres y 18 Hombres. Cul es la probabilidad de que sea
mujer? Sea hombre?
Evento A: Sea Mujer
P(A): Probabilidad de que sea Mujer
X: Nmero de mujeres en el curso.
Ec.QuispeG.JimmyJavier
33
34
En las combinaciones por lo general el nmero posible de disposiciones es menor a las permutaciones
Ejemplo:
Un estudiante tiene 7 libros que le gustara colocar en un portafolio, pero solo caben cuatro. Sin tener en
cuenta como los ordeno de cuantas formas hay de colocar cuatro libros en el portafolio?
7
C
4
=
7!
4!(7-4)!
=
5040
26(6)
=
5040
144
= SS moncros posiblcs Jc colocor los libros
3.4 Reglas de adicin
a) Los eventos son mutuamente excluyentes.- Es decir que cuando un evento ocurre, ninguno de los
dems eventos puede ocurrir al mismo tiempo. Esta regla de la adicin conocida como regla
especial de la adicin indica la probabilidad de que ocurra uno u otro evento pero no ambos.
P (A o B) = P (A) + P (B)
b) Los eventos no son mutuamente excluyentes.- Los resultados de un experimento pueden suceder al
mismo tiempo. Es decir, esta regla de la adicin conocida como regla general de la adicin indica
la probabilidad de que suceda el evento A o el evento B o ambos.
P (A o B) = P (A) + P (B) P (A y B)
La letra o indica unin U, es decir suma de eventos tomando en cuenta si son o no mutuamente
excluyentes.
A la probabilidad de un evento simple se conoce como probabilidad marginal o simple de ese evento, y a la
probabilidad de eventos compuestos (es decir, la probabilidad de dos o ms eventos) se conoce como
probabilidad conjunta.
Al complemento de un evento simple se denota por: A
C
y a la probabilidad de un evento complemento se
denota por: P (A
C
)
Esto nos lleva a la regla del complemento que viene dada por la frmula:
P(A) +P(A
c
) = 1
Diagrama de Venn
Ejemplo:
La siguiente tabla nos indica el nmero de alumnos por paralelos de una carrera de segundo ao que reciben
estadsticas aplicadas.
Paralelos Evento No alumnos Probabilidad de que
ocurra el evento
1 A 40 0.26
2 B 30 0.20
3 C 45 0.30
4 D 35 0.23
Total 150 1.00
Como se observa en esta tabla existen 4 eventos simples con sus respectivas probabilidades. Si se quiere
obtener la probabilidad de seleccionar un alumno del paralelo B, sera:
Evento B: Alumnos del paralelo 2
P (A): Probabilidad de seleccionar un alumno del paralelo 2. (Probabilidad simple)
A
A
C
Ec.QuispeG.JimmyJavier
35
P (B) =
Su
1Su
= u.2
Cul sera la probabilidad de seleccionar un alumno del paralelo 2 o 4?
P(B o ) = P(B) +P() =
30
150
+
35
150
= u.2u +u.2S = u.4S
A esta probabilidad se denomina probabilidad conjunta, los eventos son mutuamente excluyentes pues un
alumno no puede ser del paralelo 2 y del 4 al mismo tiempo.
Nota.-
Cuando se trate de ejercicios de cartas (barajas) se consideran 52 cartas, de las cuales 26 son negras y 26
rojas.
3.5 Reglas de la multiplicacin
En esta parte se estimar la probabilidad de ocurrencia de dos eventos de manera simultnea. Hay dos reglas:
a) Regla especial de la multiplicacin.- Requiere que dos eventos, A y B, sean independientes, y lo son
si el hecho de que uno ocurra no altera la probabilidad de que el otro suceda, es decir que el
muestreo es con reposicin.
Independencia.- Si un evento ocurre, no tiene ningn efecto sobre la probabilidad de que otro evento
acontezca.
Frmula: P (A y B) = P(A) P (B)
En el caso de tres eventos, la frmula es: P (A y B y C) = P(A) P (B) P(C)
Regla general de la multiplicacin.- Si dos eventos no son independientes, se dice que son dependientes. En
esta regla se aplica un muestreo sin reposicin. Por ejemplo: si hay tres naranjas en la refrigeradora y se toma
una, en la refrigeradora quedan dos y la probabilidad de ser seleccionada una segunda naranja ya vari (a
0.50).
Frmula: P (A y B) = P (A/B) P (B)
Con las reglas de adicin se analizaron las probabilidades simples y conjuntas, en cambio con las reglas de la
multiplicacin se analizar la probabilidad condicional.
Probabilidad condicional.- Probabilidad de que un evento en particular ocurra, dado que otro evento ha
acontecido.
De la regla multiplicativa se obtiene la probabilidad condicional como:
P(A B) =
P(A y B)
P(B)
Ejemplos:
En un recipiente hay dos tubos defectuosos y cinco buenos. Se seleccionan al azar, dos tubos del depsito, sin
reposicin.
a) Cul es la probabilidad de que ambos tubos sean defectuosos?
2 tubos defectuosos
+ 5 tubos buenos
7
Evento A
d
: 1 tubo defectuoso
Evento B
d
: 2 tubo defectuoso
P (A
d
y B
d
)= P(A
d
) P(B
d
/A
d
)
=
2
7
1
6
=
2
42
=
1
21
Ec.QuispeG.JimmyJavier
36
El 2/7 significa que hay dos tubos defectuosos de un total de 7, el trmino 1/6 significa que seleccionaremos
otro tubo defectuoso pero de 6, dado que ya sali un defectuoso.
b) Cul es la probabilidad de que el primer tubo seleccionado sea defectuoso y que el segundo sea bueno?
Evento A
d
: tubo defectuoso
Evento B
b
: tubo bueno
P (A
d
y B
b
) = P (A
d
) P (B
b
/A
d
)
=
2
7
5
6
=
10
42
= 0,24
El 2/7 significa que hay dos tubos defectuosos de un total de 7, el trmino 5/6 significa que seleccionaremos
otro tubo pero esta vez un tubo bueno de los 5, pero que ahora son 6 en total dado que ya sali un tubo del
recipiente.
c) Suponga que ahora el muestreo es con reposicin, Cul es la probabilidad de que el primer tubo
seleccionado sea defectuoso y que el segundo sea bueno?
Evento A
d
: tubo defectuoso
Evento B
b
: tubo bueno
P (A
d
y B
b
) = P (A
d
) P (B
b
/A
d
)
=
2
7
5
7
=
10
49
= 0,21
El 2/7 significa que hay dos tubos defectuosos de un total de 7, el trmino 5/7 significa que seleccionaremos
otro tubo pero esta vez es un tubo bueno de los 5, sin embargo el haber seleccionado un primer tubo NO
afecta la probabilidad de seleccionar un segundo debido a que se ha realizado un muestreo con reposicin.
La formula puede ser tambin:
P (A
d
y B
b
) = P (A
d
) P (B
b
)
=
2
7
5
7
=
10
49
= 0,21
Esta frmula que se aplica para eventos donde el muestreo es con reposicin:
3.6 Tablas de Contingencia y Diagramas de rbol
Tabla de contingencia.- Tabla utilizada para clasificar observaciones (datos) de una muestra, de acuerdo con
dos o ms caractersticas identificables, se la conoce tambin como tablas cruzadas o de doble entrada. En
esta tabla se puede obtener la probabilidad simple o marginal (que est en los mrgenes o subtotales de la
misma) y la probabilidad conjunta que se encuentra dentro de la tabla misma.
Para elaborar tablas de contingencia en Excel y en spss, podemos revisar en las siguientes direcciones:
http://www.youtube.com/watch?v=awBkfxyk1fM (Excel)
http://www.youtube.com/watch?v=VFnPhbM_6T4 (spss)
Diagramas de rbol.- Es una grfica til para organizar clculos que implican varias etapas. Cada segmento
del rbol constituye una etapa del problema. Las ramas del rbol se ponderan por medio de probabilidades.
En las primera ramas se encuentra las probabilidades simples, y en las sub ramas de cada rama se encuentran
las probabilidades condicionales, al final (diramos el fruto) se encuentran las probabilidades conjuntas.
Ejemplo resumen:
En una amplia rea metropolitana se selecciono una muestra de 500 entrevistados para determinar diversas
informaciones relacionadas con el comportamiento del consumidor. Entre las preguntas realizadas se
encontraba: Disfruta ir de compras? De 240 hombres; 136 contestaron que s. De 260 mujeres; 224
contestaron que s.
a.- Elabore una tabla cruzada y un diagrama de Venn para evaluar las probabilidades
Ec.QuispeG.JimmyJavier
37
Eventos
Si disfruta ir de
compras
No disfruta ir de
compras
Total
Hombres
Mujeres
136
224
104
36
240
260
TOTAL 360 140 500
Con los valores subrayados son los que se obtienen las probabilidades conjuntas, se divide cada valor para el
total de la tabla.
Cada subtotal de filas y columnas son valores con los que se obtienen probabilidades simples o marginales
dividido cada valor para el total de la tabla.
Esta tabla presenta 4 eventos simples: 2 estn en las filas y 2 eventos ms estn en las columnas, adems
presenta 4 eventos compuestos que resultan de las intersecciones de las filas con las columnas.
3.7 Probabilidad Condicional
Como ya se mencion la probabilidad condicional de un evento viene dado por:
P(A B) =
P(A y B)
P(B)
P(A/B) significa Probabilidad del evento A dado el evento B.
Esto quiere decir:
* Que primero debi haber sucedido el evento B para que ocurra el evento A.
* Si sucede B ocurre A.
* Si sucede B entonces ocurre A.
* Sucede A dado que ocurri B
Ejemplo resumen:
Tomando el ejemplo anterior sobre hombres/mujeres y si disfrutan o no ir de compras, desarrolle:
a.- Escriba los eventos simples y dos eventos compuestos
Ec.QuispeG.JimmyJavier
38
Eventos simples:
A: Si disfruta ir de compras
A
c
: No disfruta ir de compras
B: Mujer
B
c
: Hombre
Eventos compuestos:
A y B: Mujer que disfruta ir de compras.
A y B
C
: Hombre que disfruta ir de compras.
Probabilidad simple:
b.- Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria: Sea Hombre?, disfrute ir
de compras?
P(B
c
) = 240/500 = 0.48
P(A) = 360/500 = 0.72
c.- Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria: Sea Mujer?, no disfrute
ir de compras?
P(B) = 260/500 = 0.52
P(A
c
) = 140/500 = 0.28
Probabilidad conjunta:
d.- Qu probabilidad hay de que un entrevistado seleccionado al azar: Sea mujer y disfrute ir de compras?
Sea hombre y no disfrute ir de compras?
P(BA) = 224/500= 0,448
P(B
c
r A
c
) = 104/500 = 0.21
e.- Qu probabilidad hay de que un entrevistado seleccionado al azar: Sea hombre y disfrute ir de compras?
P (B
c
r A) = 136/500 = 0.27
Probabilidad condicional:
f.- Supngase que el entrevistado seleccionado sea mujer Entonces cul es la probabilidad de que no disfrute
ir de compras?
Primero debe ser mujer el seleccionado y luego que no disfrute ir de compras:
P (A
c
B) =
P (A
c
rB)
P(B)
=
36
S00
260
S00
= 0.14
g.- Supngase que el entrevistado disfrute ir de compras Entonces cul es la probabilidad de que sea
hombre?
P (B
c
A) =
P (B
c
rA)
P(A)
=
136
S00
360
S00
= 0.38
Diagrama de rbol donde se aprecian las tres probabilidades, simple o marginal, condicional y conjunta.
Ec.QuispeG.JimmyJavier
39
Regla de Adicin:
h.- Cual es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea mujer o disfrute ir de
compras?
P (BUA)= P(B) + P(A) P(BA)
[
260
500
+ [
360
500
[
224
500
=
396
500
= 0.79
i.- Cual es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea hombre o no disfrute ir
de compras?
P (B
c
u A
c
) = P (B
c
) + P ( A
c
) P (B
c
r A
c
)
[
240
500
+ [
140
500
[
104
500
=
276
500
= 0.55
j.- Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea hombre o mujer?
P (B
c
u B) = P (B
c
) + P (B) P (B
c
r B)
_
24u
Suu
] + _
26u
Suu
] -u =
Suu
Suu
= 1
3.8 Regla de Bayes
El Teorema o Regla de Bayes nos brinda un mtodo para contestar algunas preguntas muy importantes. En su
esencia, esta regla nos indica cul informacin es necesaria tener y el mtodo para invertir la condicin
cuando calculamos una probabilidad condicional: si A y B son eventos y conocemos:
P(A | B), P(B), P(A | B
c
)
Entonces podemos calcular P(B | A). La necesidad de calcular este ltimo valor a partir de la informacin
disponible es imprescindible para entender las consecuencias de algunas de nuestras decisiones.
Teorema.-
Sea {A
1
,A
2
,...,A
n
} un conjunto de sucesos mutuamente excluyentes y exhaustivos, y tales que la probabilidad
de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se conocen las probabilidades
condicionales P(B | A
i
). Entonces, la probabilidad P(A
i
| B) viene dada por la expresin:
Ec.QuispeG.JimmyJavier
40
p(A
1
B) =
P(A
1
)P(BA
1
)
P(A
1
)P(BA
1
) +P(A
2
)P(BA
2
) +...P(A
n
)P(BA
n
)
donde:
P(A
i
) son las probabilidades a priori (probabilidades basadas en el nivel de informacin actual)
P(B | A
i
) es la probabilidad de B en la hiptesis A
i
.
P(A
i
| B) son las probabilidades a posteriori (probabilidades revisadas a partir de informacin adicional)
Ejemplos:
1.- Considera una fbrica de botellas que cuenta con dos mquinas para producir sus botellas. En esa fbrica
se producen 10,000 botellas al da. La mquina A produce 6,500 botellas diarias de las cuales el 2% son
defectuosas. La mquina B produce 3,500 botellas cada da de las cuales el 1% son defectuosas.
El inspector de calidad de la compaa selecciona una botella al azar y encuentra que est defectuosa.
Cul es la probabilidad de que la botella haya sido producida por la mquina A?
Para visualizar mejor los datos, los organizamos en un diagrama de rbol. Denotamos por A el evento de que
la botella seleccionada haya sido producida por la mquina A y por B el evento de que haya sido producida
por la mquina B. El evento de que la botella seleccionada sea defectuosa se denota por D, su complemento
D
c
representa una botella que no es defectuosa.
La probabilidad de que una botella cualquiera haya sido producida por la mquina A es .65, pues de las
10,000 producidas, 6,500 son producidas por A. Nos interesa calcular P(A | D), la cual no se puede obtener
de forma directa de los datos o del rbol que los representa. Para esto recurrimos directamente a la definicin
de probabilidad condicional: P( A | D) = P(A y D) / P(D).
Las cantidades P(AD) y P(A) se pueden obtener del rbol. Para que una botella seleccionada al azar sea una
defectuosa producida por la mquina A, debemos seleccionar primero la mquina A y de las botellas
producidas all seleccionar una defectuosa. Tenemos que P(A y D) = P(A) P( D | A), lo que equivale a hacer
la travesa en el rbol desde su raz o comienzo hasta la hoja donde obtenemos el resultado A y D.
As P(A y D) = .65 x 0.02.
Para encontrar P(D) debemos darnos cuenta que una botella defectuosa puede ser producida de la mquina A
o de la B. Si examinamos las hojas del rbol, vemos que hay dos lugares donde obtenemos una botella
defectuosa, A y D o B y D. Esto equivale a hacer una travesa por uno de caminos en el rbol. Estos caminos
Ec.QuispeG.JimmyJavier
41
son mutuamente excluyentes, pues si caminamos por uno no podemos estar caminando por el otro. Segn se
muestra en la figura de al lado, el evento D = (A y D) o (B y D) y su probabilidad es entonces calculada:
P(D) = P(A y D) + P(B y D).
Complete el Diagrama de Venn para este problema:
El primero de estos trminos P(A y D) ya haba sido calculado. El segundo se obtiene de forma similar.
Obtenemos entonces que P( B y D) = P(B) P(D | B). Uniendo estos resultados tenemos que:
P(D) = P(A) P( D | A) + P(B) P(D | B). Finalmente podemos calcular la probabilidad deseada:
P (A/D)=
P(A)P(A)
P(A)P(A)+P(B)P(B)
P(A/D)=
(0.65)(0.02)
(0.65)(0.02)+(0.35)(0.01)
=
0.013
0.013+0.0035
= u.788
Esto quiere decir que una vez sabemos que una botella seleccionada al azar est defectuosa, la probabilidad
de que haya sido producida por la mquina A es 0.788. Dicho de otra manera, de todas las botellas
defectuosas producidas, aproximadamente el 79% son producidas por la mquina A.
Pregunta:
Cmo se puede explicar que la mquina A produzca el 79% de las botellas defectuosas?
Este hecho se debe a dos factores. El primero es que la mquina A produce casi el doble de botellas que la
mquina B. An si la tasa de botellas defectuosas fuera la misma para ambas mquinas, por el mero hecho de
producir un mayor nmero de botellas, la mquina A producira casi el doble de defectuosas de la mquina B.
El segundo factor es que la tasa de produccin de defectuosas de la mquina A es el doble de la
correspondiente de la mquina B. En este caso, an si ambas mquinas produjeran la misma cantidad de
botellas, las producidas por la mquina A contendran el doble de botellas defectuosas que las que vienen de
la mquina B.
2.- El gerente de Ventas de una fbrica de juguetes est planeando introducir al mercado un nuevo juguete.
En el pasado el 40% de los juguetes creados por la compaa han tenido xito y el 60% no ha sido exitoso.
Antes de que se llegue a comercializar realmente el juguete se lleva a cabo una investigacin de mercado y se
prepara un informe, favorable o desfavorable. En el pasado el 80% de los juguetes exitosos recibieron
informes favorables. Al gerente de mercadotecnia le agradara conocer la probabilidad de que el nuevo
juguete tendr xito si recibe un informe favorable.
Eventos:
E: Exitoso F: Favorable
E
c
: No Exitoso F
c
: Desfavorable
P(E) = 0.40 P(F/E) = 0.80 P(E/F) = ?
P(Ec) = 0.60 P(F/Ec) = 0.30
P (E/F)=
P(PL)P(L)
P(PL)P(L)+P(PL)P(Lc)
P(E/F)=
(0.80)(0.40)
(0.80)(0.40)+(0.30)(0.60)
=
0.32
0.32+0.18
=
0.32
0.50
= u.64
Ec.QuispeG.JimmyJavier
42
3.- Una estacin de televisin querra medir la habilidad de su meteorlogo. La informacin recopilada
seala lo siguiente:
La probabilidad de que se predijera un da de sol en das soleados es 0.80
La probabilidad de que se predijera da de sol en das no soleados es 0.40
La probabilidad de un da de sol es 0.60
Encuentre la probabilidad de que:
a.- Sea un da soleado, sabiendo que se ha pronosticado un da de sol
Eventos:
S: Das Soleados
R: Pronstico de un da de sol
S
c
: Das no soleados
R
c
: Pronstico de un da no soleado
P(S)=0,60 P(R/S)=0,80 P(R/S
c
)=0,40
P(S/R)=
P(RS)P(S)
P(RS)P(S)+P(RS)P(S
c
)
P(S/R)=
(0,80)(0.60)
(0,80)(0,60)+(0,40)(0,40)
=
0,48
0,64
= u,7S
b.- Predecir un da soleado
P(R)=0,64
3.9 Aplicacin en Excel
Revisar las direcciones en youtube sobre como armar tablas de contingencia y diagramas de rbol. En la
siguiente hoja de clculo se muestra dos de las tres reglas de conteo analizadas en clases:
Ec.QuispeG.JimmyJavier
43
UNIDAD 4: VARIABLES ALEATORIAS DISCRETAS
Objetivos: identificar variables aleatorias discretas mediante sus distribuciones de probabilidad para el
anlisis del comportamiento poblacional
Competencias especficas:
Identificar distribuciones de probabilidad
Aplicar distribuciones en computadora
Capacidad de analizar poblaciones y su distribucin
En los captulos anteriores se mencionaba el trmino distribucin de frecuencias relativas para describir un
pasado de ocurrencia, ahora en cambio distribucin de probabilidad describe la probabilidad de que un
evento ocurra en el futuro.
Supongamos que el jefe de control de calidad selecciona 4 artculos cualesquiera de 240 en total para
determinar si estn o no defectuosos, en la unidad anterior vimos que el jefe podra seleccionar los 4 artculos
de varias maneras, en este caso 4 de 120, pero por otro lado el jefe de control de calidad querr saber de esos
cuatro, cuntos estn defectuosos y cuntos estn buenos, por lo que existen artculos que pueden tener 0
defecto, 1 defecto, 2 defectos, 3 defectos o 4 defectos, si nos damos cuenta el hecho de que el artculo pueda
tomar varios valores numricos lo convierten en una variable aleatoria que para nosotros ser x. En este caso,
los valores que puede tomar x son: 0,1, 2, 3 y 4.
4.1 Definicin y su distribucin de probabilidad
Variable Aleatoria.- Cantidad que resulta de un experimento que, por azar (aleatorio), puede adoptar
diferentes valores.
Variable Aleatoria Discreta.- Variable aleatoria que adopta slo valores claramente separados.
Distribucin de probabilidad.- Listado de todos los resultados de un experimento y la probabilidad asociada
con cada resultado. Es decir, cada resultado tiene una probabilidad de ocurrencia.
Ejemplo.- Usted lanza dos monedas y desea observar al menos una cara en los lanzamientos. Cul es la
distribucin de probabilidad del nmero de caras?
Los resultados posibles son los siguientes:
C: Cara
Cr: Cruz
Resultado
posible
Primer
lanzamiento
Segundo
lanzamiento
Nmero
de caras
1 C C 2
2 C Cr 1
3 Cr C 1
4 Cr Cr 0
La distribucin de probabilidad para el nmero de caras es:
Nmero de
caras: X
Probabilidad del
resultado: P(x)
2
1
0
Total 1
4.2 Media, Varianza y Desviacin Estndar de una v.a.d.
Ec.QuispeG.JimmyJavier
44
Media de una v.a.d..- Es el valor promedio de larga duracin de la variable aleatoria. Se conoce como valor
esperado o esperanza matemtica.
Medta = = |x
t
. P(x
t
)]
Varianza de una v.a.d.- Describe el grado de dispersin en una distribucin, es decir la variacin.
Vartanza = n
2
= |(x
t
-)
2
P(x
t
)]
La siguiente distribucin corresponde a las ventas de automviles de una empresa durante los das sbados.
Calcule la media y la desviacin estndar de la distribucin de probabilidad discreta.
Media Empresa A:
Nmero de autos
vendidos: X
P(X) X. P(x)
0 0.50 0.00
1 0.20 0.20
2 0.15 0.30
3 0.10 0.30
4 0.05 0.20
Total 1.00
Varianza Empresa A
X P(x
i
) (X
i
-) (Xi-)
2
* P(X
i
)
0 0,50 (0-1) 1 * 0,50= 0,50
1 0,20 (1-1) 0 * 0,20= 0,00
2 0,15 (2-1) 1 * 0,15= 0.15
3 0,10 (3-1) 4 * 0,10= 0,40
4 0,05 (4-1) 9 * 0,05= 0,45
Total 1.50
La media fue 1 auto vendido en promedio los sbados con una desviacin de 1.23 autos vendidos. (La
desviacin estndar se obtiene al extraer la raz cuadrada de la varianza)
4.3 Distribucin de Probabilidad Binomial
En la distribucin binomial se presentan slo dos posibles resultados: xito resultados: xito y fracaso, los
eventos son mutuamente excluyentes.
La distribucin binomial inicia con n pruebas idnticas de distribucin de bernoulli que tiene un xito () y
un fracaso (1- ), es decir:
Distribucin de Bernoulli.-
P (xito) + P(fracaso) = 1
Frmula:
P (x) =
x
. (1- )
1-x
Donde:
X: Variable aleatoria discreta
Ec.QuispeG.JimmyJavier
45
: Probabilidad de xito
1- : Probabilidad de fracaso.
Sin embargo la distribucin de bernoulli nos ayuda para un solo experimento, por lo que la distribucin
binomial es ms general y aplicativa. Nota: Lo que se desea observar en el experimento (el resultado) se
convierte en l xito.
Distribucin Binomial
Caractersticas de un experimento de probabilidad binomial.-
2- Es el resultado de (n) pruebas de bernoulli idnticas.
3- El resultado de cada prueba de clasifica en una de dos categoras mutuamente excluyentes: xito o
fracaso.
4- La variable aleatoria permite contar el nmero de xitos en una cantidad fija de pruebas.
5- Las probabilidad de xito y fracaso permanecen constantes o iguales en todo el experimento
(prueba).
6- Las pruebas son independientes, es decir el resultado de una prueba no influye en el resultado de
otra prueba.
Frmula:
P (x) =
n
C
x
. n
x
. (1 -n)
n-x
x: variable aleatoria discreta Binomial
: Probabilidad de xito
1-: Probabilidad de fracaso
n
C
x
: Combinacin n de x. (Revisar Reglas de conteo)
Media de una distribucin binomial.-
= n
Varianza de una distribucin binomial.-
2
= n (1 - )
Para fortalecer los conocimientos en Excel se recomienda ingresar a la Biblioteca virtual (pgina 5) y
seleccionar le texto: Manual: Teora de Probabilidades, Ramrez Snchez, pginas 24 a 30.
Ejemplo:
En la base a experiencias anterior, la impresora principal del centro de cmputo de cierta universidad
funciona adecuadamente el 90% del tiempo si se hace una muestra aleatoria de 10 inspecciones.
a.- Cul es la probabilidad de que la impresora principal funcione en forma apropiada:
1.- Exactamente nueve veces? (es decir 9 veces ni ms ni menos)
n = 10
= 0.90
P (x = 9) = ?
x= Nmero de veces que funcione de forma apropiada la impresora principal.
P(x = 9) = 1uC9 (u.9u)
9
u.1u
1
P(x = 9) = 1uxu.S8742u489xu.1u
P(x = 9) = u.7S61es la probabilidad de que la impresora 9 veces funcione correctamente.
2.- Por lo menos nueve veces? (es decir mnimo 9 veces)
P(x 9) =.
P(x 9) = P(x = 9) +P(x = 1u)
P(x 9) = 1uC9(u.9u)
9
(u.1u)
1
+1uC1u(u.9u)
10
(u.1u)
0
P(x 9) = u.S8742u489 +u.S467844
P(x 9) = u.7S61es la probabilidad de que la impresora funcione correctamente 9 veces o ms.
Ec.QuispeG.JimmyJavier
46
3.- Cuando ms nueve veces? (es decir mximo 9 veces)
P(x 9) =.
P(x 9) = P(x = 9) +P(x = 8) +P(x = 7) +P(x = 6) +P(x = S) +P(x = 4) +P(x = S)
+P(x = 2) +P(x = 1) +P(x = u)
P(x 9) = 1uC9(u.9u)
9
(u.1u)
1
+1uC8(u.9u)
8
(u.1u)
2
+1uC7(u.9u)
7
(u.1u)
3
+1uC6(u.9u)
6
(u.1u)
4
+1uCS(u.9u)
5
(u.1u)
5
+1uC4(u.9u)
4
(u.1u)
6
+1ucS(u.9u)
3
(u.1u)
7+
1uC2(u.9u)
2
(u.1u)
8+
1uC1(u.9u)
1
(u.1u)
9
1uCu(u.9u)
0
(u.1u)
10
P(x 9) = u.S8742u489 +u.19S71u244 +u.uS7S9S626 +u.u1116u261 +u.uu1488uS48
+u.uuu1S7781 +u.uuuuuuuuu1
p(x 9) = u.6S1S
Una manera sencilla de calcular este tipo probabilidades y probabilidades y evitar un clculo a mano muy
extenso es usando la regla del complemento (captulo anterior), es decir, en lugar de calcular la probabilidad
de xitos menores o iguales a 9, calculamos los xitos de su complemento (en este caso es 10)
P(x 9) = 1 -P(x > 9)= 1 P(x = 10) = 1 0.3487844 = 0.651215 es la probabilidad de que la
impresora funciones correctamente 9 veces o menos.
Se recomienda revisar desigualdades, especficamente sobre el conjunto solucin de una desigualdad lineal.
Repaso de signos y desigualdades:
Expresin
Equivalencia
en intervalo y
palabras
Conjunto solucin de la
desigualdad nmeros
reales positivos ms el
cero
Otros significados
Complemento
X > 3
(3, )
No incluye al 3
4, 5, 6, 7
Valores mayores a 3,
ms de 3
X 3
0, 1, 2, 3
X 3
[3, )
Si incluye al 3
o
Desde el 3
3, 4, 5, 6, 7
Valores mayores o
iguales a 3, 3 o ms,
mnimo 3, por lo menos
3, al menos 3, cuando
menos 3
X < 3
0, 1, 2
X < 3
(, 3)
No incluye al 3
0, 1, 2
Valores menores a 3,
menos de 3
X 3
3, 4, 5, 6, 7
X 3
(, 3]
Si incluye al 3
o
Hasta el 3
0, 1, 2, 3
Valores menores o
iguales a 3, 3 o menos,
mximo 3, mximo 3,
cuando ms 3, a lo
mucho 3
X > 3
4, 5, 6, 7
4.- mas de nueves veces?
P(x > 9) =.
P(x > 9) = P(x = 1u)
P(x > 9) = u.S487es la probabilidad de que ms de 9 impresoras funciones correctamente.
5.- menos de nueve veces?
p(x < 9) =.
p(x < 9) = p(x = 8) +p(x = 2) +p(x = 1) +p(x = u)
Ec.QuispeG.JimmyJavier
47
48
49
Formula:
P (X) =
(
r
C
x
)(
N-r
C
n-x
)
N
C
n
Donde:
N: Nmero de la Poblacin
n: Nmero de la muestra
r: Nmero de xitos en la poblacin
x: Nmero de xitos en la muestra
C: Combinacin
Media:
p =
n. r
N
Varianza:
o
2
=
r. (N -r). n. (N -n)
N
2
. (N -1)
Ejemplo:
De un inventario de 48 celulares NOKIA (con radio) que se embarcan a distribuidores locales, 12 tienen
radios defectuosos.
a) Cul es la probabilidad de que ciertos distribuidores reciban ocho celulares y:
1.- Todos tengan radios defectuosos?
La variable x es igual a celulares que tengan radios defectuosos y como el propsito de mi investigacin es
encontrar la probabilidad de celulares nokia con radios defectuosos; la variables x se convierte en mi xito.
N = 48
n = 8
r = 12
x = 8
P (x = 8)=
C C
C
=
C C
C
=
495 . 1
377348994
=
495
377348994
= u.uuuuu1S11 es la probabilidad de que en una
muestra de 8 celulares del total (48) se seleccionan 8 celulares con radios defectuosos.
PoblacinN
conrxitos
Muestran
conxxitos
Ec.QuispeG.JimmyJavier
50
Si nos damos cuenta la suma de las dos combinaciones del numerador debe ser igual a la combinacin del
denominador. (
48
C
8
)
2.- Ningn celular tenga radio defectuoso?
P (x = 0)=
C C
C
=
1 . C
3773
=
1 . 30260
377348994
=
30260
377348994
= u.u8u1919 probabilidad de que al seleccionar una
muestra de 8 celulares, ninguno salga con radio defectuoso.
3.- Por lo menos un celular tenga el radio defectuoso?
Usamos la regla del complemento:
P (x 1) = 1 - P (x < 1) = 1 - P (x = 0) = 1 - 0.08019 = 0.9198 es la probabilidad de que al menos o por lo
menos un celular salga con la radio defectuosa, al decir por lo menos uno significa que pueden salir 1,2,3
hasta 8 con la radio defectuosa.
b) Cuntos celulares con radios defectuosos se esperara recibir?
=
n
N
=
8 . 12
48
=
96
48
= 2 celulares con radios defectuosas se esperara sean seleccionados si se repite este
experimento varias veces.
4.6 Aplicacin en Excel y SPSS.
La siguiente hoja de clculo muestra los tres primeros literales del ltimo ejercicio, las dems distribuciones
siguen similares pasos.
Ec.QuispeG.JimmyJavier
51
Desvi
Ejemp
El vol
500 li
Es de
est e
El val
Es dec
5.3 D
En es
0 cuya
El val
iacin estnda
plo:
lumen de prec
itros por metro
ecir, que el vo
ntre 401 y 402
lor medio espe
cir, la precipit
Distribucin d
tadstica la di
a funcin de d
lor esperado y
ar.-
cipitaciones e
o cuadrado. C
olumen de pre
2 litros, otro 1
erado es:
tacin media e
de Probabilid
istribucin exp
densidad es:
y la varianza d
stimado para
Calcular la fun
ecipitaciones e
1%, etc.
estimada en S
dad Exponenc
ponencial es u
de una variable
52
el prximo a
cin de distrib
est entre 400
Sevilla para el
cial
una distribuci
e aleatoria X c
o en la ciuda
bucin y la pre
0 y 401 litros
prximo ao
n de probabi
con distribuci
Ec
ad de Sevilla v
ecipitacin m
tiene un 1%
es de 450 litro
ilidad continu
n exponencia
c.QuispeG.Jimm
va a oscilar en
media esperada
de probabilid
os.
ua con un par
al son:
myJavier
ntre 400 y
a:
dades; que
metro >
Ec.QuispeG.JimmyJavier
53
54
Para facilitar el clculo de las probabilidades con la distribucin normal se aplica la siguiente fmrula que
est estandarizada:
(z) =
1
2 II
c
-(
1
2
)z
2
Distribucin de probabilidad normal estndar.- Cualquier distribucin normal puede convertirse en una
distribucin normal estndar al restar la media de cada observacin y dividir esta diferencia entre la
desviacin estndar como se aprecia en la f+ormula anterior. Los resultados reciben el nombre de valores z o
valores tipificados que se obtiene a partir del uso de la tabla de distribucin normal (est al final de la gua)
o aplicando Excel y/o spss. La curva normal estandarizada quedara as:
En el grfico se puede comparar los valores z que ya estn estandarizados y los valores de =16 horas y de
=2 horas de estudio que un alumno a la semana destina para los deberes.
Valor z.- Distancia con signo (+ o -) entre un valor seleccionado, designado x, y la media, , dividida entre la
desviacin estndar, . El rea sombreada es la probabilidad de un valor cualquiera.
Frmula del valor normal estndar:
z =
x-
c
Parte de la tabla de la distribucin normal estndar
X 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5723
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
La tabla que se utilizar es de frecuencia acumulada, se lee de la siguiente manera:
La columna de la izquierda indica el valor cuya probabilidad acumulada queremos conocer. La primera fila
nos indica el segundo decimal del valor que estamos consultando.
Ec.QuispeG.JimmyJavier
55
Ejemplo: queremos conocer la probabilidad acumulada en el valor 0,45.Entonces buscamos en la columna de
la izquierda el valor 0,4 y en la primera fila el valor 0,05. La casilla en la que se interseccionan es su
probabilidad acumulada (0,6736, es decir 67.36%), en Excel se aplica el mismo anlisis.
Atencin: la tabla nos da la probabilidad acumulada, es decir, la que va desde el inicio de la curva por la
izquierda hasta dicho valor. No nos da la probabilidad concreta en ese punto. En una distribucin continua en
el que la variable puede tomar infinitos valores, la probabilidad en un punto concreto es prcticamente
despreciable (es decir es cero).
En Excel en cambio se trabaja con la funcin estadstica distr.norm.estand (valor de z) que nos da
exactamente el valor acumulado como se explic en la tabla.
Ejemplos de clculo de probabilidades con distribucin normal estndar, diferentes casos:
Supongamos que X es una variable aleatoria que se distribuye segn una distribucin N con media = 70 y
varianza = 36. Calcular:
a) P (x 80)
z =
x -p
o
z =
8u -7u
6
Calcular la probabilidad anterior es lo mismo que decir: P (z 1.67) = 0.95254 (rea sombreada)
b) P (x > 80)
z =
8u -7u
6
Calcular la probabilidad anterior es lo mismo que decir: P (z > 1.67) = 0.04745 (que se obtuvo
restando 1 0.95254)
c) P (x 60)
z =
6u -7u
6
Ec.QuispeG.JimmyJavier
56
Calcular la probabilidad anterior es lo mismo que decir: P (z -1.67) = 0.04745 (probabilidad igual al
anterior literal)
d) P (x > 60)
z =
6u -7u
6
Calcular la probabilidad anterior es lo mismo que decir: P (z > -1.67) = 0.04745, cuya probabilidad
igual al literal a).
e) P (50 < x 80)
z
1
=
Su -7u
6
= -S.SS
z
2
=
8u -7u
6
= 1.67
Calcular la probabilidad anterior es lo mismo que decir: P (-3.33 < z 1.67) = 0.95210. Para este tipo
de ejercicios siempre se obtiene el valor deseado restando la probabilidad del nmero positivo
menos la probabilidad del nmero negativo. En este caso: 0.95254 0.000432 = 0.952106
f) (50 < x 60)
z
1
=
Su -7u
6
= -S.SS
z
2
=
6u -7u
6
= -1.67
Ec.QuispeG.JimmyJavier
57
Calcular la probabilidad anterior es lo mismo que decir: P (-3.33 < z -1.67) = 0.04702. Para este tipo
de ejercicios siempre se obtiene el valor deseado restando la probabilidad del nmero negativo ms
cercano al cero (es decir el mayor) menos la probabilidad del nmero negativo ms pequeo (es decir ms
alejado del cero). En este caso: 0.047459 0.0004342 = 0.04702
g) P (80 < x 90)
z
1
=
8u -7u
6
= 1.67
z
2
=
9u -7u
6
= S.SS
Calcular la probabilidad anterior es lo mismo que decir: P (1.67 < z 3.33) = 0.04702 (probabilidad igual
al anterior literal). Para este tipo de ejercicios siempre se obtiene el valor deseado restando la probabilidad
del nmero positivo mayor menos la probabilidad del nmero positivo menor. En este caso: 0.99956
0.95254 = 0.047025
Problemas:
1.- El salario medio de los empleados de una empresa se distribuye segn una distribucin normal, con media
5 mil dlares y desviacin tpica de mil dlares. Calcular el porcentaje de empleados con un sueldo inferior a
7 mil dlares.
Lo primero que haremos es transformar esa distribucin en una normal tipificada, para ello se crea una nueva
variable (z) que ser igual a la anterior (X) menos su media y dividida por la desviacin tpica:
z =
x -p
o
En el ejemplo, la nueva variable sera:
z =
x -S
1
Esta nueva variable se distribuye como una normal tipificada. La variable z que corresponde a una variable X
de valor 7 es:
Ec.QuispeG.JimmyJavier
58
z =
7 -S
1
= 2
Ya podemos consultar en la tabla la probabilidad acumulada para el valor 2 (equivalente a la probabilidad de
sueldos inferiores a 7 mil dlares). Esta probabilidad es 0,97725
Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 mil dlares es del 97,725%.
2.- La vida media de los habitantes de un pas es de 68 aos, con una varianza de 25. Se hace un estudio en
una pequea ciudad de 10.000 habitantes:
a) Cuntas personas superarn previsiblemente los 75 aos?
Es decir nos piden cuantas personas vivirn (previsiblemente) ms de 75 aos, para eso calculamos el valor
de la normal tipificada equivalente a 75 aos.
z =
7S -68
S
= 1.4
Por lo tanto
P (X > 75) = (z > 1,4) = 1 - P (z < 1,4) = 1 - 0,9192 = 0,0808
Luego, el 8,08% de la poblacin (808 habitantes) vivirn ms de 75 aos.
b) Personas que vivirn (previsiblemente) menos de 60 aos
Calculamos el valor de la normal tipificada equivalente a 60 aos
z =
6u -68
S
= -1.6
Por lo tanto
P (X < 60) = (z < -1,6) = 0,0548
Es decir, el 5,48% de la poblacin (548 habitantes) no llegarn probablemente a esta edad.
3.- La renta media de los habitantes de un pas es de 4 mil dlares/ao, con una varianza de 1,5. Se supone
que se distribuye segn una distribucin normal. Calcular:
a) Porcentaje de la poblacin con una renta inferior a 3 mil dlares.
Lo primero que tenemos que hacer es calcular la normal tipificada:
z =
S -4
1,22
= -u,816
P (X < 3) = P (z < -0,816)
Ahora tenemos que ver cul es la probabilidad acumulada hasta ese valor. Por lo tanto:
P (z < -0,816) = 0,2072
Luego, el 20,72% de la poblacin tiene una renta inferior a 3 mil dlares.
Ec.QuispeG.JimmyJavier
59
b) Renta a partir de la cual se sita el 10% de la poblacin con mayores ingresos.
En este tipo de problemas primero vemos en la tabla el valor de la variable tipificada (z) cuya probabilidad
acumulada es el 0,9 (90%), lo que quiere decir que por encima se sita el 10% superior.
Ese valor corresponde a z = 1,282 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de
la normal tipificada:
1,282 =
x -4
1,22
Despejando X, su valor es 5,57. Por lo tanto, aquellas personas con ingresos superiores a 5,57 mil dlares
constituyen el 10% de la poblacin con renta ms elevada.
c) Ingresos mnimo y mximo que engloba al 60% de la poblacin con renta media.
Volvemos a buscar en la tabla el valor de la variable normalizada z cuya probabilidad acumulada es el 0,8
(80%). Como sabemos que hasta la media la probabilidad acumulada es del 50%, quiere decir que entre la
media y este valor de z hay un 30% de probabilidad. Dentro de la tabla se busca el valor 0.30.
Por otra parte, al ser la distribucin normal simtrica, entre -z y la media hay otro 30% de probabilidad. En
definitiva, el segmento (-z, z) engloba al 60% de poblacin con renta media.
El valor de Y que acumula el 80% de la probabilidad es 0,842 (aprox.), por lo que el segmento viene definido
por (-0,842, +0,842). Ahora calculamos los valores de la variable X correspondientes a estos valores de Y.
u,842 =
x -4
1,22
y -u,842 =
x -4
1,22
Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos superiores a 2,97 mil dlares e
inferiores a 5,03 mil dlares constituyen el 60% de la poblacin con un nivel medio de renta.
5.4.- Aproximacin de la Binomial a la Normal y aplicacin en Excel y spss
Antes de entrar al tema brevemente veamos lo que dice el Teorema Central del Lmite: Si tenemos un
grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribucin
(cualquiera que ste sea), la suma de ellas se distribuye segn una distribucin normal.
La distribucin normal constituye una buena aproximacin a la normal si n y n(1-) son ambos por lo
menos 5. Sin embargo antes de aplicar esta aproximacin es importante reconocer si la distribucin es
binomial (revisar unidad anterior)
Como la distribucin binomial es discreta y la distribucin normal es continua es necesario aplicar un factor
de correccin de continuidad o de yates que consiste en restar o sumar 0,5 segn los siguientes 5 casos:
1.- Para la probabilidad especfica de un valor cualquiera, se utiliza el rea por debajo (x-0.5) y por encima
(x+0.5)
2.- Para la probabilidad de que por lo menos ocurra x, se utiliza el rea por encima de (x-0.5)
3.- Para la probabilidad de ocurra ms que x, se utiliza el rea por encima de (x+0.5)
4.- Para la probabilidad de que ocurra x o menos, se utiliza el rea debajo de (x+0.5)
5.- Para la probabilidad de que ocurra menos que x, se utiliza el rea debajo de (x-0.5)
Otra manera de entenderlo y con ejemplos sencillos es la siguiente:
Ec.QuispeG.JimmyJavier
60
D. BINOMIAL D. NORMAL
1) P (x = k) P(k -u.S < x < k +u.S)
EJEMPLO
P (x = S) P(2.S < x < S.S)
2) P (x k) P(x < k -u.S)
EJEMPLO
P (x S) P(x 2.S)
3) P (x > k) P(x < k +u.S)
EJEMPLO
P (x > S) es lo mismo que decir P(x 4) P(x > S.S)
4) P (x k) P(x k +u.S)
EJEMPLO
P (x S) P(x S.S)
5) P(x < k) P(x < k -u.S)
EJEMPLO
P (x < S) es lo mismo que decir P(x 4) P(x < S.S)
La distribucin binomial B(n,p) se puede aproximar mediante una distribucin normal de la siguiente
manera:
N (n, nn(1 -n), entonces la distribucin normal estndar luego de aplicar el factor de correccin de
continuidad tendra la siguiente frmula:
z =
x -nn
nn(1 -n)
Ejemplo:
Una prueba consta de 200 preguntas de verdadero o falso, para un sujeto que respondiese al azar Cul sera
la probabilidad de que acertase?
a) 50 preguntas o menos.
b) Ms de 50 y menos de 100.
c) Ms de 120 preguntas.
Solucin.
El nmero de preguntas acertadas seguir una distribucin Binomial con n = 200 y = 0,5. Ahora bien, como
el nmero de pruebas es elevado esta distribucin se puede aproximar por una Normal de media 2000,5 =
100 y de varianza 2000,50,5 = 50 o lo que es lo mismo con desviacin tpica 7,07, luego:
a) P(x 50) P(x 50,5) =
Ec.QuispeG.JimmyJavier
61
z =
Su,S -1uu
7,u7
= -7
Al buscar en la tabla o aplicando en Excel nos damos cuenta que la probabilidad de que una persona acierte
50 preguntas o menos es 0.
b) P(50 < x < 100) P(50.5 < x < 99.5) =
Su,S -1uu
7,u7
< z <
99,S -1uu
7,u7
-7 < z < -u.u7 = u.472u9 -u = u.472u9
La probabilidad de que un alumno conteste entre 50 y 100 preguntas correctas es de 0.47209.
c) P(x > 120) P(x > 120.5) = P(z >2.9)
z =
12u,S -1uu
7,u7
= 2.9
La probabilidad de que una persona conteste acertadamente ms de 120 preguntas es de 1- 0.99813 =
0.00186, es decir casi imposible.
Para calcular probabilidades en Excel se trabaja de la siguiente manera, la presente hoja de clculo presenta
los resultados para los ejercicios de la pgina 55:
Ec.QuispeG.JimmyJavier
62
UNIDAD 6: MUESTREO Y ESTIMACIN
Objetivo:Estimarparmetrosmedianteaplicacindemtodosdemuestreoparadeterminacindeintervalosde
confianzaparalamediamuestral.
Competenciasespecficas:
Capacidaddemuestrearunapoblacin
Determinacindeintervalosdeconfianzaamanoyacomputadora
Anlisisdeintervalos
6.1 Muestreo
6.1.1 Definicin y clasificacin
La inferencia estadstica es el proceso de hacer uso de los resultados mustrales para obtener conclusiones
sobre las caractersticas de una poblacin.
Un importante objetivo del anlisis de datos es el uso de estadsticas como la media y la proporcin de la
muestra, a fin de estimar los valores reales correspondientes en la poblacin. El proceso de generalizar estos
resultados muestrales a la poblacin se conoce inferencia estadstica
La muestra se obtiene por observacin o experimentacin. La necesidad de obtener un subconjunto reducido
de la poblacin es obvia si tenemos en cuenta los costes econmicos de la experimentacin o el hecho de que
muchos de los mtodos de medida son destructivos.
Toda inferencia inductiva exacta es imposible ya que disponemos de informacin parcial, sin embargo es
posible realizar inferencias inseguras y medir el grado de inseguridad si el experimento se ha realizado de
acuerdo con determinados principios.
Propsito de la inferencia Estadstica
Es el de conseguir tcnicas para hacer inferencias inductivas y medir el grado de incertidumbre de tales
inferencias. La medida de la incertidumbre se realiza en trminos de probabilidad.
La inferencia estadstica realiza un estudio sobre una o varias muestras extradas de una poblacin o universo
y las conclusiones a las que se arriban son aplicables a todos los elementos de dicha poblacin. Estas
conclusiones se aplican a todos los elementos de la poblacin pero ello no quiere decir que todos
(absolutamente todos) tienen que cumplir con las caractersticas determinadas. Para ello se utiliza la teora de
probabilidades, en el trabajo estadstico de un estudio las pruebas se disean de modo que se puede
determinar con qu grado de probabilidad se encontrarn las caractersticas determinadas en la muestra, entre
los elementos que componen la poblacin.
Los estadgrafos muestrales son los valores de la caracterstica estudiada en la muestra y que se pueden
considerar coinciden con los de la poblacin con una determinada probabilidad de error.
Ec.QuispeG.JimmyJavier
63
Existe un concepto mucho ms refinado para el trabajo con poblaciones y es lo que se conoce como
poblacin objetivo. Desde el punto de vista de la metodologa de la investigacin la poblacin objetivo
podemos considerarla como aquella poblacin que est limitada por los objetivos de la investigacin que
queremos realizar.
Muestreo.- Herramienta para inferir algo sobre una poblacin, el comportamiento de los datos de la
poblacin, para esto debemos recordar que la muestra debe ser representativa, y para que esto suceda
veremos cuatro mtodos de muestreo que nos ayudarn a realizar un muestreo confiable, para esto:
1.- Analizaremos las caractersticas de cada mtodo y en qu circunstancias se deberan aplicar.
2.- Construiremos una distribucin de la media de la muestra para entender como las medias tienden a
acumularse en torno a la media de la poblacin.
3.- Demostraremos que para cualquier poblacin, la forma de esta distribucin de muestreo tiende a seguir la
distribucin de probabilidad normal.
6.1.2 Mtodos de Muestreo
6.1.2.1 Muestreo Aleatorio Simple
Muestreo aleatorio simple: Es aquel en que cada elemento de la poblacin tiene la misma probabilidad de ser
seleccionado para integrar la muestra. Una muestra simple aleatoria es aquella en que sus elementos son
seleccionados mediante el muestreo aleatorio simple.
En la prctica no nos interesa el individuo elemento de la poblacin seleccionado en general, sino solo una
caracterstica que mediremos u observaremos en l y cuyo valor ser el valor de una variable aleatoria que en
cada individuo o elemento de la poblacin puede tomar un valor que ser un elemento de cierto conjunto de
valores. De modo que una muestra simple aleatoria x
1
, x
2
, x
n
se puede interpretar como un conjunto de
valores de n variables aleatorias independientes, cada una de las cuales tiene la misma distribucin que es
llamada distribucin poblacional.
Existen dos formas de extraer una muestra de una poblacin: con reposicin y sin reposicin.
Muestreo con reemplazo.-
Es aquel en que un elemento puede ser seleccionado ms de una vez en la muestra para ello se extrae un
elemento de la poblacin se observa y se devuelve a la poblacin, por lo que de esta forma se pueden hacer
infinitas extracciones de la poblacin aun siendo esta finita.
Muestreo sin reemplazo.-
No se devuelve los elementos extrados a la poblacin hasta que no se hallan extrados todos los elementos de
la poblacin que conforman la muestra.
Cuando se hace una muestra probabilstica debemos tener en cuenta principalmente dos aspectos:
El mtodo de seleccin.
El tamao de la muestra
1.- Mtodo de seleccin.-
Un procedimiento de extraer una muestra aleatoria de una poblacin finita es el de enumerar todos los
elementos que conforman la poblacin, escribir esos nmeros en papelitos y colocarlos en una funda o
nfora, mezclarlos bien y sacar uno a uno tantos como lo indique el tamao de la muestra. En este caso los
elementos de la muestra lo constituirn los elementos de la poblacin cuyos nmeros coincidan con los
extrados de la funda.
Otro procedimiento para obtener una muestra de una poblacin ya sea el muestreo con reemplazo o sin
reemplazo es mediante la utilizacin de la tabla de nmeros aleatorios pero solamente para poblaciones
finitas, la utilizacin de estas tablas puede realizarse de diferentes modos.
Existen diferentes tablas de nmeros aleatorios (incluso en Excel mediante la funcin aleatorio o random se
puede aplicar) en el presente trabajo se utilizar como referencia la tabla de M. G. Kendall y B. Babington
Ec.QuispeG.JimmyJavier
64
Smith que se encuentra en el texto de tablas estadsticas, la misma est constituida por 4 bloques de 1000
nmeros aleatorios dispuestos en 25 filas y 40 columnas.
Veamos cmo se procede para la utilizacin de la tabla. Consideremos que se desea extraer de una poblacin
de tamao N una muestra de tamao n se selecciona el bloque, la fila y la columna de la tabla que se va a
comenzar, a partir de esta seleccin (que la hace el investigador) se toman tantas columnas como dgitos tiene
N. Comenzando por el primer nmero de las columnas seleccionadas se irn incluyendo en la muestra
aquellos individuos que en la lista de la poblacin ( ya sea de forma horizontal o vertical) ocupa la posicin
de los n nmeros de las columnas seleccionadas que resultan menores que N, en los caso que al seleccionar
un nmero en la tabla de nmeros aleatorios sea mayor que N se divide este por N y el resto de la divisin
que ser un nmero entre 0 y N-1 ser la posicin del individuo a seleccionar tomando el convenio de que el
resto 0 corresponde a la posicin N. Para la aplicacin de este procedimiento requiere que se fije previamente
el mayor mltiplo de N que se considerar, para as garantizar que todos los restos desde 0 a N -1 tengan la
misma probabilidad de ser seleccionados, por ejemplo si N = 150 y tomando 3 columnas se consideraran slo
aquellos nmeros menores o iguales que 900, los nmeros mayores que 900 no sern analizados en la
seleccin de la muestra.
Ejemplo: Dada la siguiente poblacin formada por la edad del hijo mayor de 200 ncleos familiares de una
cierta regin.
Seleccione una muestra aleatoria de tamao 10 (use la tabla de nmeros aleatorios, escoja la tercera fila,
tercera columna del segundo bloque de a 1000) numere la poblacin horizontalmente.
La siguiente tabla es una fraccin de la tabla completa:
48 49 50 51 50 46 47 56 47 38
53 50 47 46 48 47 48 46 46 50
42 51 51 49 47 51 48 47 42 49
46 48 50 47 48 47 51 56 45 49
45 54 61 46 48 46 46 47 50 34
46 46 51 39 53 55 52 49 47 46
33 40 52 46 44 52 44 54 41 33
48 49 52 42 42 49 47 47 38 48
44 43 44 40 44 45 49 44 43 42
49 49 48 41 51 51 52 42 40 47
37 48 45 46 50 45 47 53 43 47
44 40 46 46 45 48 47 42 47 46
52 53 47 49 46 47 49 42 43 42
43 38 52 50 44 52 44 53 43 45
41 57 47 48 52 53 40 49 40 50
45 42 44 53 57 46 62 47 50 47
45 51 43 45 39 39 41 44 35 41
Ec.QuispeG.JimmyJavier
65
54 48 51 53 54 42 48 51 37 38
42 37 52 50 45 55 51 46 38 43
53 43 42 39 46 52 53 39 51 40
Para extraer la muestra lo primero que hacemos es disponer tres columnas en las cuales la primera se
ubicarn los nmeros aleatorios, es decir los nmeros extrados de la tabla de nmeros aleatorios; en la
segunda columna pondremos los nmeros aleatorios rectificados que sern aquellos nmeros aleatorios
menores que N =200 y los restos de las divisiones de los nmeros aleatorios mayores que N =200 y menores
que el mayor mltiplo de N es decir 800 y en la tercera columna se encontrarn los valores de la muestra.
En la tabla de nmeros aleatorios la tercera fila, tercera columna del segundo bloque de a 1000 le
corresponde al nmero 3 pero como tenemos que coger el nmero aleatorio de tres dgitos el primer nmero
aleatorio sera el 017, los dems serian, 984, 955, 130, 850, 374, 665, 910, 288, 753, 765, 691, 496, 001,
hemos escogido 14 nmeros de la tabla de nmeros aleatorios debido a que hay 4 que son mayores que 800.
Veamos a continuacin como extraemos la muestra de la poblacin:
Para el primer nmero aleatorio 017 se busca en la poblacin el valor que ocupa la posicin 017 leda la
poblacin horizontalmente que sera la edad de 48 aos, el nmero aleatorio 984 no se contempla dentro del
anlisis ya que es mayor que 800, al igual que el nmero 955, el nmero 130, le corresponde la edad de 52
aos, al nmero 850 no se contempla dentro del anlisis, el 374 como es mayor que 200 se divide por 200 y
se obtiene reto 174 y este es el nmero aleatorio rectificado correspondindole la edad de 53 aos, al nmero
665 se divide por 200 y se obtiene resto 65 que es el nmero aleatorio rectificado correspondindole la edad
de 44 aos en la poblacin, a continuacin presentaremos la tabla de las tres columnas a la cual nos referimos
anteriormente como una va fcil y prctica para obtener la muestra deseada.
Nmero aleatorio Nmero aleatorio rectificado
muestra
017 017 48
984 --
955 --
130 130 42
850 --
374 174 53
665 065 53
910 --
288 088 44
753 153 44
765 165 39
691 091 49
496 096 51
001 001 48
Nota: obsrvese que en la muestra existen edades que se repiten esto puede pasar si el muestreo es con
reemplazo si el muestreo es sin reemplazo debemos seguir buscando de la misma manera en la tabla de
nmeros aleatorios seguido del nmero 001, hasta lograr tener la muestra con 10 valores de la poblacin no
repetidos.
Este muestreo se puede realizar utilizando Excel siguiendo los pasos siguientes:
1.- Se instala la opcin de anlisis de datos para ello se va a herramienta luego a complemento y se activa en
la ventana complemento la opcin herramienta para anlisis.
2.- Se abre una hoja Excel y se introducen los datos de la poblacin en columna.
3.- Se va a herramienta y se elige anlisis de datos y en esta ventana se selecciona la opcin muestra.
Ec.QuispeG.JimmyJavier
66
4.- En la ventana muestra se introduce el rango de entrada que sera seleccionar todos los valores de la
poblacin, si al suministrar en la hoja Excel los datos de la poblacin al inicio se le designan a estos alguna
variable o comentario debe activarse la opcin rtulo de lo contrario no debe ser activada, se activa la casilla
de muestreo aleatorio y se introduce el tamao de muestra deseado.
5.- Se selecciona el rango de salida que consiste en seleccionar una celda en la hoja Excel que no est
afectada por ninguna informacin ni hacia abajo ni a la derecha de la misma.
6.- Se selecciona aceptar en esta ventana y saldr el resultado deseado que sera las muestras elegidas por el
programa en la poblacin.
2.- El tamao de la muestra:
Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de unidades de
anlisis que se necesitan para conformar una muestra n?
Ms adelante se analizar la frmula para la determinacin del tamao de muestra.
6.1.2.2 Muestreo Sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo. Primero hay
que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una
constante, que se denomina coeficiente de elevacin K= N/n; donde N es el tamao del universo y n el
tamao de la muestra. Determinar en qu fecha se producir la primera extraccin, para ello hay que elegir al
azar un nmero entre 1 y K; de ah en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente,
es conveniente tener en cuenta la periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin y queremos escoger
de esa poblacin un nmero ms pequeo el cual es la muestra, dividimos el nmero de la poblacin por el
nmero de la muestra que queremos tomar y el resultado de esta operacin ser el intervalo, entonces
escogemos un nmero al azar desde uno hasta el nmero del intervalo, y a partir de este nmero escogemos
los dems siguiendo el orden del intervalo.
6.1.2.3 Muestreo Estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con
respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una
cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada
estrato se suele usar la tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la
prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos
tcnicas de muestreo estratificado:
Asignacin proporcional.- El tamao de la muestra dentro de cada estrato es proporcional al tamao del
estrato dentro de la poblacin.
Asignacin ptima.- La muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad.
Para ello es necesario un conocimiento previo de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las opiniones de
hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta
homogeneidad. As, si la poblacin est compuesta de un 55% de mujeres y un 45% de hombres, se tomara
una muestra que contenga tambin esos mismos porcentajes de hombres y mujeres.
Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados con este
procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos
conocidos N
1
, N
2
,..., N
h
tal que las unidades en cada estrato sean homogneas respecto a la caracterstica en
cuestin. La media y la varianza desconocidas para el i-simo estrato son denotadas por m
i
y s
1
2
,
respectivamente.
Ec.QuispeG.JimmyJavier
67
68
6.2 Estimacin
6.2.1 Estimadores puntuales e intervalos de confianza de una media
Un estimador puntual es un estadstico calculado a partir de informacin de la muestra para estimar el
parmetro poblacional.
Intervalo de confianza es un conjunto de valores formados a partir de una muestra de datos de forma que
exista la posibilidad de que el parmetro poblacional ocurra dentro de dicho conjunto con una probabilidad
especfica. La probabilidad especfica recibe el nombre de nivel de confianza.
6.2.1.1 Desviacin estndar de la poblacin conocida
A partir del valor z y del error estndar de la media podemos calcular un intervalo de confianza para la media
poblacional con una conocida:
x _z
o
n
Para este intervalo el valor z define el nivel de confianza que se desee obtener, ese nivel de confianza debe
dividirse para 2 debido a que el intervalo tiene 2 lmites, uno inferior y otro superior.
Ejemplo:
El gerente de control de calidad de una fbrica de focos necesita estimar la vida promedio de un gran
embarque. Se sabe que la desviacin estndar del proceso es de 100 horas. Una muestra aleatoria de 50 focos
mostr una vida promedio de 350 horas.
Estime un intervalo de confianza del 95% de vida promedio real de los focos en este embarque
= 100 horas
x = 350 horas
n = 50 focos
x Zo
2
c
n
350 Z
0.025
100
50
350 1.96
100
7.07
350 1.96 (14.144)
(322.27; 377.72) La vida promedio real de los focos se encuentra entre 322.67 y 377.72 horas
6.2.1.2 Desviacin estndar poblacional desconocida
Cuando desconocemos la desviacin poblacional entonces aplicamos el siguiente distribucin conocida como
distribucin t student:
t =
x -p
s
n
Esto nos permite calcular el siguiente intervalo de confianza para la media con desviacin estndar
poblacional desconocida:
x _t
s
n
Para trabajar con el valor t se debe conocer el nivel de confianza deseado en el intervalo de confianza, ese
valor dividirlo para 2 segn el caso (depende de la tabla t) y buscar en la tabla de distribucin t.
Ejemplo:
Los siguientes datos son el nmero de kilmetros al ao que es manejado el automvil por una muestra de 25
propietarios de automviles:
Ec.QuispeG.JimmyJavier
69
70
71
6.2.4 Factor de correccin de una poblacin finita
Cuando el nmero de elementos de una poblacin es conocida se dice que la poblacin es finita y se debe
aplicar la siguiente frmula para ajustar los errores muestrales.
FPC =
_
N -n
N -1
Si se desea encontrar un intervalo de confianza para la media con desviacin desconocida y poblacin finita,
entonces tendramos:
x _t
s
n
_
N -n
N -1
6.2.5 Eleccin del tamao adecuado de una muestra
En la prctica una de las frmulas que se aplica para determinar el tamao de muestra para determinar el
comportamiento poblacional es la siguiente:
n =
z
2
Nn(1 -n)
c
2
(N -1) +z
2
n(1 -n)
Donde:
z : es el valor que obtiene de la tabla o en Excel a partir del nivel de confianza
N: poblacin conocida o finita
: probabilidad de xito (si no se conoce este valor se trabaja con 0.5)
e: error mximo permitido
Ec.QuispeG.JimmyJavier
72
Competenciasespecficas:
Capacidaddeplantearhiptesis
Validarunahiptesisdeunparmetroamanoyacomputadora
Plantearhiptesisensuprofesin
73
74
Valor p.- Es la probabilidad de observar un valor muestral tan extremo o ms que el valor observado, si la
hiptesis nula es verdadera. Se lo encuentra a partir del estadstico de prueba y no a partir del nivel de
confianza, es decir el valor del estadstico de prueba lo busco en la tabla o en software. El siguiente grfico
muestra el valor p para una prueba de una cola, cuando la prueba es de dos colas entonces se suman ambos
valores p (probabilidad sombreada)
Interpretacin de la importancia de la evidencia en contra de Ho si el valor p es menor que:
a) 0.10, hay cierta evidencia de que Ho no es verdadera.
b) 0.05, hay evidencia fuerte de que Ho no es verdadera.
c) 0.01, hay evidencia muy fuerte de que Ho no es verdadera.
d) 0.001, hay evidencia extremadamente fuerte de que Ho no es verdadera.
Se debe tener en cuenta adems que si el valor p es menor que el nivel de significancia () entonces se
rechaza Ho, si es mayor que el nivel de significancia no se rechaza Ho.
Las pruebas de hiptesis planteadas en la presente gua tienen la siguiente forma:
7.4 Prueba de la media con desviacin poblacional conocida y desconocida
Prueba de hiptesis para cuando se conoce la desviacin poblacional (muestra grande)
Prueba de una cola
H
o
:
o
Ho:
o
H
a
: >
o
Ha: <
o
Prueba de dos colas
Ho: =
Ha: o
Ec.QuispeG.JimmyJavier
75
Estadstico de prueba
Z =
X -
cn
Ejemplo:
En los folletos de propaganda, una empresa asegura que las bombillas que fabrican tiene una duracin media
de 1600 horas. A fin de contrastar este dato, se tomo una muestra aleatoria de 100 bombillas, obtenindose
una Duracin media de 1570 horas, con una desviacin tpica de 120 horas. Puede aceptarse la informacin
de los folletos con un nivel de confianza del 95%?
Datos
n = 100
y = 1600
= 120 Ho: = 1600
= 95% Ha: 1600
z =
x -
s n
z =
1S7u -16uu
12u 1uu
= -2.S
Se rechaza la hiptesis nula, el estadgrafo de prueba se encuentra en la regin de rechazo, es decir, que la
duracin media de las bombillas es diferente a 1600 con un nivel de confianza del 95%.
Pruebas de hiptesis de la media poblacional con desviacin desconocida (Distribucin t Student)
Prueba de una cola
Ec.QuispeG.JimmyJavier
76
H
o
:
o
Ho:
o
H
a
: >
o
Ha: <
o
Prueba de dos colas
Ho: =
Ha: o
Estadstico de prueba
t =
-
sn
Ejemplo:
Se obtiene una muestra de 16 estudiantes con una x = 68 y una desviacin de 9 en un examen de estadstica.
Hay evidencia suficiente que apoye que la media poblacional de las calificaciones de estadstica es mayor de
70 con = 02
Datos
n = 16
y = 70
s= 9 Ho: 70
= 98% Ha: < 70
t =
x -
s n
t =
68 -7u
9 16
= -2.67
Ec.QuispeG.JimmyJavier
77
Se rechaza la hiptesis nula, el estadstico de prueba se encuentra en la regin de rechazo. es decir, la media
poblacional de calificaciones de estadstica es menor a 70 con un nivel de confianza del 98%.
7.5 Prueba de hiptesis de la proporcin
Prueba de una cola
H
o
: p
o
H
o
: p
o
H
a
: < p
o
H
a
: > p
o
Estadstico de prueba
Z =
p-a
_
a(1-a)
n
Prueba de dos colas
Ho: = p
0
Ha: p
0
Ec.QuispeG.JimmyJavier
78
Ejemplo:
En una muestra de 1000 nacimientos el numero de varones ha sido 542 Puede considerarse con un nivel de
significacin del 10% que en general nacen ms nios que nias?
E
0
: u.S
E
u
: > u.S
n = 1uuu
x= S42
n = u.S p =
542
1000
= u.S42
Z =
u.S42 -u.S
_
(u.S)(u.S)
1uuu
=
u.u42
_
u.2S
1uu
=
u.u42
u.uuu24
=
u.u42
u.u16
= 2.6S
Se rechaza la hiptesis nula, debido a que cae en la regin de rechazo, es decir se puede concluir que en
general nacen ms nios que nias en esa localidad con un nivel de confianza del 90%.
7.6 Error tipo II
Recordemos que la probabilidad de que se rechace la hiptesis nula cuando es verdadera es , y se llama
error tipo I, Tambin hay la probabilidad () de aceptar la hiptesis nula cuando en realidad es falsa (error
tipo II).
Con el fin de calcular la probabilidad de que esto ocurra es til considerar la probabilidad como el rea bajo
la distribucin muestral, con base en la media verdadera de la poblacin superpuesta a la distribucin
muestral supuesta en la hiptesis nula, y en la regin de no rechazo.
Ec.QuispeG.JimmyJavier
79
La probabilidad del error Tipo II se calcula asumiendo que la hiptesis nula es falsa, ya que sta se define
como la probabilidad de no rechazar una hiptesis nula falsa.
El procedimiento para calcular el error Tipo II, para un valor especfico de supuesto en H
0
es el siguiente:
1. Establecer la regin de no rechazo para H
0
, utilizando la media supuesta en H
0
y los datos del problema.
2. Usar la tabla z o Excel (spss) para determinar los puntos crticos correspondientes a (Z
c
),
3. Determinar los valores o valor de correspondientes a los valores crticos, utilizando la igualdad
x = Z
o
n
+
0
.
4. Dibujar la distribucin de la media verdadera (correspondiente a H
a
verdadera o H
0
falsa). (Vase figura
inferior)
5. Determinar los valores crticos correspondientes a los valores de , calculados en el paso 3.
igualdad
z
[
=
x -
u
o n
.
6. 6. Usar la tabla z o Excel (spss) para determinar el valor de .
Ejemplo:
Suponga que el sueldo de los profesionales administrativos por hora es de $5. Suponga que realiza una
muestra a 36 personas de algunas entidades pblicas y concluye que la media de las horas laboradas es de
$5.22 con una desviacin estndar de $.06. A un nivel de significancia de 0.01 puede concluirse que las horas
laborables de los profesionales administrativos es superior a $5?
X
z
X
Ec.QuispeG.JimmyJavier
80
Eo: S; Eo: > S
z =
x -
s n
z =
S.22 -S
u.6 S6
= 2.2
Conclusin: No se rechaza la hiptesis nula, es decir que no hay pruebas suficientes que indiquen que las
horas de trabajo de los profesionales administrativos son superiores a $5 con un nivel de confianza del 99%.
Si nos damos cuenta no rechazamos la hiptesis nula, lo que nos llevara a cometer tal vez un error tipo II
(Aceptar la hiptesis nula cuando en realidad es falsa)
Ejemplo: Cul es la probabilidad del error Tipo II si la hora/trabajo verdadero es de $5.10?
1. Distribucin de H
0
Verdadera y regin crtica.
2. z de tabla z o Excel (spss) correspondiente a un nivel de significancia de 0.01.
3. Clculo de:
x = Z
o
n
+
0
x = 2.S26
u.6
S6
+S = S.2S26
Se calcula con la media poblacional original (=5) y el valor resultante se reemplaza en la frmula del
numeral 4.
4. Distribucin de H
0
Falsa y ubicacin de .
5. Clculo de z
z
[
=
x -
u
o n
z
[
=
S.2S26 -S.1u
u. 6u S6
= 1.S26
Ec.QuispeG.JimmyJavier
81
6. El valor de (de tabla z, Excel o spss) es 0.9082, que es la probabilidad de cometer error tipo II.
Ejemplo: Cul es la probabilidad del error Tipo II si la hora/trabajo es de $5.50?
1. Distribucin de H
0
Verdadera y regin crtica.
2. z de tabla, Excel o spss correspondiente a . Cuyo valor crtico Zc es 2.326
3. Clculo de
x = Z
o
n
+
0
x = 2.S26
u.6
S6
+S = S.2S26
4. Distribucin de H
0
Falsa y ubicacin de .
5. Clculo de
z
[
=
x -
0
o n
z
[
=
S.2S26 -S.S
u.6u S6
= -2.674
6. El valor de (de tabla, Excel o spss) es 0.0035, esta es la probabilidad de cometer un error tipo II.
01 . 0 =
Ec.QuispeG.JimmyJavier
82
En los siguientes tres tems (7.7, 7.8 y 7.9) se pretende probar que cuando se obtienen muestras aleatorias de
dos poblaciones distintas, sus medias o proporciones de la poblacin son o no iguales. Veremos solo tres
casos:
7.7 Prueba de Hiptesis para dos muestras: Muestras independientes y desviaciones conocidas.
Supuestos:
Las dos muestras no deben estar relacionadas, es decir, deben ser independientes.
Debe conocerse la desviacin estndar para las dos poblaciones.
Prueba de hiptesis:
Prueba de una cola
H
o
:
1
2
Ho:
1
2
H
a
:
1
>
2
Ha:
1
<
2
Prueba de dos colas
Ho:
1
=
2
Ha:
1
2
Los grficos siguen la misma direccin anteriormente explicado.
Estadstico de prueba de dos medias de muestras independientes y desviaciones conocidas:
z =
x
1
-x
2
_
o
1
2
n
1
+
o
2
2
n
2
Ejemplo:
Se realiz un estudio para comparar las ventas de una industria durante dos aos: 2005 y 2006. Con un nivel
de significancia de .01 Podemos concluir que las ventas del ao 2006 son mayores a las del 2005?
Ec.QuispeG.JimmyJavier
83
84
p
c
=
SS +22
Suu +2Su
= u.1uS6
z =
u.1167 -u.u88
_
u.1uS6(1 -u.1uS6)
Suu
+
u.1uS6(1 -u.1uS6)
2Su
= 1.u99
El z crtico es 1.645, por lo que H
0
no se rechaza, es decir no hay pruebas suficientes de que la proporcin de
los trabajadores solteros falten ms de 5 das que la proporcin de trabajadores casados que tambin faltan
ms de 5 das al trabajo.
El valor p es: P{ z > 1.1} = 0.1357, como es mayor que el nivel de significancia entonces no rechazamos Ho.
7.9 Prueba de medias con desviaciones poblacionales desconocidas
La prueba de hiptesis es:
Prueba de dos colas
Eo: o
1
2
= o
2
2
Eo: o
1
2
= o
2
2
Estadstico de prueba:
F =
S
1
2
S
2
2
En esta prueba de hiptesis se trabaja con la distribucin F, se busca en la tabla F o Excel 8spss), en Excel
mediante la funcin: distr.f.inv (probabilidad /
2
; grados de libertad 1; grados de libertad 2)
Como la prueba es de dos colas, entonces hay que dividir el nivel de significancia para dos y con ese valor se
analiza.
Colin, agente de bolsa del Critical Securities, report que la tasa media de retorno en una muestra de 10
acciones de software fue 12.6% con una desviacin estndar de 3.9%. La tasa media de retorno en una
muestra de 8 acciones de compaas de servicios fue 10.9% con desviacin estndar de 3.5%. Para 0.05 de
nivel de significancia, Puede Colin concluir que hay diferencia en las variaciones de acciones de software y
de compaas de servicio?
Eo: o
s
2
= o
c
2
Eo: o
s
2
= o
c
2
Ec.QuispeG.JimmyJavier
85
F =
S
s
2
S
c
2
=
u.uS9
2
u.uSS
2
=
u.uu1S21
u.uu122S
= 1.2416
No se rechaza Ho, debido a que el estadstico de prueba no cae en la regin de rechazo, es decir no hay
pruebas suficientes que indiquen que existen diferencias entre las desviaciones de las dos acciones con un
nivel de confianza del 95%.
7.10 PruebaANOVA
La distribucin F tambin se usa para probar la igualdad de ms de dos medias poblacionales con una tcnica
llamada anlisis de variancia (ANOVA). Se requiere las siguientes condiciones:
La poblacin que se muestrea tiene una distribucin normal.
Las poblaciones tienen desviaciones estndar iguales
Las muestras se seleccionan al azar y son independientes
Pasos:
1.- Formule las hiptesis nula y alternativa:
Hiptesis nula: las medias de las poblaciones son iguales.
H
o
:
1
=
2
=
3
=
4
Hiptesis alterna: al menos una de las medias es diferente.
Ha: No todas las medias son iguales
Si no se rechaza la hiptesis nula se concluye que no hay diferencia en las medias para las diferentes
poblaciones. Si rechaza Ho se concluye que hay una diferencia en al menos un par de medias poblacionales,
pero en este punto no se sabe cual par o cuantos pares difieren.
2.- Seleccione el nivel de significancia.
3.- Determine el estadstico de prueba.
Estadstico de prueba: F = (variancia entre muestras) / (variancia dentro de muestras).
4.- Formule la regla de decisin.
Para esto es necesario tener el valor crtico de F, se lo obtiene teniendo en cuenta:
Grados de libertad en el numerador = k 1
Ec.QuispeG.JimmyJavier
86
)
2
X: Cada observacin de la muestra
X
C
)
2
X
C
: Media muestral para el tratamiento c.
Variacin de tratamiento: Suma de las diferencias elevadas al cuadrado entre la media de cada tratamiento y
la media total o global.
SSI = SSIotol -SSE
Regla de decisin: , la hiptesis nula se rechaza si F (calculada) para un nivel de significancia es mayor que
F (en tablas) con grados de libertad en el numerador y en el denominador.
7.11 Prueba de bondad de ajuste: frecuencias esperadas iguales.
La prueba de Bondad de Ajuste es una de las pruebas estadsticas de uso ms comn. Se analizar el caso de
frecuencias esperadas iguales.
1.- Formule la hiptesis nula y alternativa.
La hiptesis nula es que no hay diferencia entre el conjunto de frecuencias observadas y el conjunto de
frecuencias esperadas.
La hiptesis alternativa es que hay diferencia entre los conjuntos observado y esperado de frecuencias. Si
rechaza Ho y acepta Ha, significa que las frecuencias observadas no se distribuyen de igual forma entre todas
las categoras.
2.- Seleccione el nivel de significancia.
3.- Seleccione el estadstico de prueba.
Ec.QuispeG.JimmyJavier
87
c
_
Con k 1 grados de libertad, donde:
k es el nmero de categoras.
f
o
es una frecuencia observada en una categora particular.
f
e
es una frecuencia esperada en una categora particular.
4.- Formule la regla de decisin
5.- Calcule el valor de ji cuadrado y tome una decisin
Ejemplo:
La seora Patio es la gerente de marketing de un fabricante de tarjetas deportivas. Ella planea iniciar la
venta de una serie de fotografas y estadsticas de juegos de jugadores de ftbol que participaron en el ltimo
mundial. Uno de los problemas es la seleccin de jugadores. En una exhibicin de tarjetas de ftbol en el
Paseo Shopping el pasado fin de semana, instal un puesto y ofreci tarjetas de los siguientes seis jugadores:
Lionel Mesi, Diego Forln, Iker Casillas, Rafael Mrquez, Cristiano Ronaldo y Kak. Al final del da vendi
120 tarjetas. La seora Patio puede concluir que las ventas no son iguales por cada jugador?
El nmero de tarjetas vendidas es la siguiente:
Jugador Tarjetas vendidas
Lionel Messi 13
Diego Forln 33
Iker Casillas 14
Rafael Mrquez 7
Cristiano Ronaldo 36
Kak 17
Total 120
Desarrollo:
Eo: No boy Jicrcncio cntrc con]untos Jc rccucncios obscr:oJos y cspcroJos
Eo: Eoy uno Jicrcncio cntrc con]untos Jc rccucncios obscr:oJos y cspcroJos
7.12 Aplicacin en escel y spss
Ec.QuispeG.JimmyJavier
88
En la tabla chi cuadrada podemos darnos cuenta que con 5 grados de libertad el valor chi cuadrado crtico es
11.070, por lo tanto con un nivel de significacin del 0.05, se rechaza la Hiptesis nula y aceptar la hiptesis
alternativa. Es decir, las diferencias entre las frecuencias observadas y esperadas no se debe a la casualidad
sino que las diferencias son bastante grandes. Por lo que se concluye que es improbable que las ventas de
tarjetas sean las mismas entre los seis jugadores.
En la hoja de clculo podemos darnos cuenta que se hall el valor p que al ser menor que el valor alfa se
concluye que se rechaza la hiptesis nula.
La distribucin chi cuadrada puede cambiar de figura dependiendo del nmero de grados de libertas, adems
nunca toma valores negativos. Observemos el siguiente grfico (v son los diferentes grados de libertad):
Ec.QuispeG.JimmyJavier
89
.
Ec.QuispeG.JimmyJavier
90
Unidad VIII: REGRESIN LINEAL SIMPLE Y MLTIPLE
Objetivo: Analizar datos histricos o recopilados mediante un modelo de regresin lineal o mltiple para la
prediccin del comportamiento poblacional.
Competencias especficas:
Predecir comportamiento de variables
Aplicar modelos de regresin simple en Excel y regresin mltiple en spss
Anlisis crtico de situacin empresarial actual y futura
8.1. Regresin Lineal Simple
8.1.1. Supuestos y elementos
El objetivo es analizar el grado de la relacin existente entre variables utilizando modelos matemticos y
representaciones grficas. As pues, para representar la relacin entre dos o ms variables desarrollaremos
una ecuacin que permitir estimar una variable en funcin de la otra.
Por ejemplo, en qu medida, un aumento de los gastos en publicidad hace aumentar las ventas de un
determinado producto?, cmo representamos que la bajada de temperaturas implica un aumento del
consumo de la calefaccin?,...
A continuacin, estudiaremos dicho grado de relacin entre dos variables en lo que llamaremos anlisis de
correlacin. Para representar esta relacin utilizaremos una representacin grfica llamada diagrama de
dispersin y, finalmente, estudiaremos un modelo matemtico para estimar el valor de una variable
basndonos en el valor de otra, en lo que llamaremos anlisis de regresin.
Supuestos:
1. Los valores de la variable independiente X son fijos, medidos sin error.
2. La variable Y es aleatoria
3. Para cada valor de X, existe una distribucin normal de valores de Y (subpoblaciones Y)
4. Las variancias de las subpoblaciones Y son todas iguales.
5. Todas las medias de las subpoblaciones de Y estn sobre la recta.
6. Los valores de Y estn normalmente distribuidos y son estadsticamente independientes
El modelo de regresin lineal simple es:
y = [
0
+[
1
x +e
Elementos:
y : variable dependiente
x : variable independiente
E(y) : [
0
+[
1
x es el componente determinstico (la ecuacin de una recta)
e : componente de error aleatorio
0
: ordenada al origen de la lnea, es decir el punto en el que la lnea intercepta el eje y.
[
1
: Pendiente de la lnea, es decir, magnitud del incremento (o decremento) del componente
determinstico de y por cada unidad de incremento en x.
8.1.2. Mtodo de Mnimos Cuadrados
Para poder estimar los parmetros
0
y
1
se aplicar el mtodo de mnimos cuadrados. Como se va a estimar
los parmetros mencionados, entonces la ecuacin de regresin lineal queda de la siguiente manera:
y = b
1
+bx
Las frmulas para encontrar los valores a y b son:
Ec.QuispeG.JimmyJavier
91
b
1
=
n xy -x y
n xi
2
-(xi)
2
b
0
= y -b
1
x
El presente tema se desarrollar con el siguiente ejemplo:
El Analista de una fbrica estadounidense de automviles querra desarrollar un modelo estadstico para
predecir el tiempo de entrega (los das entre la compra del automvil y la entrega real del mismo) de
automviles nuevos de fabricacin especial. El cree que hay relacin lineal entre las opciones del automvil
ordenado y su tiempo de entrega. Se selecciona una muestra aleatoria de 16 automviles; los resultados se
presentan a continuacin:
Automvil
Nmero de opciones
ordenadas X
Tiempo de entrega Y (en
das)
1 3 25
2 4 32
3 4 26
4 7 38
5 7 34
6 8 41
7 9 39
8 11 46
9 12 44
10 12 51
11 14 53
12 16 58
13 17 61
14 20 64
15 23 66
16 25 70
Total 192 748
a) Prepare un diagrama de dispersin.-
El diagrama de dispersin contribuye para conocer la tendencia de la relacin entre la variable
independiente y dependiente.
25
35
45
55
65
75
5 10 15 20 25
Ec.QuispeG.JimmyJavier
92
b) Suponiendo una relacin lineal, use el mtodo de mnimos cuadrados para calcular los coeficientes
de regresin b
1
b
0
y =
748
16
= 46.8
x =
192
16
= 12
b =
n xy -x y
n xi
2
-(xi)
2
b
1
=
16(1uS91) -(192)(748)
16 (2988) (192)
2
b
1
=
1662S6 -14S616
478u8 -S6864
b
1
=
2264u
1u994
b
1
= 2.u687
b
0=
y - b
1
x
b
0=
46.8 -2.u7 (12)
b
0=
21.92
y = 21. 9 +2. 7x
8.1.3. Interpretacin de la pendiente de la recta b
1
y prediccin
c) Interprete el significado de la pendiente b
1
Por cada auto adicional que se pida, la empresa se demora 2.07 das para entregarlo
d) Si se orden un automvil que tena 16 opciones Se puede predecir cuantos das se necesitarn para
su entrega?
Y
= h
+h
1
(x|)
= SS.u8
Ec.QuispeG.JimmyJavier
93
Y| - h
1
X|Y|
38026 21.9254 (748) 2.0687 (10391)
38026 16400,19 21495,86 = 129,95
SST = SSR + SSE
r
2
=
SSR
SSI
2927,76
2927,76+129,95
= 0,9575
Ec.QuispeG.JimmyJavier
94
El coeficiente de determinacin, el 95.75% se puede explicar por la variabilidad por el nmero de opciones o
autos pedidos.
g) Calcule el coeficiente de correlacin
r = r
2
= u.9S7S = 0.9785 = 97,85%
El coeficiente de correlacin es igual a 97,85% lo que indica que existe una fuerte relacin entre las variables
Nmero de opciones ordenadas (autos) y el tiempo de entrega.
8.1.6. Prueba de hiptesis
h) Al nivel de significancia de 0.05 Hay relacin lineal entre las opciones y el tiempo de entrega?
E
0
: [
1
= u
E
u
: [
1
= u
t =
b
1
-[
1
Sb
1
Sb
1
=
Sxy
_
Xi
2
-
(xi)
2
n
2,S4
_
2988 -
(192)
2
16
2,S4
2988 - 2Su4
2,54
684
=
254
26,15
= u.u9711
t =
2,07 -0
0,09711
= 21,S1
Se rechaza la hiptesis nula debido a que el estadstico de prueba cae en la regin de
rechazo, es decir, que hay alguna relacin entre las variables das de entrega y #de pedidos
de autos con un nivel de confianza del 95%
Ec.QuispeG.JimmyJavier
95
8.1.7. Aplicacin en Excel y SPSS
8.2. Regresin Lineal Mltiple en spss
8.2.1. Ecuacin de regresin mltiple
Dispone de una ecuacin con dos variables independientes adicionales:
Se puede ampliar para cualquier nmero "m" de variables independientes:
Para poder resolver y obtener a, b1 y b2 en una ecuacin de regresin mltiple el clculo se presenta muy
tediosa porque se tiene atender 3 ecuaciones que se generan por el mtodo de mnimo de cuadrados:
Ec.QuispeG.JimmyJavier
96
Para poder resolver se puede utilizar programas informticos como SPSS, Minitab y/o Excel.
8.2.1.1. Error estndar de estimacin mltiple
El error estndar de la regresin mltiple S
xy.
Es una medida de dispersin la estimacin se hace ms precisa conforme el grado de dispersin alrededor del
plano de regresin se hace mas pequeo.
Para medirla se utiliza la formula:
Y: Valores observados en la muestra
y: Valores estimados a partir a partir de la ecuacin de regresin
n : Nmero de datos
m : Nmero de variables independientes
8.2.1.2. Coeficiente de determinacin mltiple
Mide la tasa porcentual de los cambios de Y que pueden ser explicados por x
1,
x
2 y
x
3
, simultneamente.
8.2.2. Evaluacin de supuestos
8.2.2.1. Linealidad
Existe una relacin lineal, es decir, existe una relacin directa entre la variable dependiente y el conjunto de
variables independientes.
8.2.2.2. Homoscedasticidad
La variacin en los residuos es la misma tanto para valores grandes como pequeos de y. En otras palabras,
(y -y) no est relacionada, ya sea que y sea grande o pequea.
8.2.2.3. Normalidad
Los residuos siguen la distribucin de probabilidad normal, recordemos que el residuo es la diferencia entre
(y -y). Estos residuos debern seguir de manera aproximada una distribucin normal. Adems, la media de
los residuos deber ser 0.
8.2.2.4. Multicolinealidad
Las variables independientes no debern estar correlacionadas, es decir, conviene seleccionar un conjunto de
variables independientes que no estn correlacionadas entre s.
8.2.2.5. Independencia
Los residuos son independientes, esto significa que las observaciones sucesivas de las variables dependientes
no estn correlacionadas. Esta suposicin con frecuencia se viola cuando se comprende el tiempo con las
observaciones meustreadas.
8.2.3. Regresin por pasos
Mediante el siguiente problema podremos ilustrar la aplicacin de Regresin Multiple:
En la Facultad de Ingeniera de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere
entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al
Ec.QuispeG.JimmyJavier
97
azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de
Datos y Programacin como se muestran en el siguiente cuadro.
98
Por lo tanto podemos construir la ecuacin de regresin que buscamos:
El Error Estndar de Regresin Mltiple
Mediante esta medida de dispersin se hace ms preciso el grado de dispersin alrededor del plano de
regresin, se hace ms pequeo.
Para calcularla se utiliza la formula siguiente:
En los resultados de Excel se llama error tpico y para explicar la relacin del aprendizaje de PHP que se
viene desarrollando es de 0.861
El coeficiente de determinacin mltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las variables mltiples, utilizando la
si siguiente formula:
IV.- CONCLUSIONES
El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las
asignaturas de Algoritmos, Base de Datos y Programacin.
99
Trabajo Autnomo
Cada ejercicio o problema debe ser resuelto en computadora (Excel o spss segn el caso) y a calculadora de
manera que se desarrolle competencias y agilidad en el desarrollo y anlisis de temas estadsticos.
Unidad 1: Introduccin a Estadsticas, Frecuencias y Grficas
1. Cul es el nivel de medicin de cada una de las siguientes variables?
a) Coeficientes intelectuales de los alumnos.
b) La distancia que viajan los estudiantes para viajar a clases.
c) Las calificaciones de los estudiantes en el primer examen de estadstica.
d) Una clasificacin de alumnos por fechas de nacimiento.
e) Una clasificacin de estudiantes que cursan primero, segundo, tercero o ltimo grado.
f) Nmero de alumnos que los alumnos estudian a la semana.
2. En los siguientes casos determine si el grupo representa una muestra o una poblacin.
a) Los participantes en el estudio de un nuevo frmaco contra el colesterol.
b) Los conductores que recibieron una multa por exceso de velocidad en la ciudad de Salinas en la ltima
temporada.
c) Beneficiarios del programa de asistencia social en Cook Country (Chicago), Illinois.
d) Las 30 acciones que forman parte del promedio industrial Dow Jones.
3. En un estudio de mercado, se pidi a 100 consumidores que seleccionaran el mejor reproductor musical
digital entre iPod, iRiver y Magic Star MP3. Con la finalidad de resumir las respuestas de los consumidores
en una tabla de frecuencias, Cuntas clases tendra la tabla de frecuencias?
4. Se pregunt a un total de 1.000 residentes de Minnesota qu estacin del ao preferan. Los resultados fueron
que: A 100 les gustaba ms el invierno; a 300, la primavera; a 400, el verano y a 200 el otoo. Si se
resumieran los datos en una tabla de frecuencias, Cuntas clases seran necesarias? Cules seran las
frecuencias relativas de cada clase? Presente los datos mediante una grfica de frecuencias de barras.
5. Se pregunt a 2.000 viajeros de negocios frecuentes de Midwestern qu ciudad de la regin central de
Estados Unidos preferan: Indianpolis, San Luis, Chicago o Milwaukee. A 100 les gustaba Indianpolis; a
450 San Luis; a 1.300 Chicago y el resto prefera Milwakee. Elabore una tabla de frecuencias y una tabla de
frecuencias relativas para resumir esta informacin. Presente la informacin con una grfica de pastel.
6. MARK S.A. produce y comercializa fundas de reposicin para telfonos celulares en una variedad de
colores. A la compaa le gustara circunscribir sus planes de produccin a 5 diferentes colores. La compaa
mont un quiosco en el Paseo Shopping por varias horas y pregunt a personas elegidas de forma aleatoria,
que color de fundas era su favorito. Los resultados fueron los siguientes:
Blanco Brillante 130
Negro Metlico 104
Lima Magntico 325
Naranja Tangerina 455
Rojo Fusin 286
a) Qu nombre recibe la tabla?
b) Elabore una grfica de barras para la tabla y una grfica de pastel.
c) Si Mark S.A. tiene planes de producir un milln de fundas para telfono celular, Cuntas de cada color
debera producir?
7. La siguiente tabla muestra informacin de una empresa de publicidad que posee 78 clientes en la Provincia
de Santa Elena. Presente los datos mediante una grfica de barras de frecuencia relativa y de pastel.
Salinas 12
La Libertad 45
Santa Elena 21
100
8. La siguiente distribucin de frecuencias muestra el nmero de millas de viajero frecuente, expresado en miles
de millas, de empleados Servi Plus durante el primer trimestre de 2007.
Millas de viajero
frecuente (miles)
Nmero de
empleados
0 a 3 5
3 a 6 12
6 a 9 23
9 a 12 8
12 a 15 2
Total 50
a) Cuntos empleados se estudiaron?
b) Cul es el punto medio de la primera clase?
c) Si un empleado recorre 3.000 millas frecuentemente, Dnde se agrupa la observacin? Explique.
d) Construya un histograma e interprete
e) Dibuje un polgono de frecuencias, Cules son las coordenadas de la marca correspondiente a la
primera clase?
f) Construya un polgono de frecuencias e interprete.
g) Interprete las millas de viajero frecuente acumuladas mediante un polgono de frecuencias
acumulativas.
9. A continuacin se muestra el nmero de minutos que le lleva a un grupo de estudiantes de la UPSE viajar en
automvil de su casa al trabajo.
28 25 48 37 41 19 32 26 16 23 23 29 36
31 26 21 32
25
31 43 35 42 38 33 28
a) Cuntas clases recomienda? Qu intervalo de clase sugiere? Cul sera el lmite inferior para la
primera clase?
b) Organice los datos en una distribucin de frecuencias.
c) Presente los datos en un polgono de frecuencias e interprete.
10. Los siguientes datos proporcionan las cantidades semanales que gasta en abarrotes una muestra de casas.
$271 $373 $159 $76 $227 $337 $50 $319 $250 $474 $278 $162 $434 $41 $335
279 116 205 100 279 151 266 240 199 279 297 295 232 123 320
192 429 181 294 321 570 309 342 246 177 235 170 188 303 325
a) Cuntas clases recomendara? Qu intervalo de clase sugerira?
b) Cul sera el valor del lmite inferior para la primera clase?
c) Organice los datos en una distribucin de frecuencias
d) Presente los datos mediante un histograma y polgono de frecuencias acumulativas. Interprete.
11. Usted tiene los registros de ventas mensuales de la boletera del ltimo ao en una sala de cine. Para
representar este conjunto de datos grficamente, construira usted un grfico de barras o un histograma?
Por qu es esa alternativa mejor que la otra? Utilizando los siguientes datos, construya el grfico que usted
seleccion e indique 3 interpretaciones en porcentajes.
12. Usted juega en un equipo local de ftbol, y durante los ltimos tres aos, ha registrado los goles marcados
por cada uno de los 12 jugadores del equipo. Es ms apropiado crear un grfico de barras o un histograma
para representar la situacin? Utilizando los siguientes datos, disee el grfico apropiado e indique 3
interpretaciones en porcentajes.
Mes Ene
ro
Febre
ro
Mar
zo
Abr
il
Ma
yo
Jun
io
Juli
o
Agos
to
Septiem
bre
Octu
bre
Noviem
bre
Diciem
bre
Vtas.bol
etos
25 30 15 20 30 35 40 20 25 15 20 30
101
13. En una epidemia de escarlatina, se ha recogido el nmero de muertos en 40 ciudades de un pas, obtenindose
la siguiente tabla:
No. de muertos 0 1 2 3 4 5 6 7
Ciudades 7 11 10 7 1 2 1 1
a) Representar grficamente estos datos mediante cualquier grfica.
b) Obtener la distribucin acumulada y representarla grficamente.
14. Las siguientes calificaciones corresponden al tercer perodo del ao 2009-2010 de la carrera de Ingeniera en
Marketing en la asignatura de Estadstica Aplicada.
a) En base a los datos, Debera construir una tabla de frecuencias o una distribucin de frecuencias?
b) Agrupe los datos (en bruto) en clases con sus respectivas frecuencias.
c) Encuentre las frecuencias relativas acumulativas.
d) Presente los datos mediante una grfica de barras de frecuencia relativa o un histograma de frecuencia
relativa. (Analice que tipos de datos han sido recopilados)
15. La tabla siguiente muestra la composicin por edad, sexo y trabajo de un grupo de personas con tuberculosis
pulmonar en la provincia de Vizcaya (Espaa) en el ao 1979:
a) Representar grficamente la distribucin de frecuencias de aquellas personas trabajadoras que padecen
tuberculosis.
b) Graficar la distribucin de frecuencias de los varones no trabajadores que padecen tuberculosis.
c) Graficar la distribucin de frecuencias del nmero total de mujeres que padecen tuberculosis.
d) Cul es la edad en la que se observa con mayor frecuencia que no trabajan los varones? Y las
mujeres? Determinar as mismo la edad ms frecuente (sin distincin de sexos ni ocupacin).
e) Por debajo de qu edad est el 50% de los varones? Por encima de qu edad se encuentra el 80% de
las mujeres?
Jugador 1 2 3 4 5 6 7 8 9 10 11 12
Goles anotados 12 3 24 6 19 12 10 17 4 22 16 8
47 73 68 76 60 35 10 41 46 90 65 61 77 10
0
90 19 72 64 83 56 73
66 78 79 79 94 84 88 94 72 10
0
78 86 73 9 61 36 89 84 68 49
Edad Trabajadores No trabajadores Totales
Varn Mujer Total Varn Mujer Total Varn Mujer Total
14-19 2 1 3 25 40 65 27 41 68
19-24 10 4 14 20 36 56 30 40 70
24-29 32 10 42 15 50 65 47 60 107
29-34 47 12 59 13 34 47 60 46 106
34-39 38 8 46 10 25 35 48 33 81
39-44 22 4 26 7 18 25 29 22 51
102
Unidad 2: Estadgrafos y anlisis de datos
1. Con los siguientes dos conjuntos de datos, ambos con tamao de muestra n=7. Calcule estadgrafos de
localizacin y de dispersin. Analice resultados
2. Un entrenador de pista debe decidir a cul de dos corredoras debe elegir para la prxima carrera de 100
metros planos. El entrenador basar su decisin en los resultados de 5 carreras entre las dos atletas realizadas
en un perodo de una hora con descanso de 15 minutos. Se registraron los siguientes datos en las 5 carreras
(en segundos):
Con base en los datos, A cul de las dos corredoras debe elegir el entrenador? Por qu?
b) Debera ser diferente la seleccin si el entrenador supiera que Kelly se cay al principio de la cuarta
carrera? Por qu? Adems, comente las diferencias entre los conceptos media y mediana como medidas de
tendencia central y su relacin con los literales a) y b).
3. El precio de un departamento sencillo en un da entre semana en diversos hoteles en Salinas fue:
a) Cul es el precio mediano de un departamento de hotel en Salinas? Cul es el precio medio?
b) Cul es la variabilidad de los precios de departamento en Salinas?
c) Qu provecho podra obtener el Gerente Marketing de un reconocido hotel de la localidad con esta
informacin?
4. Los ltimos 10 das de junio, el tren Costa Especial lleg tarde a su destino en los siguientes nmeros de
minutos (un nmero negativo significa que el tren lleg con anticipacin en ese nmero de minutos):
Si el ferrocarril lo contratara a Ud. Para conocer si el tren ofrece un buen servicio, Qu medidas de medicin
utilizara? Cul es la varianza?
5. Una compaa de exportacin de pecado desea conocer el promedio de ventas y costos durante sus ltimos
10 aos; de manera que el Departamento de Mercadeo establezca las estrategias para la crisis financiera del
pas. Los valores estn en miles de dlares.
a) Qu puede concluir sobre las ventas y costos de la compaa de acuerdo a su variabilidad?
b) Qu estrategias recomendara?Sus recomendaciones estaran soportadas sobre sus ventas o sus
costos?
Lote 1: 10 2 3 2 4 2 5
Lote 2: 20 12 13 12 14 12 15
Carrera
Atletas 1 2 3 4 5
Kelly 12.1 12.0 12.0 16.8 12.1
Tamara 12.3 12.4 12.4 12.5 12.4
14,50 21,00 11,00 13,50 9,00 12,50
12,00 10,50 12,40 11,80 12,20 13,00
-3 6 4 10 -4 124 2 -1 4 1
Ao 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Vtas.($) 200 150 160 170 200 220 250 250 300 320
Ctos.($) 140 130 135 140 145 150 170 190 180 185
103
6. Para estimar el suministro de agua que la comunidad de Falling Rock requerir en la siguiente dcada, el
alcalde pidi al administrador de a ciudad que determinara cunta agua utiliza una muestra de familias en
esos momentos. La muestra compuesta por 15 familias utiliz los siguientes galones (en miles) el ao
anterior:
11.2 21.5 16.4 19.7 14.6 16.9 32.2 18.2
13.1 23.8 18.3 15.5 18.8 22.7 14.0
a) Cul es la cantidad promedio de agua utilizada por familia? Cul la mediana? Cul el rango medio?
b) Supngase el alcalde espero que dentro de 10 aos haya en la ciudad 45.000 familias. Cuntos galones
de agua se requerirn al ao si la tasa de consumo por familia permanece igual?
7. Los gastos en publicidad constituyen un elemento significativo del costo de los artculos vendidos. Enseguida
aparece una distribucin de frecuencias que muestra los gastos en publicidad de 60 compaas fabricantes
ubicadas en el suroeste de USA. Calcule la media, mediana, moda y la desviacin estndar de los gastos de
publicidad. Determine la asimetra y curtosis de los datos. Interprete.
8. Una empresa mayorista distribuidora de aparatos elctricos desea estudiar sus cuentas por cobrar para dos
meses sucesivos. Se seleccionan dos muestras independientes de 50 cuentas para cada uno de los meses. Los
resultados son los que se resumen en la siguiente distribucin de frecuencias:
Monto f de marzo f de abril
0 a menos de 2 6 10
2 a menos de 4 13 14
4 a menos de 6 17 13
6 a menos de 8 10 10
8 a menos de 10 4 0
10 a menos de 12 0 3
Totales 50 50
a) Calcule la media, mediana, moda y desviacin estndar para cada conjunto de datos. Interprete.
b) Ubique los estadgrafos respectivos en cada histograma de frecuencia.
c) Presente en un solo grfico los dos conjuntos de datos. (Sugerencia: Utilice Polgono de
frecuencias). Interprete.
d) Determine la asimetra y curtosis de los datos.
9. Una empresa distribuidora de combustible para calefaccin domstica desea comparar el tiempo requerido
para cobrar las facturas del combustible en dos ciudades. Se eligi una muestra aleatoria de 50 pagars de
Quito y 100 de Guayaquil, y se registr el nmero de das entre la fecha de entrega y la fecha de pago, y son
los que se muestran a continuacin:
Gastos en publicidad
(millones $)
Nmero de
compaas
25 a 35 5
35 a 45 10
45 a 55 21
55 a 65 16
65 a 75 8
Totales 60
Nmero de das f en Quito f en Gquil.
0-4 4 6
5-9 14 21
10-14 16 24
15-19 10 30
20-24 5 7
25-29 1 6
29-34 0 6
Totales 50 50
104
a) Calcule la media, mediana, moda y desviacin estndar para cada conjunto de datos. Interprete.
b) Ubique los estadgrafos respectivos en cada histograma de frecuencia
c) Determine la asimetra y curtosis de los datos.
10. La siguiente distribucin de frecuencias muestra los resultados de un censo realizado a una localidad y donde
se observa las edades de las personas con su frecuencia.
a) Calcule la media; mediana, moda y desviacin estndar. Determine si existe sesgo en los datos.
b) Grafique los datos en un histograma y localice los estadgrafos.
11. La siguiente tabla muestra el nmero de autos vendidos en los ltimos 24 meses en una concesionaria.
23 27 30 27 32 31 12 32 35 33 26 28
28 39 32 29 35 36 33 25 15 37 40 30
a) Dibuje un diagrama de puntos. Presente los datos en un diagrama de tallo y hojas.
b) Dibuje un diagrama de caja
12. La siguiente tabla muestra las visitas que 40 personas hacen a familias de una provincia. En la lista de abajo,
en orden de menor a mayor, aparece la cantidad de visitas de la semana pasada.
38 40 41 45 48 48 50 50 51 51 52 52 52 53 54 55 55 55 56 56
57 59 59 59 62 62 62 63 64 65 66 66 67 67 69 69 71 77 78 79
a) Realice un diagrama de tallos y hojas
b) Determine la cantidad mediana de llamadas. Determine el primer y noveno decil, el 33percentil.
c) Dibuje un diagrama de caja
13. El siguiente diagrama de tallo y hojas muestra el nmero de unidades producidas por da en una fbrica.
a) Cuntos das se registraron? Cuntas observaciones hay en la primera clase?
b) Cul es el valor mnimo y el valor mximo?
c) Elabore una lista de los valores reales de la cuarta fila.
d) Cuntos valores son menores que 70? Cuntos valores son mayores a 80 o ms? Cuntos valores
se encuentran entre 60 y 89, inclusive?
e) Cul es la mediana? Cul es el primer y tercer cuartil? Dibuje un diagrama de puntos y de caja.
Das f
0 4 6
5 9 30
10 14 22
15 19 18
20 24 14
25 29 10
30 34 6
3 8
4
5 6
6 0 1 3 3 5 5 9
7 0 2 3 6 7 7 8
8 5 9
9 0 0 1 5 6
10 3 6
105
Unidad 3: Introduccin a Probabilidad
1. Qu es probabilidad? Cite tres ejemplos para cada uno de los siguientes enfoques de la teora de
probabilidad:
9 Enfoque clsico a priori
9 Enfoque clsico de frecuencia relativa
9 Enfoque subjetivo
2. Si se lanza una moneda una vez, tres veces, diez veces, Cuntos resultados diferentes son posibles?
3. Si se lanza un dado una vez, dos veces, cuatro veces, Cuntos resultados diferentes son posibles?
4. Si se va a colocar en una repisa un grupo de seis libros de texto, pero solo hay lugar para cuatro de ellos En
cuntas formas se pueden colocar en el estante estos libros?
5. Si se va a colocar en una repisa un grupo de seis libros de texto, Cul es el nmero de formas en que se
pueden colocar los seis libros?
6. Un jardinero dispone de siete surcos en su hortaliza para sembrar tomates, berenjenas, pimientos, pepinos,
frjoles, lechugas y calabazas. A cada verdura se le asignar un solo surco. De cuntas formas puede colocar
estas verduras en su jardn?
7. Los cinco individuos que componen la direccin de una pequea empresa manufacturera sern sentados
juntos en un banquete. Determinar el nmero de diferentes posiciones posibles de los asientos para los cinco
individuos.
8. En relacin al ejemplo anterior, supongamos que slo a tres de los cinco directivos se les pedir representar a
la compaa en el banquete. Cuntas diferentes posiciones sern posibles en la mesa considerando que
pueden ser elegidos tres cualesquiera de los cinco individuos?
9. Una trifecta en el hipdromo local consiste en seleccionar el orden correcto de llegada de los tres primeros
caballos en la novena carrera, Si en la novena carrera de hoy compiten 12 caballos Cuntos resultados para
la trifecta hay?
10. La gerente marketing de una tienda de ropa para damas desea determinar la relacin entre el tipo de clientes y
la forma de pago. Ha recopilado la siguiente informacin:
a) D un ejemplo de evento simple
b) D un ejemplo de un evento compuesto
c) Cul es el complemento del pago de contado?
d) Por qu es un evento compuesto el cliente habitual que paga de contado?
e) Dibuje el diagrama de Venn
11. Para curar una enfermedad se ha aplicado un nuevo tratamiento a una serie de individuos, obtenindose los
resultados reflejados en la tabla.
Pago
Clientes Pago a crdito Pago de contado
Habituales 70 50
No habituales 40 40
Curados C No Curados NC
Tratamiento Nuevo TN 60 21
Tratamiento Antiguo TA 43 36
106
a) Se ha curado Qu tipo de evento es? Por qu?
b) La persona se ha curado con el tratamiento Nuevo? Qu tipo de evento es? Por qu?
c) Dibuje el diagrama de Venn
12. De 39 alumnos de una clase, 16 alumnos escogieron como idioma el francs y 27 el ingls. Nueve alumnos
eligieron ambos idiomas y el resto no escogi ninguno de ellos.
a) Escriba los eventos simples y dos eventos compuestos
b) Con la informacin dada construya un diagrama de Venn
c) Presente los datos en una tabla de contingencia
13. La asociacin de estadstica de una universidad estatal grande deseara determinar si hay una relacin entre el
inters de un estudiante en la estadstica y su habilidad para las matemticas. Se selecciona una muestra
aleatoria de 200 estudiantes y se les pregunta si su habilidad para las matemticas e inters en las estadsticas
es bajo, promedio o alto. Los resultados fueron los siguientes:
a) Cite tres ejemplos de eventos simples
b) Cite tres ejemplos de eventos compuestos
14. En una amplia rea metropolitana se seleccion una muestra de 500 entrevistados para determinar diversas
informaciones relacionadas con el comportamiento del consumidor. Entre las preguntas realizadas se
encontraba: Disfruta ir de compras? De 240 hombres; 136 contestaron que si. De 260 mujeres; 224
contestaron que si.
a) Elabore una cruzada y un diagrama de Venn para evaluar las probabilidades.
b) Escriba un ejemplo de evento simple y de evento compuesto
c) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria: Sea hombre?,
Disfrute ir de compras?
d) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria: Sea mujer? No
disfrute ir de compras?
e) Qu probabilidad hay de que un entrevistado seleccionado al azar: Sea mujer y disfrute ir de
compras? Sea hombre y no disfrute ir de compras?
f) Qu probabilidad hay de que un entrevistado seleccionado al azar Sea hombre y disfrute ir de
compras?
g) Supngase que el entrevistado seleccionado sea mujer: Cul es entonces la probabilidad de que no
disfrute ir de compras?
h) Supngase que el entrevistado disfruta ir de compras Cul es entonces la probabilidad de que sea
un hombre?
i) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea mujer o disfrute
ir de compras?
j) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea hombre o no
disfrute ir de compras?
k) Cul es la probabilidad de que el entrevistado seleccionado en forma aleatoria sea hombre o mujer?
15. De 250 empleados de una compaa tabacalera, un total de 130 personas fuman. Hay 150 hombres trabajando
en esa compaa; 85 de ellos fuman.
Habilidad para las matemticas
Inters en la estadstica Bajo Promedio Alto
Bajo 60 15 15
Promedio 15 45 10
Alto 5 10 25
107
108
24. Represente mediante un rbol de decisin la siguiente tabla cruzada para cocina moderna y bao moderno de
una encuesta realizada a 233 familias. Defina como evento A (Existencia de cocina moderna) y como evento
B (Existencia de bao moderno)
25. Una encuesta poltica realizada entre 1.500 votantes registrados del estado de Nueva York produjo la
siguiente calificacin, de acuerdo a la afiliacin partidaria sindical. Represente la informacin mediante un
rbol de decisin con sus respectivas probabilidades.
Sindicalizados
Afiliacin partidaria Si No Desempleados
Demcrata 371 19 208
Independiente 263 88 93
Republicano 89 222 147
Rojo Negro
As 2 2
No es as 24 24
Existencia de bao moderno Carencia de bao moderno
Existencia de cocina moderna 72 8
Carencia de cocina moderna 7 146
109
Unidad 4: Variables aleatorias discretas
1. Con las siguientes distribuciones de probabilidad:
Distribucin C Distribucin D
x P(x) X P(x)
0 0.20 0 0.10
1 0.20 1 0.20
2 0.20 2 0.40
3 0.20 3 0.20
4 0.20 4 0.10
a) Calcule la media para cada distribucin.
b) Calcule la desviacin estndar para cada distribucin.
c) Compare los resultados.
2. Con los registros de la compaa de los ltimos 500 das hbiles, el gerente de Silverman Motors, una
distribuidora suburbana de automviles, ha resumido en la siguiente tabla los automviles vendidos cada da:
Nmero de
automviles
vendidos por da
0 1 2 3 4 5 6 7 8 9 10 11 Total
Frecuencia de
ocurrencia
40 100 142 66 36 30 26 20 16 14 8 2 500
a) Elabore la distribucin de probabilidad para la variable aleatoria discreta X, el nmero de automviles
vendidos por da.
b) Calcule la media o cantidad esperada de venta de automviles por da.
c) Calcule la desviacin estndar.
d) Cul es la probabilidad de que vendan en determinado da:
1) Menos de cuatro automviles
2) Cuando ms cuatro automviles
3) Por lo menos cuatro automviles
4) Ms de cuatro automviles
3. Se lanza dos veces una moneda balanceada y se observa el nmero y de caras. Calcule la distribucin de
probabilidad para y. Grafique un histograma de frecuencia relativa terica para y.
4. El director de sistemas de una fbrica pequea de computadoras personales cree que la distribucin de
probabilidad discreta que se muestra en la siguiente figura caracteriza a y, el nmero de PC nuevas que la
empresa arrendar el siguiente ao.
a.- Muestre la distribucin de probabilidad en forma tabular.
110
b.- Qu probabilidad hay de que se arrendarn exactamente 9 PC? De que se arrendarn menos de 12 PC?
5. Sea X una variable aleatoria discreta cuya funcin de probabilidad es:
X 0 1 2 3 4 5
P(X) 0.1 0.2 0.1 0.4 0.1 0.1
a) Calcular y representar grficamente la funcin de distribucin.
b) Calcular las siguientes probabilidades:
1) p (X < 4.5)
2) p (X 3)
3) p (3 X < 4.5)
Ingresar a la Biblioteca Virtual de la UPSE y mediante la direccin que aparece en la pgina 5, seleccione el
texto Probabilidad Problemario y resuelva:
6. Ejercicios: 1, 2, 4 y 5 (pgina 11)
7. Ejercicios: 9, 10 y 12 (pgina 12)
8. Ejercicios: 17 (pgina 13) y 24 (pgina (14)
9. En los siguientes literales encuentre la probabilidad respectiva:
a) Si n= 4 y p=0.12, entonces P(x=0)= ?
b) Si n=10 y p=0.40, entonces P(x=9)= ?
c) Si n=15 y p=0.50, entonces P(x=8)= ?
d) Si n= 9 y p=0.90, entonces P(x=9)= ?
10. La probabilidad de que un paciente no se recupere de una operacin en particular es 0.1.
a) Cul es la probabilidad de que exactamente dos de los siguientes ocho pacientes que sufran esta operacin
no se recuperen?
b) Cul es la probabilidad de que slo un paciente de los ocho no se recupere?
11. En base a experiencias pasadas, el 7% de todos los comprobantes de gastos de almuerzos estn equivocados.
Si se selecciona una muestra aleatoria de cinco comprobantes Cul es la probabilidad de que:
a) exactamente uno est equivocado?
b) por lo menos dos estn equivocados?
c) no ms de dos estn equivocados?
12. Se sabe que el 30% de las piezas defectuosas en un proceso de manufactura pueden quedar bien mediante un
trabajo de reprocesado.
a) Cul es la probabilidad de que en un lote de seis piezas defectuosas se puedan reprocesar satisfactoriamente
por lo menos tres de ellas?
b) Cul es la probabilidad de que ninguna de ellas se pueda reprocesar?
c) Cul es la probabilidad de que todas se puedan reprocesar?
13. En base a experiencia anterior, la impresora principal del centro de cmputo de cierta universidad funciona
adecuadamente el 90% del tiempo. Si se hace una muestra aleatoria de 10 inspecciones.
a) Cul es la probabilidad de que la impresora principal funcione en forma apropiada:
1.- Exactamente nueve veces?
2.- por lo menos nueve veces?
3.- cuando ms nueve veces?
4.- ms de nueve veces?
5.- menos de nueve veces?
b) Cuntas veces se puede esperar que funcione en forma apropiada la impresora principal?
111
Ingresar a la Biblioteca Virtual de la UPSE y mediante la direccin que aparece en la pgina 5, seleccione el
texto Probabilidad Problemario y resuelva:
14. Ejercicios: 1, 2, 3, 4 y 6 (pgina 15)
15. Ejercicios: 15 y 16 (pgina 12)
16. Ejercicios: 17 (pgina 13) y 24 (pgina (14)
17. Determine lo siguiente:
a) Si N=10, r=5; n=4, entonces P(y=3) es?
b) Si N= 6, r=3; n=4, entonces P(y=1) es?
c) Si N= 5, r=3; n=3, entonces P(y1) es?
18. Determine la distribucin de probabilidad, la media y varianza de las siguientes variables aleatorias
hipergeomtrica:
a) Si N=12, r=5; n=3
b) Si N=8, r=3; n=2
19. El decano de la Facultad de Ciencias Administrativas desea crear un comit ejecutivo de cinco personas
seleccionadas entre los 40 miembros de la facultad. La seleccin debe ser aleatoria y en la facultad hay ocho
miembros de la carrera de Ingeniera en Marketing.
a) Cul es la probabilidad de que en el comit haya
1) ninguno de marketing?
2) al menos uno de marketing?
3) no mas de uno de marketing?
b) Cuntos miembros de la carrera de marketing se podra esperar que participen?
20. Con base en datos suministrados por el Departamento de Salud y Recursos Humanos de Estados Unidos, se
estima que uno de cada cinco trasplantes de rin falla en menos de un ao. Suponga que exactamente 3 de
los siguientes 15 trasplantes de rin fallarn en menos de un ao. Considere una muestra aleatoria de tres de
estos 15 pacientes.
a) Calcule la probabilidad de que los tres trasplantes muestreados fallen en menos de un ao.
b) Calcule la probabilidad de que por lo menos uno de los tres trasplantes muestreados fallen en menos de un
ao.
21. De un inventario de 48 automviles que se embarcan a distribuidores locales, 12 tienen instalados radios
defectuosos.
a) Cul es la probabilidad de que cierto distribuidor reciba ocho automviles y:
1) todos tengan radios defectuosos?
2) ninguno tenga radio defectuoso?
3) por lo menos uno tenga el radio defectuoso?
b) Cuntos automviles con radios defectuosos se esperara recibir?
22. La Direccin de la carrera de Ingeniera en Marketing desea estimar el porcentaje de estudiantes que fuman
cigarrillos durante el receso de clases en el horario nocturno. En la carrera existen 450 alumnos, se sabe por
estudios anteriores que el 30% fuma y se decide realizar una encuesta piloto a 100 estudiantes. Si Ud. es
designado como parte del equipo estadstico, determine:
a) La probabilidad de que diez alumnos fumen en el receso nocturno.
b) La probabilidad de que treinta alumnos fumen.
c) Cul es el promedio de estudiantes que se esperan fumen?
112
Unidad 5: Variables Aleatorias Continuas
Ingresar a la Biblioteca Virtual de la UPSE y mediante la direccin que aparece en la pgina 5, seleccione el
texto Probabilidad Problemario y resuelva:
1. Ejercicios: 1, 2 y 3 (pgina 33)
2. Ejercicios: 6 (pgina 34) y 12 (pgina (35)
3. Supongamos que X es una variable aleatoria que se distribuye segn una distribucin N con media = 70 y
varianza = 36. Calcular:
a) P (x 80); P (x 89); P (x < 75)
b) P (x > 80); P (x > 89); P (x 75)
c) P (x 60); P (x 65); P (x 50)
d) P (x > 60); P (x > 65); P (x > 50)
e) P (75 < x 80); P (80 < x 90); P (70 < x 80)
f) P (60 < x 70); P (55 < x 65); P (45 < x 50)
g) P (50 < x 90); P (60 < x 80); P (60 < x 85)
4. Supongamos que Z es una variable aleatoria que se distribuye segn una distribucin N(0, 1). Calcular:
a) P (z 1.47); P (z 1.9); P (z < 2.9)
b) P (z > 1.47); P (z > 2.8); P (z 0.5)
c) P (z 1.47); P (z 1.95); P (z 0.7)
d) P (z > - 1.47); P (z > - 3.0); P (z > - 1.02)
e) P (0.45 < z 1.47); P (1.45 < z 2.47); P (1.5 < z 1.6)
f) P (1.47 < z 0.45); P (1.7 < z 0.1); P (2.47 < z 1.45)
g) P (-1.47 < z 0.45); P (-1.71 < z 1.5); P (-2.33 < z 2.33)
5. Halle el valor de z para cada probabilidad, ejemplo: P (z > z
o
) = 0.05, entonces z
o
= ?
a) p = 0.75; p = 0.63; p = 0.99; p = 0.80
b) p= 0.25; p = 0.49; p = 0.10; p = 0.05
c) P (z > z
o
) = 0.05; P (z > z
o
) = 0.40; P (z > z
o
) = 0.90
d) P (z < z
o
) = 0.80; P (z < z
o
)= 0.20; P (z < z
o
) = 0.10
Ingresar a la Biblioteca Virtual de la UPSE y mediante la direccin que aparece en la pgina 5, seleccione el
texto Probabilidad Problemario y resuelva:
6. Ejercicios: 1, 2 y 3 (pgina 36)
113
114
Unidad 6: Muestreo y Estimacin
1. Suponga que un centro de cmputo regional desea evaluar el desempeo de su sistema de memoria en disco.
Una medida del desempeo es el tiempo medio entre fallas de su unidad de disco. A fin de estimar este valor,
el centro registr el tiempo entre fallas para una muestra aleatoria de 45 fallas de la unidad de disco. Se
obtuvo:
y=1.762 horas y =215 horas
Estime el verdadero tiempo medio entre fallas con un intervalo de confianza de 90%.
2. Queremos estimar la diferencia entre los salarios inciales medios de graduados recientes en Ingeniera en
Sistemas e Ingeniera en Desarrollo Comunitario de la UPSE. Se cuenta con la siguiente informacin:
* Una muestra aleatoria de 59 salarios inciales de graduados en Ingeniera en Sistemas de la UPSE arroj
una media de muestra de $3.267 y una desviacin estndar de 5443.
* Una muestra aleatoria de 30 salarios inciales de graduados en Ingeniera en Desarrollo Comunitario de la
UPSE arroj una media de muestra de $2.746 y una desviacin estndar de $428.
3. El departamento de informtica de la UPSE realiza un informe cada ao de las computadoras que tienen
algn defecto de manera que se pueda proyectar la compra de nuevos equipos para el ao lectivo venidero.
En el ao 2007 se realiz una muestra a 12 computadoras de las cuales dio como resultado una media de 7
mquinas defectuosas con una desviacin de 1.02. En el ao 2008 se muestre a 25 mquinas con una media
de 15 equipos con defectos y una desviacin de 2.05. Establezca un intervalo de confianza de 95% para la
diferencia entre las medias de computadoras con defectos en la UPSE. Intrprete e intervalo.
Ingresar a la Biblioteca Virtual de la UPSE y mediante la direccin que aparece en la pgina 5, seleccione el
texto Probabilidad Problemario y resuelva:
4. Ejercicios: 1 y 2 (pgina 57)
5. Ejercicios: 3 y 4 (pgina 58)
6. Ejercicios: 3, 7, 8, 9 y 10 (pgina 59)
7. Ejercicios: 11, 12 y 13 (pgina 60)
8. Ejercicios: 18 y 19 (pgina 62)
9. Resolver ejercicios propuestos en el texto gua de Lind Marchall: pginas: 309, 312 y 314.
115
Unidad 7: Pruebas de Hiptesis
Ingresar a la Biblioteca Virtual de la UPSE y mediante la direccin que aparece en la pgina 5, seleccione el
texto Probabilidad Problemario y resuelva:
1. Ejercicios: 1, 2, 3 y 4 (pgina 85)
2. Ejercicios: 5 y 6 (pgina 86)
3. Ejercicios: 7 y 9 (pgina 87)
4. Ejercicios: 10, 12 y 13 (pginas 88 y 89)
5. Analice las siguientes pruebas estadsticas sobre proporciones:
a) E
0
: p = u.6
E
u
: p = u.6 = u.6S, n = 1uu, y = u.u1
b) E
0
: p = u.29
E
u
: p = u.29 = u.26, n = 9u, y = u.u1
c) E
0
: p = u.S6
E
u
: p < u.S6 = u.S4, n = 6Su, y = u.uS
d) E
0
: p = u.2
E
u
: p > u.2 = u.24S, n = 4uu, y . = u.u1
e) E
0
: p = u.SS
E
u
: p < u.SS, = 17S, n = Suu, y . = u.uS
f) E
0
: p = u.2
E
u
: p. u.2, = 2SS, n = 1uuu, y . = u.u2
6. Un manufacturero de juguetes Tailands reclama que solo un 10% de los osos de juguete hechos para hablar
estn defectuosos. Cuatrocientos de estos juguetes se sometieron a prueba de forma aleatoria y se encontr
que 50 estaban defectuosos. Pruebe el reclamo del manufacturero con un nivel de significacin del 5%.
7. Una agencia de empleos afirma que el 80% de todas las solicitudes hechas por mujeres con nios prefieren
trabajos a tiempo parcial. En una muestra aleatoria de 200 solicitantes mujeres con nios, se encontr que
110 prefirieron trabajos a tiempo parcial. Pruebe la hiptesis de la agencia con un nivel de significancia de
5%.
8. Nacionalmente, un 16% de los hogares tiene una computadora personal. En una muestra aleatoria de 80
hogares en Baltimore, solo 13 posean una computadora personal. Con un nivel de significancia de 5%,
pruebe si el porciento de hogares en Baltimore que tienen computadoras personales es menor que el
porcentaje nacional.
9. Se requiere determinar si la proporcin de personas que toman un medicamento para el dolor de cabeza y que
obtienen alivio es del 90%, como afirma la publicidad. Se tiene una muestra aleatoria de 100 individuos de
los cuales, 88 obtuvieron alivio al tomar el medicamento. Pruebe con un nivel de confianza del 95%.
116
117
118
Distribucin t Student
Puntosdeporcentajedeladistribucint
r
0,25 0,2 0,15 0,1 0,05 0,025 0,01 0,005 0,0005
1
1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 636,578
2
0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,600
3
0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924
4
0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5
0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
6
0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
7
0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8
0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9
0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073
16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015
17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850
21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,768
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,689
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,660
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646
40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551
60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,460
12
0
0,6770,67
4
0,8450,84
2
1,0411,03
6
1,2891,28
2
1,6581,64
5
1,9801,96
0
2,3582,32
6
2,6172,57
6
3,3733,29
0
119