Vous êtes sur la page 1sur 248

Pontificia Universidad Catlica Madre y Maestra

Recinto Santo Toms de Aquino


Facultad de Ciencias Sociales y Administrativas
Departamento de Administracin de Empresa

ADM-237-T MTODOS CUANTITATIVOS PARA NEGOCIOS II

en honor a Carlos Dreyfus


PROGRAMA GENERAL
Maestro: Ing. Rubn Daro Estrella Snchez, MBA
Cavaliere dellordine al Merito della Repubblica Italiana (Roma 2003)
Ingeniero de Sistemas (UNIBE - 1993), Administrador (PUCMM - 2000), Matemtico (PUCMM - 2007), Telogo (UNEV - 2002)
y Maestro (SALOME UREA - 1985)

rubendarioestrella@hotmail.com ; rubendarioestrellas@gmail.com

www.atalayadecristo.org
MAYO 2016
Objetivo General:
Este curso persigue desarrollar habilidades en los gerentes y futuros gerentes de
negocios/proyectos que le permitan valorizar, aplicar y crear diferentes modelos
matemticos, tiles en el proceso de toma de decisiones en el mundo de los negocios,
con la finalidad de optimizar los resultados a obtener en las diferentes situaciones del
mundo real. Los encargados de toma de decisiones estarn mejor preparados para
trabajar en este tipo de ambiente si se familiarizan con las clases ms comunes de los
anlisis cuantitativos y con la tecnologa de la computadora. Este dominio les ayudar
a ser mejores crticos y usuarios de estas herramientas y, segn se supone,
perfeccionarn su habilidad en la toma de decisiones.
Descripcin de la Materia:
Crditos
: 03
Pre-requisitos
: ADM-236-T; ADM-236-P
Co-requisitos
: ADM-237-P
En esta segunda parte de Mtodos Cuantitativos para Negocios nos adentraremos en la
aplicacin de la estadstica inferencial a la toma de decisiones en los negocios. Al finalizar el
(la) estudiante podr hacer uso de la teora de muestras, probabilidades para el anlisis de
datos, as como la aplicacin de las tcnicas de estimacin de parmetros poblacionales para
Modelos Estadsticos para la Toma de Decisiones

| Ing. Rubn Daro Estrella, MBA Cavaliere

Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

2
contrastar si una afirmacin provisional sobre un parmetro poblacional es aprobada o no
ante la evidencia de la muestra. El curso consta de una parte terica y de un laboratorio en el
que se utilizar un software estadstico para la resolucin de los problemas.
Objetivos Especficos del Curso:
Proporcionar una comprensin conceptual del papel que juegan los mtodos
cuantitativos en el proceso de toma de decisiones.
Construir nuevas estructuras mentales ya que se trata de una forma distinta de pensar
matemticamente.
Abordar y resolver situaciones de una variedad ilimitada y problemas cuya
complejidad rebasara otras ramas de las matemticas.
Enfatizar los conceptos.
Presentar cuidadosamente los mtodos estadsticos, dirigindolos a la comprensin,
tanto de la adaptabilidad del mtodo como del anlisis de los resultados y la toma de
decisiones.
Evaluar hiptesis cuantitativas acerca de las caractersticas de procesos, productos o
servicios.
Evaluar afirmaciones sobre poblaciones a partir de muestras obtenidas de stas, a las
que se les aplican procedimientos estadsticos basados en modelos de probabilidad.
Contrastar hiptesis cuantitativas paramtricas y no paramtricas, acerca del valor de
una variable que mide caractersticas de un proceso, producto o servicio.
Desarrollar procedimientos de recoleccin, tratamiento y anlisis de datos
cuantitativos, con apego a la tica y a los supuestos de los modelos estadsticos
aplicados.
Seleccionar los modelos estadsticos que mejor se ajusten a la situacin administrativa
que se va a estudiar.
Desarrollar habilidades y destrezas que permitan, mediante el razonamiento, el
anlisis y la interpretacin de datos, la toma de decisiones gerenciales.
Metodologa de Clases:
Este curso est orientado a las aplicaciones de las estadsticas en la solucin de casos o
escenarios del mundo de los negocios. El enfoque didctico de este curso est orientado ms
hacia el desarrollo de habilidades que hacia la adquisicin de conocimientos, es decir, saber
cmo resolver problemas mediante la aplicacin de herramientas estadsticas.
Ctedras expositivas de los temas que constituyen el programa.
Anlisis de casos, principalmente del entorno nacional.
Aplicacin de los modelos estadsticos a data proveniente de una empresa elegida
por el (la) estudiante.
Resolucin de ejercicios de texto u otros libros de referencia.
Anlisis de artculos de publicaciones arbitradas.
Participacin activa del estudiante, debates, discusiones.
Aprendizaje colaborativo, mediante la resolucin en grupo de ejercicios y casos, tanto
de manera presencial como virtual.
Pruebas parciales y prueba final
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 2
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

3
Evaluacin:
Pruebas Cortas
Prctica de
Calentamiento

15 puntos
5 puntos

1 Parcial
Proyecto Parcial

25 puntos
15 puntos

2 Parcial
Proyecto Final

25 puntos
15 puntos

Aplicacin de Cuestionario Seleccionado a 50 personas


y Aplicacin de la Estadstica Descriptiva e Inferencial,
Preparar un Reporte de Resultados.
Aplicacin de las Estadsticas Nacionales para la Ubicacin
de un Supermercado.
Aplicacin de las Estadsticas en un Estudio de Mercado.

Materiales tiles:
- Calculadora Cientfica con Combinacin nCr
- Computador Porttil Notebook Laptop (Ser usada en el aula, en los
exmenes y en el laboratorio).
- Memoria USB de 8 GB
- Juego de Reglas y Comps.
- Manual de Ejercicios (Impreso) o Presentaciones.
- Bibliografa indicada a continuacin.
Software tiles:
MegaStat - SPSS 22 Minitab Stata
Probabilidades y Estadstica de la Mc Graw Hill.
Microsoft Excel
Aplicaciones aportadas por los estudiantes.
Metodologa del Laboratorio:

Utilizacin de Microsoft Excel Hoja Electrnica de Clculo.

Utilizacin de los Programas: MegaStat SPSS 22 Probalidades y Estadsticas de


la Mc Graw Hill - Minitab Stata.

Bsqueda de Programas.

Implementacin del Software En los casos resueltos y asignados.

Presentacin en el Laboratorio de la Implementacin.

Entrega de los archivos de los Programas identificados.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 3
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

4
CONTENIDO DEL PROGRAMA
....................................................................................................................................
Tema I - Distribuciones de muestreo
Objetivos de Aprendizaje:
Manejar los conceptos de: inferencia estadstica, estimadores puntuales, estimacin por
intervalos, muestreo, tipos de muestreo, errores de muestreo.
Comprender cmo se realizan los principales tipos de muestreo: aleatorio simple,
estratificado, por conglomerados o racimos, por conveniencia.
Comprobar terica y empricamente, la distribucin muestral de medias, de
proporciones y de varianzas
Contenido Temtico:
1.1 Inferencia Estadstica: Estimadores puntuales y parmetros poblacionales. Propiedades
deseables en los estimadores.
1.2 Muestreo probabilstico para poblacin finita o infinita. Tipos de muestreo.
1.3 Distribucin muestral de las medias. Clculo de la media y la desviacin muestrales.
1.4 Distribucin muestral de las proporciones. Clculo de la proporcin y desviacin
muestrales.
1.5 Teorema central del lmite.
1.6 Distribucin muestral de las varianzas.
....................................................................................................................................
Tema II - Estimacin por intervalos de confianza y prueba de hiptesis para la media o
proporcin poblacional

Objetivos de Aprendizaje:
Comprender qu es: intervalo de confianza, estadstico de la prueba, valor crtico, pvalor, nivel de significancia o error tipo I, el error tipo II, y la potencia de una prueba.
Construir e interpretar intervalos de confianza para la media poblacional y para la
proporcin poblacional.
Realizar pruebas de hiptesis de una cola y de dos colas para la media poblacional y
para la proporcin poblacional para el caso en que se conozca la varianza poblacional,
utilizando distribucin normal estndar, y los enfoques del valor crtico y del p-valor.
Realizar pruebas de hiptesis de una cola y de dos colas para la media poblacional
para el caso en que no se conozca la varianza poblacional, utilizando la distribucin t
de Student, y los enfoques del valor crtico y del p-valor.
Calcular el tamao de muestra requerido para cualquier nivel de precisin deseado en
la estimacin a realizar.
Calcular las probabilidades de cometer errores tipo I y II, y la potencia de la prueba.
Contenido Temtico:
2.1 Intervalo de confianza para la media de una poblacin con varianza conocida.
2.2 Intervalo de confianza para la proporcin poblacional.
2.3 Intervalo de confianza para la media de una poblacin con varianza desconocida.
2.4 Prueba de hiptesis para la media de una poblacin con varianza desconocida.
2.5 Clculo del tamao de la muestra. Errores tipo I, II y potencia de la prueba.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 4
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

5
....................................................................................................................................
Tema III - Estimacin por intervalos de confianza y prueba de hiptesis para dos medias o
proporciones poblacionales.

Objetivos de Aprendizaje:
Construir e interpretar intervalos de confianza para la diferencia de dos medias
poblacionales o proporciones poblacionales con varianza conocida.
Construir e interpretar intervalos de confianza para la diferencia de dos proporcionales
poblacionales.
Construir e interpretar intervalos de confianza para la diferencia de dos medias
poblacionales no independientes.
Realizar pruebas de hiptesis de una cola y de dos colas para los casos mencionados.

Contenido Temtico:
3.1 Intervalo de confianza para la diferencia de dos medias poblaciones normales con
varianza conocida.
3.2 Intervalo de confianza para la diferencia de proporciones de dos poblaciones
normales
3.3 Intervalo de confianza para la diferencia de dos medias poblaciones normales 3.4
con varianza desconocida.
3.5 Intervalo de confianza para la diferencia de dos medias poblacionales: muestras
pareadas.
3.6 Pruebas de hiptesis para la diferencia de dos medias poblacionales
independientes, con varianza conocida o desconocida.
3.7 Pruebas de hiptesis para la diferencia de dos proporciones poblacionales.
3.8 Pruebas de hiptesis para la diferencia de dos medias poblacionales dependientes.
....................................................................................................................................
Tema IV - Estimacin por intervalo y prueba de hiptesis para la varianza: Una poblacin
y dos poblaciones.
Objetivos de Aprendizaje:
Construir e interpretar intervalos de confianza para la varianza poblacional, utilizando
la distribucin Chi Cuadrada.
Construir e interpretar intervalos de confianza para varianzas de dos poblaciones
independientes, utilizando la distribucin F.
Realizar pruebas de hiptesis para ambos casos, utilizando las distribuciones
correspondientes, y los enfoques del valor crtico y del p-valor.
Contenido Temtico:
4.1 Intervalo de confianza para la varianza poblacional.
4.2 Intervalo de confianza para las varianzas de dos poblaciones independientes.
4.3 Pruebas de hiptesis para la varianza poblacional.
4.4 Pruebas de hiptesis para las varianzas de dos poblaciones independientes.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 5
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

6
...............................................................................................................................
Tema V - Correlacin y regresin simples: estimacin y prueba de hiptesis.
Objetivos de Aprendizaje:

Comprender la importancia de la deteccin de relaciones lineales entre dos variables


para la toma de decisiones en los negocios.

Utilizar diagramas de dispersin y tendencia para visualizar la relacin lineal entre dos
variables.

Utilizar anlisis de regresin lineal para estimar la relacin entre dos variables.

Utilizar la ecuacin de estimacin de mnimos cuadrados para predecir valores futuros


de la variable dependiente de inters.

Calcular e interpretar los coeficientes de correlacin y regresin.

Comprender las limitaciones de la regresin y del anlisis de correlacin y las


advertencias sobre su utilizacin.

Construir intervalos de confianza para los parmetros de la ecuacin de la recta.

Realizar pruebas de hiptesis para el coeficiente de correlacin simple.


Contenido Temtico:
5.1
Diagrama de dispersin.
5.2
La recta de regresin de la poblacin.
5.3
Estimacin de la recta de regresin de poblacin por el mtodo de los mnimos
cuadrados. Prediccin.
5.4
El coeficiente de correlacin simple o de Pearson. El coeficiente de
determinacin.
5.5
Estimacin del coeficiente de correlacin simple.
5.6 Pruebas de hiptesis relativa al coeficiente de correlacin simple.
....................................................................................................................................
Tema VI - Pruebas no paramtricas.

Objetivos de Aprendizaje:
Identificar las pruebas no paramtricas que son apropiadas a situaciones en las que no
se puede suponer una distribucin de probabilidad especfica para la poblacin que
estamos muestreando.
Realizar pruebas de hiptesis acerca de valores poblacionales utilizando dichas
pruebas.

Contenido Temtico:
6.1
Introduccin a las pruebas no paramtricas.
6.2
Pruebas de bondad de ajuste, independencia y tablas de contingencia con Chi
Cuadrada.
6.3
Prueba de Signo.
6.4
Prueba de rangos con signo de Wilcoxon para dos muestras dependientes.
6.5
Prueba de suma de rangos de Wilcoxon para dos muestras independientes.
6.6
Prueba de Kruskal-Wallis.
6.7
Correlacin de rangos.
6.8
Prueba de series para detectar aleatoriedad.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 6
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

Agenda Calendario
Tema

Contenido
Introduccin y Presentacin del Programa
Distribucin Normal

Prctica de Calentamiento: Aplicacin de Cuestionario


Seleccionado a 50 personas y Aplicacin de la Estadstica
Descriptiva, Preparar un Reporte de Resultados.

Libro

Fecha

Webster Cap. 5
Lind Cap. 7
Anderson Cap. 6
Manual pg. 92
1) Bienestar Laboral.
2) Negocios Informales.

12/05/2016
16/05/2016
LU/MI 2+3h
MI/JU 2+3h
12/05/2016
16/05/2016
LU/MI 2+3h
MI/JU 2+3h
16/05/2016
18/05/2016
19/05/2016
LU/MI 2+3h
MI/JU 2+3h
25/05/2016
27/05/2016
28/05/2016
LU/MI 2+3h
MI/JU 2+3h
01/06/2016
02/06/2016
MI 3h
JU 3h
08/06/2016
09/06/2016
MI 3h
JU 3h
06/06/2016
08/06/2016
LU 2h
MI 2h
13/06/2016
15/06/2016
16/06/2016
LU/MI 2+3h
MI/JU 2+3h

Asistencia

20/06/2016
22/06/2016
23/06/2016
LU/MI 2+3h
MI/JU 2+3h
29/06/2016
30/06/2016
MI 3h
JU 3h
04/07/2016
06/07/2016
07/07/2016
LU/MI 2+3h
MI/JU 2+3h
13/07/2016
14/07/2016
MI 3h
JU 3h
11/07/2016
13/07/2016
LU 2h
MI 2h

Asistencia

Distribuciones de muestreo

Webster Cap. 6
Lind Cap. 8
Anderson Cap. 7
Manual pg. 100

II

Estimacin por intervalos de confianza pg. 128, Tamao


de Muestra pg. 138 y prueba de hiptesis para la media o
proporcin poblacional 147, Distribuciones Normal, T
Student pg. 134 y Chi Cuadrada pg. 163.

Webster Cap. 7, 8
Lind Cap. 9, 10
Anderson Cap. 8, 9
Manual pg. 128, 134,
138, 147 y 163

Primer Control de Lectura

Primer Parcial

Proyecto Parcial (Presentacin aplicando la Estadstica


Descriptiva e Inferencial)
II

IV

Anlisis de Varianza (ANOVA)


Con un Factor / Con un Factor en Bloques / Con dos
Factores
Estimacin por intervalo y prueba de hiptesis para la
varianza: Una poblacin y dos poblaciones. (Anlisis de
Varianza)
Correlacin y regresin simples: estimacin y prueba de
hiptesis.

Webster Cap. 10
Lind Cap. 12
Anderson Cap. 11
Manual pg. 169, 189 y
195
Webster Cap. 11
Lind Cap. 13
Anderson Cap. 14
Manual pg. 208

Segundo Control de Lectura

Pruebas no paramtricas.

Segundo Parcial

Proyecto Final (Presentacin en el Lab. aplicando la


Estadstica Inferencial)

Webster Cap. 14
Lind Cap. 17, 18
Anderson Cap. 19
Manual pg. 224

Valor

Valor 5
puntos
Asistencia

Asistencia

Valor 5
puntos
Valor 25
puntos
Valor 15
puntos
Asistencia

Valor 10
puntos
Asistencia

25 puntos

15 puntos

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 7
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

Pontificia Universidad Catlica Madre y Maestra


Recinto Santo Toms de Aquino
Facultad de Ciencias Sociales y Administrativas - Departamento de Administracin de Empresa

ADM-236-T MTODOS CUANTITATIVOS PARA NEGOCIOS I


en honor a Carlos Dreyfus
Maestro: Ing. Rubn Daro Estrella Snchez, MBA
Cavaliere dellordine al Merito della Repubblica Italiana (Roma 2003)
Ingeniero de Sistemas (UNIBE - 1993), Administrador (PUCMM - 2000), Matemtico (PUCMM - 2007), Telogo (UNEV - 2002)
y Maestro (SALOME UREA - 1985)

rubendarioestrella@hotmail.com ; rubendarioestrellas@gmail.com

www.atalayadecristo.org
Aplicacin de las Estadsticas
Proyecto Parcial
Valor 15 puntos - Fecha de Entrega: 6 y 8 de junio de 2016
Una empresa multinacional del Sector Supermercados que est ubicada en el Distrito Nacional, Santo Domingo y Santiago, est pensando
expandir sus operaciones establecindose en otras 3 provincias del Pas, con este propsito un equipo de estudiantes de Modelos para la
Toma de Decisiones fue contratado, para determinar en cules y qu orden debe ubicarse tomando en consideracin las siguientes
informaciones estadsticas:
1. Poblacin Rural y Urbana.
2. Hogares Rurales y Urbanos.
3. Poblacin Ocupada.
4. Poblacin Econmicamente Activa.
5. Proporcin de la Ocupada en relacin a la Activa.
6. Gasto Anual por Hogar Rural (En alimentos, bebidas y tabaco).
7. Gasto Anual por Hogar Urbano (En alimentos, bebidas y tabaco).
8. Demanda total (En base a la suma del Gasto Rural y Urbano).
9. Densidad Poblacional.
Adems:
- Caracterstica del Sector Industrial (Supermercados), situacin actual, entorno, tendencias, etc.
- Estilo de vida.
- Desarrollo provincial.
- Nivel de Educacin.
- Niveles de pobreza.
- Imgenes tpicas.
- Mapas
- Acceso a la tecnologa y medios de comunicacin.
- Nivel de participacin de la competencia.
- Distancia de los centros de distribucin.
- Medios y costos de transporte.
- Disponibilidad y costo de mano de obra.
- Disponibilidad y calidad de los servicios pblicos.
- Rentabilidad del negocio.
Utilizando las Herramientas estadsticas, algunas consideraciones de Operaciones y Mercadeo, presente su Informe. Impreso y en CD.
Sitios de Internet a visitar: www.bancentral.gov.do / www.one.gov.do / www.pnud.gov.do / www.tiendalasirena.com /
www.superpola.com / www.jumbo.com.do / www.ole.com.do / www.supermercadoslacadena.com / www.superbravo.com
FECHA DE ASIGNACIN: 12 y 16 de mayo de 2016
www.bancentral.gov.do
www.one.gov.do

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 8
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

9
Pontificia Universidad Catlica Madre y Maestra - Recinto Santo Toms de Aquino

ADM-236-T MTODOS CUANTITATIVOS PARA NEGOCIOS I


en honor a Carlos Dreyfus
Maestro: Ing. Rubn Daro Estrella Snchez, MBA
Cavaliere dellordine al Merito della Repubblica Italiana (Roma 2003)
Ingeniero de Sistemas (UNIBE - 1993), Administrador (PUCMM - 2000), Matemtico (PUCMM - 2007), Telogo (UNEV - 2002)
y Maestro (SALOME UREA - 1985)

rubendarioestrella@hotmail.com ; rubendarioestrellas@gmail.com
PROYECTO FINAL
Valor 15 puntos
Lineamientos generales para el trabajo final
Elaborar para una empresa de su eleccin o para un nuevo negocio un estudio de mercado
que permita determinar el comportamiento de una o varias variables que se desean controlar,
tomando en consideracin la situacin actual de la empresa, cultura, posibilidades
econmicas, caractersticas de su sector industrial, disponibilidad de tecnologa, etc.
Algunos detalles a incluir en su trabajo:
Propsito del Estudio de Mercado.
Objetivos del Estudio de Mercado.
Breve resea de la empresa, historia, evolucin, cultura, etc.
Caracterstica del Sector Industrial, situacin actual, entorno, tendencias, etc.
Misin, Visin y Objetivos.
Evaluacin de oportunidades y tendencias del mercado.
Evaluar la situacin actual del objeto de estudio de mercado (definicin y
comportamiento de las variables); hacer una crtica de la situacin, emitir un
diagnstico claro y completo.
Utilizando todos mtodos de Estadstica Descriptiva e Inferencial determine:
o Elaboracin del cuestionario a utilizar para la recoleccin de los datos en
Encuesta (Utilizando Libros de Metodologa de Investigacin y de Investigacin
o Estudio de Mercado).
o Determinar el Tamao de la muestra a utilizar en la Encuesta.
o Analisis Estadstico de los datos obtenidos en la Encuesta.
o Elaboracin de Tablas y Grficos Estadsticos.
o Determinacin de Estadsticos, Parametros, y probabilidades de ocurrencias.
o Aplicar todos los modelos de la Estadstica Inferencial estudiados.

Evaluacin y presentacin clara, evidente y objetiva de los efectos y el impacto de sus


recomendaciones, basado en el estudio de mercado, en la empresa: econmicas, de
calidad, de imagen, etc.
Mnimo de Fuentes Bibliogrficas (Libros) a utilizar: 5
Impreso y en CD.
FECHA DE ASIGNACIN: 12 y 16 de mayo de 2016
FECHA DE ENTREGA: 11 y 13 de julio de 2016
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 9
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

10

BIBLIOGRAFA.
o ESTRELLA, Rubn Daro. Modelos Estadsticos para la Toma de Decisiones.
Edicin 2016.
o WEBSTER, Allen L. Estadstica Aplicada a los Negocios y la Economa.
McGraw-Hill: Tercera Edicin. 2000.
o LIND Douglas A., MARCHAL William G. and WATHEN Samuel A.
Estadstica Aplicada a los Negocios y a la Economa. McGraw-Hill. 15
Edicin. 2012.
o ANDERSON David, SWEENEY Dennis and WILLIAMS Thomas.
Estadstica para Negocios y Economa. CENGAGE Learning: 11 Edicin.
2012.
o TRIOLA, Mario F. Estadstica. PEARSON Addison Wesley. 11 Edicin.
2013.
o MATEOS-APARICIO Gregoria and MARTIN Miguel. El Anlisis de la
Varianza en la Investigacin Comercial. Prentice Hall: 2002.
o SPIEGEL Murray, SHILLER John and SRINIVASAN R. Alu. Probabilidad y
Estadstica. Mc Graw Hill. 3. Edicin Serie Shaum. 2010.
o NIEVES Antonio and DOMINGUEZ Federico. Probabilidad y Estadstica
para Ingeniera un enfoque moderno. Mc Graw Hill. 2010.
o HERNANDEZ SAMPIERI Roberto, FERNANDEZ COLLADO Carlos and
BAPTISTA LUCIO Pilar. Mtodos de la Investigacin. Mc Graw Hill. Quinta
Edicin. 2010.
o MCDANIEL Carl and GATES Roger.
CENGAGE Learning: Octava Edicin. 2011.

Investigacin

de

Mercados.

o MENDEZ Carlos. METODOLOGIA Gua para elaborar diseos de


investigacin en ciencias econmicas, contables y administrativas. Mc Graw
Hill: Segunda Edicin, 2001.
o DAVIS Duane. Investigacin en Administracin para la toma de decisiones.
International Thomson Editores: Quinta Edicin. 2001.
o GUTIERREZ PULIDO Humberto and DE LA VARA SALAZAR Romn.
Control Estadstico de Calidad y Seis Sigma 6. Mc Graw Hill. 2004

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 10
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

11
o JONSON Robert and KUBY Patricia. Estadstica Elemental Lo Esencial.
International Thomson Editores, S. A.: Tercera Edicin 2004.
o LIPSCHUTS Seymour and LIPSON Marc. PROBABILIDAD. Mc Graw Hill.
Segunda Edicin. 2001.
o MILTON J. Susan and ARNOLD Jesse C.
ESTADISTICA. Mc Graw Hill. Cuarta Edicin. 2004.

PROBABILIDAD

o MONTIEL A. M., RIUS F. And BARON F.J. Elementos Bsicos de


Estadstica Econmica y Empresarial. Prentice Hall: 1997.
o HOPKINS Kenneth, HOPKINS B.R. and GLASS Gene. Estadstica Bsica
para las Ciencias Sociales y del Comportamiento. Prentice Hall: Tercera
Edicin. 1997.
o LAPIN Lawrence L. Statistics for Modern Business. The Dryden Press: 1995.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 11
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

12

Conceptos Generales de Estadstica (Statistics)


La Estadstica: Es una coleccin de mtodos para planear experimentos, obtener datos y
luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones con base en
esos datos.
- Se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una
causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la
finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
- Es el arte y la ciencia de reunir, analizar, presentar e interpretar datos.
Es un cuerpo de mtodos y teoras que es aplicado con evidencia numrica, cuando se toman
decisiones en presencia o situaciones de incertidumbre.
Estadstica Descriptiva (Desciptive Statistics): Es el proceso de recopilacin, organizacin y
presentacin de datos de alguna manera que describa con rapidez y facilidad.
- Describe, analiza y representa un grupo de datos utilizando mtodos numricos y grficos
que resumen y presentan la informacin contenida en ellos.
- La estadstica descriptiva proporciona herramientas para organizar, simplificar y resumir
informacin bsica a partir de un conjunto de datos que de otra forma seria poco manejable.
Esta incluye la tabulacin, representacin y descripcin de conjuntos de datos.
- La estadstica es descriptiva cuando los resultados del anlisis estadstico no pretende ir ms
all del conjunto de datos investigados.
Estadstica Inferencial (Inferential Statistics): Implica la utilizacin de una muestra para
extraer alguna inferencia o conclusin sobre la poblacin correspondiente.
- Apoyndose en el clculo de probabilidades y a partir de datos mustrales, efecta
estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de
datos.
La estadstica es inferencial cuando se derivan conclusiones generales para un conjunto de
datos ms amplio a partir de la informacin proporcionada por los datos estudiados.
Es el proceso de reunir datos obtenidos de una muestra para hacer estimaciones o
probar hiptesis acerca de las caractersticas de una poblacin.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 12
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

13
Estadstica Descriptiva
Obtener datos o recopilacin
Organizar y resumir
Presentar
Estadstica Inferencial
Analizar
Interpretar
Llegar a conclusiones
Uso de la Estadstica en:
- Mercadeo.
- Investigacin de mercado.
- Encuestas
- Combinacin de productos y existencias.
- Publicidad.
- Gerencia de Operaciones.
- Pronsticos.
- Gestin de Calidad Total (TQM).
- Minimizacin de costos.
- Eliminacin de desperdicios.
- Localizacin.
- Ruta crtica.
- Productividad.
- Simulacin.
- Teoras de colas.
- Finanzas
- Anlisis financieros.
- Economa.
- Anlisis econmicos.
- Impuestos y Gastos pblicos.
- Produccin nacional.
- Inflacin.
- Macroeconoma.
- Comercio internacional.
- Localizacin o Ubicacin de Negocios.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 13
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

14

Conceptos Elementales de Estadstica.


Poblacin (Population): Es la coleccin completa de todos los elementos (puntajes,
personas, mediciones, etc.) que se van a estudiar.
- Es una coleccin completa de todas las observaciones de inters para el investigador.
Censo (Census): Es la coleccin de datos de cada elemento de una poblacin.
Muestra (Sample): Es un subconjunto de elementos extrados de una poblacin.
- Es una porcin representativa de la poblacin, que se selecciona para su estudio porque la
poblacin es demasiado grande para analizarla en su totalidad.
Parmetro (Parameter): Es una medicin numrica que describe alguna caracterstica de una
poblacin.
- Medida descriptiva de la poblacin completa de observaciones que tienen inters para el
investigador.
Estadstico (Statistic): Es una medicin numrica que describe alguna caracterstica de una
muestra.
Variable: Caracterstica de la poblacin que se analiza en el estudio estadstico.
- Caracterstica observable de un aspecto discernible en un objeto de estudio que puede
adoptar diferentes valores o expresarse en varias categoras.
Clasificacin de las variables.
Segn el modo como se presentan estas caractersticas o propiedades las variables se pueden
clasificar de esta forma:
- Cualitativas o Cuantitativas
- Continuas o discontinuos (discretas)
- Dependientes o independientes
- Explicadoras o externas
- Generales, intermedias o empricas
Variables cualitativas (Qualitative Categorical Attribute Data): Son aquellas variables
cuyos elementos de variacin tienen un carcter cualitativo no susceptible de medicin
numrica, por ejemplo el sexo de los estudiantes de estadstica, el estado civil de los
solicitantes de prstamos, preferencia religiosa, etc.
Se pueden dividir en diferentes categoras que se distinguen por alguna caracterstica no
numrica.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 14
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

15
Una variable cualitativa se mide por medios no numricos.
Los datos cualitativos emplean la escala de medicin nominal o la ordinal y pueden ser
no numricos o numricos.
Si la variable es cualitativa, el anlisis estadstico es bastante limitado. Podemos
resumir los datos cualitativos al contar el nmero de observaciones en cada categora
cualitativa, o bien, al calcular la proporcin de observaciones en cada categora cualitativa.
Los datos cualitativos son descripciones detalladas de situaciones, eventos, personas,
interacciones, conductas observadas y sus manifestaciones.
Variables cuantitativas (Quantitative Data): Son aquellas cuyas caractersticas o propiedades
pueden presentarse en diversos grados o intensidad y tienen un carcter numrico, como por
ejemplo nivel de ingresos, desercin escolar, las calificaciones que los estudiantes reciben en
el examen final, el nmero de kilmetros que recorren los que asisten a la universidad, etc.
Segn el nmero de valores que pueden tomar las variables cuantitativas se distingue
variables continuas y discontinuas.
Variables continuas (Continuos numerical Data): Son las que pueden tomar cualquier
valor dentro de un intervalo dado. Por muy prxima que puedan estar dos observaciones, si
el instrumento de medida tiene la precisin suficiente siempre puede haber una tercera
observacin que caiga entre las dos primeras. Los valores de una variable continua proceden
en general de mediciones, por ejemplo las cantidades de leche que las vacas producen son
datos continuos porque son mediciones que pueden asumir cualquier valor dentro de un
intervalo continuo.
Se pueden obtener de un nmero infinito de posibles valores que pueden asociarse a
puntos de una escala continua, de tal manera que no haya huecos ni interrupciones.
Variables discontinuas o discretas (Discrete Data): Son las que no pueden tomar valores
intermedios entre otros dos valores dados, han de hacerlo siempre con valores enteros, por
ejemplo el nmero de alumnos de una escuela, los socios de una cooperativa, etc.
Se obtienen de un nmero finito de posibles valores o bien de un nmero de posibles
valores que pueden contarse.
Slo puede tomar determinados valores, por lo general nmeros enteros. Puede ser
resultado de la enumeracin o del conteo. En ninguno de los casos se observaran valores
fraccionarios.
Consideradas conforme a la posicin que une a las variables entre s, se distingue entre
variables dependientes e independientes.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 15
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

16
Variables dependientes (Y):
Reciben este nombre las variables a explicar, o sea, el objeto
de la investigacin, que se trata de explicar en funcin de otros elementos.
Variables independientes (X): Son las variables explicativas, o sea, los factores o elementos
susceptibles de explicar las variables dependientes (en un experimento son las variables que
se manipulan).
Variables explicadoras: Son las propiedades que interesan directamente al investigador en
trminos de su modelo.
Variables externas: Son las que estn fuera del inters terico inmediato y que pueden afectar
los resultados de la investigacin emprica.
Variables generales: Se refieren a realidades no inmediatamente medibles.
Variables intermedias o intervinientes: Expresan algunos aspectos parciales de las variables
generales, pero ms concretos y cercanos a la realidad.
En algunos casos de anlisis de relacin causa-efecto, se introducen una o ms
variables de enlace interpretativo entre las variables dependientes e independientes. Se trata
de variables vinculadas funcionalmente a la variable dependiente y a la variable
independiente y que producen un efecto en la relacin existente entre esas variables.
Variables empricas: Representan aspectos directamente medibles y observables.

Clasificacin de las Variables segn el Nivel de Medicin


Los datos se renen mediante una de las siguientes escala de medicin: nominal,
ordinal, intervalo y de razn. La escala o nivel de medicin permite determinar la cantidad
de informacin que contienen los datos e indica el resumen de los datos y el anlisis
estadstico ms apropiado.
La escala para medir una caracterstica tiene implicaciones en la forma de presentar y
resumir la informacin; tambin determina el mtodo estadstico escogido para analizar los
datos.
Nivel de medicin nominal (Nominal level of measurement):
Se caracteriza por datos que consisten exclusivamente en nombres, rtulos o
categoras. Los datos no pueden acomodarse segn un esquema de ordenamiento.
Nombres o clases que se utilizan para organizar los datos en categoras separadas y
distintas.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 16
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

17
La escala de medicin para una variable es nominal cuando los datos son etiquetas o
nombres que se emplean para identificar un atributo del elemento.
Ejemplos:
El sexo de los estudiantes de esta clase de estadstica.
Las bebidas gaseosas refrescantes se pueden clasificar en: Coke, Pepsi, 7-Up o Country
Club.
La escala de medicin es nominal aun cuando los datos son mostrados como valores
numricos.
1. Coke
2. Pepsi
3. 7-Up
4. Country Club
El partido poltico al que pertenecen los miembros de las cmaras de senadores y
diputados del pas.
Los datos evaluados en escala nominal en ocasiones suelen llamarse observaciones
cualitativas, porque describen una cualidad de la persona o casa estudiada, y observaciones
categricas, si los valores caen en categoras. En general, los datos nominales o cualitativos se
describen en trminos de porcentajes o proporciones. A menudo se utilizan las tablas de
contingencia y las grficas de barras para mostrar este tipo de informacin.
Nivel de medicin ordinal (Ordinal level of measurement).
La escala de medicin para una variable es ordinal si los datos tienen propiedades de
datos nominales y el orden de los datos es significativa.
Mediciones que jerarquizan los datos en categoras, ordenadas en virtud de un
determinado criterio.
Implica datos que pueden acomodarse en algn orden, pero no es posible determinar
diferencias entre los valores de los datos, o tales diferencias carecen de significado.
Los datos para una escala ordinal podran ser no numricos o numricos.
Este nivel ordinal proporciona informacin sobre comparaciones relativas, pero los
grados de las diferencias no se pueden usar en clculos.
Ejemplos:

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 17
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

18
Los productos de un determinado almacn pueden ser clasificados como "buenos",
"mejores" y "ptimos".
Un editor califica algunos manuscritos como "excelentes", otros como "buenos" y
algunos como "malos". (No podemos encontrar una diferencia cuantitativa especfica entre
"bueno" y "malo").
La Revista Money clasificacin las inversiones a partir de los niveles de riesgos "bajo",
"alto" y "muy alto".
Nivel de medicin de intervalos (Interval level of measurement).
La escala de medicin para una variable es una escala de intervalo si los datos tienen
las propiedades de datos ordinales y el intervalo entre observaciones se expresa en trminos
de una unidad fija de medida. Los datos de intervalos siempre son numricos.
Es como el nivel ordinal, con la propiedad adicional de que podemos determinar
magnitudes de diferencias entre los datos que tienen algn significado. Sin embargo, no hay
un punto de partida o cero inherente (natural) en el que la cantidad este totalmente ausente.
Mediciones respecto de una escala numrica en la cual el valor del cero es arbitrario,
pero la diferencia de valores es importante.
La escala Fahrenheit de temperaturas es un ejemplo de escala de intervalos: 70 grados
no slo significan una temperatura mayor que 60 grados, sino que existe la misma diferencia
de 10 grados que entre 100 y 90 grados Fahrenheit.
Las temperaturas promedian anuales (en grados Celsius) de las capitales de todos los
estados de los Estados Unidos.
Los aos 1000, 2000, 1776 y 1944.
Nivel de medicin de proporcin o de razn (Ratio level of measurement).
La Escala de medicin para una variable es una escala de razn si los datos tienen
todas las propiedades de los datos de intervalos y el cociente de los dos valores es
significativo. Variables como distancia, peso, altura y tiempo emplean la escala de razn. Un
requisito de esta escala es que puede contener un valor cero que indica que no existe nada
para una variable en el punto cero.
Mediciones numricas en las cuales el cero es un valor fijo en cualquier escala y la
diferencia de valores es importante.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 18
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

19
Es el nivel de intervalo modificado para incluir el punto de partida o cero inherente
(donde cero indica que nada de la cantidad est presente). Para los valores de este nivel,
tanto las diferencias como las razones tienen significado.
De los cuatro niveles de medicin, slo la escala de proporcin o de razn se basa en
un sistema numrico en el cual el cero tiene sentido. Por consiguiente, las operaciones
aritmticas de multiplicacin y divisin tambin adquieren una interpretacin racional.
Mediciones tales como el peso, el tiempo y la distancia se miden en escala de
proporcin, puesto que el cero ocupa un lugar natural.
Ejemplo:
Distancia (en kilmetros) recorridas por automviles en una prueba de consumo de
combustible.
Longitudes (en minutos) de pelculas de cine.
Los valores de cada una estas colecciones de datos se pueden acomodar en orden, las
diferencias pueden calcularse y existe un punto de partida o cero inherente. Este nivel se
denomina "razn" porque el punto de partida hace que las razones o cocientes tengan
significado.
Nivel
Resumen
Ejemplo
Observacin
Nominal
Slo categoras.
Autos de
Slo categoras o
Los datos no
estudiantes:
nombres
pueden
10 Mercedes Benz
acomodarse en un 20 BMW
esquema de
40 Toyota
ordenamiento.
Ordinal
Las categoras
Vehculos de los
Se determina un
estn ordenadas,
estudiantes:
orden con
pero no es posible 10 compactos
compactos,
determinar
20 medianos
medianos y
diferencias, o stas 40 grandes
grandes.
carecen de
significado.
De Intervalo
Se pueden calcular Temperaturas:
90 no es dos veces
diferencias entre
45 C
ms caliente que
valores, pero no
80 C
45 C.
existe un punto de 90 C
partida inherente.
Los cocientes no
tienen significado.
De Razn
Igual que el
Pesos de
140 kg es dos veces
intervalo, pero con deportistas
70 kg.
un punto de
universitarios:
partida inherente. 70 kg
Los cocientes
85 kg
tienen significado 140 kg
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 19
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

20
Estudio Experimental: En este estudio primero se identifican las variables de inters. Luego
se identifican o controlan una o ms variables, de modo que se puedan obtener datos de cmo
influyen en la variable de inters. Por ejemplo, a una empresa farmacutica le puede
interesar un experimento para determinar la forma en que una nueva medicina afecta la
presin sangunea.
Es cuando aplicamos algn tratamiento y luego procedemos a observar su efecto sobre
los sujetos.
Estudio estadstico No Experimentales u Observacionales:
No se trata de controlar las
variables de inters, ni de influir sobre ellas. Quizs el tipo ms comn de estudio
observacional es la encuesta. Por ejemplo, para una encuesta personal se identifican primero
las preguntas de investigacin; a continuacin se disea un cuestionario y se administra a una
nuestra de individuos.
En este estudio observamos y medimos caractersticas especficas, pero no intentamos
manipular ni modificar los sujetos que estamos estudiando.
Muestra: Es un subconjunto de elementos extrados de una poblacin.
- Es una porcin representativa de la poblacin, que se selecciona para su estudio
porque la poblacin es demasiado grande para analizarla en su totalidad.
Muestra Aleatoria o Probabilstica: Se seleccionan los miembros de la poblacin de modo
que cada uno tenga la misma probabilidad de ser escogido.
Son muestras en que los elementos a seleccionar se obtienen con base en la
probabilidad. Cada elemento de una poblacin tiene cierta probabilidad de ser elegido como
parte de la muestra.
Muestra Aleatoria Simple (Random Sample): Una muestra es seleccionada de modo que
todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos. De igual
manera, todas las muestras de tamao n tienen la misma posibilidad de ser elegidas. Las
muestras aleatorias simples se obtienen por muestreo con reemplazo en una poblacin finita
o por muestreo sin reemplazo en una poblacin sin reemplazo.
Una muestra aleatoria simple de n sujetos se selecciona de tal manera que toda posible
muestra de tamao n tenga la misma probabilidad de ser escogida.
Muestreo Estratificado (Stratified Sampling): Subdividimos la poblacin en por lo menos
dos subpoblaciones (o estratos) distintas que comparten categoras (como genero), y luego
sacamos una muestra de cada estrato.
Muestreo en el que la poblacin se divide en segmentos y se selecciona una muestra
para cada segmento.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 20
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

21
Si los tamaos de muestra de los distintos estratos reflejan la poblacin general,
decimos que tenemos un muestreo proporcional.
Muestra que se obtienen al estratificar el marco muestral y luego seleccionar un
nmero fijo de elementos de cada uno de los estratos pro promedio de una tcnica de
muestreo aleatorio simple.
Muestreo Proporcional: Muestra que se obtienen al estratificar el marco muestral y luego
seleccionar de cada estrato un nmero de elementos en proporcin al tamao de los estratos,
por medio de una tcnica de muestreo aleatorio simple.
Cuando se extrae una muestra aleatoria proporcional, el marco muestral se subdivide
en varios estratos y luego de cada estrato se extrae una sub muestra. Una forma conveniente
de expresar el concepto de muestreo proporcional es establecer una proporcin. Por ejemplo,
uno de cada 150, le induce a seleccionar un (1) elemento por cada 150 elementos en el
estrato.
Muestreo sistemtico (Systematic Sampling): Seleccionamos un punto inicial y luego
seleccionamos cada k-simo (digamos, cada quincuagsimo) elemento de la poblacin.
La tcnica sistemtica es fcil de describir y ejecutar; no obstante, conlleva algunos
peligros cuando el marco muestral es repetitivo o de naturaleza cclica. En estas condiciones,
puede que los resultados no se aproximen a una muestra aleatoria simple.
Este procedimiento de seleccin es muy til e implica elegir dentro de una poblacin N
un nmero n de elementos a partir de un intervalo K. Este ltimo (K) es un intervalo que se
va a determinar por el tamao de la poblacin y el tamao de la muestra. De manera que
tenemos que K = N/n, en donde K = un intervalo de seleccin sistemtica, N = la poblacin y
n = la muestra.
Muestreo por cmulos o conglomerados (Cluster Sampling):
Muestreo que se obtiene al
muestrear algunas, pero no todas, las subdivisiones posibles que hay dentro de una
poblacin. Estas subdivisiones, denominadas conglomerados, a menudo ocurren de manera
natural dentro de la poblacin.
Primero dividimos el rea de la poblacin en secciones (o cmulos) y luego
seleccionamos aleatoriamente unas cuantas de esas secciones escogiendo todos los miembros
de las secciones seleccionadas.
Una diferencia importante entre el muestreo por cmulos y el estratificado es que en el
muestreo por cmulos se usan todos los miembros de cmulos seleccionados, mientras que
en el muestreo estratificado se usa una muestra de miembros de cada estrato.
Muestreo de conveniencia o de juicio (Convenience Sampling): Simplemente utilizamos
resultados que ya estn disponibles.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 21
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

22
Las muestras son elegidas con base en el hecho de que son tpicas.
Cuando se obtiene una muestra de juicio, la persona que elabora la muestra elige
unidades que considera representativas de la poblacin. La validez de los resultados de una
muestra de juicio refleja la solidez del juicio del recolector de datos.
Error de muestreo: Es la diferencia entre el resultado de una muestra y el verdadero
resultado de la poblacin; tal error es consecuencia de las fluctuaciones aleatorias de las
muestras.
Error de muestreo: Este error ocurre cuando los datos de una muestra se obtienen, registran o
analizan de forma incorrecta. Tal error es consecuencia de una equivocacin y no de una
fluctuacin aleatoria y predispuesta, cuando se usa un instrumento de medicin defectuoso,
cuando se hacen preguntas predispuestas en una encuesta, cuando mucha gente se niega a
responder o cuando se cometen errores al copiar los datos de la muestra.
Sesgo muestral: Tendencia a favorecer la eleccin de unos determinados elementos de la
muestra en detrimento de otros.
Este anlisis de las muestras conduce a distinguir entre las dos ramas principales del
anlisis estadstico: 1) Estadstica descriptiva o deductiva, y 2) Estadstica inferencial o
inductiva.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 22
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

23
Tabla de Frecuencias y Grficos Estadsticos (Frequency Tables Frequency Distribuitions)

Herramientas estadsticas que resultan de particular utilidad para organizar los datos.
Tabla de frecuencia es un resumen tabular de un conjunto datos donde se muestra la
frecuencia (o cantidad) del objeto de estudio en cada una de varias clases.
Distribucin de Frecuencias es un conjunto de puntuaciones ordenadas en sus respectivas
categoras y generalmente se presenta como una tabla.
270
278
250
278
290
274
242
269
257
272
265
263
234
270
273
270
277
294
279
268
230
268
278
268
262

273
201
275
260
286
272
284
282
278
268
263
273
282
285
289
268
208
292
275
279
276
242
285
273
268

258
264
281
262
278
265
241
267
295
283
281
209
276
273
263
218
271
289
223
217
225
283
292
270
262

204
265
271
273
283
275
276
282
270
256
268
259
272
269
270
251
208
290
220
259
282
277
282
256
293

254
223
263
274
262
263
200
272
268
206
280
287
257
284
279
252
280
215
281
291
276
285
287
297
290

228 282
274 230
277 275
286 236
277 295
251 289
278 283
277 261
286 262
277 252
289 283
269 277
267 204
276 286
206 270
284 278
269 270
284 283
268 272
291 281
289 288
293 248
277 266
280 256
274 292

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 23
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

24
TABLA DE
FRECUENCIA
CLASES FREC. FREC. FREC
.
LI LS ABS. REL. ABS.
ACU
M.
1 200 209
9
0,051
9
2 210 219
3
0,017 12
3 220 229
5
0,029 17
4 230 239
4
0,023 21
5 240 249
4
0,023 25
6 250 259
14
0,080 39
7 260 269
32
0,183 71
8 270 279
52
0,297 123
9 280 289
38
0,217 161
10 290 299
14
0,080 175
TOTALE
175 1,000
S

FREC. MARCA

FREC.

REL.
DE
X MARCA
ACUM. CLASE
DE
CLASE
0,0514 204,5 1.840,50
0,0686 214,5
643,50
0,0971 224,5 1.122,50
0,1200 234,5
938,00
0,1429 244,5
978,00
0,2229 254,5 3.563,00
0,4057 264,5 8.464,00
0,7029 274,5 14.274,00
0,9200 284,5 10.811,00
1,0000 294,5 4.123,00
46.757,50

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 24
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

25

Grficos.
Los Grficos que pueden proporcionar una representacin visual de los datos.
HISTOGRAMA (Histogram).
Consiste en una escala horizontal para valores de los datos que se estn representando,
una escala vertical para las frecuencias, y barras que representan la frecuencia de cada clase
de valores.
En el eje horizontal pueden ser colocadas las marcas de clase.
Coloca las clases de una distribucin de frecuencia en el eje horizontal y las frecuencias
en el eje vertical.
60

52

50
38

40
FRECUENCIAS

32

30
20
10

14

9
3

214,5

224,5

234,5

244,5

14

0
204,5

254,5

264,5

274,5

284,5

294,5

MARCAS DE CLASES

TABLA DE
FRECUENCIA
CLASES FREC. FREC. FREC
.
LI LS ABS. REL. ABS.
ACU
M.
1 200 209
9
0,051
9
2 210 219
3
0,017 12
3 220 229
5
0,029 17
4 230 239
4
0,023 21
5 240 249
4
0,023 25
6 250 259
14
0,080 39
7 260 269
32
0,183 71
8 270 279
52
0,297 123
9 280 289
38
0,217 161
10 290 299
14
0,080 175
TOTALE
175 1,000
S

FREC. MARCA

FREC.

REL.
DE
X MARCA
ACUM. CLASE
DE
CLASE
0,0514 204,5 1.840,50
0,0686 214,5
643,50
0,0971 224,5 1.122,50
0,1200 234,5
938,00
0,1429 244,5
978,00
0,2229 254,5 3.563,00
0,4057 264,5 8.464,00
0,7029 274,5 14.274,00
0,9200 284,5 10.811,00
1,0000 294,5 4.123,00
46.757,50

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 25
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

26
HISTOGRAMA DE FRECUENCIA RELATIVA (Relative Frequency Histogram).
Tiene la misma forma y escala horizontal que un histograma, pero la escala vertical se
marcara con frecuencias relativas en lugar de frecuencias reales o absolutas.

0,297
0,217

0,183

0,080

4,
5
29

4,
5
28

4,
5
27

4,
5
26

4,
5
25

4,
5
24

4,
5
23

4,
5

0,017 0,029 0,023 0,023

22

21

20

0,080

4,
5

0,051

4,
5

FRECUENCIAS RELATIVAS

0,350
0,300
0,250
0,200
0,150
0,100
0,050
0,000

MARCAS DE CLASES

TABLA DE
FRECUENCIA
CLASES FREC. FREC. FREC
.
LI LS ABS. REL. ABS.
ACU
M.
1 200 209
9
0,051
9
2 210 219
3
0,017 12
3 220 229
5
0,029 17
4 230 239
4
0,023 21
5 240 249
4
0,023 25
6 250 259
14
0,080 39
7 260 269
32
0,183 71
8 270 279
52
0,297 123
9 280 289
38
0,217 161
10 290 299
14
0,080 175
TOTALE
175 1,000
S

FREC. MARCA

FREC.

REL.
DE
X MARCA
ACUM. CLASE
DE
CLASE
0,0514 204,5 1.840,50
0,0686 214,5
643,50
0,0971 224,5 1.122,50
0,1200 234,5
938,00
0,1429 244,5
978,00
0,2229 254,5 3.563,00
0,4057 264,5 8.464,00
0,7029 274,5 14.274,00
0,9200 284,5 10.811,00
1,0000 294,5 4.123,00
46.757,50

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 26
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

27
DIAGRAMA DE BARRAS.
Este puede mostrar cantidades o porcentajes para dos o ms valores sobre el eje
vertical.
Es una forma de grfica de representar datos cualitativos que se han resumido en una
distribucin de frecuencias, de frecuencias relativas o porcentuales. Para los datos
cualitativos, las barras deben estar separadas para enfatizar el hecho de que cada clase
(categora) es separada.
Relacion Ingresos/Costos
30000
20000

Ingresos

10000

Costos

0
10

20

30

40

50

60

70

80

90 100 110 120 130 140 150 160 170 180 190 200

Unidades Producidas y Vendidas

ANALISIS DE PUNTO DE
EQUILIBRIO
CANTIDAD COSTO PRECIO
UNIDADES UNITARIO
FIJO
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200

60
60
60
60
60
60
60
60
60
60
60
60
60
60
60
60
60
60
60
60

7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500
7.500

COSTO COSTO PRECIO


VARIABL TOTAL UNITARI INGRESOS BENEFICI
E
O
O
600
8.100
130
1.300
-6.800
1.200
8.700
130
2.600
-6.100
1.800
9.300
130
3.900
-5.400
2.400
9.900
130
5.200
-4.700
3.000
10.500
130
6.500
-4.000
3.600
11.100
130
7.800
-3.300
4.200
11.700
130
9.100
-2.600
4.800
12.300
130
10.400
-1.900
5.400
12.900
130
11.700
-1.200
6.000
13.500
130
13.000
-500
6.600
14.100
130
14.300
200
7.200
14.700
130
15.600
900
7.800
15.300
130
16.900
1.600
8.400
15.900
130
18.200
2.300
9.000
16.500
130
19.500
3.000
9.600
17.100
130
20.800
3.700
10.200
17.700
130
22.100
4.400
10.800
18.300
130
23.400
5.100
11.400
18.900
130
24.700
5.800
12.000
19.500
130
26.000
6.500

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 27
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

28
DIAGRAMA DE TALLO Y HOJAS (Steam-and-Leaf Plots).
Frequency

Stem Leaf

20

0144

20

66889

21

21

578

22

033

22

58

23

004

23

24

122

24

25

011224

25

66677899

13

26

0122222333334

19

26

5556778888888889999

25

27

0000000011222223333334444

27

27

555566666777777778888888999

23

28

00011112222223333334444

15

28

555666677899999

11

29

00011222334

29

557

175

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 28
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

29
POLIGONOS DE FRECUENCIA Y POLIGONO DE PORCENTAJE (Frequency Poligon).
El proceso de construccin de un polgono de frecuencias es similar al del histograma
excepto que slo un punto sobre el punto medio de cada intervalo se utiliza para indicar la
frecuencia y los puntos adyacentes se conectan mediante segmentos de lneas.

FRECUENCIAS

60
50
40
30
20
10
0

52
32
9

14
3

38
14

204,5 214,5 224,5 234,5 244,5 254,5 264,5 274,5 284,5 294,5
MARCAS DE CLASES

TABLA DE
FRECUENCIA
CLASES FREC. FREC. FREC
.
LI LS ABS. REL. ABS.
ACU
M.
1 200 209
9
0,051
9
2 210 219
3
0,017 12
3 220 229
5
0,029 17
4 230 239
4
0,023 21
5 240 249
4
0,023 25
6 250 259
14
0,080 39
7 260 269
32
0,183 71
8 270 279
52
0,297 123
9 280 289
38
0,217 161
10 290 299
14
0,080 175
TOTALE
175 1,000
S

FREC. MARCA

FREC.

REL.
DE
X MARCA
ACUM. CLASE
DE
CLASE
0,0514 204,5 1.840,50
0,0686 214,5
643,50
0,0971 224,5 1.122,50
0,1200 234,5
938,00
0,1429 244,5
978,00
0,2229 254,5 3.563,00
0,4057 264,5 8.464,00
0,7029 274,5 14.274,00
0,9200 284,5 10.811,00
1,0000 294,5 4.123,00
46.757,50

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 29
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

30
GRAFICA DE SERIES DE TIEMPO (The Time Series Plot).
Es una grfica de lnea en la que la lnea base representa el tiempo.

ESTUDIANTES MATRICULADOS EN
EL NIVEL SUPERIOR
90.000
80.000
70.000
60.000
50.000
40.000
30.000
20.000
10.000
-

UASD
PUCMM
UNPHU
INTEC
UNIBE
1994

1995

1996

1997

ESTUDIANTES MATRICULADOS EN EL NIVEL


SUPERIOR, POR INSTITUCION.
INSTITUCI
N

AO DE
FUNDACIO
N

UASD

1538

PUCMM

1962

UNPHU

1967

INTEC

1974

UNIBE

1982

1994

AOS
1995

1996

1997

41.139

51.432

62.058

81.753

8.560

8.816

9.081

9.438

6.124

6.171

6.220

6.044

3.074

2.369

2.335

2.803

1.747

1.665

1.910

1.947

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 30
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

31
CURVA DE OJIVA (Ogive for cumulative relative frequency).
Es una grfica de una distribucin acumulada. Los valores de los datos estn en el eje
horizontal y las frecuencias acumuladas, frecuencias relativas acumuladas se muestran en el
eje vertical.

FRECUENCIAS
ACUMULADAS

1,2000
1,0000
0,8000
0,6000
0,4000
0,2000
0,0000

0,9200

1,0000

0,7029
0,4057

0,0514

0,0686

0,0971

0,1200

0,1429

0,2229

204,5 214,5 224,5 234,5 244,5 254,5 264,5 274,5 284,5 294,5
MARCAS DE CLASES

TABLA DE
FRECUENCIA
CLASES FREC. FREC. FREC
.
LI LS ABS. REL. ABS.
ACU
M.
1 200 209
9
0,051
9
2 210 219
3
0,017 12
3 220 229
5
0,029 17
4 230 239
4
0,023 21
5 240 249
4
0,023 25
6 250 259
14
0,080 39
7 260 269
32
0,183 71
8 270 279
52
0,297 123
9 280 289
38
0,217 161
10 290 299
14
0,080 175
TOTALE
175 1,000
S

FREC. MARCA

FREC.

REL.
DE
X MARCA
ACUM. CLASE
DE
CLASE
0,0514 204,5 1.840,50
0,0686 214,5
643,50
0,0971 224,5 1.122,50
0,1200 234,5
938,00
0,1429 244,5
978,00
0,2229 254,5 3.563,00
0,4057 264,5 8.464,00
0,7029 274,5 14.274,00
0,9200 284,5 10.811,00
1,0000 294,5 4.123,00
46.757,50

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 31
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

32
DIAGRAMA DE PARETO.
Es una grfica de barras en la que las barras se acomodan en orden segn la frecuencia.
Al igual que los histogramas, las escalas verticales de los diagramas de Pareto pueden
representar frecuencias o frecuencias relativas.
En este la barra ms alta queda a la izquierda, y la ms pequea a la derecha.

Problemas o defectos en Botas


Razn de defecto
Reventado de Piel
Costuras fallas
Mal montada
Piel arrugada
Total

Total
369
135
135
99
738

% Acumulado
50.00
68.29
86.59
100.00

Porcentaje
0.50
0.18
0.18
0.13
100.00%

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 32
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

33
DIAGRAMA CIRCULAR, DE SECTORES O TORTAS (Pie Chart).
Es de especial utilidad para mostrar proporciones (porcentajes) relativas de una
variable. Se utiliza para representar variables cualitativas.
Por ejemplo si una determinada categora representa el 57.8% del total de los datos u
observaciones, el ngulo central deber ser de 0.578 x 360 = 208.
TABLA DE
FRECUENCIA
CLASES FREC. FREC. FREC
.
LI LS ABS. REL. ABS.
ACU
M.
1 200 209
9
0,051
9
2 210 219
3
0,017 12
3 220 229
5
0,029 17
4 230 239
4
0,023 21
5 240 249
4
0,023 25
6 250 259
14
0,080 39
7 260 269
32
0,183 71
8 270 279
52
0,297 123
9 280 289
38
0,217 161
10 290 299
14
0,080 175
TOTALE
175 1,000
S

8%

5%

FREC.

REL.
DE
X MARCA
ACUM. CLASE
DE
CLASE
0,0514 204,5 1.840,50
0,0686 214,5
643,50
0,0971 224,5 1.122,50
0,1200 234,5
938,00
0,1429 244,5
978,00
0,2229 254,5 3.563,00
0,4057 264,5 8.464,00
0,7029 274,5 14.274,00
0,9200 284,5 10.811,00
1,0000 294,5 4.123,00
46.757,50

3%
2%

200 - 209

2%
2%
8%

22%

FREC. MARCA

210 - 219
220 - 229
230 - 239
240 - 249
250 - 259
260 - 269

18%

270 - 279
280 - 289
30%

290 - 299

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 33
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

34
PICTOGRAMA (Pictographs).
Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de
la variable. Estos grficos se hacen representado en diferentes escalas un mismo dibujo.
La escala de los dibujos debe ser tal que el rea de cada uno de ellos sea proporcional a
la frecuencia de la modalidad que representa. Se utiliza para representar variables
cualitativas.
DIAGRAMA DE DISPERSION O DISPERSIOGRAMA (Scatter Diagram).
Hay ocasiones en que tenemos datos apareados de manera que se establece una
correspondencia entre cada valor de un conjunto de datos y un valor de un segundo conjunto
de datos.
Un diagrama de dispersin es una grfica de los datos (x,y) apareados con un eje "x"
horizontal y un eje "y" vertical.
En un diagrama de dispersin cada marca (punto o raya) representa la interseccin de
dos valores - hay una marca para cada par de observaciones de los temas. El propsito
principal de la grfica es mostrar de manera grfica la relacin entre dos. La relacin no es
lineal sino curvilnea.
CAMPAA PUBLICITARIA PARA
VENTAS DE PASAJES AEREOS
Y
X
Y
OBSERVACI VENTAS PUBLICIDA 4.38625+1.08132
S.
D
X
MES
EN
EN MILES
MILES
1
15
10
15,20
2
17
12
17,36
3
13
8
13,04
4
23
17
22,77
5
16
10
15,20
6
21
15
20,61
7
14
10
15,20
8
20
14
19,52
9
24
19
24,93
10
17
10
15,20
11
16
11
16,28
12
18
13
18,44
13
23
16
21,69
14
15
10
15,20
15
16
12
17,36
TOTALES
268
187

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 34
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

35

Pasajes Aereos vendidos en base a la publicidad


30,00
25,00
20,00
15,00
10,00
5,00
0,00

Pasajes Aereos

10

15

20

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 35
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

36

Medidas de Tendencias Central (Measure of Central Tendency)


Una medida de tendencia central es un valor que est en el centro o punto medio de
un conjunto de datos.
Es una medida que ubica e identifica el punto alrededor del cual se centran los datos.
Es un valor numrico que localiza, de alguna manera el centro de un conjunto de
datos.
La Media Aritmtica (Mean)
La Media Aritmtica o Promedio de un conjunto de puntajes es el valor que se obtiene
sumando los puntajes y dividiendo el total entre el nmero de puntajes.
La media es el punto que menos dista de todas las observaciones. Por esta razn a
veces se le considera como el centro de gravedad de los datos.
La media es una medida ms confiable que la mediana y la moda, porque tiene un
menor error de muestreo. Adems la media tambin tiene ms facilidad para un tratamiento
estadstico posterior que la mediana o la moda.
Es una medida que toma en consideracin todos los valores de la distribucin. Esto es
positivo, pero por la misma razn es muy sensible a la presentacin de observaciones
extremas que hacen que la media se desplace hacia ellas. En consecuencia no es
recomendable usar la media como medida de tendencia central en estos casos, pues la
cantidad obtenida no es representativa del total de los datos.
Tiene la ventaja de que es la nica y siempre se puede calcular. Pero cuando se trabaja
con datos agrupados, la divisin en intervalos influye en el valor resultante de la media.
La media es el estadstico de centralizacin ms utilizado para realizar inferencias
debido a una buena propiedad matemtica que posee: es el centro de gravedad de la
distribucin. Depende de todas y cada una de las observaciones.
El valor de la media puede no coincidir con uno de los valores de la variable. Si
consideramos una variable discreta, por ejemplo, nmero de hijos en las familias de un
barrio el valor de la media puede resultar x=2.5 hijos, que no pertenece al conjunto de
valores de la variable.
La media es el promedio ms utilizado.
Para datos no agrupados:
Media Poblacional = Xi/N =(X1 + X2 + X3...XN)/N
Media Muestral = Xi/n=(X1 + X2 + X3...XN)/n
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 36
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

37
Para datos agrupados:
Media = *M/n=M/=(1*M1+2*M2+...n*Mn)/
La Mediana o Media Posicional (Median)
La Mediana o Media Posicional de un conjunto de puntajes es el valor que est en medio,
cuando los puntajes se acomodan en orden de magnitud creciente (o decreciente).
La mediana deja a un lado y al otro lado de la distribucin el mismo nmero de
observaciones.
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable, sino del orden de los
mismos. Por ello, es adecuado su uso en distribuciones que presentan observaciones
extremadamente grandes o pequeas.
La mediana es la medida de localizacin que se utiliza con ms frecuencia para datos
de ingreso anual y valores catastrales, pues con unos pocos ingresos o con propiedades
extremadamente grandes se puede inflar la media. En esos casos, la mediana es una mejor
medida de la tendencia central.
La mediana es el valor de la variable que deja por encima y por debajo la misma
cantidad de datos (una vez que stos han sido ordenados de menor a mayor). Al contrario de
la media, en su clculo no interviene ms que el valor (o valores centrales). Esta
particularidad ofrece:
Ventajas: No se ve afectada por la aparicin de observaciones anmalas. Por ello, en
tales casos la podemos considerar como una medida ms representativa de la mayor parte de
los datos que la media.
Inconvenientes: No utiliza toda la informacin de los datos (slo los valores centrales).
Para datos no agrupados:
Posicin de la Mediana = (n + 1)/2
1.- Si el nmero de puntajes es impar, la mediana es el nmero que est situado exactamente
a la mitad de la lista.
2.- Si el nmero de puntaje es par, la mediana se obtiene calculando la media de los dos
nmeros que estn a la mitad.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 37
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

38
Para datos agrupados:
Me = LImd + [(n/2 - F)/fmd] (C)
md = clase mediana
Clase Mediana es la clase cuya frecuencia acumulada es mayor que o igual a n/2.
LImd = lmite inferior de la clase de la mediana.
F

= frecuencia acumulada de la clase que


antecede a la clase de la mediana.

fmd = es la frecuencia de la clase de la mediana.


C
= Es la anchura de la clase (es la diferencia entre dos LS consecutivos o entre dos LI
consecutivos).
La Moda (Mode)
La Moda de un conjunto de datos es el puntaje que ocurre con ms frecuencia.
La observacin modal es la observacin que ocurre con mayor frecuencia.
Es el punto donde se concentra el mayor nmero de observaciones.
Se puede calcular para todo tipo de variables, incluidas las cualitativas.
Puede no ser nica. Cuando hay dos o ms modas hablamos de distribuciones
bimodales o plurimodales respectivamente.
Para datos no agrupados:
Mo = Mayor Frecuencia
Para datos agrupados:
Mo = LImo + [1/(2+1)]*(C)
mo = clase modal
Clase Modal es la clase que tiene la mayor frecuencia.
LImo = lmite inferior de la clase modal
1 = diferencia entre la frecuencia de la clase modal y la clase que la antecede.
2 = diferencia entre la frecuencia de la clase modal y la clase que le sigue.
C
= Es la anchura de la clase (es la diferencia entre dos LS consecutivos o entre dos LI
consecutivos).

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 38
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

39
La Media Ponderada
Media Ponderada: Media de una coleccin de puntajes a los que se asignado diferentes
grados de importancia.
Media Ponderada w = (X*W)/W
W = es el peso o ponderacin asignada a cada Observacin.
La Media Geomtrica
Media Geomtrica puede utilizarse para mostrar los cambios porcentuales en una serie de
nmeros positivos.
La media geomtrica proporciona una medida precisa de un cambio porcentual promedio en
una serie de nmeros.
MG = X1*X2*X3*...Xn
La media geomtrica se utiliza con ms frecuencia para calcular la tasa de crecimiento
porcentual promedio de algunas series dadas, a travs del tiempo.
TAREA: RELACION ENTRE LA MEDIA, MEDIANA Y MODA.
VENTAJAS Y DESVENTAJAS
OBSERVACIONES PARA EL USO DE LAS MISMAS.
Observaciones:
1. La media se usa para datos numricos y distribuciones simtricas (no sesgadas o
cargadas).
2. La mediana se utiliza para datos ordinales o para datos numricos si la distribucin
est cargada o sesgada.
3. La moda se utiliza principalmente para distribuciones bimodales.

Eleccin de los procedimientos estadsticos o pruebas:


Datos nominales
Datos ordinales
Datos por intervalos o razn

Moda
Mediana, moda
Media, mediana, moda, desviacin estndar, varianza,
Rango.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 39
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

40
MEDIA ARITMETICA:
Para datos no agrupados:
Media Poblacional = Xi/N =(X1 + X2 + X3...XN)/N
_
Media Muestral = Xi/n=(X1 + X2 + X3...XN)/n
Para datos agrupados:
_
Media = *M/n=M/=(1*M1+2*M2+...n*Mn)/
MEDIANA
Para datos no agrupados:
Posicin de la Mediana = (n + 1)/2
Para datos agrupados:
Me = LImd + [(n/2 - F)/fmd] (C)
md = clase mediana
Clase Mediana es la clase cuya frecuencia acumulada es mayor que o igual a n/2.
LImd = lmite inferior de la clase de la mediana.
F = frecuencia acumulada de la clase que antecede a la clase de la mediana.
fmd = es la frecuencia de la clase de la mediana.
C
= Es la anchura de la clase (es la diferencia entre dos LS consecutivos o entre dos LI
consecutivos).
MODA
Para datos no agrupados:
Mo = Mayor Frecuencia
Para datos agrupados:
Mo = LImo + [1/(2+1)]*(C)
mo = clase modal
Clase Modal es la clase que tiene la mayor frecuencia.
LImo = lmite inferior de la clase modal
1 = diferencia entre la frecuencia de la clase modal y la clase que la antecede.
2 = diferencia entre la frecuencia de la clase modal y la clase que le sigue.
C
= Es la anchura de la clase (es la diferencia entre dos LS consecutivos o entre dos LI
consecutivos).

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 40
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

41

Medidas de Dispersin o Variabilidad (Measures of Variation).


Las medidas de dispersin miden que tanto se dispersan las observaciones alrededor
de su media. El propsito de estas es cuantificar el grado de variacin entre el conjunto de
valores de una distribucin.
La variabilidad se refiere a que tan grandes son las diferencias entre los valores
evaluados.
EL RANGO O RECORRIDO INTERVALO (Range).
Es la medida de dispersin ms simple y menos til. Esta se obtiene de la diferencia
entre la observacin ms alta y la ms baja.
Re = X mx X mn
VALORES DE DESVIACION.
Para la variabilidad, se consideran las diferencias entre la media y cada valor. Estas
diferencias se llaman valores de desviacin.
Valores de desviacin = X-
_
Valores de desviacin = X-X
VARIANZA (Variance). Es el promedio de las observaciones respecto a su media elevadas al
cuadrado.
Es la media de las diferencias cuadrticas de N puntuaciones en relacin a su media
aritmtica.
La varianza es til para comparar la dispersin, o variabilidad, de dos conjuntos de
tatos. Al comparar conjuntos de datos, el que tiene mayor varianza tiene mayor dispersin o
variabilidad.
La Varianza para una Poblacin ( = suma de cuadrados).
=[(Xi-)]/N
0
Procedimiento para calcular La Varianza para una Poblacin ( = suma de cuadrados)
1. Encuentre la desviacin de cada valor de la media: Valores de desviacin = X-
2. Eleve al cuadrado cada valor de desviacin: (Xi-)
3. Realice la sumatoria de cada valor de desviacin elevado al cuadrado: (Xi-)
4. Encuentre la varianza dividiendo la sumatoria anterior entre N (totalidad de las
observaciones).
La Varianza para una muestra de datos no agrupados (s).
_
s =[(Xi-X)]/n-1

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 41
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

42
La Varianza de la muestra de datos agrupados (s).
_
s=[M-nX]/n-1
LA DESVIACION ESTANDAR (Standard Deviation). Es el promedio de desviacin de las
puntuaciones con respecto a la media. Esta medida se expresa en las unidades originales de
medicin de la distribucin. Cuanto mayor sea la dispersin de los datos alrededor de la
media, mayor ser la desviacin estndar.
Es la raz cuadrada de la varianza. Es una medida importante de la dispersin de los
datos.
Esta regresa a la medicin de los valores originales, as tiene ms valor descriptivo
directo.
La desviacin estndar es ms til para describir la variabilidad de un conjunto de
datos que la varianza. La desviacin estndar lleva las mismas unidades que los valores
originales.
La Desviacin Estndar para una poblacin.
=
La Desviacin Estndar para una muestra.
s=s
La Desviacin Media o Absoluta (Mean Deviation).
Se define como el promedio de la suma de las diferencias en valor absoluto de los
valores de la variable con respecto a la media.
_
Desviacin media= |Xi-X|/n
Coeficiente de Variacin.
Este sirve como medida relativa de dispersin. Determina el grado de dispersin de
un conjunto de datos relativo a su media.
_
CV = (s/X) * 100

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 42
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

43

Los Cuantiles (Measures of Position).


Cuando los valores ordenados de una variable han de ser divididos en grupos
homogneos en cuanto al tamao, se suelen utilizar los cuantiles.
Entre los cuantiles ms utilizados se encuentran:
Los cuartiles Q (Quartiles)
Los deciles D (Deciles)
Los percentiles P (Percentiles)
Cuartiles.
As como la mediana divide los datos en dos partes iguales, los tres cuartiles,
denotados por Q1, Q2 y Q3, dividen los puntajes clasificados en cuatro partes iguales. (Los
puntajes se clasifican cuando se acomodan en orden). A grandes rasgos:
Q1 separa el 25% inferior de los puntajes clasificados del 75% superior;
- al menos el 25% de los datos es <= Q1
- al menos el 75% de los datos es >= Q1
- N/4 = 25
- Q1 = P25
Q2 es la mediana;
- 2N/4 = 50
- Q2 = P50
Q3 separa el 25% superior del 75% inferior
- al menos el 75% de los datos es <= Q3
- al menos el 25% de los datos es >= Q3
- 3N/4 = 75
- Q3 = P75
Los Deciles.
Hay nueve deciles, denotados por D1, D2, D3, D4, D5, D6, D7, D8, D9, que dividen los
datos en 10 grupos con aproximadamente el 10% de los datos en cada grupo.
El primer decil es la observacin debajo de la cual se encuentra el 10% de las
observaciones, mientras que el 90% restante se encuentra encima de este.
- al menos el 10% de los datos es <= D1
- al menos el 90% de los datos es >= D1

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 43
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

44
D1 = P10
D2 = P20
D3 = P30
:
.
D9 = P90
Los Percentiles.
Hay 99 percentiles (P1, P2, P3 ... P99), que dividen los datos en 100 grupos con
aproximadamente el 1% de los puntajes en cada grupo.
- al menos el 1% de los datos es <= P1
- al menos el 99% de los datos es >= P1
Ubicacin de un Percentil.
Lp = (n + 1) (P/100)
Lp
es el sitio del percentil deseado en una serie ordenada.
n es el nmero de observaciones
P es el percentil deseado
Percentil de un puntaje.
Percentil del puntaje x = nmero de puntajes menores que x . 100
nmero total de puntajes
Otras Medidas de Tendencia Central con los Cuantiles.
intervalo intercuartiles = Q3 - Q1
intervalo semiintercuartiles = Q3 - Q1
(desviacin del cuartil)
2
cuartil medio = Q3 + Q1
2
intervalo de percentiles 10-90 = P90 - P10

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 44
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

45

Los cuartiles (Q) para datos agrupados


TABLA DE
FRECUENCIA
CLASES FREC. FREC. FREC
.
LI LS ABS. REL. ABS.
ACU
M.
1 200 209
9
0,051
9
2 210 219
3
0,017 12
3 220 229
5
0,029 17
4 230 239
4
0,023 21
5 240 249
4
0,023 25
6 250 259
14
0,080 39
7 260 269
32
0,183 71
8 270 279
52
0,297 123
9 280 289
38
0,217 161
10 290 299
14
0,080 175
TOTALE
175 1,000
S

FREC. MARCA

FREC.

REL.
DE
X MARCA
ACUM. CLASE
DE
CLASE
0,0514 204,5 1.840,50
0,0686 214,5
643,50
0,0971 224,5 1.122,50
0,1200 234,5
938,00
0,1429 244,5
978,00
0,2229 254,5 3.563,00
0,4057 264,5 8.464,00
0,7029 274,5 14.274,00
0,9200 284,5 10.811,00
1,0000 294,5 4.123,00
46.757,50

Q1 = LI + N/4 F * C
f
N/4 = 43.75; primera F > N/4 = 71
Q1 = 260 + 43.75 39 * (10) = 261.48
32
Q2 = LI + 2N/4 F * C
f
2N/ 4 = 87.50; primera F > 2N/4 = 123
Q2 = 270 + 87.50 71 * (10) = 273.17
52
Q3 = LI + 3N/4 F * C
f
3N/4 = 131.25; primera F > 3N/4 = 161
Q3 = 280 + 131.25 123 * (10) = 282.17
38
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 45
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

46

CUARTILES

DECILES

PERCENTILES

Q1

VALOR QUE OCUPA N/4

Q2

VALOR QUE OCUPA 2N/4

Q3

VALOR QUE OCUPA 3N/4

D1

VALOR QUE OCUPA N/10

D2

VALOR QUE OCUPA 2N/10

D9

VALOR QUE OCUPA 9N/10

P1

VALOR QUE OCUPA N/100

P2

VALOR QUE OCUPA 2N/100

P99

VALOR QUE OCUPA 99N/100

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 46
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

47

Usos frecuentes de la desviacin estndar.


Teorema de Chebyshev (matemtico ruso P.L. Chebyshev 1821-1894)
La proporcin (o fraccin) de cualquier conjunto de datos que queda a menos de K
desviaciones estndar de la media siempre es al menos 1 - 1/K, donde K es cualquier
numero positivo mayor que 1. Para K = 2 y K = 3, obtenemos los dos resultados especficos
siguientes:
- Al menos 3/4 (o el 75%) de todos los puntajes quedan a menos de 2 desviaciones
estndar de la media (x-2s a x+2s).
- Al menos 8/9 (o el 89%) de todos los puntajes quedan a menos de 3 desviaciones
estndar de la media (x-3s a x+3s).

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 47
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

48

La distribucin normal (o gaussiana) y la regla emprica.


La distribucin normal es una distribucin de datos continuos (*) (no discretos) que
produce una curva simtrica en forma de campana.
La distribucin gaussiana fue presentada por Karl Friedrich Gauss (1777-1855) en el
1812.
La campana de Gauss o curva de distribucin normal, curva de probabilidad normal;
se caracteriza por:
- Es unimodal.
- Es simtrica (la simetra es perfecta).
- La mitad izquierda de su histograma es aproximadamente una imagen especular de
su mitad derecha.
- La asimetra de la distribucin es cero.
- Las colas de la curva se aproximan ms, pero nunca tocan, el eje horizontal.
- La media, la mediana y la moda son iguales.
- La mitad de las observaciones est por encima de la media y la mitad est por debajo.
- Si las observaciones estn altamente dispersas, la curva en forma de campana se
aplanara y se esparcir.
(*) Variables continas:
Son las que pueden tomar cualquier valor dentro de un intervalo dado. Por muy prxima que
puedan estar dos observaciones, si el instrumento de medida tiene la precisin suficiente siempre puede
haber una tercera observacin que caiga entre las dos primeras. Los valores de una variable continua
proceden en general de mediciones, por ejemplo las cantidades de leche que las vacas producen son datos
continuos porque son mediciones que pueden asumir cualquier valor dentro de un intervalo continuo.
Se pueden obtener de un nmero infinito de posibles valores que pueden asociarse a puntos de
una escala continua, de tal manera que no haya huecos ni interrupciones.
La Regla Emprica o Regla 68-95-99. Esta regla solo aplica a un conjunto de datos cuya
distribucin tiene aproximadamente forma de campana. Esta afirma que:
- Cerca del 68.26% de todos los puntajes u observaciones queda a menos de una
desviacin estndar de la media.
- Cerca del 95.44% de todos los puntajes u observaciones queda a menos de dos
desviaciones estndar de la media.
- Cerca del 99.74% de todos los puntajes u observaciones que a menos de tres
desviaciones estndar de la media.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 48
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

49
Distribuciones de Datos Sesgadas (Skewness).
Una distribucin de datos esta sesgada, si no es simtrica y se extiende ms hacia un
lado que hacia otro.
Sesgo describe la falta de simetra en una distribucin.
Los datos sesgados a la izquierda se dice que tienen sesgo negativo; la media y la
mediana estn a la izquierda de la moda. Generalmente tiene la media a la izquierda de la
mediana.
Sesgo negativo (Negatively Skewed Distribution) describe distribuciones asimtricas en la que
la mediana excede a la media; la cola de la distribucin es hacia los valores bajos.
Los datos sesgados a la derecha se dice que tienen sesgo positivo; la media y la
mediana estn a la derecha de la moda.
Sesgo positivo (Positively Skewed Distribution) describe distribuciones asimtricas en las que la
media excede la mediana; los valores se alargan hacia los valores altos.
En ambos casos, la moda es por definicin la observacin que ocurre con mayor
frecuencia, por tanto esta en el pico de la distribucin.
Observaciones:
1. Si la media y la mediana son iguales, la distribucin de los resultados suele ser
simtrica.
2. Si la media es mayor que la mediana, la distribucin se carga a la derecha.
3. Si la media es menor que la mediana, la distribucin se carga a la izquierda.
Coeficiente de Sesgo de Pearson.
P = 3 (Media - Mediana)
s
Si P < 0, los datos estn sesgados a la izquierda.
Si P > 0, los datos estn sesgados a la derecha.
Si P = 0, los datos estn distribuidos normalmente.
La Curtosis kurtosis, del griego kupts, kyrtos, kurtos = curva: es un indicador de lo plana
o picuda que es la curva. Cuando es cero (curtosis = 0), significa que puede tratarse de una
curva normal. Si es positiva, quiere decir que la curva, la distribucin o polgono es ms
picuda(o) o elevada(o). Si la curtosis es negativa, indica que es ms plana la curva.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 49
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

50

SPSS Statistics Base 17/22


Pasos para construir una tabla de Frecuencia en SPSS 17/22.
1. Crear la Base de Datos o Conjuntos de observaciones o puntajes que
desea agrupar. (Leer el Captulo 5 del Manual de SPSS Statistics Base 17.
2. Opcin del men Transformar.
3. Opcin Agrupacin Visual.
4. Seleccionar la Variable a transformar. => SALARIOS
5. Crear nueva Variable agrupada. => SALARIOS1
6. Establecer los Lmites Superiores (Intervalos cerrados o abiertos
Incluidos <= o Excluidos <).
7. Crear puntos de corte.
Posicin del primer punto de corte. Min+Anchura-1 o
Min.+Anchura. Primer LS => 209
Nmero de puntos de corte, Nmero de Clases 1. #Clases = 10
=> #Cortes = 10 1.
Anchura.
8. Crear etiquetas Crear las clases.
9. Aceptar.
10. Se visualiza la nueva Variable agrupada SALARIOS1
Pasos para visualizar una tabla de Frecuencia en SPSS 17/22.
1.
2.
3.
4.
5.
6.
7.

Despus de crear la Variable agrupada.


Seleccionar la opcin del Men Analizar.
Seleccionar la opcin Estadsticos descriptivos.
Seleccionar la opcin Frecuencias.
Seleccionar la Variable agrupada SALARIOS1.
Seleccionar los Estadsticos Todos y Percentiles deseados.
Seleccionar los grficos

Tomar como ejemplo el archivo (file) demo_cs que se encuentra en:


Local Disk C:\Program Files (x86)\SPSSInc\Statistics17\Samples\Spanish

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 50
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

51
Ejercicios Propuestos. Calcule los modelos de tendencia central, represente grficamente
cada situacin e interprete los resultados.
Caso I.
El precio que acostumbran a pagar 500 usuarias de un determinado producto aparece en la
siguiente tabla:
NUMERO
DE
PRECIOS PRECIOS USUARIAS
5.05
10.05
38
10.05
15.05
167
15.05
20.05
143
20.05
25.05
92
25.05
30.05
37
30.05
35.05
17
35.05
40.05
6
1. Construya una tabla de frecuencia.
2. Cul es el precio ms representativo?
3. Cul es el precio que representa al sector socioeconmico que est equidistante de los
sectores extremos?
4. Cul fue el precio que ms pagaron estas usuarias?
5. Grafique un diagrama circular.
6. Grafique un Histograma.
Caso II.
Se considera la distribucin de los ingresos mensuales de una muestra de directores de
enseanza bsica, segn muestra la siguiente tabla:
NUMERO DE
INGRESOS
DIRECTORES
7,000.00 7,999.00
6
8,000.00 8,999.00
6
9,000.00 9,999.00
10
10,000.00 10,999.00
18
11,000.00 11,999.00
30
12,000.00 12,999.00
25
13,000.00 13,999.00
40
14,000.00 14,999.00
80
15,000.00 15,999.00
15
1. Construya una tabla de frecuencia.
2. Cul es el ingreso ms representativo de estos directores?
3. Cul es el ingreso que representa a los directores estn equidistantes de los extremos?
4. Cul es el ingreso que ms recibieron los directores?
5. Grafique una curva de ojiva.
6. Grafique un Polgono de frecuencia.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 51
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

52
Caso III.
Una organizacin est por revisar el monto que los estudiantes invierten en textos cada
semestre. Cincuenta estudiantes reportaron las cantidades aproximadas en dlares:
DOLARES
NUMERO DE
INVERTIDOS
ESTUDIANTES
100
124
8
125
149
11
150
174
8
175
199
6
200
224
10
225
249
6
250
274
1
TOTALES
50
1. Construya una tabla de frecuencia.
2. Cul es la cantidad de dinero invertida que ms representa a todos los estudiantes?
3. Cul es la inversin ms comn entre los estudiantes?
4. Cul sera la cantidad que representa la mitad de la inversin de todos los
estudiantes?
5. Grafique un diagrama circular.
6. Grafique un Histograma.
7. Grafique una curva de ojiva.
Caso IV.
Un analista de la Secretara de Estado de Trabajo est evaluando los sueldos de los empleados
dominicanos para recomendar un reajuste salarial. Para esto tomo una muestra de 140
empleados, en base a la siguiente tabla:
SUELDOS
USA$
USA$
EMPLEADOS
305
609
65
610
914
30
915
1,219
22
1,220
1,524
10
1,525
1,829
5
1,830
2,134
3
2,135
2,439
2
2,440
2,744
2
2,745
3,049
1
TOTALES
140
1. Construya una tabla de frecuencia.
2. Cul es el sueldo ms representativo de estos empleados?
3. Cul es el sueldo que representa la mitad?
4. Cul es el sueldo ms comn?
5. Grafique una curva de ojiva.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 52
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

53
6. Grafique un Polgono de frecuencia.
7. Usando el coeficiente de sesgo de Pearson determine si est sesgada.
8. Cmo est sesgada? Por qu?
9. Es simtrica? Por qu?
10. Es una distribucin normal? Por qu?
Caso V.
Un estudiante de quinto semestre de administracin de empresas est cursando 5
asignaturas, y estos estiman obtener las siguientes calificaciones:
ASIGNATURA
NOTA
LETRA
CREDITOS
CONTABILIDAD DE COSTOS
80
B=3
5
INTR. AL DERECHO LABORAL
90
A=4
3
METODOS CUANTITATIVOS
85
B=3
4
METODOG. DE LA INVESTIGACION 95
A=4
3
MERCADEO II
90
A=4
3
Determine cul ser el ndice acadmico del semestre.
Caso VI.
Un fabricante de circuitos elctricos ha producido el siguiente nmero de unidades en los
siguientes aos:
1995
1996
1997
1998
1999
12,500
13,250
14,310
15,741
17,630
1. Calcule el incremento porcentual de cada ao con relacin al anterior.
2. Determine la media tomando en consideracin los incrementos porcentuales.
Caso VII.
Un inversionista extranjero est interesado en ingresar en algn sector econmico de la
Repblica Dominicana, para ello seleccion 4 sectores y as evaluar su comportamiento. Este
se bas en los datos del Banco Central de la R. D. segn el informe de la economa
dominicana ene-dic 1999 del producto interno bruto (PIB) durante los aos 1995-1999. Estos
sectores crecieron de la siguiente manera:
SECTORES
1995
1996
1997
1998
1999
MANUFACTURA
839.4
866.4
929.9
987.5
1053.6
COMERCIO
554.8
603.9
661.9
733.4
800.1
COMUNICACIONES
159.7
185.7
221.5
267
308.7
HOTELES, BARES Y REST.
259.4
292.6
343.6
359.7
395.6
1. Tomando como base la tasa de crecimiento porcentual promedio de cada sector, en
cul sector usted le recomendara invertir?
2. Haga un diagrama de serie de tiempo que represente simultneamente todos los
sectores.
Caso VIII.
Calcule la desviacin estndar de los siguientes tiempos de espera (en minutos) de los clientes
del Banco BHD, basados en una muestra. Calcule la Mediana y la Moda.
6.5
6.6
6.7
6.8
7.1
7.3
7.4
7.7
7.7
7.7

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 53
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

54
Caso IX.
Se utilizan dos procesos para producir discos de computadoras, pero han surgido problemas
respecto a la variacin en los tamaos de tales discos. Con base en los datos de muestra aqu
presentados de ocho tamaos de discos en pulgadas para cada proceso. Explique en cul
proceso aconsejara usted si su objetivo es minimizar la desviacin en el tamao de los discos.
PROCESO I PROCESO II
3.41
3.74
3.89
3.65

3.22
3.06
3.65
3.33

3.81
3.26
3.07
3.35

3.26
3.79
3.14
3.51

Caso X.
Los salarios en miles de dlares de los directores ejecutivos de las mejores corporaciones de
los Estados Unidos de Amrica reportados por la edicin de la revista Forbes de la edicin del
24 de mayo de 1997 aparecen en la siguiente tabla de frecuencias:
SALARIOS
DIRECTORES
(EN MILES DE US$) EJECUTIVOS
90
439
6
440
789
8
790 1,139
10
1,140 1,489
12
1,490 1,839
10
1,840 2,189
8
2,190 2,539
6
TOTALES
1.
2.
3.
4.
5.
6.
7.
8.

Haga un Histograma.
Cul es el salario ms comn de los directores ejecutivos?
Haga un Diagrama Circular e Interprtelo.
Determine si est sesgada.
Cul es el salario que est equidistante de los dos extremos?
Es una distribucin normal? Por qu?
Represente grficamente si es normal o el sesgo.
Compruebe si se cumple la regla emprica.

Caso XI.
Un inversionista extranjero est interesado en ingresar en algn sector econmico de la
Repblica Dominicana, para ello seleccion 5 sectores y as evaluar su comportamiento. Este
se bas en los datos del Banco Central de la R. D. segn el informe de la economa
dominicana ene-dic 2002 del producto interno bruto (PIB) durante los aos 1996-2002. Estos
sectores crecieron de la siguiente manera:

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 54
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

55
BANCO CENTRAL DE LA REPUBLICA DOMINICANA
Departamento de Cuentas Nacionales y Estadsticas Econmicas
PRODUCTO INTERNO BRUTO POR SECTORES DE ORIGEN 1996-2002
Millones de RD$
Sectores
CONSTRUCCIN
COMERCIO
COMUNICACIONES
ELECTRICIDAD
FINANZAS
TASAS DE CRECIMIENTO (%)
SECTORES
CONSTRUCCIN
COMERCIO
COMUNICACIONES
ELECTRICIDAD
FINANZAS

1996 1997 1998


702.1
603.9 664.2 743.3
185.7 221.5 266.7
106.0 120.7
228.8 236.2 245.7

1999
826.2
805.7
308.3
130.5
256.0

2000 2001* 2002*


872.8 876.9 904.9
875.8 885.0 915.1
355.7 442.0 518.9
139.5 165.1 178.0
264.4 271.9 279.7

97/ 96 98/97 99/98 00/99 01/00* 02/01*


17.7 5.6
0.5
3.2
10.0 11.9 8.4 8.7
1.1
3.4
19.3 20.4 15.6 15.4 24.2 17.4
13.8 8.1 7.0 18.3
7.8
3.2 4.0 4.2 3.2
2.8
2.9

1. Tomando como base la tasa de crecimiento porcentual promedio de cada sector, en


cules sectores usted le recomendara invertir?
2. Haga un diagrama de serie de tiempo que represente simultneamente todos los
sectores.
Caso XII.
Un analista de la Secretara de Estado de Trabajo est evaluando los sueldos de los empleados
dominicanos en la rama Industrias y Manufactureras para recomendar un reajuste salarial.
Para esto tomo una muestra de 464 empleados, en base a la siguiente tabla:
Ingresos por rama de actividad econmica segn el Banco Central
Fuente: Encuesta Nacional de Fuerza de Trabajo, Abril 2002.
Ingresos por Hora
(RD$)
Empleados
6
9
18
10
13
35
14
17
60
18
21
61
22
25
64
26
29
53
30
33
48
34
37
49
38
41
36
42
45
40
1. Construya una tabla de frecuencia.
2. Cul es el sueldo ms representativo de estos empleados?
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 55
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

56
3.
4.
5.
6.
7.
8.

Cul es el sueldo que representa la mitad?


Cul es el sueldo ms comn?
Grafique un Polgono de frecuencia
Usando el coeficiente de sesgo de Pearson determine si est sesgada.
Cmo est sesgada? Por qu?
Es una distribucin normal? Por qu? Diga 5 razones.

Caso XIII.
El informe Nielsen sobre Tecnologa Domestica (20 de febrero de 1996) describi las
tecnologas caseras y su empleo por parte de personas de 12 aos o ms. Los datos siguientes
son las horas de empleo de computadoras personales durante una semana, para una muestra
de 50 personas.
4.1
3.1
4.1
10.8
7.2

1.5
4.8
4.1
2.8
6.1

10.4
2.0
8.8
9.5
5.7

5.9
14.8
5.6
12.9
5.9

3.4
5.4
4.3
12.1
4.7

5.7
4.2
3.3
0.7
3.9

1.6
3.9
7.1
4.0
3.7

6.1
4.1
10.3
9.2
3.1

3.0
11.1
6.2
4.4
6.1

3.7
3.5
7.6
5.7
3.1

Resuma estos datos formando:


a. Construya una tabla de distribucin de frecuencias, empleando anchura de clase igual
a 3 horas.
b. Un histograma.
c. Una Ojiva.
d. Un diagrama circular.
e. Un Polgono de Frecuencia.
f. Haga comentarios acerca de lo que indican los datos respecto al uso de computadoras
en el hogar.
g. Cul es el tiempo ms empleado?
h. Qu tiempo est a la mitad?
i. Cul es el ms representativo de los tiempos?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 56
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

57
Caso XIV.
Los sueldos de los dominicanos expresados en dlares USA$ oscilan dentro de la siguiente
distribucin de valores:
105 305 505 705 905 1,105 1,305 1,505 1,705 1,905 2,105 2,305
145 345 545 745 945 1,145 1,345 1,545 1,745 1,945 2,145 2,345
185 385 585 785 985 1,185 1,385 1,585 1,785 1,985 2,185 2,385
225 425 625 825 1,025 1,225 1,425 1,625 1,825 2,025 2,225 2,425
265 465 665 865 1,065 1,265 1,465 1,665 1,865 2,065 2,265 2,465
1. Determine los cuartiles Q1, Q2 y Q3
2. Determine el percentil 70
3. Determine el sexto decil
4. Determine la desviacin del cuartil
5. Determine el percentil del valor US$1,425
6. Determine la mediana
Caso XV.
Los salarios inicial para recin graduados de licenciatura en contabilidad, durante 1996 y
1997, fue US$30,393 (US Online, U.S. News and World Report, diciembre 1997). A
continuacin vemos una muestra de salarios iniciales, en miles de dlares.
30.7 28.8 29.1 31.1 30.1
29.7 30.7 30.0 30.6 30.5
31.2 32.1 30.2 30.3 32.9
32.2 29.9 28.9 30.6 31.8
32.2 30.3 30.4 32.3 33.3
32.7 29.3 30.3 30.9 30.3
a. Cul es el salario promedio inicial para datos no agrupados?
b. Cul es la mediana de salario inicial para datos no agrupados?
c. Cul es la moda de salario inicial para datos no agrupados?
d. Cul es el primer cuartil?
e. Cul es el segundo cuartil?
f. Condicen estos resultados con lo que afirma U.S. News & World Report?
Caso XVI.
Dos modos que usan los empleados para ir a trabajar diariamente son el transporte pblico y
el automvil. A continuacin vemos unas muestras de tiempos de cada modo. Las cifras son
en minutos.
Transporte
pblico
28.0 29.0 32.0 37.0 33.0 25.0 29.0 32.0 41.0 34.0
Automvil
29.0 31.0 33.0 32.0 34.0 30.0 31.0 32.0 35.0 33.0
a. Calcule la media de la muestra del tiempo que se lleva en cada modo de transporte.
b. Calcule la desviacin estndar de la muestra para cada modo de transporte.
c. Con base en los resultados de los incisos a y b, qu modo de transporte debe
preferirse? Explique sus razones?
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 57
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

58
Caso XVII.
Como estadstico residente en Air Santo Domingo, el director de anlisis estadstico le pide
recolectar y agrupar los datos sobre el nmero de pasajeros que han decidido viajar con Air
Santo Domingo. Tales datos correspondientes a los ltimos 50 das aparecen en la tabla
siguiente. Sin embargo, con estos datos en bruto, es improbable que el director pueda
obtener informacin til y significativa respecto a las operaciones de vuelo. Los datos no
estn organizados y es difcil llegar a una conclusin significativa simplemente revisando una
serie de nmeros anotados en un papel. Es preciso agrupar y presentar los datos de manera
concisa y reveladora para facilitar el acceso a la informacin que contienen.
68
72
50
70
65
83
77
78
80
93

71
74
60
84
72
84
73
81
84
92

77
57
70
59
85
74
78
79
91
102

83
67
66
75
79
82
93
90
101
80

79
69
76
94
71
97
95
83
86
69

9. Haga un Histograma.
10. Cul es el nmero de pasajeros que ocurre con ms frecuencia?
11. Qu tan dispersos estn los datos?
12. Haga un Diagrama Circular e Interprtelo.
13. Determine si est sesgada.
14. Qu cantidad de pasajeros est equidistante de los dos extremos?
15. Es una distribucin normal? Por qu?
16. Represente grficamente si es normal o el sesgo.
Caso XVIII.
En Aeromar se aceptaron reservaciones telefnicas de vuelos. En la tabla siguiente vemos las
duraciones de las llamadas en minutos, para una muestra de reservaciones telefnicas.
2.1
4.8
5.5
10.4
3.3
3.5
4.8
5.8
5.3
5.5
2.8
3.6
5.9
6.6
7.8
10.5
7.5
6.0
4.5
4.8
a) Qu tan dispersos estn los tiempos de estas llamadas?
b) Cul es el tiempo que est equidistante de los extremos?
c) Determine el primer Cuartil.
d) Determine el quinto Decil.
e) Determine el percentil de la duracin 7.8
f) Construya una tabla de frecuencia.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 58
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

59
g) Determine si est sesgada analticamente.
h) Es una distribucin normal? Por qu? Diga 5 razones.
i) Represente grficamente el comportamiento de esta distribucin.
j) Haga una curva de ojiva.
k) Construya un diagrama circular e interprtelo.
l) Se puede comprobar la Regla Emprica.
Caso XIX.
Los siguientes datos representan el tiempo, en segundos, para pasar de 0 a 60 mi/h para una
muestra de 15 automviles hechos en Alemania y 20 hechos en Japn:
Automviles
Automviles
Alemanes
Japoneses
10.0 10.9 4.8
9.4 9.5
7.1
8.0
6.4
7.9 8.9
8.9 7.7
10.5
6.5
8.5
6.9 7.1
6.7 9.3
5.7
12.5
5.5
6.4 8.7
7.2 9.1
8.3
8.2
5.1
6.0 7.5
8.5 6.8
9.5
9.7
Compare y describa las diferencias en tiempos de aceleracin de automviles alemanes y
japoneses, en trminos de sus estadsticas de tendencia central, estadsticas de dispersin y
los cuartiles.
Caso XX.
5 compras de una materia prima en los ltimos 3 meses:
Costo por
libra
Cantidad
Compra
Dlares
de libras
1
3.00
1,200
2
3.40
500
3
2.80
2,500
4
2.90
1,000
5
3.25
800
Observe que el costo por libra cambi de 3.4 a 2.80 dlares, ya que la cantidad comprada
vari de 500 a 2,500 libras. Suponga que un administrador pidi informacin sobre el costo
promedio por libra de la materia prima.
Caso XXI.
El Colmado Gazcue vende cinco tipos de limpiadores para desages. En la tabla se muestra
cada tipo junto con la utilidad por lata y el nmero de latas vendidas:
Utilidad
Volumen de
Limpiador
por lata ventas en latas
Glunk Out
2.00
3
Bubble Up
Dream Drain
Clear More
Main Drain

3.50
5.00
7.50
6.00

7
15
12
52

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 59
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

60
Determine la utilidad promedio por lata.
Caso XXII.
Los miembros de un Club deben pagar cuotas con base en su peso promedio. De los 60
miembros, 12 pesan 110 libras, 25 pesaron 120 libras, 18 hicieron girar la balanza hasta 150 y
el resto registraron 180 libras. Si los miembros deben pagar US$5 por cada libra que pesan en
promedio, cunto debe desembolsar cada uno?
Nmero de
Libras
Miembros
110
12
120
25
150
18
180
5
Caso XXIII.
Aplicando el Teorema de Chebyshev.
La media de una lnea area es de 78.7 pasajeros por da, con una desviacin estndar de
12.14. Para programar los tiempos de para una nueva ruta que abri, la gerencia desea saber
con qu frecuencia los pasajeros estn dentro de K = dos desviaciones estndar de la media, y
cul es dicho intervalo.
Caso XXIV.
Suponga que las calificaciones del examen de aptitudes de 100 candidatos a las posiciones
vacantes en su organizacin, tuvieron un promedio de 70 y una desviacin estndar de 5.
Cuntos candidatos tuvieron calificaciones entre 60 y 80? cuntos entre 58 y 82?
Caso XXV.
Wageweb lleva a cabo encuesta de salarios y presenta resmenes en su sitio de la red. Con
los datos de salarios, Wageweb inform que los salarios de los gerentes de beneficios variaron
entre 50,935 a 79,577 dlares. Suponga que los datos siguientes son una muestra de los
salarios anuales para 30 gerentes de beneficios (los datos estn en miles de dlares).
57.7
63.0
64.2
63.0
68.7
59.3

64.4
64.7
63.3
66.7
63.8
69.5

62.1
61.2
62.2
60.3
59.2
61.7

69.1
66.8
61.2
74.0
60.3
58.9

71.1
61.8
59.4
62.8
56.6
63.1

17. Haga un Histograma.


18. Cul es el nmero de pasajeros que ocurre con ms frecuencia?
19. Qu tan dispersos estn los datos?
20. Qu representa esta dispersin?
21. Haga un Diagrama Circular e Interprtelo.
22. Determine si est sesgada.
23. Qu cantidad de pasajeros est equidistante de los dos extremos?
24. Es una distribucin normal? Por qu? Diga por lo menos 5 razones.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 60
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

61
25. Represente grficamente si es normal o el sesgo por pedio de un poligono de
frecuencia.
26. Determine el tercer Cuartil.
27. Determine el octavo Decil.
28. Demuestre y diga si se cumple la regla emprica.
29. Utilice el Teorema de Chebyshev para determinar el porcentaje de los gerentes con un
salario anual entre 53,000 y 71,000 dlares.
30. Utilice la regla emprica para determinar el porcentaje de gerentes con un salario anual
entre 50,000 y 71,000 dlares. Compare sus resultados con el punto anterior.
31. Al parecer es razonable suponer que la distribucin de salarios se puede aproximar a
una distribucin de Gauss?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 61
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

62

Introduccin a las Probabilidades (Probability)


Gran parte de la vida del hombre se caracteriza por la incertidumbre. Muchos
fenmenos del mundo parecen estar dominados por el comportamiento aleatorio. Casi todas
las decisiones se toman en un entorno caracterizado por la ausencia de un conocimiento
completo de la situacin. As, una decisin acerca de la cantidad de unidades a fabricar se
basa en las estimaciones del nmero de unidades que se espera vender. Si se conociera este
ltimo con anticipacin, la decisin sera elaborar exactamente esa cantidad, sin que hubiera
ni escasez ni excedentes. Con todo, en las situaciones concretas de la toma de decisiones rara
vez puede recabarse informacin tan precisa.
Estadstica Inferencial:
Implica la utilizacin de una muestra para extraer alguna inferencia o conclusin sobre
la poblacin correspondiente.
- Apoyndose en el clculo de probabilidades y a partir de datos mustrales, efecta
estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de
datos.
La estadstica es inferencial cuando se derivan conclusiones generales para un conjunto
de datos ms amplio a partir de la informacin proporcionada por los datos estudiados.
Experimento.
Experimento es cualquier proceso que permite a los investigadores obtener
observaciones.
Es el proceso que produce un evento o suceso.
Experimento se refiere a un estudio en el que se manipulan intencionalmente una o
ms variables independientes (supuestas causas-antecedentes), para analizar las
consecuencias que la manipulacin tiene sobre una o ms variables dependientes (supuestos
efectos-consecuentes), dentro de una situacin de control para el investigador.
Experimento situacin de control en la cual se manipulan, de manera intencional, una
o ms variables independientes (causas) para analizar las consecuencias de tal manipulacin
sobre una o ms variables dependientes (efectos).
Experimento
Lanza una moneda
Seleccionar una parte para inspeccin
Lanzar un dado
Jugar un partido de pelota

Resultados experimentales
Cara, cruz
Defectuosa, no defectuosa
1, 2, 3, 4, 5, 6
Ganar, perder, empatar

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 62
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

63
Experimento Aleatorio o de azar.
Es un proceso que produce uno de varios resultados posibles.
Decimos que un experimento es aleatorio si se verifican las siguientes condiciones:
a. Se puede repetir indefinidamente, siempre en las mismas condiciones.
b. Antes de realizarlo, no se puede predecir el resultado que se va a obtener.
c. El resultado que se obtenga, pertenece a un conjunto de resultados posibles conocido
previamente. A este conjunto de resultados posibles, lo denominamos como espacio
muestral. Los elementos del espacio muestral se denominan sucesos elementales.
Ensayo: Es cada repeticin de un experimento.
Suceso o Evento.
Es cualquier coleccin de resultados de un experimento.
Es una coleccin de puntos mustrales (resultados experimentales).
El suceso o evento es un subconjunto del Espacio Muestral.
Suceso Simple.
Es un resultado o un suceso que no puede desglosarse.
Espacio muestral.
El conjunto de todos los posibles resultados para un experimento.
Probabilidad.
Los conceptos de probabilidad pueden resultar de suma utilidad cuando nos hallamos
frente a la incertidumbre que caracteriza a la mayor parte de los ambientes en que se adoptan
decisiones.
Es una medida numrica de la posibilidad de que ocurrir un evento.
Es la posibilidad numrica de que ocurra un evento, medida entre 0 y 1.
Es la frecuencia relativa con la que puede esperarse que ocurra ese evento.
Las probabilidades de los diferentes resultados posibles de un ensayo deben sumar
uno.
Las probabilidades son siempre mayores que o iguales a cero (es decir, las
probabilidades nunca son negativas) y son menores que o iguales a uno. Cuanto ms
pequea sea la probabilidad, tanto menos posibilidad tendr el evento.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 63
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

64
Suceso seguro o evento cierto.
Es aquel que siempre se verifica despus de un experimento aleatorio.
Entre mayor sea la probabilidad de que ocurra un evento, su probabilidad asignada
estar ms prxima a 1.
La probabilidad de certeza es 1.
Suceso imposible o evento imposible.
Es aquel que nunca se verifica como resultado del experimento aleatorio. La nica
posibilidad es que el suceso imposible sea el conjunto vaci.
La probabilidad de una imposibilidad es 0.
Formas de Enfocar la Probabilidad.
1. Probabilidad de Laplace o Clsica (a priori)
2. Probabilidad Frecuencial o Frec. Relativa (a posteriori)
3. Probabilidad Subjetiva
4. Probabilidad Axiomtica
1. Probabilidad de Laplace o Clsica (a priori=antes del hecho).
Segn la Regla del marques Laplace (1789-1827) en su obra "Theorie analytique des
probabilites" de 1812:
Si un experimento cualquiera puede dar lugar a un nmero finito de resultados
posibles, y no existe ninguna razn que de privilegio a unos resultados en contra de otros tiene una estructura de un juego de azar - entonces la probabilidad de un evento aleatoria A
es el cociente entre el nmero de formas o casos en las que puede ocurrir un evento
(favorables), y el nmero de todos los posibles resultados del experimento.
P(A) = Numero de formas en las que puede ocurrir un evento
Nmero total de posibles resultados
Ejemplos:
La probabilidad de obtener una cara en un solo lanzamiento de una moneda.
La probabilidad de sacar un numero x al lanzar un dado.
La probabilidad de sacar una carta de una baraja de 52 cartas.
2. Probabilidad Frecuencial o Frec. Relativa (a posteriori).
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 64
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

65
Esta fue establecida por autores como el ingls Ronald A. Fisher (1890-1962) y el
austriaco Richard von Mises (1883-1953)
Utiliza datos que se han observado empricamente, registra la frecuencia con que ha
ocurrido algn evento en el pasado y estima la probabilidad de que el evento ocurra
nuevamente con base en estos datos histricos. Esta se determina mediante:
P(E) = Nmero de veces que ha ocurrido el evento en el pasado
Nmero total de observaciones
3. Probabilidad Subjetiva.
Cuando se estudian fenmenos aleatorios en los que no hay posibilidad de repeticin o
experimentacin, la probabilidad subjetiva es la cuantificacin (basada en supuesto) que una
persona (o grupo) hace de un evento, utilizando la informacin que posee.
Esta conceptualizacin de la probabilidad es muy aplicada en la empresa, en la
estadstica bayesiana, la teora de la decisin y la teora de juegos. Ha sido tratada por
autores como Keynes (1921), Ramsey (1926), de Finetti (1937), Koopman (1940) y Savage
(1954).
El modelo subjetivo requiere establecer la probabilidad de algn evento con base en la
mejor evidencia disponible. En muchos casos esto puede ser apenas una conjetura hecha
sobre cierta base. Esta se utiliza cuando se desea asignar probabilidad a un evento que nunca
ha ocurrido.
4. Probabilidad Axiomtica.
El concepto axiomtico de probabilidad fue formulado por Kolmogorov 1933. Para
ello preciso ciertas leyes o axiomas que debe cumplir una funcin de probabilidades. Los
axiomas deberan implicar, entre otras, las siguientes cuestiones:
a. La probabilidad solo puede tomar valores comprendidos entre 0 y 1.
0 <= P(A) <= 1
b. La probabilidad del suceso seguro es 1.
c. La probabilidad de dos sucesos incompatibles (de interseccin vaca) debe ser la
suma de sus posibilidades respectivas.
d. La probabilidad de la interseccin de dos sucesos es menor o igual que la
probabilidad de cada uno de los sucesos por separado, es decir,
P(AB) <= P(A) ; P(AB) <= P(B)
e. La probabilidad de la unin de sucesos es mayor que la de cada uno de los sucesos
separados.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 65
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

66
P(AB) >= P(A) ; P(AB) >= P(A)
Ms an, si los sucesos son disjuntos (incompatibles) ocurre que:
AB = P(AB) = P(A) + P(B)
f. La probabilidad del suceso contrario a A, es
P(A') = 1 - P(A)
Operaciones bsicas con sucesos aleatorios.
Que es un conjunto?
Que es AB?
Que es AB?
Que es A-B o A\B?
Que es AB o A\B B\A?
Que es A'?
Que es un diagrama de Venn?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 66
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

67
Caso I.
(Probabilidad Clsica, Frecuencial, Subjetiva o Axiomtica)
La Nike Corporation quiere probar un nuevo material que se usar para hacer zapatos
deportivos. Un grupo de prueba consistente en 20 hombre y 30 mujeres. Si se escoge
aleatoriamente a una persona de este grupo de prueba, calcule la probabilidad o posibilidad
de no escoger a un hombre.
Caso II.
(Probabilidad Clsica, Frecuencial, Subjetiva o Axiomtica)
La Compaa de Seguros (PROSEGUROS) estudia causas de muertes accidentales en el hogar
y compilo un archivo que incluye 160 muertes por cadas, 120 muertes causadas por veneno y
70 muertes causadas por incendios y quemadas. Si se escoge aleatoriamente una de estas
muertes, calcule la probabilidad de que se haya debido a veneno.
Caso III.
(Probabilidad Clsica, Frecuencial, Subjetiva o Axiomtica)
Un estudio de 500 vuelos de American Airlines escogidos aleatoriamente mostr que 430
llegaron a tiempo (Basados en datos del Departamento de Transporte de los Estados Unidos).
Estime la probabilidad de que un vuelo de American Airlines llegue a tiempo. Describira
usted ese resultado como muy bueno?
Caso IV.
(Probabilidad Clsica, Frecuencial, Subjetiva o Axiomtica)
En un estudio de reconocimiento de marcas, 831 consumidores saban de las sopas Campbell,
18 no haban odo de ellas (Basados en datos de Total Research Corporation). Utilice estos
resultados para estimar la probabilidad de que un consumidor seleccionado aleatoriamente
reconozca las sopas Campbell. Cmo cree usted que sea este valor en comparacin con los
valores tpicos de otras marcas comerciales?
Caso V.
(Probabilidad Clsica, Frecuencial, Subjetiva o Axiomtica)
MasterCard Internacional realiz un estudio de fraudes con tarjeta de crdito. Si se escoge al
azar un caso de fraude en la tabla siguiente, calcule la probabilidad de que el fraude se haya
basado en el uso de una tarjeta falsa.
Tarjeta Robada
243
Tarjeta Falsa
85
Pedido por Correo
52
Otro
46
TARJETA ROBADA
243
TARJETA ROBADA
243
Caso VI.
(Probabilidad Clsica, Frecuencial, Subjetiva o Axiomtica)
Una encuesta Gallup produjo los datos de muestra de la tabla que aparece a continuacin. Si
se escoge aleatoriamente a uno de los encuestados, calcule la probabilidad de que sea una
persona que se cepilla los dientes tres veces al da, tal y como recomiendan los dentistas.
Cepilladas de Dientes
Al Da
Nmero
1
228
2
672
3
240
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 67
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

68
Caso VII.
(Probabilidad Clsica, Frecuencial, Subjetiva o Axiomtica)
Si asumimos que los 35 puntos evaluados hasta el momento representan el 100% de la
evaluacin. En base a su calificacin obtenida hasta el momento. Cul es la probabilidad de
que apruebe la asignatura?
Caso VIII.
(Probabilidad Clsica, Frecuencial, Subjetiva o Axiomtica)
En base a su experiencia como estudiante que ha cursado diferentes asignaturas y al ritmo de
estudio que dedica a esta materia en particular. Cul es la probabilidad de que no apruebe
Mtodos Cuantitativos?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 68
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

69
Eventos mutuamente excluyentes.
Los sucesos A y B son mutuamente exclusivos si no pueden ocurrir simultneamente.
Si la ocurrencia de un evento prohbe la ocurrencia del otro.
P(AUB) = P(A) + P(B)
En el lanzamiento de una moneda, dos resultados simples posibles son cara y cruz.
Puesto que la ocurrencia de una cara excluye la posibilidad de cruz y a la inversa, los eventos
cara y cruz son mutuamente excluyentes.
Eventos colectivamente exhaustivos.
Se dice que un conjunto de eventos es colectivamente exhaustivo, si su unin explica
todos los resultados posibles de un experimento.
Consta de todos los posibles resultados de un experimento y constituye su espacio
muestral.
P(X) = 1
Eventos independientes.
Dos eventos son independientes si la ocurrencia o no ocurrencia de un evento de
ninguna manera afecta a la posibilidad o probabilidad de ocurrencia del otro evento.
Dos sucesos A y B son independientes si la ocurrencia de uno no afecta la probabilidad
de ocurrencia del otro.
La ocurrencia de uno no tiene que ver nada con la del otro.
P(AB) = P(A) * P(B)
Eventos dependientes.
Dos eventos son dependientes si la probabilidad de ocurrencia de uno es afectada por
la ocurrencia o no ocurrencia del otro.
Si A y B no son independientes, se dice que son dependientes.
P(AB) = P(A) * P(B\A)
Eventos complementarios (Complemento de un evento).
Para un evento A, el complemento del evento A es el evento consistente en todos los
puntos muestrales que no estn en A.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 69
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

70
El complemento del suceso A, denotado por A', consiste en todos los resultados en los
que el suceso A no ocurre.
Si un evento no ocurre, el otro debe ocurrir.
P(A) + P(A') = 1
P(A) = 1 - P(A')
P(A') = 1 - P(A)
P(AUA') = P(A) + P(A')
Ejercicios 1-6 Pgs. 79-80 y Ejercicios 7-12 Pgs. 81-82
Tabla de Contingencia (Contingency Table).
Las tablas contingencias son aquellas que sirven para comparar dos variables.
TABLA DE CONTIGENCIA
CLASIFICACION DE LOS EMPLEADOS
GENERO
ADMINISTR.(A) LINEA (L) AUXILIAR (O) TOTAL
HOMBRE (H)
120
150
30
300
MUJER (M)
50
140
10
200
TOTAL

170

290

40

500

Tabla de Probabilidad (Probability Table).


Esta se obtiene dividiendo cada una de las entradas entre el total de las observaciones
(que se encuentra en el extremo inferior de la diagonal).
TABLA DE PROBABILIDAD
CLASIFICACION DE LOS EMPLEADOS
GENERO
ADMINISTR.(A) LINEA (L) AUXILIAR (O) TOTAL
HOMBRE (H)
MUJER (M)
TOTAL
Las probabilidades marginales son los valores que se encuentran en las mrgenes de la
tabla. Se obtiene de la suma de las probabilidades conjuntas correspondientes.
Las probabilidades conjuntas son las celdas de la estructura principal de la tabla.
Estas muestran la probabilidad de la interseccin de dos eventos.
Ejercicios 13 al 15 - Pgs. 83-84

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 70
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

71
Caso II.
El Presidente Dr. Leonel Fernndez Reina se bas en la opinin de 500 expertos en el rea
econmica de diferentes Universidades, Empresas Privadas y Miembros del Gabinete de su
Gobierno, para someter al Congreso un aumento al ITBIS de un 16%, con la finalidad de
aumentar las recaudaciones y poder hacer frente al dficit fiscal que posee el Gobierno. Sin
embargo, el Presidente tiene duda de que la medida impositiva afecte significativamente a la
economa nacional.
Los asesores econmicos del Gobierno trataron de construir una tabla para organizar estas
opiniones... Pero no pudieron... Trata de completarla...
CONTRACCION
ECONOMISTAS
ESTABLE (E) EXPANSION(X)
TOTAL
ACADEMICOS (A)
125
100
EMPRESAS PRIVADAS (P)
35
110
GOBIERNO (G)
25
40
65
200
TOTAL
1. Construya una tabla de probabilidades.
2. Determine:
a. P(A)
b. P(P)
c. P(G)
d. P(E)
e. P(X)
f. P
g. P(AC)
h. P(GX)
i. P(X|A)

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 71
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

72
Probabilidad Condicional.
La probabilidad condicional de B dado A es la probabilidad de que el suceso B ocurra,
dado que el suceso A ya ocurri, y se puede calcular dividiendo la probabilidad de que
ocurran ambos sucesos, A y B, entre la probabilidad del suceso A:
P(B\A) = P(AB)
P(A)
P(AB) = P(A) * P(B\A)
Es la probabilidad de que el evento B ocurra, dado que o a condicin de que el evento
A ya haya ocurrido.
Ejemplo: La probabilidad de que un trabajador tomado aleatoriamente sea hombre es
P(H)=0.60. Sin embargo, si se desea calcular la probabilidad de que el trabajador sea hombre
dado que es un miembro del personal administrativo P(H\A).
P(H\A) = P(HA)/P(A) = 0.24/0.34 = 0.71
Otra opcin:
P(H\A) =[P(H)*P(A\H)]/P(A)=(0.60 * 0.40)/0.34=0.71
0.60 --> 1
0.24 --> X
Ejercicios 16 y 17 Pg. 85
Reglas de la probabilidad.
A. Regla de la Multiplicacin.
Consiste en determinar la probabilidad del evento conjunto P(AB), es decir de la
probabilidad de "A y B".
Esta se obtiene simplemente multiplicando sus respectivas probabilidades.
El procedimiento depende de s A y B son dependientes o independientes.
Probabilidades de eventos independientes.
P(AB) = P(A) * P(B)
Eventos independientes. Dos sucesos A y B son independientes si la ocurrencia de uno no
afecta la probabilidad de ocurrencia del otro.
La ocurrencia de uno no tiene que ver nada con la del otro.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 72
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

73
El 20% de los carros que pasan por el Km. 12 de la Carretera Snchez, se detienen en
un Motel, para alquilar una cabaa.
Cul es la probabilidad de que los prximos dos carros se detengan? Asumiendo que
estos son eventos independientes.
P(C1C2) = 0.20 * 0.20 = 0.04
Cul es la probabilidad de que el primer carro se pare y que el segundo siga?
P(C1C2) = 0.20 * 0.80 = 0.16
Probabilidad de Eventos dependientes.
P(AB) = P(A) * P(B\A)
Eventos dependientes. Dos sucesos A y B son dependientes si la ocurrencia de uno afecta la
probabilidad de ocurrencia del otro.
La ocurrencia de uno tiene que ver con la del otro.
Ejemplo:
La probabilidad conjunta de que sea hombre y miembro administrativo.
P(HA) = 0.24
P(HA) = P(H) * P(A\H) = 0.60 * 0.40 = 0.24
P(A\H) = P(AH)/P(H) = 0.24/0.60 = 0.40
Regla de la Adicin.
Se utiliza para determinar la probabilidad de A o B, P(AB).
La probabilidad del evento A o B (cuando los eventos no son mutuamente excluyentes).
P(AB)= P(A) + P(B) - P(AB)
La razn por la cual se debe restar la probabilidad conjunta es para evitar el doble
conteo.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 73
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

74
Eventos no mutuamente excluyentes.
Los sucesos A y B son no mutuamente exclusivos si pueden ocurrir simultneamente.
Si la ocurrencia de un evento no prohbe la ocurrencia del otro.
Ejemplo:
La probabilidad de sacar un as o una de las tres cartas de corazones de una
baraja.
P(AC)=P(A)+P(C)- P(AC)
P(AC)=(4/52) + (13/52) - (1/52) = 16/52
En un curso de Mtodos Cuantitativos para la toma de decisiones. De 200 estudiantes
inscritos en el curso, 160 aprobaron el examen parcial, 140 aprobaron el examen final y 124
aprobaron ambos.
A = evento de aprobar el examen parcial
B = evento de aprobar el examen final
P(A) = 160/200 = 0.80
P(B) = 140/200 = 0.70
P(AB) = 124/200 = 0.62
P(AB)= P(A) + P(B) - P(AB) = 0.80 + 0.70 0.62 = 0.88
La probabilidad de que un hombre sea un trabajador hombre o un trabajador
administrativo.
P(HA)=P(H)+P(A)- P(HA) = 0.60+0.34-0.24 = 0.70
Probabilidad del evento A o del evento B (cuando los eventos son mutuamente
excluyentes).
P(AUB) = P(A) + P(B)
Eventos mutuamente excluyentes. Los sucesos A y B son mutuamente exclusivos si no
pueden ocurrir simultneamente.
Si la ocurrencia de un evento prohbe la ocurrencia del otro.
Si A y B son mutuamente excluyente P(AB)= 0
Ejercicios 18 al 22 - Pg. 90
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 74
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

75

Teorema de Bayes.
Este fue desarrollado por el reverendo Thomas Bayes (1702-1761).
Asumimos:
Una industria X utiliza dos mquinas para producir su producto.
La mquina A produce el 60% de la produccin total.
La mquina B produce el 40% restante.
El 2% de las unidades producidas por A son defectuosas.
Las unidades de B tienen un 4% de defectos.
Podramos decir:
P(A) = 0.60
P(D\A) = 0.02
P(D'\A) = 0.98

P(B) = 0.40
P(D\B) = 0.04
P(D'\B) = 0.96

P(AD') = P(A) * (D'\A) = 0.60 * 0.98 = 0.588


P(AD) = P(A) * (D\A) = 0.60 * 0.02 = 0.012
P(BD') = P(B) * (D'\B) = 0.40 * 0.96 = 0.384
P(BD) = P(B) * (D\B) = 0.40 * 0.04 = 0.016
segn la probabilidad condicional.
P(A\D) = P(AD)/P(D) = [P(A) * P(D\A)]/P(D)
Sin embargo, para la P(D) existen dos formas en las cuales la unidad puede ser defectuosa.
Utilizando la regla de la adicin.
P(D) = P(AD) + P(BD)
P(D) = P(A) * P(D\A) + P(B) * P(D\B)
Teorema de Bayes.
P(A\D) = P(AD)/P(D)
P(A\D) = P(AD)/[P(AD) + P(BD)]
P(A\D)=P(A)*P(D\A)]/[P(A)*P(D\A) + P(B)* P(D\B)]
P(A\D)=0.012/(0.012+0.016)=0.429
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 75
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

76

Tcnicas de conteo basadas en el Anlisis Combinatorio.


Permutaciones.
Son las diferentes agrupaciones que pueden formarse con n elementos, entrando todos
en cada agrupacin y diferencindose una de otra slo en el orden de colocacin de los
elementos.
Las permutaciones pueden ser sin repeticin si los n elementos dados son diferentes, y
con repeticin si entre los n elementos dados hay algunos o algunos que aparecen repetidos.
La permutacin es un arreglo ordenado de un conjunto de elementos.
El nmero de permutaciones de n elementos tomados r a la vez es:
nPr = n!/(n-r)!
Nota: La permutacin considera el orden de los elementos de los subconjuntos.
Combinaciones.
Son las diferentes formaciones que podemos hacer con n elementos diferentes
entrando de n en r; pudiendo ser r <= n, de modo tal que dos formaciones solo se diferencian
en la naturaleza de uno de sus elementos por lo menos.
El nmero de combinaciones de n elementos tomados r a la vez es:
nCr = n!/r!(n-r)!
Nota: La combinacin no considera el orden de los elementos de los subconjuntos.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 76
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

77
Caso I.
Suponga que el 60% de los chips de computadora de una compaa se producen en una de
sus fbricas (denotada por A) y 40% se producen en su otra fbrica (denotada A'). Para un
chip seleccionado al azar, la probabilidad de que haya provenido de la fbrica A es de 0.60.
Suponga que se entera de que el chip esta defectuoso y que las tasas de defectos para las dos
fbricas son del 35% (para A) y del 25% (para A'). Podemos usar la frmula del Teorema de
Bayes para determinar que hay una probabilidad del 0.677 de que el chip defectuoso haya
provenido de la fbrica A.
Construya el diagrama de rbol.
P(A|D)=[P(A)*P(D|A)]/[P(A)*P(D|A)+P(A')* P(D|A')]
Caso II.
Una empresa manufactura recibe embarque de partes de dos proveedores distintos.
Actualmente el 65% de las partes que compra proviene del proveedor 1 y el 35% restante del
proveedor 2. Los datos histricos sugieren que la calidad de las partes vara segn su origen.
El desempeo en trmino de calidad de los dos proveedores es el siguiente:
Porcentaje de piezas buenas del proveedor 1 es de 98%
Porcentaje de piezas buenas del proveedor 2 es de 95%
A) Determine las probabilidades conjuntas de eventos dependientes de piezas buenas y
malas segn su origen.
B) Construya el diagrama de rbol con las dos etapas antes mencionadas.
C) Demuestre el Teorema de Bayes P(Proveedor 1 | Piezas Malas)
Caso III.
La Autoridad Metropolitana de Transporte AMET est formada por 1200 oficiales, 960
hombres y 240 mujeres. El pasado 27 de febrero fueron ascendidos 324 oficiales, 288 hombres
y 36 mujeres.
A) Construya una tabla de contingencia tomando en consideracin el gnero y oficiales
ascendidos y no ascendidos.
B) Construya la tabla de probabilidades.
C) Probabilidad de que un oficial seleccionado al azar sea hombre y tambin que sea
ascendido.
D) Probabilidad de que un oficial seleccionado al azar sea mujer y tambin que sea
ascendido.
E) Probabilidad de que un oficial seleccionado al azar sea hombre y tambin que no sea
ascendido.
F) Probabilidad de que sea ascendido dado que sea una mujer.
G) Probabilidad de que no sea ascendido dado que sea una mujer.
H) Probabilidad de que dos oficiales seleccionados al azar sean ascendidos.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 77
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

78
Caso IV.
Una fbrica utiliza tres mquinas X, Y, Z para producir ciertos artculos. Supongamos que:
1. La mquina X produce el 50% de todos los artculos, de los cuales el 3% son
defectuosos.
2. La mquina Y produce el 30% de todos los artculos, de los cuales el 4% son
defectuosos.
3. La mquina Z produce el 20% de todos los artculos, de los cuales el 5% son
defectuosos.
a. Encuentre la probabilidad de que el artculo seleccionado aleatoriamente sea
defectuoso.
b. Suponga que se ha encontrado un artculo defectuoso, entre la produccin.
Encuentre la probabilidad de que este provenga de cada una de las mquinas,
es decir, de X, Y, y Z.
c. Construya el diagrama de rbol.
Caso V.
Un fabricante de videorreproductoras de casete (VCR) compra un microchip en particular,
llamado LS-24, a tres proveedores: Hall Electronics, Schuller Sales y Crawford Components.
30% de los chips LS-24 se compran a Hall Electonics, 20% a Schuller Sales y el 50% restante a
Crawford Components. El fabricante tiene registro de los tres fabricantes y sabe que el 3% de
los chips de Hall Electronics estn defectuosos, el 5% de los chips de Schuller Sales tienen
defectos y el 4% de los chips comprados a Crawford Components estn defectuosos.
Identifique los chips:
A1 = El LS-24 de Hall Electronics
A2 = El LS-24 de Schuller Sales
A3 = El LS-24 de Crawford Components.
B1 = El LS-24 est defectuoso
B2 = El LS-24 no est defectuoso.
1. Construya un diagrama de rbol que incluya las probabilidades conjuntas.
2. Calcule la probabilidad de que la parte seleccionada provenga de de Crawford
Components, debido a que era un chip aceptable.
3. Calcule la probabilidad de que el chip LS-24 provenga de Schuller Sales, dado el hecho
de que el chip seleccionado estaba defectuoso.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 78
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

79
Caso VI.
Relacin entre delincuente y victima
Homicidios (H) Robo (R) Agresin (A)
Extrao (E)
12
379
727
Conocido o Pariente (C)
39
106
642
No se sabe (N)
18
20
57

Totales
1118
787
95

69

2000

505

1426

DETERMINE:

a)
b)
c)
d)
e)
f)

g)

h)

i)

P(E)
P(E|H)
P(C)
P(C|A)
P(N)
P(N|R)
P(H)
P(EH)
P(CR)
P(R)
P(A)
P(NA)
Construya la tabla de probabilidades.
Si se escoge aleatoriamente a una persona, qu probabilidad hay que haya sido
vctima de un extrao, dado que se escogi a una vctima de robo?
Dado que se seleccion a una vctima de agresin, qu probabilidad hay de que el
delincuente sea un extrao?
Calcule la probabilidad de que cuando se selecciona aleatoriamente a uno de los 2000
sujetos, la persona escogida haya sido robada por un conocido o un pariente.
Si se escogen al azar dos sujetos distintos, calcule la probabilidad de que ambos hayan
sido robados.
Si se selecciona al azar a una de las vctimas de crmenes representadas en la tabla,
calcule la probabilidad de obtener a una persona que fue vctima de alguien a quien no
conoce o que haya sido asesinada.
Si se selecciona al azar a una de las vctimas de crmenes representadas en la tabla,
calcule la probabilidad de obtener a una persona que fue vctima de un homicidio,
dado que el criminal fue un extrao.
Si se selecciona al azar a una de las vctimas de crmenes representadas en la tabla,
calcule la probabilidad de obtener a una persona que fue vctima de un extrao, dado
que fue asesinada.
Si se escoge al azar dos sujetos distintos, calcule la probabilidad de que ambos hayan
sido vctimas de criminales desconocidos.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 79
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

80

Distribucin de Probabilidades (Probability distribution)


La Distribucin Binomial (Binomial Distribution) - Una Distribucin Discreta de
Probabilidad.
Desarrollada por Jacob Bernoulli (1654-1705). Esta se caracteriza por las siguientes
propiedades:
- Slo debe haber dos posibles resultados.
- La probabilidad de un xito , sigue siendo constante de un ensayo al siguiente, al
igual que lo hace la probabilidad de fracaso, 1 - .
- La probabilidad de un xito en un ensayo es totalmente independiente de cualquier
otro ensayo.
- El experimento puede repetirse muchas veces.
Una distribucin binomial. Cada ensayo en una distribucin binomial termina en
solo uno de dos resultados mutuamente excluyentes, uno de los cuales se identifica como un
xito y el otro como un fracaso. La probabilidad de cada resultado permanece constante de
un ensayo al siguiente.
Eventos mutuamente excluyentes.
Los sucesos A y B son mutuamente exclusivos si no pueden ocurrir simultneamente. Si la
ocurrencia de un evento prohbe la ocurrencia del otro.
Probabilidad de una
x
n-x
Distribucin Binomial P(x)=nCx()(1-)
n = nmero de ensayos.
= probabilidad de un xito.
x = nmero de xitos.
Combinaciones.
Son las diferentes formaciones que podemos hacer con n elementos diferentes
entrando de n en r; pudiendo ser r <= n, de modo tal que dos formaciones solo se diferencian
en la naturaleza de uno de sus elementos por lo menos.
El nmero de combinaciones de n elementos tomados r a la vez es:
nCr = n!/r!(n-r)!
Nota: La combinacin no considera el orden de los elementos de los subconjuntos.
Caso I.
Solo 20% de los empleados de la poblacin civil que est en una base militar
restringida, porta su identificacin personal. Si llegan 10 empleados, cual es la probabilidad
de que el guardia de seguridad encuentre:
a. Ocho empleados con identificacin?
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 80
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

81
Probabilidad de una
x n-x
Distribucin Binomial P(x)=nCx()(1-)
n = 10 empleados
= 0.20
x=8
8
10-8
P(x=8|n=10,=0.20)=10C8(0.20) (1-0.20) =
Use la Calculadora o la Tabla de Distribucin Binomial - Pgs. 584-588
b. Cuatro empleados con identificacin?
4
10-4
P(x=4|n=10,=0.20)=10C4(0.20) (1-0.20) =
c. A lo sumo 5 empleados con identificacin?
P(x<=5|n=10,=0.20)= P(X=0)+P(X=1)+P(X=2)+
P(X=3)+P(X=4)+P(X=5)=0.9986
012345 678910
Evento A
Distribucin Binomial Acumulada esta comprende un rango de valores.
Use la Calculadora o la Tabla de Distribucin Binomial Acumulada - Pgs. 589-598
d. Por lo menos 4 empleados con identificacin?
P(x>=4|n=10,=0.20)=1-P(x<=3|n=10,=0.20)
0123
45678910
Evento A' Evento A
Use la Calculadora o la Tabla de Distribucin Binomial Acumulada - Pgs. 589-598
Distribucin Binomial Acumulada no da directamente la probabilidad de que un nmero de
xito sea igual o mayor que alguna cantidad.
e. Entre 4 y 7 empleados inclusive con identificacin?
P(4<=x<=7|n=10,=0.20)=P(x<=7|n=10,=0.20)P(x<=3|n=10,=0.20)
Evento A
0123
4567
8910
P(X<=3) P(X<=7)
Use la Calculadora o la Tabla de Distribucin Binomial Acumulada - Pgs. 589-598
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 81
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

82
Caso II.
El 80% de los estudiantes de Mtodos Cuantitativos I del maestro Rubn Estrella
pueden conectarse a INTERNET. Cul es la probabilidad de que en el prximo fin de semana
de 10 estudiantes seleccionados aleatoriamente, 6 estn conectados para verificar si le llego
el archivo de "distribucin de probabilidades"?
Probabilidad de una
x n-x
Distribucin Binomial P(x)=nCx()(1-)
n = 10 estudiantes
= 0.80
==> 0.80 > 0.50
x=6
Cul es la probabilidad de que no estn conectados (de no xito)?
'=1-
0 1 2 3 4 5 6 7 8 9 10 ( = 0.80)
10 9 8 7 6 5 4 3 2 1 0 ( = 0.20)
en lugar de hallar x xitos en , se halla:
n-x fracasos a 1 -
6 xitos a = 0.80 = 4 fracasos a = 0.20
P(x=6|n=10,=0.80)=P(x=4|n=10,=0.20)
Use la Calculadora o la Tabla de Distribucin Binomial - Pgs. 584-588
Media de una Distribucin Binomial.
E(X)==n
Varianza de una Distribucin Binomial.
=n(1-)
Caso III.
Una universidad se enter de que el 20% de sus alumnos se dan de baja del curso de Mtodos
Cuantitativos para Negocios. Suponga que en este cuatrimestre se inscribieron 32 alumnos.
a. Cul es la probabilidad de que dos o menos se den de baja?
b. Cul es la probabilidad de que se den de baja exactamente cuatro?
c. Cul es la cantidad esperada o media de deserciones?
d. Cul es la probabilidad de que por lo menos 3 se den de baja?
e. Cul es la probabilidad de que se den de baja entre 5 y siete inclusive?
f. Cul es la probabilidad de que a lo sumo 6 se den de baja?
g. Qu tan dispersos estn los datos?
Ejercicios 6 al 12 Pg. 113

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 82
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

83
La Distribucin hipergeometrica (Hypergeometric Distribution)
Si se selecciona una muestra sin reemplazo de una poblacin finita conocida y contiene
una proporcin relativamente grande de la poblacin, de manera que la probabilidad de xito
sea perceptiblemente alterada de una seleccin a la siguiente, debe utilizarse la distribucin
hipergeomtrica.
La distribucin hipergeomtrica de probabilidad se relaciona estrechamente con la
distribucin binomial. La diferencia principal entre las dos estriba en que, con la distribucin
hipergeomtrica, los intentos no son independientes, y en que la probabilidad de xito cambia
de un intento a otro.
P(x)=[(rCx)*(N-rCn-x)]/(NCn)
N
r
n
x

es el tamao de la poblacin.
es el nmero de xitos en la poblacin.
es el tamao de la muestra.
es el nmero de xitos en la muestra.

(rCx) representa la cantidad de manera en las que se puede seleccionar x xitos de un total
de r xitos de la poblacin.
(N-rCn-x)
representa la cantidad de maneras en que se pueden seleccionar n-x fracasos de
un total de N-r fracaso en la poblacin.
(NCn) representa la cantidad de formas en las que se puede seleccionar una muestra de
tamao n de un poblacin de tamao N.
Caso I.
Jovanna Melndez como gerente de Recursos Humanos debe contratar a 10 personas
entre 30 candidatos, 22 de los cuales tienen ttulos universitarios. Cul es la probabilidad de
que 5 de los que contrate tengan un ttulo?
N=30 candidatos
r=22 candidatos con ttulos
n=10 candidatos a contratar
x=5 candidatos con ttulos
P(x)=[(rCx)*(N-rCn-x)]/(NCn)
P(x=5)=[(22C5)*(30-22C110-5)]/(30C10)
nCr = n!/r!(n-r)!

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 83
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

84
B) Cul es la probabilidad de que a lo sumo 4 de los que contrate tengan un ttulo?
P(x<=4)=P(x=1)+P(x=2)+P(x=3)+P(x=4)
Ejercicios del 13 al 17 - Pg. 115.
La Distribucin de Poisson (Poisson Distribution). Es una distribucin de probabilidad
discreta que aplica a ocurrencias de algn suceso dentro de un intervalo especificado. La
variable aleatoria x es el nmero de ocurrencias del suceso en el intervalo. El intervalo
puede ser tiempo, distancia, rea, volumen o alguna unidad similar.
La distribucin de Poisson se utiliza frecuentemente para el modelado de tasas de
llegadas en situaciones de espera en fila.
Fue ideada por el matemtico francs Simen Poisson (1781-1840). Esta mide la
probabilidad de un evento aleatorio sobre algn intervalo de tiempo o espacio.
Se basa en dos supuestos:
1.- La probabilidad de ocurrencia del evento es constante para dos intervalos
cualesquiera de tiempo o espacio de igual longitud.
2.- La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro
intervalo cualquiera.
Funcin de probabilidad
x -
de Poisson
P(x)=( * e)/x!
x
es el nmero de veces que ocurre el evento.

es el nmero promedio de ocurrencias por unidad de tiempo o de espacio.


e
= 2.71828, la base del logaritmo natural.
La Media es
La desviacin estndar es =
Caso I.
Carmn Guzmn, gerente de trafico de telecomunicaciones del Banco Popular, est
evaluando el flujo de las llamadas telefnicas recibidas. Para tal fin selecciona la central
telefnica del Banco Popular de Plaza Central, a la cual llegan 2 llamadas por minuto
promedio y se sabe que tiene distribucin de Poisson. Si el operador se distrae por un
minuto, cual es la probabilidad de que el nmero de llamadas no respondidas sea:
a) cero?
b) Por lo menos 1?
c) Entre 3 y 5, inclusive?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 84
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

85
Funcin de probabilidad
de Poisson

x -
P(x)=( * e)/x!

a) cero?
=2 llamadas / minuto
x=0 llamada no respondida
e=2.71828
Funcin de probabilidad
de Poisson

0
-2
P(x=0|=2)=(2 * 2.71828)/0!

Use la Calculadora o la Tabla de Distribucin de Poisson - Pgs. 599-604.


b) Por lo menos 1?
=2 llamadas / minuto
x>=1 llamadas no respondidas
e=2.71828
Funcin de probabilidad
de Poisson
P(x>=1|=2)=1-P(x=0)
c) Entre 3 y 5, inclusive?
=2 llamadas / minuto
3<=x<=5 llamadas no respondidas
e=2.71828
Funcin de probabilidad
de Poisson
P(3<=x<=5|=2)=P(<=5)-P(x<=2)
=P(x=0)+P(x=1)+P(x=2)+P(x=3)+P(x=4)+P(x=5)P(x=0)+P(x=1)+P(x=2)
Evento A
012
345
678
P(X<=2) P(X<=5)
Use la Calculadora o la Tabla de Distribucin de Poisson - Pgs. 599-604.
Caso II.
El cable utilizado para asegurar las estructuras de los puentes tiene un promedio de 3
defectos por cada 100 yardas. Si usted necesita 50 yardas,
a. cul es la probabilidad de que haya una defectuosa?
b. cul es la probabilidad de que haya dos o ms defectuosas?
Ejercicios del 18 al 21 - Pg. 118.
Para entregar: Investigar la diferencia entre la distribucin de Poisson y la distribucin
binomial.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 85
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

86
Caso I.
El gerente de Anthony, basado en su experiencia, estima que la probabilidad de que cualquier
cliente compre es de 0.30. Cul es la probabilidad de que 4 de los de los siguientes 10 clientes
que entren hagan una compra?
Caso II.
En una encuesta que se realiz se habl con cientos de estudiantes de edades de 18 a 28 aos
de finanzas personales. En la encuesta se encontr que 33% de los estudiantes tienen tarjeta
de crdito.
a. En una muestra de seis estudiantes, Cul es la probabilidad de que dos tengan tarjeta
de crdito?
b. En una muestra de seis estudiantes, Cul es la probabilidad de que por lo menos dos
tengan tarjeta de crdito?
c. En una muestra de diez estudiantes, Cul es la probabilidad de que ninguno tenga
tarjeta de crdito?
Caso III.
El 50% de las industrias manufactureras de tamao mediano planearon visitas de
representantes de su administracin a Canad y Mxico, para aprovechar las oportunidades
que abri el Tratado de Libre Comercio en Norteamrica. Un grupo exportador e importador
de Toronto, Canad, invit a 20 manufactureras estadounidenses medianas a participar en
una conferencia con el fin de investigar las oportunidades de negocios.
a. Cul es la probabilidad de que 12 o ms de estas empresas manden representantes?
b. Cul es la probabilidad de que 5 de estas empresas, como mximo, manden
representantes?
Caso IV.
El 40% de las personas que viajan por negocios llevan un telfono celular o una computadora
porttil (USA Today, 12 septiembre del 2000). En una encuesta de 15 personas,
a. Cul es la probabilidad de que tres tengan un telfono celular o una computadora
porttil?
b. Cul es la probabilidad de que doce no tengan ni telfono celular ni una computadora
porttil?
c. Cul es la probabilidad de que por lo menos tres tengan un telfono celular o una
computadora porttil?
Caso V.
Al departamento de reservaciones de American Airlines llegan en promedio 48 llamadas por
hora.
a. Calcule la probabilidad de recibir tres llamadas en un intervalo de cinco minutos.
b. Calcule la probabilidad de recibir diez llamadas en un intervalo de quince minutos.
Caso VI.
El promedio anual de las veces que los clientes de Air Santo Domingo toman vuelos locales
por motivos de personales es 4.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 86
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

87
a. Cul es la probabilidad de que un cliente tome dos vuelos locales en un ao por
motivos personales?
b. Cul es la probabilidad de que un cliente tome uno o ms vuelos locales en un
semestre?
Caso VII.
Segn la revista Beverage Digest, la Coca clsica y la Pepsi ocuparon el primero y segundo
lugares en la preferencia de las personas (The Wall Street Journal Almanac, 1998). Suponga
que en un grupo de 10 personas, seis prefieren Coca clsica y cuatro prefieren Pepsi. Se
selecciona una muestra aleatoria de tres miembros de ese grupo.
a. Cul es la probabilidad de que exactamente dos prefieran Coca clsica?
b. Cul es la probabilidad de que la mayora (dos o tres) prefieran Pepsi?
Caso VIII.
Un embarque de 10 artculos contiene dos unidades defectuosas y ocho no defectuosas. Al
revisarlo, se tomar una muestra y las unidades se inspeccionarn. Si se encuentra una
unidad defectuosa, se rechazar todo el embarque.
a. Si se selecciona una muestra de tres artculos, cul es la probabilidad de rechazar el
embarque?
b. Si se selecciona una muestra de cuatro artculos, cul es la probabilidad de rechazar el
embarque?
c. Si se selecciona una muestra de cinco artculos, cul es la probabilidad de rechazar el
embarque?
d. Si la gerencia estuviera de acuerdo en que hubiera una probabilidad de 0.90 de
rechazar un embarque con dos defectuosas y ocho no defectuosas?
Caso IX.
De los 15 altos ejecutivos de un negocio de importaciones y exportaciones, se seleccionan 12
para ser enviados al Japn a estudiar un nuevo proceso de produccin. Ocho de los
ejecutivos ya tienen algo de entrenamiento en el proceso. Cul es la probabilidad de que 5
de los enviados tengan algo de conocimiento sobre el proceso antes de partir para el lejano
oriente?
Caso X.
Supongamos que se est interesado en la probabilidad de que exactamente 5 clientes lleguen
durante la siguiente hora. La observacin simple de las ltimas 80 horas ha demostrado que
800 clientes han entrado al negocio.
Caso XI.
Un fabricante en California le suministra un diseo de prototipo para una pieza de aeronave
que requiere un negocio. Este nuevo producto, que es enviado en lotes de n = 12, sufre de
una tasa de defectos de 40%.
a. Si usted no desea un riesgo mayor del 10% en la probabilidad de que 5 de los 12 sean
defectuosos debera comprarle a ese distribuidor?
b. Si usted no desea enfrentar un riesgo mayor del 20% de probabilidad de que ms de 5
salgan defectuosos, debera comprarle a este proveedor?
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 87
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

88
Caso XII.
En el curso de una hora, una mquina especfica llena 1,000 botellas de Cerveza Presidente.
En cada uno de los intervalos, se selecciona aleatoriamente una muestra de 20 botellas y se
verifica el volumen del contenido en cada una. Sea X el nmero de botellas seleccionada con
contenido insuficiente. Suponga que en una hora especfica se producen 100 botellas llenadas
en forma deficiente. Calcule la probabilidad de que al menos tres botellas con contenido
deficiente se incluyan en las muestreadas.
Caso XIII.
Se lanza una moneda 100 veces. Encuentre la probabilidad de que ocurra cara entre 48 y 53
veces inclusive.
Caso XIV.
Suponga que hay 300 errores de impresin distribuidos aleatoriamente a lo largo de un libro
de 500 pginas. Encuentre la probabilidad P de que una pgina dada contenga:
a) Exactamente 2 errores de impresin.
b) 2 o ms errores de impresin.
c) Entre 3 y 5 errores inclusive.
d) Exactamente 7 errores de impresin.
Caso XV.
PlayTime Toys, Inc. emplea a 50 personas en el Departamento de Ensamblaje. Cuarenta de
los empleados pertenecen al sindicato y diez no. Se seleccionan cinco empleados al azar para
formar un comit que va a hablar a la gerencia acerca de los horarios en que inician los
turnos. Cul es la probabilidad de que cuatro de los cinco empleados seleccionados para el
comit pertenezcan a un sindicato?
Caso XVI.
En un estudio reciente se descubri que el 90% de las familias dominicanas tiene televisores.
En una muestra de nueve familias, Cul es la probabilidad de que:
a) Las nueves tengan televisores?
b) Menos de 5 tengan televisores?
c) Ms de 5 tengan televisores?
d) Al menos siete familias tengan televisores?
e) Entre 3 y 8 inclusive tengan televisores?
f) Determine el valor esperado o media.
g) Determine la varianza
h) Determine la desviacin.
Caso XVII.
Claro hace planes para contratar este ao a 5 analistas financieros. Hay un grupo de 12
candidatos aprobados, y el presidente de Claro, decide elegir al azar a quienes va a contratar.
De los solicitantes aprobados, 8 son hombres y 4 mujeres.
a) Cul es la probabilidad de que 3 de los 5 contratados sean hombres?
b) Cul es la probabilidad de que 2 de los 5 contratados sean mujeres?
c) Cul es la probabilidad de que menos de 4 de los 5 contratados sean hombres?
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 88
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

89
Caso XVIII.
Seguros UNIVERSAL asegura propiedades frente a la playa a lo largo de la regin Este del
Pas; el clculo aproximado es que, cualquier ao, la probabilidad de que un huracn de
categora III (vientos sostenidos de ms de 110 millas por hora) o ms intenso azote una
regin de la costa es de 0.05. Si un dueo de una casa veraniega obtiene un crdito
hipotecario de 30 aos por una propiedad recin comprada en Punta Cana, Cul es la
probabilidad de que experimente por lo menos un huracn durante el periodo del crdito? Se
recomienda determinar el valor esperado o media antes de calcular la probabilidad para
determinar .
Caso XIX.
En una encuesta realizada se determin que uno de cada 4 inversionistas dispone de fondos
cotizados en bolsa en sus portafolios. Considere una muestra de 20 inversionistas.
Calcule la probabilidad de que exactamente 4 inversionistas disponen de fondos
cotizados en bolsa en sus portafolios.
Calcule la probabilidad de que por lo menos dos tienen fondos contizados en bolsa en
sus portafolios.
Si usted encuentra que exactamente 12 inversionistas disponen de fondos cotizados en
bolsa de portafolios, dudara de la exactitud de los resultados de la encuesta?
Calcule el nmero esperado de inversionistas que tienen fondos cotizados en bolsa en
sus portafolios.
Caso XX.
Los pasajeros e una lnea area llegan al azar y de manera independiente a la instalacin de
revisin de pasajeros en un aeropuerto internacional. La razn media de llegadas es de 10
personas por minuto.
Calcule la probabilidad de que no haya llegadas en un periodo de un minuto.
Determine la probabilidad de que tres pasajeros o menos lleguen en un periodo de un
minuto.
Calcule la probabilidad de que no haya llegadas en un periodo de 15 minutos.
Estime la probabilidad de cuanto menos una llegada en un periodo de 15 minutos.
Caso XXI.
Una encuesta de la Revista Fortune sirve como fuente para este problema, que su supervisor
le solicita que resuelva. De los 10 empleados hombres, 7 tenan esposas que tambin trabajan.
1) Cul es la probabilidad de que a lo sumo un esposo tenga una esposa que est empleada
fuera de casa si se seleccionan 3 trabajadores al azar?
2) La encuesta revel que 6 de los 10 empleados ganaban ms de US$95,000 al ao. De los 3
seleccionados, cul es la probabilidad de que todos tres ganen ms de US$95,000?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 89
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

90
Caso XXII.
Un gerente de crdito de VISA ha descubierto que el 10% de los usuarios de tarjeta no paga el
monto completo de la deuda durante un mes dado. Desea determinar que de 20 usuarios
seleccionados de manera aleatoria.
1) 5 no sean pagadas.
2) menos de 10 no sean pagadas.
3) entre 4 y 8 no sean pagadas.
4) determine el valor esperado.
5) determine la variabilidad.
7) a lo sumo 5 no sean pagadas.
8) como mnimo 3 no sean pagadas.
9) ms de 10 no sean pagadas.
10) por lo menos 1 no sea pagada.
Caso XXIII.
Cada ao ms de 50 millones de huspedes se hospedan en hoteles que ofrecen alojamiento y
desayuno. El sitio web Bed and Breakfast Inns de Norteamrica, que recibe un promedio de
siete visitantes por minuto, permite a muchos hoteles de este tipo atraer clientes.
a) Calcule la probabilidad de que nadie visite el sitio web en un periodo de un minuto.
b) Estime la probabilidad de dos o ms visitantes al sitio web en un periodo de un minuto.
c) Calcule la probabilidad de uno o ms visitantes en un periodo de 30 segundos.
d) Determine la probabilidad de cinco o ms visitantes en un periodo de un minuto.
Caso XXIV.
Una encuesta de restaurantes de ZAGAT proporciona las calificaciones de los platillos, la
decoracin y el servicio de algunos restaurantes de Estados Unidos. Para 15 establecimientos
ubicados en Boston, el precio medio de una cena, incluyendo una bebida y la propina, es de
$48.60. Usted est de viaje de negocios en Boston y cenar en tres de estos restaurantes. Su
empresa rembolsar un mximo de $50 por cena. Los socios de negocios familiarizados con
estos establecimientos le han dicho que el costo de la cena en un tercio de los restaurantes de
la encuesta rebasa los $50 por cena. Suponga que selecciona al azar tres de estos negocios
para comer.
a) Cul es la probabilidad de que ninguna de las cenas rebase el costo que cubre su empresa?
b) Cul es la probabilidad de que una de las cenas supere el costo que cubre su empresa?
c) Cul es la probabilidad de que dos de las cenas rebasen tal costo?
d) Cul es la probabilidad de que tres de las cenas rebasen dicho costo?
Caso XXV.
Una encuesta reciente de la American Accounting Association revel que 23% de los
estudiantes graduados en contabilidad elige la contadura pblica. Suponga que elige una
muestra de 15 recin graduados.
a) Cul es la probabilidad de que dos hayan elegido contadura pblica?
b) Cul es la probabilidad de que cinco hayan elegido la contadura pblica?
c) Cul es la probabilidad de que ninguno haya elegido contadura pblica?
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 90
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

91
d) Cuntos graduados esperara que eligieran contadura pblica?
e) Cul es la dispersin en esta situacin?
f) Cul es la probabilidad de que a lo sumo seis hayan elegido la contadura pblica?
g) Cul es la probabilidad de que por lo menos tres hayan elegido la contadura pblica?
Caso XXVI.
Un taller automovilstico tiene en existencia 10 transmisiones reconstruidas. De ellas, tres no
funcionan correctamente y tienen algn defecto interno que causar problemas en las
primeras 1,000 millas de recorrido. Cuatro de ellas seleccionadas aleatoriamente e instalan en
los vehculos de los clientes.
a) Calcule la probabilidad de que ninguna trasmisin defectuosa se instale.
b) Calcule la probabilidad de que se instale exactamente una transmisin defectuosa.
c) Calcule la probabilidad de que a lo sumo 2 trasmisiones sean defectuosa y se instale.
Caso XXVII.
En las ltimas 80 horas han llegado a una bodega de recepcin 240 camiones para ser
descargados. Se tiene inters en la probabilidad de cierto nmero de arribos, como se indica a
continuacin.
a) 5 arribos en la siguiente hora.
b) ningn arribo en la siguiente hora
c) a lo sumo 3 arribos en una hora
d) 2 arribos en 30 minutos.
e) Entre 4 y 8 arribos en 20 minutos.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 91
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

92

La distribucin normal o gaussiana (Standard Normal


Distribution) y la regla emprica (Empirical Rule)
La distribucin normal es una distribucin de datos continuos (*) (no discretos) que
produce una curva simtrica en forma de campana.
La distribucin gaussiana fue presentada por Karl Friedrich Gauss (1777-1855) en el
1812.
La campana de Gauss o curva de distribucin normal, curva de probabilidad normal;
se caracteriza por:
- Es unimodal.
- Es simtrica (la simetra es perfecta).
- La mitad izquierda de su histograma es aproximadamente una imagen especular de
su mitad derecha.
- La asimetra de la distribucin es cero.
- Las colas de la curva se aproximan ms, pero nunca tocan, el eje horizontal.
- La media, la mediana y la moda son iguales.
- La mitad de las observaciones est por encima de la media y la mitad est por debajo.
- Si las observaciones estn altamente dispersas, la curva en forma de campana se
aplanara y se esparcir. La desviacin estndar determina el ancho de la curva. A valores
mayores de la desviacin estndar se tienen curvas ms anchas y bajas, que muestran una
mayor dispersin en los datos.
- El punto ms alto de la curva normal es la media, que tambin es la mediana y la
moda de la distribucin.
- El rea total bajo la curva de la distribucin normal de probabilidad es 1.
(*) Variables continas:
Son las que pueden tomar cualquier valor dentro de un intervalo dado. Por muy prxima que
puedan estar dos observaciones, si el instrumento de medida tiene la precisin suficiente siempre puede
haber una tercera observacin que caiga entre las dos primeras. Los valores de una variable continua
proceden en general de mediciones, por ejemplo las cantidades de leche que las vacas producen son datos
continuos porque son mediciones que pueden asumir cualquier valor dentro de un intervalo continuo.
Se pueden obtener de un nmero infinito de posibles valores que pueden asociarse a puntos de una
escala continua, de tal manera que no haya huecos ni interrupciones.
La Regla Emprica o Regla 68-95-99.
Esta regla solo aplica a un conjunto de datos cuya distribucin tiene aproximadamente
forma de campana. Esta afirma que:
- Cerca del 68.26% de todos los puntajes u observaciones queda a menos de una
desviacin estndar de la media.
- Cerca del 95.44% de todos los puntajes u observaciones queda a menos de dos
desviaciones estndar de la media.
- Cerca del 99.7% de todos los puntajes u observaciones que a menos de tres
desviaciones estndar de la media.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 92
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

93
La Desviacin Normal o Formula Z.
Z = (X - )/
Valor de Z: Es el nmero de desviaciones estndar a las que una observacin est por
encima o por debajo de la media.
X

es algn valor especfico de la variable aleatoria.


es la media
es la desviacin estndar

Caso I.
Claudia Cffaro en su viaje que realizo en el fin de semana pasado, para reunirse con
los funcionarios de la Casa Matriz de diseo de modas a la cual pertenece, determinaron que
el pblico al cual se dirigen estaba en constante cambio en su tamao fsico y en sus
proporciones. Por lo que realizaron un estudio y llegaron a la conclusin de que las estaturas
de sus clientes estaban distribuidas normalmente alrededor de una media de 67 pulgadas,
con una desviacin estndar de 2 pulgadas.
Si Claudia fuera a expresar en Valor de Z la estatura de dos de sus clientes, que tienen
64 y 73 pulgadas respectivamente. Que debe hacer? Tambin represntelo grficamente.
La Desviacin Normal o Formula Z.
Z = (X - )/
Si se selecciona aleatoriamente a un cliente del negocio de Claudia:
1. Cul es la probabilidad de que la estatura del mismo est entre 67 y 69 pulgadas?
2. Cul es la probabilidad de que la estatura del cliente sea superior a 69 pulgadas?
3. Cul es la probabilidad de que la estatura del cliente sea inferior a 69 pulgadas?
4. Cul es la probabilidad de que la estatura de est entre 64.5 y 70.3 pulgadas?
5. Cul es la probabilidad de que la estatura de est entre 69.3 y 70.5 pulgadas?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 93
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

94
Aproximacin de la distribucin Binomial a la distribucin Normal.
Media de una Distribucin Binomial.
E(X) = = n = np
Varianza de una Distribucin Binomial.
= n(1- ) = npq
_______
____
Desviacin = n(1- ) = npq

Si n es muy grande.
p = = denota probabilidad de tener xito en uno de los n ensayos.
q = denota la probabilidad de fracasar en uno de los n ensayos.
p+q=1
p=1q
q=1p
n > 5
np > 5
n(1- ) > 5
nq > 5
Si n es muy grande y np y nq son mayores que 5, p se aproxima a 0.5, podemos aproximar.
Caso:
El 40% de los sindicalistas del Sindicato quiere huelga. Si seleccionan 15 miembros Cul
es la probabilidad de que 10 apoyen un paro?
Probabilidad de una
x
n-x
Distribucin Binomial P(x) = nCx () (1-)
10
15-10
P(x=10|n=15, =0.40) = 15C10*(0.40)*(1-0.40) = 3003 * 0.0001049 * 0.07776 = 0.02449
1) Media de una Distribucin Binomial.
E(X) = = n = np = 15 * 0.40 = 6
2) Varianza de una Distribucin Binomial.
= n(1- ) = npq = 15 * 0.40 * 0.60 = 3.6
______
____
3) Desviacion = n(1- ) = npq
= 1.89737
4)Factor de Correccion de Continuidad
X 0.5 = 10 0.5 = 9.5
X + 0.5 = 10 + 0.5 = 10.5
5) Z = (9.5 6) / 1.89737 = 1.85
Z = (10.5 6) / 1.89737 = 2.37
6) P(9.5 X 10.5) = P(1.85 Z 2.37) = 0.4911 0.4678 = 0.0233

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 94
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

95
El Teorema del Limite Central indica que en el caso de muestras grandes (n > 30), la
distribucin de las medias de muestra es aproximadamente normal con media y desviacin
estndar /n. Provocando as una variacin de la ecuacin:
= (X' - )/(/n)
La regla general es que si n es por lo menos 30, el Teorema del Limite Central asegurara una
distribucin normal en las medias muestrales incluso si la poblacin no es normal.
Caso I.
Los tiempos de reemplazo de los reproductores de CD tienen una distribucin normal con
una media de 7.1 aos y una desviacin estndar de 1.4 aos (basados en datos de "Getting
Things Fixed", Consumer Reports). Determine la probabilidad de que un reproductor de CD
seleccionado al azar tenga un tiempo de reemplazo de menos de 8 aos.
Caso II.
Suponga que los pesos del papel desechado por los hogares cada semana estan normalmente
distribuidos con un media de 9.4 lbs y una desviacin estndar de 4.2 lbs. Determine la
probabilidad de seleccionar aleatoriamente un hogar y obtener uno que desecha entre 5 y 8
lbs de papel en una semana.
Caso III.
Segun la International Mass Retail Association, las muchachas estadounidenses entre los 13 y
17 aos gastan en promedio US$31.2 dlares al mes cuando van de compras. Suponga que
las cantidades tienen una distribucin normal con una desviacin estndar de US$8.27
dlares. Si seleccionamos al azar a una muchacha perteneciente a esa categoria de edades,
qu probabilidad hay de que gaste entre US$35 y US$40 dlares en un mes?
Caso IV.
Los puntajes de cociente intelectual (IQ) estn distribuidos normalmente con una media de
100 y una desviacin estndar de 15. Mensa es una organizacin para personas con cociente
intelectual elevado, y solo acepta personas con un IQ mayor que 131.5.
Si se escoge aleatoriamente a una persona, determine la probabilidad de que satisfaga el
requisito de Mensa.
Caso V.
VERIZON registro los mensajes telefnicos para sus clientes, los cuales promediaron 150
segundos, con una desviacin estndar de 15 segundos.
VERIZON desea determinar la probabilidad de que una sola llamada dure:
a) Entre 145 y 150.
b) Sea mayor que 145.
c) Sea menor que 155.
d) Entre 145 y 155.
e) Sea Mayor que 155.
f) Entre 160 y 170
g) Entre 140 y 145.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 95
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

96
Caso VI.
Cerca del 4.4% de los accidentes fatales de vehculos motorizados se debe a neumticos
defectuosos (basados en datos del Consejo Nacional de Seguridad de Estados Unidos). Si un
estudio de seguridad de autopistas inicia con la seleccin de 750 casos fatales de choque de
vehculos motorizados, estime la probabilidad de que exactamente 35 de ellos hayan sido
causados por neumticos defectuosos. Represente grficamente la situacin planteada.
Caso VII.
El promedio de los salarios en los bancos comerciales de New York es de US$22.87 por hora,
con una desviacin estndar de US$5.87. Cul debe ser su salario por hora si desea ganar
(Represente grficamente cada situacin planteada:
a. Ms que el 80% de todos los empleados?
b. Ms que el 30% de todos los empleados?
c. Menos que el 20% de todos los empleados?
d. Ms que el 50% de todos los empleados?
Caso VIII.
Los registros muestran que el 45% de todos los automviles producidos por Ford Motor
Company contiene partes importadas de Japn. Cul es la probabilidad de que los prximos
200 carros, 115 contengan partes japonesas. Represente grficamente.
Caso IX.
El precio promedio del boleto de entrada a un juego de bisbol de ligas mayores fue de $11.98
dlares en 1998 (USA Today, 1 de noviembre de 1998). Sumando a los boletos el costo de
alimentos, estacionamiento y souvenirs, el costo promedio aproximado fue de $110.00 dlares
para una familia de 4 miembros, con una desviacin de $20.00 dlares.
a. Cul es la probabilidad de que una familia gaste ms de $100.00 dlares?
b. Cul es la probabilidad de que una familia gaste $90.00 dlares o menos?
c. Cul es la probabilidad de que una familia gaste $80.00 dlares a 130 dlares?
d. Cul es la probabilidad de que una familia gaste entre $120.00 dlares y 130 dlares?
e. Cul es la probabilidad de que una familia gaste entre $95.00 dlares y 100 dlares?
f. Cul debe ser el gasto de una familia que est por encima del 80% de los datos
evaluados?
g. Cul debe ser el gasto del 50% de las familias de 4 miembros?
h. Cul debe ser el gasto de una familia que separa el 40% del 60 restante de los datos
evaluados?
i. Si se toma una muestra de 50 familias, cul es la probabilidad de que gasten entre
115.00 dlares y 125.00 dlares?
Caso X.
Cul es el ingreso que separa el 10% de la gente ms pobre del 90% restante de la poblacin
dominicana? Si el ingreso medio es de RD$5,200 y la desviacin es de RD$1,300.
Ejercicios 32, 34, 35 y 36 de las pgs. 133-134

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 96
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

97
Caso XI.
El 40% de los sindicalistas del Sindicato quiere huelga. Si seleccionan 15 miembros Cul es la
probabilidad de que 10 apoyen un paro?
Caso XII.
Los registros muestran que 45% de todos los automviles producidos por Ford Motor
Company contienen partes importadas de Japn. Cul es la probabilidad de que los
prximos 200 carros, 115 contengan partes japonesas?
Caso XIII.
Cuando usted firma un contrato para obtener una tarjeta de crdito, lo lee detenidamente?
En una encuesta de FindLaw.com se pregunt a las personas: Cunto cuidado pone al leer
un contrato de tarjeta de crdito? (USA Today, 16 de octubre de 2003). Los hallazgos
arrojaron que 44% lee cada palabra, 33% lee lo suficiente para entender el contrato, 11% slo
le da un vistazo y 4% no lo lee.
1) Para una muestra de 500 personas, Cuntas esperara que dijeran que leen cada palabra de
un contrato de tarjeta de crdito?
2) Para una muestra de 500 personas, Cul es la probabilidad de que 200 o menos digan que
leen cada palabra de un contrato de tarjeta de crdito? Resuelva por aproximacin y compare
ambas probabilidades.
3) Represente grficamente el punto 2.
Caso XIV.
La distribucin de los ingresos anuales de un grupo de empleados de mandos medios en
Compton Plastics se aproxima a una distribucin normal, con una media de $47,200 y una
desviacin estndar de $800.
1)Entre que par de valores de los ingresos anuales se encuentran aproximadamente el
68.26%?
2)Entre que par de valores de los ingresos anuales se encuentran aproximadamente el
95.44%?
3) Cul es ingreso anual que est a ms del 80%?
4) Cul es ingreso anual que est a ms del 30%?
5) Cul es ingreso anual que est a menos del 20%?
6) Cul es ingreso anual que est a ms del 50%?
Caso XV.
La Administracin de Pizzarelli se da cuenta de que el 70% de sus nuevos clientes regresa a
comer. Si seleccionan aleatoriamente a 80 clientes, cul es la probabilidad de que 60 o ms
regresen a consumir pizza?
Resuelva por aproximacin, compare ambas probabilidades y Represente grficamente.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 97
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

98
Caso XVI.
Orange planea instalar nuevos equipos que mejoraran la eficiencia de sus operaciones. Sin
embargo, antes de que los ejecutivos puedan decidir si dicha inversin ser eficaz en funcin
de los costos, deben determinar la probabilidad de una muestra de n = 35, basados en
estudios previos donde se determin que la duracin media de las llamadas es de 150
segundos con una desviacin estndar de 15 segundos.
a) Entre 145 y 150.
b) Sea mayor que 145.
c) Sea menor que 155.
d) Entre 145 y 155.
e) Sea Mayor que 155.
f) Entre 160 y 170
g) Entre 140 y 145.
Caso XVII.
Se emprende un estudio para investigar la relacin del tabaquismo en mujeres embarazadas
con los defectos de nacimiento en los hijos. De las madres estudiadas, 40% fuma y 60% no lo
hace. Cuando nacen sus hijos, existe algn tipo de defecto congnito en 20. Sea X el nmero
de hijos cuya madre fum durante el embarazo.
a) Cul es la probabilidad de que 12 o ms de los nios sean hijos de madres fumadoras?
b) Resuelva por aproximacin y compare ambas probabilidades.
c) Represente grficamente.
d) Interprete los resultados.
Caso XVIII.
Suponga que el 4% de la poblacin mayor de 65 aos tiene la enfermedad de Alzheimer.
Suponga que se toma una muestra aleatoria de 3,500 personas mayores de 65.
a) Encuentre la probabilidad de que menos de 150 de ellas tengan la enfermedad.
b) Resuelva por aproximacin y compare ambas probabilidades.
c) Represente grficamente.
d) Interprete los resultados.
Caso XIX.
Al medir los miligramos de glucosa por decilitro de sangre, se obtiene una variable aleatoria
X continua. Despus de 12 horas de ayuno, la media es de 85 y una desviacin de 25
(despus de 50 aos de edad, la media y la desviacin estndar tienden a aumentar). Cul es
la probabilidad de que despus de 12 horas de ayuno, un adulto menor de 50 aos elegido
aleatoriamente reporte:
a) un valor de mayor de 60? Represente grficamente e Interprete.
b) Menor que 85? Represente grficamente e Interprete.
c) Entre 60 y 85 inclusive? Represente grficamente e Interprete.
d) mayor que 140 (la frontera de la diabetes empieza en 140). Represente grficamente e
Interprete.
e) Entre que par de valores se encuentran aproximadamente el 68.26%? Represente
grficamente e Interprete.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 98
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

99
f)Entre que par de valores se encuentran aproximadamente el 95.44%? Represente
grficamente e Interprete.
g) Cul es el valor que est a ms del 80%? Represente grficamente e Interprete.
h) Cul es el valor que est a ms del 30%? Represente grficamente e Interprete.
i) Cul es el valor que est a menos del 20%? Represente grficamente e Interprete.
j) Cul es el valor que est a ms del 50%? Represente grficamente e Interprete.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 99
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

100

Distribucin Muestral
Generalmente las poblaciones son demasiado grandes como para ser estudiadas en su
totalidad. Es necesario seleccionar una muestra representativa de un tamao ms manejable.
Esta muestra se utiliza luego para sacar conclusiones sobre la poblacin.
Distribucin Muestral: Es una lista de todos los valores posibles para un estadstico y la
probabilidad relacionada con cada valor.
Error de Muestreo: Es la diferencia entre el parmetro poblacional y el estadstico de la
muestra para estimar el parmetro.
X'-X"
X'-
Parmetro: Es una medicin numrica que describe alguna caracterstica de una poblacin.
- Medida descriptiva de la poblacin completa de observaciones que tienen inters para el
investigador.
Estadstico: Es una medicin numrica que describe alguna caracterstica de una muestra.
El estadstico se utiliza como estimador del parmetro. Al confiar en una muestra para
sacar alguna conclusin o inferencia sobre la poblacin.
Combinaciones. Son las diferentes formaciones que podemos hacer con n elementos
diferentes entrando de n en r; pudiendo ser r <= n, de modo tal que dos formaciones solo se
diferencian en la naturaleza de uno de sus elementos por lo menos.
El nmero de combinaciones de n elementos tomados r a la vez es:
nCr = n!/r!(n-r)!
Nota: La combinacin no considera el orden de los elementos de los subconjuntos.
Caso I.
Las ventas en miles de dlares de Electrom, S.A. durante los ltimos 6 meses fueron de
70, 77, 73, 78, 85 y 80. Asumiendo que estos seis meses constituyen una poblacin, la media
claramente es = 77.17. El director de Marketing desea estimar esta media "desconocida"
tomando una muestra de tamao n=4. Se espera que el error de muestreo que es probable
que ocurra sea relativamente pequeo. Realice la distribucin muestral.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 100
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

101
1 Podemos obtener muchas muestras de tamao 4.
Especficamente 6C4 = 15
2 Construya la tabla en base a la cantidad de muestra del primer punto, indicando los
elementos mustrales (Xi), y Medias Mustrales (X')
3 Construya la tabla con la Probabilidad de cada media muestral.
4 Calcule la media de las medias mustrales.
La Media de las Medias Mustrales:
X"= estndar de las medias mustrales/K.
Varianza de la Distribucin Muestral de las Medias Mustrales:
x'=(X'-X")/K
Error Estndar de la Muestral de las Medias Mustrales:
x'=x'
Una aproximacin cercana puede obtenerse mediante:
x'=/n
x'=/n
Si el tamao de la muestra es ms del 5% de la poblacin, n>0.05N, debe aplicarse el factor de
correccin para poblaciones finitas (fpc).
Error Estndar utilizando el fpc:
x'=(/n)((N-n/N-1))
(N-n/N-1) es el fpc.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 101
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

102
70

73

77

78

80

85

TABLA DE DISTRIBUCION MUESTRAL


POBLACION
ELEMENTOS
VENTAS

NUMERO DE
MEDIA (X')
LA MUESTRA
MENSUALES
MUESTRA (X)
MUESTRAL
70
70 73 77 78
1
77
70 73 77 80
2
73
70 73 77 85
3
78
70 73 78 80
4
85
70 73 78 85
5
80
70 73 80 85
6
77.17
MEDIA
70 77 78 80
7
VARIANZA
70 77 78 85
8
DESVICION
70 77 80 85
9
70 78 80 85
10
73 77 78 80
11
73 77 78 85
12
73 77 80 85
13
73 78 80 85
14
77 78 80 85
15
MEDIA DE
X'

VENTAS

VALORES DE

CUADRADO DE

MENSUALES

DESVIACION X-X'

VALORES DE DESV.

ERROR DE
MUESTREO
(X'-X")

CUADRADO
DEL
ERROR (X'X")

VARIANZA
ERROR
ESTANDAR

70
77
73
78
85
80
MEDIA

SUMATORIA
VARIANZA
DESVIACION

SQRT

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 102
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

103
TABLA DE PROBABILIDADES
F/K
MEDIAS (X') FRECUENCIA P(X')

Ejercicios 1 al 5 - Pgs. 149-150


Teorema del Limite Central.
A medida que n se vuelve ms grande, la distribucin de las medias mustrales se
aproxima a una distribucin normal con una media X"= y un error estndar de x'=/n.
A mayor n menor x'
Por tanto, incluso si la poblacin no est distribuida normalmente, la distribucin de
muestreo de las medias mustrales ser normal si n es lo suficientemente grande.
La regla general es que si n es por lo menos 30, el Teorema del Limite Central
asegurara una distribucin normal en las medias mustrales incluso si la poblacin no es
normal.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 103
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

104

En sntesis:
Teorema del Lmite Central:
Dado que:
1.- La variable aleatoria x tiene una distribucin (que podra ser o no normal) con media y
una desviacin estndar .
2.- Se seleccionan aleatoriamente muestras de tamao n de esa poblacin.
Conclusiones:
1.- A medida que aumenta el tamao de las muestras, la distribucin de las medias de
muestra se acercara a una distribucin normal.
2. - La media de las medias de muestra ser la media de la poblacin X"=.
3.- La desviacin estndar de las medias de muestra ser x'=/n.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 104
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

105
Reglas prcticas de uso comn:
1.- Para muestras de tamao n mayor que 30, la distribucin de las medias de muestra se
puede aproximar razonablemente bien con una distribucin normal. La aproximacin es ms
exacta a medida que aumenta el tamao de muestra n.
2.- Si la poblacin original tambin est distribuida normalmente, las medias de muestra
tendrn una distribucin normal para cualquier tamao de muestra n.
El Teorema del Limite Central indica que en el caso de muestras grandes (n > 30), la
distribucin de las medias de muestra es aproximadamente normal con media y desviacin
estndar /n. Provocando as una variacin de la ecuacin:
= (X' - )/(/n)
La regla general es que si n es por lo menos 30, el Teorema del Limite Central asegurara una
distribucin normal en las medias mustrales incluso si la poblacin no es normal.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 105
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

106
Caso I.
Tartus Industries cuenta con siete empleados de produccin (a quienes se les considera
poblacin). En la tabla siguiente se incluyen los ingresos por hora de cada empleado.
Empleado
Joe
Sam
Sue
Bob
Jan
Art
Ted

Ingresos
por hora
7
7
8
8
7
8
9

Encontrar:
a) La media de la poblacin.
b) La desviacin estndar de la poblacin.
c) La media de la distribucin muestral de media con muestras de tamao 2.
d) La desviacin estndar de la distribucin muestral de medias, es decir, el error
estndar de las medias.
e) La tabla de Probabilidades.

Caso II.
Los tiempos de servicio de los ejecutivos que laboran en Standard Chemicals son los
siguientes:
Nombre
Snow
Tolson
Kraft
Irwin
Jones

Aos
20
22
26
24
28

a) Cuntas muestras de tamao 2 son posibles?


b) Elabore una lista de todas las muestras posibles de 2 ejecutivos de la poblacin y
calcule las medias.
c) Organice las medias en una distribucin muestral.
d) Compare la media poblacional y la media de las medias de las muestras.
e) Compare la dispersin en la poblacin con la dispersin de la distribucin muestral de
la media.
f) Construya la tabla de probabilidades.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 106
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

107
Caso III.
En el despacho de abogados hay seis socios. En la siguiente tabla se incluye el nmero de
casos que en realidad atendi cada socio en los tribunales durante el mes pasado.

Socio
Ruud
Wu
Sass
Flores
Wilhelms
Schueller

Nmero de
Casos
3
6
3
3
0
1

a) Cuntas muestras de tamao 3 son posibles?


b) Elabore una lista de todas las muestras posibles de 3 de la poblacin y calcule las
medias.
c) Organice las medias en una distribucin muestral.
d) Compare la media poblacional y la media de las medias de las muestras.
e) Compare la dispersin en la poblacin con la dispersin de la distribucin muestral de
la media.
f) Construya la tabla de probabilidades.

Caso IV.
Hay cinco vendedores en Mi-Motors Ford. Los cinco representantes de ventas y el nmero de
automviles que vendieron la semana pasada son los siguientes.
Representante
de Ventas
Peter Hankish
Connie Stalter
Juan Lopez
Ted Bames
Peggy Chu

Autos
Vendidos
8
6
4
10
6

a) Cuntas muestras de tamao 3 son posibles?


b) Elabore una lista de todas las muestras posibles de 3 de la poblacin y calcule las
medias.
c) Organice las medias en una distribucin muestral.
d) Compare la media poblacional y la media de las medias de las muestras.
e) Compare la dispersin en la poblacin con la dispersin de la distribucin muestral de
la media.
f) Construya la tabla de probabilidades.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 107
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

108
Caso V.
Una poblacin consta de cinco nmeros 2, 3, 6, 8, 11. Considerar todas las muestras posibles
de tamao dos que pueden extraerse con reemplazo de esta poblacin.
Encontrar:
f) La media de la poblacin.
g) La desviacin estndar de la poblacin.
h) La media de la distribucin muestral de media.
i) La desviacin estndar de la distribucin muestral de medias, es decir, el error
estndar de las medias.
j) La tabla de Probabilidades.
Caso VI.
De una lista de 500 firmas, sera posible obtener muchas muestras diferentes de tamao 50.
Especficamente se podra obtener 500C50 muestras diferentes de tamao n=50. Debido a que
500C50 es un nmero ms bien grande, se asume en aras de la simplicidad de la discusin,
que se tiene una poblacin de N = 4 ingresos para cuatro estudiantes universitarios. Estos
ingresos son de $100, $200, $300 y $400. El ingreso promedio puede calcularse como =$250.
a) Cuntas muestras de tamao 2 son posibles?
b) Elabore una lista de todas las muestras posibles de 2 de la poblacin y calcule las
medias.
c) Organice las medias en una distribucin muestral.
d) Compare la media poblacional y la media de las medias de las muestras.
e) Compare la dispersin en la poblacin con la dispersin de la distribucin muestral de
la media.
f) Construya la tabla de probabilidades.

Caso VII.
Una poblacin de las ventas semanales (en miles de dlares) en Blazing Salads, un
restaurante vegetariano en Chicago, es 27, 32, 17, 21 y 32.
a) Calcule e interprete la desviacin poblacional.
b) Determine n = 2 y desarrolle la distribucin muestral.
c) Calcule e interprete la desviacin de la distribucin muestral y compare con la
desviacin poblacional.
d) Calcule e interprete la .
e) Calcule e interprete la media de las medias mustrales; y compare con la media
poblacional.
f) Construya la tabla de probabilidades.
g) Ahora desarrolle la distribucin muestral con n=3
h) Calcule la media de las medias muestrales y la desviacin de la distribucin muestral.
Y Compare con las del punto c y e.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 108
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

109
Caso VIII.
Orange registr los mensajes telefnicos de sus clientes, los cuales promedian 150 segundos,
con una desviacin de 15 segundos, por lo que planea instalar nuevos equipos que mejoraran
la eficiencia de sus operaciones. Sin embargo, antes que los ejecutivos puedan decidir si
dicha inversin ser eficaz en funcin de los costos, deben determinar la probabilidad de que
la media de una muestra de n = 35:
b. Est entre 145 y 150.
c. Sea mayor que 145.
d. Sea menor que 155.
e. Est entre145 y 155.
f. Sea mayor que 155.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 109
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

110
Distribucin de Proporciones Mustrales
Muchos asuntos de negocios tratan la proporcin de la poblacin . Una firma de
marketing puede querer averiguar si un cliente (1) compra o (2) no compra el producto. Un
banco con frecuencia debe determinar si un depositante (1) pedir o (2) no pedir un crdito
para auto. Muchas firmas deben determinar la probabilidad de que un proyecto para
presupuestar capital (1) generara o (2) no generara un rendimiento positivo.
un cliente (1) compra (p = )
o (2) no compra el producto (q = 1 - )
un depositante (1) pedir un crdito para auto (p = )
o (2) no pedir un crdito para auto (q = 1 - )

Valor esperado (media) de la


Distribucin Muestra de la Proporcin: E(p) = = p/K

Error estndar de la Distribucin


_______
____
Muestra de la Proporcin: p = (1-)/n = pq/n
Si el tamao de la muestra es ms del 5% de la poblacin, n>0.05N, debe aplicarse el factor de
correccin para poblaciones finitas (fpc).

Error estndar de la Distribucin


_______
________
Muestra de la Proporcin:p = (1-)/n * (N-n/N-1)
____
________
p = pq/n * (N-n/N-1)
Caso I.
Publicidad Sarmiento pregunta a toda la poblacin N=4 clientes si vieron el anuncio
publicitario de Sarmiento en el peridico de esta maana. Se registr una respuesta si
como xito, y no como fracaso. Los cuatros clientes S1, N2, N3 y S4. La proporcin
poblacional de xitos es = 0.5. Se tomaron muestras de tamao n = 2 (4C2 = 6), y la
proporcin de xitos se registra en la siguiente tabla:
p = x/n

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 110
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

111
Xi

Nm. De
xitos

S1, N2

0.50

S1, N3

0.50

S1, S4

1.00

N2, N3

N2, S4

0.50

N3, S4

0.50

TOTAL

3.00

Valor esperado (media) de la


Distribucin Muestra de la Proporcin:
E(p) = = p/K = 3/6 = 0.5
Error estndar de la Distribucin
Muestra de la Proporcin: p = (1-)/n * (N-n/N-1)
________
_______
p = 0.5*0.5/2 * (4-2/4-1)
p = 0.35355339 * 0.81649658 = 0.289
Z = (p - )/p
Caso II.
BellLabs adquiere componentes para sus telfonos celulares en lotes de 200 de una firma en
Palo Alto. El componente tiene una tasa de defectos del 10%. Una poltica establecida
recientemente por BellLabs establece que si el siguiente envo tiene:
a.
b.
c.
d.
e.

Ms del 12% de defectos, definitivamente buscar un nuevo suplidor.


Entre el 10 y el 12% de defectos, considerar un nuevo proveedor.
Entre el 5 y 10% de defectos, definidamente no conseguir un nuevo proveedor.
Menos del 5% de defectos, incrementar sus pedidos.
Cul decisin es ms probable que tome BellLabs?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 111
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

112

a. Ms del 12% de defectos, definitivamente buscar un nuevo suplidor.


Valor esperado (media) de la
Distribucin Muestra de la Proporcin:
E(p) = = 0.10
Error estndar de la Distribucin
Muestra de la Proporcin:
p = (1-)/n
__________
p = 0.1*0.9/200 = 0.021
P(p > 0.12):
Z = (p - )/p
Z = (0.12 0.10)/0.021 = 0.95
Z = 0.95 rea de 0.3289
P(p > 0.12) = P(Z > 0.95) = 0.5 - 0.3289 = 0.1711

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 112
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

113
b. Entre el 10 y el 12% de defectos, considerar un nuevo proveedor.
Valor esperado (media) de la
Distribucin Muestra de la Proporcin:
E(p) = = 0.10
Error estndar de la Distribucin
Muestra de la Proporcin:
p = (1-)/n
__________
p = 0.1*0.9/200 = 0.021
P(0.10 <= p <= 0.12):
Z = (p - )/p
Z = (0.12 0.10)/0.021 = 0.95
Z = 0.95 rea de 0.3289
P(0.10 <= p <= 0.12) = 0.3289

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 113
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

114
c. Entre el 5 y 10% de defectos, definitivamente no conseguir un nuevo
proveedor.
Valor esperado (media) de la
Distribucin Muestra de la Proporcin:
E(p) = = 0.10
Error estndar de la Distribucin
Muestra de la Proporcin: Error Estndar p = (1-)/n
__________
p = 0.1*0.9/200 = 0.021
P(0.05 <= p <= 0.10):

Z = (p - )/p
Z = (0.05 0.10)/0.021 = -2.38
Z = 2.38 rea de 0.4913
P(0.05 <= p <= 0.10) = 0.4913

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 114
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

115

d. Menos del 5% de defectos, incrementar sus pedidos.


Cal decisin es ms probable que tome BellLabs?
Valor esperado (media) de la
Distribucin Muestra de la Proporcin:
E(p) = = 0.10
Error estndar de la Distribucin
Muestra de la Proporcin:
p = (1-)/n
__________
p = 0.1*0.9/200 = 0.021
P(p < 0.05):
Z = (p - )/p
Z = (0.05 0.10)/0.021 = -2.38
Z = 2.38 rea de 0.4913
P(p < 0.05) = 0.5 - 0.4913 = 0.0087

Webster: Ejercicios 9 al 12 - Pg. 157


Webster: Ejercicios 13 al 17 - Pg. 160
Webster: Ejercicios 18 al 46 - Pg. 164-166

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 115
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

116
Caso II.
El 30% de todos los empleados de una empresa tienen capacitacin avanzada. Si en una
muestra de 500 empleados menos del 27% estaba preparado de forma adecuada, todos los
nuevos contratos necesitarn registrarse en un programa de capacitacin. Cul es la
probabilidad de que inicie el programa?
Valor esperado (media) de la
Distribucin Muestra de la Proporcin:
E(p) = = 0.30
Error estndar de la Distribucin
Muestra de la Proporcin:
p = (1-)/n
____________
p = 0.30*0.70/500 = 0.02049
P(p < 0.27):

Z = (p - )/p
Z = (0.27 0.30)/ 0.02049 = - 1.46
Z = -1.46 rea de 0.4279

P(p < 0.27) = P(Z < -1.46) = 0.5 - 0.4279 = 0.0721

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 116
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

117
Caso III.
La proporcin de todos los clientes de Pizza Hut que comen en el sitio es del 75%. En una
muestra de 100 clientes. Cul es la probabilidad de que menos del 20% lleven su comida a
casa?
Valor esperado (media) de la
Distribucin Muestra de la Proporcin:
E(p) = = 0.75 Comen en el Sitio
Error estndar de la Distribucin
Muestra de la Proporcin:
p = (1-)/n
____________
p = 0.75*0.25/100 = 0.04330
P(p < 0.20):

Z = (p - )/p
Z = (0.20 0.25)/ 0.04330 = - 1.16
Z = -1.16 rea de 0.3770

P(p < 0.20) = P(Z < -1.16) = 0.5 0.3770 = 0.1230

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 117
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

118
Caso IV.
El Director de Distribuidora Corripio piensa que el 30% de los pedidos proviene de nuevos
clientes. Para ver la proporcin de clientes nuevos se usar una muestra aleatoria simple de
100 pedidos.
a) Cul es la probabilidad de que la proporcin muestral de p est entre 0.20 y 0.40?
b) Cul es la probabilidad de que la proporcin muestral de p est entre 0.25 y 0.35?
Caso V.
La proporcin poblacional es 0.30. Cul es la probabilidad de que las proporciones
mustrales y poblacional estn entre 0.04 con los tamaos siguientes?
a) n = 100
b) n = 200
c) n = 500
d) n = 1000
e) Qu ventaja tiene un tamao grande de muestra?

n = 100
E(p) = = 0.30
p = (0.3*0.7)/100 = 0.04583

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 118
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

119
Caso VI.
La Revista Mercado informa que el 66% de los adultos y 87% de los jvenes entre 12 y 17 aos
usan Internet. Considere estos datos como proporciones poblacionales y suponga que se
usar una muestra de 300 adultos y 300 jvenes para obtener informacin respecto de su
opinin acerca de la seguridad de Internet.
a) Cul es la probabilidad de que la diferencia entre la proporcin muestral y la
proporcin poblacional de adultos que usan Internet no sea mayor de 0.04?
b) Cul es la probabilidad de que la diferencia entre la proporcin muestral y la
proporcin poblacional de jvenes que usan Internet no sea mayor de 0.04?
c) Son diferentes las probabilidades anteriores? Si es as por qu?
d) En caso de que el tamao de la muestra sea 600. es menor la probabilidad? Por qu?
Caso VII.
Las personas terminan por desechar 12% de lo que compran en el supermercado. Asuma que
esta es la verdadera proporcin poblacional y que planea realizar una encuesta por muestreo
de 450 compradores para investigar ms acerca de su comportamiento.
Cul es la probabilidad de que la encueste genere una proporcin muestral de 0.03 de la
proporcin poblacin?
Cul es la probabilidad de que la encueste genere una proporcin muestral de 0.015 de la
proporcin poblacin?
Caso VIII.
The Grocery Manufacturers of America informa que el 76% de los consumidores lee los
ingredientes que se mencionan en la etiqueta de un producto. Suponga que la proporcin
poblacional es 0.76 y que de la poblacin de consumidores se selecciona una muestra de 400.
Cul es la probabilidad de que la diferencia entre las proporciones muestral y poblacional no
sea mayor que 0.03?
Si la muestra es de 750 consumidores, cul es la probabilidad de que la diferencia entre las
proporciones muestral y poblacional no sea mayor que 0.03?

Investigar los siguientes Mtodos de Muestreo y dar dos Ejemplos: Valor 2 adicionales a
los 100.
Muestreo Aleatorio Simple
Muestreo Sistemtico
Muestreo Estratificado
Muestreo por Conglomerados
Muestreo de Conveniencia

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 119
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

120

Mtodos de Muestreo
Muestra: Es un subconjunto de elementos extrados de una poblacin.
- Es una porcin representativa de la poblacin, que se selecciona para su estudio
porque la poblacin es demasiado grande para analizarla en su totalidad.
Muestra Aleatoria o Probabilstica: Se seleccionan los miembros de la poblacin de modo
que cada uno tenga la misma probabilidad de ser escogido.
Son muestras en que los elementos a seleccionar se obtienen con base en la
probabilidad. Cada elemento de una poblacin tiene cierta probabilidad de ser elegido como
parte de la muestra.
Muestra Aleatoria Simple (Random Sample): Una muestra es seleccionada de modo que
todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos. De igual
manera, todas las muestras de tamao n tienen la misma posibilidad de ser elegidas. Las
muestras aleatorias simples se obtienen por muestreo con reemplazo en una poblacin finita
o por muestreo sin reemplazo en una poblacin sin reemplazo.
Una muestra aleatoria simple de n sujetos se selecciona de tal manera que toda posible
muestra de tamao n tenga la misma probabilidad de ser escogida.
Ejemplos:
Suponga que una poblacin consta de 845 empleados de un Empresa, de la cual se va a elegir
una muestra de 52 empleados. Una forma de asegurarse de que todos los empleados de la
poblacin tienen las mismas posibilidades de que se les elija consiste en escribir primero el
nombre de cada empleado en un papel y depositarlos todos en una caja. Despus de mezclar
todos los papeles, se efecta la primera seleccin tomando uno de la caja sin mirarlo. Se
repite este proceso hasta terminar de elegir la muestra de 52 empleados.
Se asume que una cadena nacional de comidas rpidas desea seleccionar aleatoriamente 5 de
los 50 estados de USA para tomar muestras sobre el gusto de los consumidores. Una muestra
aleatoria simple garantizar que las 50C5=2,118,760 muestras de tamao 5, tengan la misma
probabilidad de ser utilizadas en el estudio.
Muestreo Estratificado (Stratified Sampling): Subdividimos la poblacin en por lo menos
dos subpoblaciones (o estratos) distintas que comparten categoras (como gnero, edad,
departamento, tipo de industria, etc.), y luego sacamos una muestra de cada estrato. Se
obtienen mejores resultados cuando los elementos que los forman son lo ms parecido
posible.
Muestreo en el que la poblacin se divide en segmentos y se selecciona una muestra
para cada segmento.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 120
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

121
Ejemplos:
En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos
que hay 200 trabajadores en la Seccin A, 150 en la B, 150 en la C y 100 en la D.
SECCION
TRABAJADORES
p = 20/600
Seleccin

A
200
6.666666667
7

B
150
5
5

C
150
5
5

D
100
3.33333333
3

TOTAL
600
20

Por ejemplo, podemos estudiar los gastos en publicidad de las 352 empresas ms grandes de
Estados Unidos. Suponga que el objetivo del estudio consiste en determinar si las empresas
con altos rendimientos sobre el capital (una medida de rentabilidad) gastan en publicidad la
mayor parte del dinero ganado que las empresas con un de registro bajo rendimiento o
dficit. Suponga que deseamos seleccionar una muestra de 50 empresas para realizar el
estudio.

Estrato
1
2
3
4
5

Probabilidad
Recuperacin
de Capital
30% y ms
de 20% a 30%
de 10% a 20%
de 0% a 10%
Dficit

Proporcin
Nmero de Frecuencia
Nmero
Nmero
Empresas
Relativa Muestreado Muestreado
8
0.02
1.14
1
35
0.10
4.97
5
189
0.54
26.85
27
115
0.33
16.34
16
5
0.01
0.71
1
352
1.00
50.00
50

Si los tamaos de muestra de los distintos estratos reflejan la poblacin general,


decimos que tenemos un muestreo proporcional.
Muestra que se obtienen al estratificar el marco muestral y luego seleccionar un
nmero fijo de elementos de cada uno de los estratos pro promedio de una tcnica de
muestreo aleatorio simple.
Muestreo Proporcional: Muestra que se obtienen al estratificar el marco muestral y luego
seleccionar de cada estrato un nmero de elementos en proporcin al tamao de los estratos,
por medio de una tcnica de muestreo aleatorio simple.
Cuando se extrae una muestra aleatoria proporcional, el marco muestral se subdivide
en varios estratos y luego de cada estrato se extrae una submuestra. Una forma conveniente
de expresar el concepto de muestreo proporcional es establecer una proporcin. Por ejemplo,
uno de cada 150, le induce a seleccionar un (1) elemento por cada 150 elementos en el
estrato.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 121
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

122
Muestreo sistemtico (Systematic Sampling): Seleccionamos un punto inicial y luego
seleccionamos cada k-simo (digamos, cada quincuagsimo) elemento de la poblacin.
La tcnica sistemtica es fcil de describir y ejecutar; no obstante, conlleva algunos
peligros cuando el marco muestral es repetitivo o de naturaleza cclica. En estas condiciones,
puede que los resultados no se aproximen a una muestra aleatoria simple.
Este procedimiento de seleccin es muy til e implica elegir dentro de una poblacin N
un nmero n de elementos a partir de un intervalo K. Este ltimo (K) es un intervalo que se
va a determinar por el tamao de la poblacin y el tamao de la muestra. De manera que
tenemos que K = N/n, en donde K = un intervalo de seleccin sistemtica, N = la poblacin y
n = la muestra.
Antes de aplicar el muestreo aleatorio sistemtico, debe observar con cuidado el orden
fsico de la poblacin. Cuando el orden fsico se relaciona con la caracterstica de la
poblacin, no debe aplicar el muestreo aleatorio sistemtico.
Muestreo por cmulos o conglomerados (Clusters Sampling):
Muestreo que se obtiene al
muestrear algunas, pero no todas, las subdivisiones posibles que hay dentro de una
poblacin. Estas subdivisiones, denominadas conglomerados, a menudo ocurren de manera
natural dentro de la poblacin.
En el muestreo por conglomerados (o clusters) los elementos de la poblacin primero
se dividen en grupos separados, llamados conglomerados o clusters. Cada elemento
pertenece a uno y slo un conglomerado. Se toma una muestra aleatoria simple de los
conglomerados. Todos los elementos en cada conglomerado muestreado forman una
muestra.
Este muestreo tiende a proporcionar mejores resultados cuando los elementos dentro
de los conglomerados no son semejantes. Lo ideal es que cada conglomerado sea una
representacin, a pequea escala, de la poblacin completa.
Una de las principales aplicaciones del muestreo por conglomerados es el muestreo de
reas, en el que los conglomerados son las manzanas de una ciudad u otras zonas bien
definidas. A menudo se emplea para reducir el costo de muestrear una poblacin dispersa
en cierta rea geogrfica.
Por lo general, precisa tama
Primero dividimos el rea de la poblacin en secciones (o cmulos) y luego
seleccionamos aleatoriamente unas cuantas de esas secciones escogiendo todos los miembros
de las secciones seleccionadas.
Una diferencia importante entre el muestreo por cmulos y el estratificado es que en el
muestreo por cmulos se usan todos los miembros de cmulos seleccionados, mientras que
en el muestreo estratificado se usa una muestra de miembros de cada estrato.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 122
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

123
Muestreo de conveniencia o de juicio (Convenience Sampling): Simplemente utilizamos
resultados que ya estn disponibles.
Las muestras son elegidas con base en el hecho de que son tpicas.
Cuando se obtiene una muestra de juicio, la persona que elabora la muestra elige
unidades que considera representativas de la poblacin. La validez de los resultados de una
muestra de juicio refleja la solidez del juicio del recolector de datos.
Error de muestreo: Es la diferencia entre el resultado de una muestra y el verdadero
resultado de la poblacin; tal error es consecuencia de las fluctuaciones aleatorias de las
muestras.
Error de muestreo: Este error ocurre cuando los datos de una muestra se obtienen, registran o
analizan de forma incorrecta. Tal error es consecuencia de una equivocacin y no de una
fluctuacin aleatoria y predispuesta, cuando se usa un instrumento de medicin defectuoso,
cuando se hacen preguntas predispuestas en una encuesta, cuando mucha gente se niega a
responder o cuando se cometen errores al copiar los datos de la muestra.
Sesgo muestral: Tendencia a favorecer la eleccin de unos determinados elementos de la
muestra en detrimento de otros.
Este anlisis de las muestras conduce a distinguir entre las dos ramas principales del
anlisis estadstico: 1) Estadstica descriptiva o deductiva, y 2) Estadstica inferencial o
inductiva.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 123
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

124

Diseo y Direccin de un Estudio Muestral.


Fase I Planificacin
Identificacin y delimitacin de la Poblacin a estudiar.
o Enfoque del Estudio:
Cualitativo.
Cuantitativo.
Mixto.
Seleccin del Procedimiento de Observacin.
o Diseo y Construccin del Instrumento de Medicin (Cuestionarios, Escala de
medicin de actitudes, Observacin, Entrevistas, otros tipos).
o Seleccin de Instrumentos de Medicin.
Seleccin de tipo de muestreo.
o Muestreo Aleatorio Simple.
o Muestreo Sistemtico.
o Muestreo Estratificado (Estratos = Segmentos = Subpoblaciones).
o Muestreo por Conglomerados (Racimos = Clster = Secciones = Cmulos).
o Muestreo de Conveniencia.
o Otros: Muestra de Expertos, Muestra Caso-Tipo, Muestra por cuotas, etc.
Seleccin Procedimientos Estadsticos.
o Estimacin.
o Seleccin de Prueba Estadstica.
Determinar el Tamao necesario de la Muestra.
o Clculo de la Muestra.
o Viabilidad, Costo y Tiempo.
Fase II Recoleccin de Datos.
Seleccionar las unidades de anlisis de la muestra.
Realizar observaciones.
Administracin del Instrumento de Medicin.
o Auto-administrado.
o Por entrevista personal.
o Por entrevista telefnica.
Validez.
Confiabilidad o Fiabilidad.
Objetividad.
Fase III Anlisis de Datos y Conclusiones.
Seleccin de los programas estadsticos (Softwares: MegaStat - SPSS Minitab SPCXL
Stata SPCXL Otros) para analizar los datos.
Calcular las estadsticas de la Muestra (Estadsticas Descriptivas).
Estimar los valores de los parmetros de la poblacin (Puntuales, de intervalos).
Pruebas de Hiptesis en relacin a la Poblacin (Descriptivas, Correlacionales, Causales).
Anlisis paramtrico / Anlisis no paramtrico.
Anlisis multivariados.
Elaboracin del Reporte de Resultados.
LAPIN Lawrence L. Statistics for Modern Business. The Dryden Press: 1995.
ESTRELLA, Rubn Daro. Modelos Estadsticos para la Toma de Decisiones. Edicin 2016.
HERNANDEZ SAMPIERI Roberto, FERNANDEZ COLLADO Carlos and BAPTISTA LUCIO Pilar. Mtodos de
la Investigacin. Mc Graw Hill. Quinta Edicin. 2010.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 124
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

125

Fases del Diseo de Investigacin.


I.
II.

III.

IV.
V.

VI.
VII.

VIII.
IX.
X.
XI.

Seleccin y Definicin del Tema de Investigacin.


a. Qu estudiar?
Planteamiento, formulacin y sistematizacin del Problema de
Investigacin.
a. Cul es la situacin actual?
b. Cules son las preguntas de investigacin que deben ser
respondidas?
Objetivos de Investigacin.
i. Qu propsitos tiene la investigacin que se
plantea?
b. Objetivos Generales.
c. Objetivos Especficos
Justificacin de la Investigacin (Teora, Metodologa, Prctica).
a. Cules son los motivos para hacer el estudio propuesto?
Marco de Referencia (Terico Conceptual).
a. Quines han investigado anteriormente sobre el tema
planteado?
b. Qu hay escrito al respecto?
Hiptesis de Trabajo.
a. Qu se pretende probar?
Aspectos Metodolgicos de la Investigacin.
i. Cmo se va a realizar la investigacin??
b. Tipo de Estudio (Exploratorio, Descriptivo, Explicativo).
c. Mtodo de Investigacin (Observacin, Induccin,
Deduccin, Anlisis, Sntesis).
d. Tcnicas y Procedimientos para la recoleccin de la
informacin (Encuestas, etc.)
e. Tratamiento que se va a dar a la informacin.
Tabla de Contenido de la Investigacin.
Bibliografa
a. A qu fuentes escribas se va a referir el investigador?
Cronograma (tiempo para realizar la Investigacin).
a. Cunto tiempo va a emplear en hacer el estudio?
Presupuesto (Costos de la Investigacin).
a. Qu recursos se necesitan?

HERNANDEZ SAMPIERI Roberto, FERNANDEZ COLLADO Carlos and BAPTISTA LUCIO Pilar. Mtodos de
la Investigacin. Mc Graw Hill. Quinta Edicin. 2010.
MENDEZ Carlos. METODOLOGIA Gua para elaborar diseos de investigacin en ciencias econmicas,
contables y administrativas. Mc Graw Hill: Segunda Edicin, 2001.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 125
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

126

Elementos de una Propuesta de Investigacin.


1. Comunicacin de Propuesta.
2. Antecedentes.
3. Planteamiento del Problema y Objetivos de Investigacin.
4. Estrategia y Metodologa de Investigacin.
a. Sitio y Acceso.
b. Perfil Socioeconmico.
c. Potencial del mercado para el proyecto de investigacin.
Metodologa
a. Recoleccin de datos secundarios.
b. Recoleccin de datos primarios.
c. Tcnicas de anlisis de datos
5. Naturaleza del Reporte Final.
a. Introduccin.
b. Resumen para la Administracin.
c. Reconocimiento de las limitaciones del estudio.
d. Descripcin de la Metodologa.
e. Presentacin de Resultados.
f. Conclusiones y Recomendaciones.
g. Apndice
6. Presupuesto y Programa.
a. Costos directos (materiales y provisiones)
b. Costos directos (otro personal)
c. Cuota de consultora
d. Costo Total
e. Trminos
f. Marco de tiempo.
7. Antecedentes de los consultores.
DAVIS Duane. Investigacin en Administracin para la toma de decisiones. International
Thomson Editores: Quinta Edicin. 2001.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 126
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

127

El Proceso de Investigacin de Mercados.


I.
II.
III.
IV.
V.
VI.
VII.

VIII.

Identificacin del Problema y establecimiento de los Objetivos de la Investigacin.


Creacin del Diseo de la Investigacin.
Eleccin del Mtodo de Investigacin.
Seleccin del Procedimiento de Muestreo.
Recabar Datos.
Anlisis de los Datos.
Redaccin y Presentacin del Informe.
a. Pgina de ttulo (Presentacin).
b. Contenido.
c. Antecedentes y Objetivos.
d. Resumen Ejecutivo.
e. Metodologa.
f. Hallazgos.
g. Apndices.
Seguimiento.

El Proceso de Medicin.
I.
II.
III.
IV.
V.
VI.
VII.
VIII.

Identificar el concepto de inters (Utilizar el concepto para).


Desarrollar un constructo (Que se utiliza para crear).
Una definicin constitutiva (Que permite que un investigador desarrolle).
Una definicin operacional (Que permite que un investigador cree).
Una escala de medicin (Que requiere que el investigador).
Evale la confiabilidad y la validez de la escala (Si la evaluacin es satisfactoria, el
investigador).
Utiliza la Escala (Lo que conduce a).
Los hallazgos de la investigacin.

MCDANIEL Carl and GATES Roger. Investigacin de Mercados. CENGAGE Learning: Octava Edicin. 2011.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 127
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

128

Estimados y Tamao de Muestra (Estimates and Sample Sizes)


Estadstica Inferencial: Implica la utilizacin de una muestra para extraer alguna inferencia o
conclusin sobre la poblacin correspondiente.
- Apoyndose en el clculo de probabilidades y a partir de datos mustrales, efecta
estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de
datos.
La estadstica es inferencial cuando se derivan conclusiones generales para un conjunto
de datos ms amplio a partir de la informacin proporcionada por los datos estudiados.
Las dos aplicaciones principales de la estadstica inferencial implican el uso de datos
de muestra para (1) estimar el valor de un parmetro de poblacin y (2) llegar a una
conclusin acerca de una poblacin.
Estimador (Estimator): es una estadstica de muestra (como la media de muestra) que se usa
para aproximar un parmetro de poblacin.
Existen dos tipos de estimadores que se utilizan normalmente:
- Estimador puntual
- Estimador por intervalo
Estimado puntual (Point Estimate): es un valor individual (o punto) que se usa para
aproximar un parmetro de poblacin.
Estimador Puntual: utiliza un nmero nico o valor para localizar una estimacin del
parmetro.
La media de muestra es el mejor estimado de la media de poblacin.
Podemos decir que la media de la muestra es un estimador no predispuesto de la
media de la poblacin, lo que quiere decir que la distribucin de las medias de muestra tiende
a centrarse alrededor del valor de la media de la poblacin. (Es decir, las medias de muestra
no tienden a sobreestimar sistemticamente el valor de , y tampoco tienden a subestimar
sistemticamente dicho valor. En vez de ello, tienden a centrarse en el valor de misma).
Estimacin por intervalo (Interval Estimate): especifica el rango dentro del cual est el
parmetro desconocido.
Intervalo de Confianza (Confidence internal): denota un rango dentro del cual puede
encontrarse el parmetro.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 128
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

129
Es una gama (o un intervalo) de valores que probablemente contiene el valor
verdadero del parmetro de poblacin.
Un intervalo de confianza se asocia a un grado de confianza, que es una medida de la
certeza que tenemos de que nuestro intervalo contiene el parmetro de poblacin.
Nivel de confianza - grado o coeficiente de confianza (Level of Confidence or Confidence
Coefificient): es la probabilidad 1- (a menudo expresada como el valor porcentual
equivalente) de que el intervalo de confianza contiene el verdadero valor del parmetro.
Existen tres niveles de confianza relacionados comnmente con los intervalos de
confianza: 99, 95 y 90%, denominados coeficientes de confianza.
Valor Alfa : Es la probabilidad de error o la probabilidad de que un intervalo dado no
contenga la media poblacional desconocida.
Valor Crtico /2 (Critical Value): Es el nmero que est en la frontera que separa las
estadsticas de muestra que probablemente ocurrirn, de aquellas que probablemente no
ocurrirn. Es un puntaje con la propiedad de que separa un rea de /2 de la cola derecha
de la distribucin normal estndar.
Margen de Error (Margin of Error): Es la mxima diferencia probable (con una
probabilidad de 1-) entre la media de muestra observada y el verdadero valor de la media
de poblacin . El margen de error tambin se denomina error mximo de la estimacin y
puede obtenerse multiplicando el valor crtico y la desviacin estndar de las medias de
muestras.
= /2 * /n
= /2 * x'
Intervalo de confianza para estimar (media poblacional real desconocida) cuando es
conocido.
I.C. para estimar = X'
Caso I.
Para estimar el gasto promedio de los clientes en el McDonald's local, los estudiantes de
Mtodos Cuantitativos II toman una muestra de 200 clientes y encuentran un gasto promedio
de US$5.67, con una desviacin estndar poblacional de US$1.10. Cul es el intervalo de
confianza del 95% para los gastos promedio de todos los clientes? Interprete sus resultados.
Datos:
=/2*/n=1.96*1.10 /200=0.15
n=200
N.C.=95%
I.C. para estimar = X'
x'=US$5.67 I.C.=?
= US$5.670.15
=US$1.10
= US$5.52 US$5.82
Interpretacin del Caso:

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 129
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

130
Los estudiantes poseen un 95% de confianza de que la media poblacional desconocida
del gasto de los clientes del McDonal's evaluados se encuentra entre el intervalo US$5.52
US$5.82.
Si se construyen todos los NCn intervalos de confianza, el 95% de ellos contendr la
media poblacional desconocida. Esto por supuesto significa que el 5% de todos los intervalos
estara errado - no contendran la media poblacional, el Valor alfa .
Calculo del cuando se desconoce (desviacin estndar poblacional):
Si n > 30, podemos sustituir de la frmula del por la desviacin estndar de la
muestra s.
= /2 * s/n
= /2 * sx'
Procedimiento para construir un intervalo de confianza para (basado en una muestra
grande: n > 30).
1. Encuentre el valor critico /2 que corresponda al grado de confianza deseado.
2. Evale el margen de error = /2 * x'. Si se desconoce la desviacin estndar de la
poblacin , use el valor de la desviacin estndar de la muestra s, siempre que n > 30.
3. Con el valor del margen de error calculado y el valor de la media de muestra X', obtenga
los valores de X'- y X'+. Sustituya estos valores en el formato general del intervalo de
confianza:
X'- X'+
= X'
(X'-,X'+)
4. Redondee los valores resultantes aplicando la regla de redondeo.
Regla de Redondeo para intervalos de confianza empleados para estimar .
1. Si usa el conjunto de datos original para construir un intervalo de confianza, redondee los
lmites del intervalo de confianza a una posicin decimal ms que las empleadas en el
conjunto de datos original.
2. Si desconoce el conjunto de datos original y solo usa las estadsticas resumidas (n,x',s),
redondee los lmites del intervalo de confianza de acuerdo al mismo nmero de posiciones
decimales que se usan para la media de muestra.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 130
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

131
Justificacin: La idea bsica en que se apoya la construccin de intervalos de confianza tiene
que ver con el teorema del lmite central, que indica que en el caso de muestras grandes (n >
30), la distribucin de las medias de muestra es aproximadamente normal con media y
desviacin estndar /n. El formato de los intervalos de confianza en realidad es una
variacin de la ecuacin:
= (X' - )/(/n)
X' - = (/n)
- = (/n) - X' (-1)
= X' - (/n)
Precisin: Un intervalo estrecho ofrece mayor precisin, aunque la probabilidad de que
contenga se reduce.
Caso I.
Una muestra consiste en 75 televisores adquiridos hace varios aos.
Los tiempos de
reemplazo de esos televisores tienen una media de 8.2 aos y una desviacin estndar de 1.1
aos (basados en datos de "Getting Things Fixed", Consumer Reports). Construya un
intervalo de confianza del 90% para el tiempo de reemplazo medio de todos los televisores de
esa poca.
Caso II.
Utilice el grado de confianza y los datos de muestra dados para determinar (a) el margen de
error y (b) el intervalo de confianza para la media de la poblacin .
1. Estaturas de mujeres: confianza del 95%; n=50, x'=63.4 pulgs., s=2.4 pulgs.
2. Promedios de calificaciones: confianza del 99%; n=75, x'=2.76, s=0.88.
3. Puntajes en una prueba: confianza del 90%; n=150, x'=77.6; s=14.2.
Ejercicios de la Seccin 1 al 10 pgs. 175 y 176.
Estimacin de una proporcin de poblacin.
Las decisiones dependen con frecuencia de parmetros que son binarios, parmetros
con solo dos posibles categoras dentro de las cuales pueden clasificarse las respuestas. En
este evento, el parmetro de inters es la proporcin poblacional.
Tanto las proporciones como las probabilidades se expresan en forma decimal o fraccionaria.
Al trabajar con porcentajes, los convertimos en proporciones omitiendo el signo de por ciento
y dividiendo entre 100. Por ejemplo, la tasa del 48% de personas que no compran libros
puede expresarse en forma decimal como 0.487.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 131
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

132
Estimado puntual para la proporcin de poblacin.
La proporcin de muestra p es el mejor estimado puntual de la proporcin de
poblacin.
p = x/n
Proporcin de muestra de x xitos en una muestra de tamao n.
Intervalo de confianza para la proporcin poblacional.
Muchos asuntos de negocios tratan la proporcin de la poblacin . Una firma de
marketing puede querer averiguar si un cliente (1) compra o (2) no compra el producto. Un
banco con frecuencia debe determinar si un depositante (1) pedir o (2) no pedir un crdito
para auto. Muchas firmas deben determinar la probabilidad de que un proyecto para
presupuestar capital (1) generara o (2) no generara un rendimiento positivo.
Repasando:
p=
p = denota probabilidad de tener xito en uno de los n ensayos.
q = denota la probabilidad de fracasar en uno de los n ensayos.
p+q=1
p=1-q
q=1-p
n > 5
np > 5
n(1-) > 5
nq > 5
Si n y n(1-) son mayores que 5, la distribucin de las proporciones mustrales ser
normal y la distribucin muestral de la proporcin muestral tendr una media igual a la
proporcin poblacional y error estndar de:
Error estndar de la distribucin muestral
de las proporciones mustrales:
p = (1-)/n = pq/n
Estimacin del Error estndar de la distribucin muestral de las proporciones mustrales:
sp = p(1-p)/n = pq/n

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 132
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

133
Margen de error del estimado de la proporcin de la poblacin:
E = ()(pq/n)
Regla de redondeo para estimados de intervalo de confianza para la proporcin de
poblacin
Redondee los lmites del intervalo de confianza a tres dgitos significativos.
Intervalo de confianza para estimar la proporcin poblacional.
I.C. para estimar la
proporcin poblacional

=pE

Caso I.
En una encuesta de 1068 estadounidenses, 673 dijeron que tenan contestadoras
telefnicas (basados en datos de International Mass Retail Association, informados en USA
Today). Utilizando estos resultados de muestra, determine:
a. El estimado puntual de la proporcin de la poblacin de todos los estadounidenses que
tienen contestadora telefnica.
b. El estimado de intervalo del 95% de la proporcin de todos los estadounidenses que tienen
contestadora telefnica.
a. Estimado puntual para la proporcin de poblacin.
p = x/n = 673/1068 = 0.630
b. Intervalo de confianza para estimar la proporcin poblacional.
E = ()(pq/n)
E = 1.96 ((0.630)(0.370)/1068) = 0.0290
I.C. para estimar la
proporcin poblacional

=pE

0.630 - 0.0290 < < 0.630 + 0.0290


0.601 < < 0.659
Este resultado a menudo se informa en el formato siguiente: "Se estima que el porcentaje de
los estadounidenses que tiene contestadora telefnica es del 63%, con un margen de error de
ms o menos 2.9 puntos porcentuales. Tambin debe informarse el nivel de confianza, pero
eso casi nunca se hace en los medios de comunicacin.
EJERCICIOS DE LA SECCION 20 AL 25 - PAG. 182.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 133
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

134

Distribucin t de Student
Los factores como el costo y el tiempo a menudo limitan severamente el tamao de las
muestras, y es posible que la distribucin normal no sea una aproximacin adecuada a la
distribucin de las medias de muestras pequeas.
En muestras pequeas, la media de muestra X' generalmente es el mejor estimado
puntual de la media de la poblacin .
Es posible construir intervalos de confianza para muestras pequeas utilizando la
distribucin normal con el mismo margen de error, siempre que la poblacin original tenga
una distribucin normal y se conozca la desviacin estndar de la poblacin (condicin que
casi nunca se cumple en aplicaciones reales).
Si tenemos una muestra pequea (n30) y queremos construir un intervalo de
confianza pero no conocemos , a veces podemos usar la Distribucin t de Student ideada
por Willian Gosset (1876-1937). Gosset era un empleado de la cervecera Guiness que
necesitaba una distribucin susceptible de usarse con muestras pequeas. La cervecera
donde trabajaba no permita la publicacin de los resultados de investigaciones, as que
Gosset publico bajo el pseudnimo Student.
Condiciones para usar la Distribucin t de Student.
1.- La muestra es pequea (n30).
2.- Se desconoce .
3.- La poblacin padre tiene una distribucin esencialmente normal. (Dado que a menudo se
desconoce la distribucin de la poblacin padre, la estimamos construyendo un histograma
con datos de muestra.)
Propiedades importantes de la Distribucin t de Student.
1.- La distribucin t de Student es diferente para los diferentes tamaos de muestra. (Ver
Figura 7.3 en la Pg. 177).
2.- La distribucin t de Student tiene la misma forma general de campana simtrica que la
distribucin normal estndar, pero refleja la mayor variabilidad (con distribuciones ms
amplias) que cabe esperar cuando la muestra es pequea.
3.- La distribucin t de Student tiene una media t=0 (as como la distribucin normal estndar
tiene una media de Z=0).

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 134
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

135
4.- La desviacin estndar de la distribucin t de Student varia con el tamao de la muestra,
pero es mayor que 1 (a diferencia de la distribucin normal estndar, que tiene =1).
Al igual que la distribucin Z, la distribucin t tiene una media de cero, es simtrica
respeto a la media y oscila entre - y + . Sin embargo, mientras que la distribucin Z tiene
una varianza de =1, la varianza de la distribucin t es mayor que 1.
5.- A medida que aumenta el tamao de muestra n, la distribucin t de Student se acerca ms
a la distribucin normal estndar. Con valores de n > 30, las diferencias son tan pequeas
que podemos utilizar los valores crticos de z en lugar de crear una tabla mucho ms grande
de valores crticos de t.
Varianza de la distribucin t

= (n-1)/(n-3)
La varianza depende de los grados de libertad (g.l.), que definimos como el nmero de
observaciones que se pueden escoger libremente. Es el nmero de observaciones menos el
nmero de restricciones impuestas sobre las observaciones, en donde una restriccin es algn
valor que tales observaciones deben poseer.
Grados de libertad.
El nmero de grados de libertad de un conjunto de datos corresponde al nmero de
puntajes que puede variar despus de haber impuestos ciertas restricciones a todos los
puntajes.
Es el nmero de observaciones menos el nmero de restricciones impuestas sobre tales
observaciones.
g.l. = n - 1
Podra parecer un poco extrao que, con una poblacin distribuida normalmente, a
veces utilicemos la distribucin t para encontrar valores crticos, pero cuando se desconoce
el uso de s de una muestra pequea incorpora otra fuente de error. A fin de mantener el grado
de confianza deseado, compensamos la variabilidad adicional ensanchando el intervalo de
confianza mediante un proceso que sustituye el valor crtico Z por el valor crtico ms grande
de t.
El estadstico t
t = (X'-)/(s/n)

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 135
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

136
Caso I.
Cuando se usan pruebas destructivas, los elementos de una muestra se destruyen durante el
proceso de probarlos. Las pruebas de choques de automviles son un ejemplo muy costoso
de pruebas destructivas.
Si usted estuviera encargado de tales pruebas de choque, no querra decirle a su
supervisor que necesita chocar y destruir ms de 30 automviles para poder usar la
distribucin normal. Supongamos que usted ha probado 12 automviles deportivos Dodge
Viper (Precio d lista actual: US$59,300 dlares) chocndolos en diversas condiciones que
simulan colisiones representativas. Un anlisis de los 12 automviles daados da como
resultado costos de reparacin cuya distribucin al parecer tiene forma de campana, con una
media de X'=US$26,227 y una desviacin estndar de s=$15,873 (basado en datos de Highway
Loss Data Institute). Determine lo siguiente.
a) El mejor estimado puntual de la media de poblacin , el costo de reparacin medio de
todos los Dodge Viper implicados en colisiones.
b) El estimado de intervalo del 95% de , el costo de reparacin medio de todos los Dodge
Viper implicados en colisiones.
Solucin:
a) El mejor estimado puntual de la media de poblacin es el valor de la media de muestra
X'. En este caso, entonces, el mejor estimado puntual de es US$26,227 dlares.
b) DATOS:
n = 12 automviles deportivos Dodge Viper
X'=US$26,227 dlares costo de reparacin
s =US$15,873 dlares
N.F.= 95% ===> t= ?
I.C. para = ?
Dada las condiciones anteriores:
1.- La muestra es pequea (n30).
2.- Se desconoce .
3.- La poblacin padre tiene una distribucin esencialmente normal. (Dado que a menudo se
desconoce la distribucin de la poblacin padre, la estimamos construyendo un histograma
con datos de muestra.)
podemos usar la Distribucin t de Student:
g.l. = grados de libertad
g.l. = n-1 = 12-1 = 11
usando la tabla de la distribucin t (Pg. 606) con los g.l.=11 y N.C.=95% cuyas colas
equivalen a 5% (0.05) determinamos el valor critico t.
g.l.=11; I.C. con N.C.=95% (0.950); dos colas=5% (0.050) ==> t=2.201
donde E = t (s/n)
E = 2.201 (15,873/12) = US$10,085.29
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 136
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

137
El intervalo de confianza es:
X' - E < < X' + E
US$26,227-US$10,085.29< < US$26,227+US$10,085.29
US$16,142 < < US$36,312
[Este resultado tambin podra expresarse en el formato de =US$26,227US$10,085.29 o
como (US$16,142, US$36,312).]
Con base en los resultados de muestra dados, tenemos un 95% de confianza en que los
limites de USD16,142 y USD36,312 contendrn realmente el valor de la media de poblacin .
Estos costos de reparacin parecen muy altos. Efectivamente, el Dodge Viper es actualmente
el automvil ms costoso de reparar despus de una colisin. Tal informacin es importante
para compaas que aseguran Dodge Vipers contra choques.
Caso II. Utilice el grado de confianza y los datos de muestra dados para determinar (a) el
margen de error y (b) el intervalo de confianza para la media de la poblacin .
1) Estaturas de mujeres: confianza del 95%; n=10, x'=63.4 pulgadas, s=2.4 pulgadas.
2) Promedios de calificaciones: confianza del 99%; n=15, x'=2.76, s=0.88
3) Puntajes en una prueba: confianza del 90%; n=16, x'=77.6, s=14.2
4) Salarios de policas: confianza del 92%; n=19, x'=$23,228, s=$8,779
Caso III.
Ejercicios 12 al 18 Pgs. 179-180 y Analizar figura 7.4 Pg. 179.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 137
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

138

Determinacin del tamao apropiado de la muestra (Sample Sizes)


El tamao de la muestra juega un papel importante al determinar la probabilidad de
error as como en la precisin de la estimacin.
Una vez se ha seleccionado el nivel de confianza, los factores importantes influyen en
el tamao muestral:
(1) la varianza de la poblacin y
(2) el tamao del error tolerable que el investigador est dispuesto a aceptar.
Tamao de la muestra para estimar .
= (X' - )/x'
= (X' - )/(/n)
X' - = (/n)
n(X' - ) =
n = /(X' - )
n = /(X' - )
n = [/E]
E = Error de Muestreo
El tamao de la muestra debe ser entero.
Regla de redondeo para el tamao de muestra n.
Al calcular el tamao de muestra n, si la formula anterior no produce un numero
entero, siempre debe aumentarse el valor de n al siguiente numero entero mayor.
El tamao de la muestra no depende del tamao de la poblacin (N); el tamao de
muestra depende del grado de confianza deseado, el margen de error deseado y del valor de la
desviacin estndar .
La duplicacin del margen de error hace que el tamao de la muestra requerida se
reduzca a la cuarta parte de su valor original. Por otro lado, si se reduce a la mitad el
margen de error se cuadruplicara el tamao de la muestra. Lo que esto implica es que si
queremos resultados ms exactos, es preciso aumentar sustancialmente el tamao de la
muestra.
Dado que las muestras grandes generalmente requieren ms tiempo y dinero, a menudo
es necesario efectuar un trueque entre el tamao de la muestra y el margen de error E.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 138
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

139
Caso I.
Un economista desea estimar los ingresos medios durante el primer ao de trabajo de un
graduado universitario que, en un alarde de sabidura, tomo un curso de estadstica.
Cuantos de tales ingresos es necesario encontrar si queremos tener una confianza del 95% en
que la media de muestra este a menos de US$500 dlares de la verdadera media de la
poblacin? Suponga que un estudio previo revelo que, para tales ingresos, =US$6250.
DATOS:
N.C.=95% ===> Z=1.96
Queremos que la media de la muestra este dentro de un margen de US$500 de la media de
la poblacin.
E=US$500
=US$6,250
n = /(X' - )
n = [(1.96)*(6250)]/(500)=
n = [/E]
n = [(1.96 * 6250)/500]=
Caso II.
Qu tan grande se requiere que sea una muestra para que proporcione una estimacin del
90% del nmero promedio de graduados de las universidades de la nacin con un error de
2000 estudiantes si una muestra piloto reporta que s=8,659?
Caso III.
Nielsen Media Research quiere estimar la cantidad media de tiempo (en horas) que los
estudiantes universitarios de tiempo completo dedican a ver televisin cada da entre
semana. Determine el tamao de muestra necesario para estimar esa media con un margen
de error de 0.25 horas (15 minutos). Suponga que se desea un grado de confianza del 96%, y
que un estudio piloto indico que la desviacin estndar se estima en 1.87 horas.
QUE PASA SI SE DESCONOCE ?
1.- Podemos utilizar la REGLA PRACTICA DE INTERVALO.
En conjuntos de datos representativos, el intervalo del conjunto tiene una anchura
aproximada de cuatro desviaciones estndar (4s), as que la desviacin estndar se puede
aproximar de la siguiente manera:
desviacin estndar intervalo/4
intervalo/4
Esta expresin proporciona una estimacin burda de la desviacin estndar, si
conocemos los puntajes mximo y mnimo. Si conocemos el valor de la desviacin estndar,
podemos usarlo para entender mejor los datos, obteniendo estimaciones burdas de los
puntajes mximo y mnimo como se indica.
2.- Realizar un estudio piloto iniciando el proceso de muestreo. Con base en la primera
recoleccin de por lo menos 31 valores de muestra seleccionados al azar, calculamos la
desviacin estndar de la muestra s y la usamos en lugar de . Este valor puede refinarse a
medida que se obtengan ms datos de muestra.
mnimo (media) - 2 * (desviacin estndar)
mximo (media) + 2 * (desviacin estndar)
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 139
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

140
Caso I.
Si razonamos que los precios de los libros de textos universitarios tpicamente varan entre
US$10 y US$90 dlares.
Usted planea estimar el precio de venta medio de un libro de texto universitario. Cuntos
libros de textos deber muestrear si desea tener una confianza del 95% en que la media de la
muestra estar a menos de US$2 dlares de la verdadera media de la poblacin ?
DATOS:
intervalo/4
(US$90-US$10)/4 US$20
N.C.=95% ===> Z=1.96
E=US$2 dlares
n = /(X' - )
n = [(1.96)*(20)]/(2)=
n = [/E]
n = [(1.96 * 20)/2]=
Caso II.
Boston Marketing Company lo acaba de contratar para realizar una encuesta con el fin de
estimar la cantidad media de dinero que los asistentes al cine de Massachussets gastan (por
pelcula). Primero use la regla prctica del intervalo para hacer un estimado burdo de la
desviacin estndar de las cantidades gastadas. Es razonable suponer que las cantidades
tpicas varan entre US$3 dlares y unos US$15 dlares. Luego utilice esa desviacin estndar
para determinar el tamao de muestra que corresponde a una confianza del 98% y a un
margen de error de 25 centavos de dlar.
Tamao de la muestra para estimar la proporcin poblacional.
Si despejamos a "n" de la expresin del margen de error E.
E = ()(pq/n)
E = ()(pq/n)
E = ()(pq/n)
En = ()(pq)
n = [()(pq)]/E
Cuando se puede obtener un estimado razonable de p utilizando muestras previas, un estudio
piloto o los conocimientos de algn experto se utiliza la formula anterior.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 140
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

141
Cuando no se conoce el estimado puntual p:

n = [()* 0.25]/E

Si no se puede conjeturarse un valor, puede asignarse el valor de 0.5 tanto a p como a q, con
lo que el tamao de muestra resultante ser al menos tan grande como necesita ser. La
justificacin para la asignacin de 0.5 es la siguiente: el valor ms alto posible del producto
p*q es de 0.25, y ocurre cuando p=0.5 y q=0.5 como se puede observar en la siguiente tabla que
usted debe completar:
p
q
p*q
0.1
0.9
0.09
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Caso I.
Las compaas de seguros se estn preocupando porque el creciente uso de telfonos
celulares est teniendo como resultado un mayor nmero de accidentes automovilsticos, y
estn considerando implementar tarifas ms altas para conductores que usan tales aparatos.
Queremos estimar, con un margen de error de tres puntos porcentuales, el porcentaje de
conductores que hablan por telfono mientras conducen. Suponiendo que queremos tener
una confianza del 95% en nuestros resultados, cuantos conductores debern encuestar?
a. Supongamos que tenemos un estimado de p basado en un estudio previo que indic que el
18% de los conductores habla por telfono (basados en datos de la revista Prevention).
b. Suponga que no tenemos informacin previa que sugiera un posible valor de p.
SOLUCION:
a) DATOS:
p=0.18
q=0.82
N.F.=95% ==> Z=1.96
E=0.03 = tres puntos porcentuales
n = [()(pq)]/E
n = [(1.96)(0.18*0.82]/(0.03)
n=
b) DATOS:
N.F.=95% ==> Z=1.96
E=0.03 = tres puntos porcentuales
n = [()* 0.25]/E
n = [(1.96)* 0.25]/(0.03)
n=
Si comparamos estos dos resultados de tamao de muestra vemos que, si no tenemos
conocimiento de un estudio anterior, se requiere una muestra ms grande para obtener los
mismos resultados que cuando se puede estimar el valor de p.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 141
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

142
Caso II.
Una compaa de comunicaciones est considerando un proyecto para prestar servicio
telefnico de larga distancia. Se le pide a usted realizar un sondeo de opinin para estimar el
porcentaje de los consumidores que est satisfecho con su servicio telefnico de larga
distancia actual. Usted quiere tener una confianza del 90% en que su porcentaje de muestra
estar a menos de 2.5 puntos porcentuales del valor real para la poblacin, y un sondeo
sugiere que el porcentaje en cuestin anda alrededor del 85%. Qu tan grande deber ser la
muestra?
Caso III.
Planeta Azul proporciona agua embotellada, en contenedores de 15 galones, a las casas de un
sector del Distrito Nacional. El gerente desea estimar el nmero promedio de contenedores
que una casa tpica utiliza cada mes. Se toma una muestra de 75 casas y se registra el nmero
de contenedores. La media es 3.2, con una desviacin de 0.78.
a. Qu revelara un intervalo de confianza del 92%?
b. Sin embargo, el gerente siente que el intervalo anterior es demasiado amplio.
Cuntas casas deben tomar como muestra para estar 99% seguro de que el intervalo
no estar errado en ms de 0.10 contenedores?
c. Se selecciona una muestra pequea de 10 casas para estimar el nmero promedio de
miembros de la familia por casa. Los resultados son 1,3,4,7,2,2,3,5,6 y 6 personas en
cada casa. Cules son los resultados de un intervalo de 99% para el nmero
promedio de miembros de la familia?
d. De las 75 casas de la muestra, 22 tienen ablandadores de agua en casa. Cul es el
estimado del intervalo del 95% de la proporcin de todas las casas del sector que tiene
ablandadores?
e. Si el intervalo oscila entre el 18.8% y el 39.2% de todas las casas que tienen
ablandadores y carece de precisin, qu tan grande debe tomarse una muestra para
producir un intervalo de slo el 10%?
Caso IV.
Se pidi a 200 personas de una muestra identificar su principal fuente de informacin de
noticias; 110 dijeron que esa fuente es los noticiarios televisivos.
a. Cul es el estimado puntual de la proporcin poblacional?
b. Determine un intervalo de confianza de 95% para la proporcin de las personas en la
poblacin que consideran a la televisin como su principal fuente de informacin
noticiosa. Interprete los resultados.
a. Qu tamao debe tener una muestra para estimar la proporcin de la poblacin, con
un margen de error igual a 0.05 y un nivel de confianza de 95%?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 142
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

143
Caso V.
Al ensayar un nuevo mtodo de produccin, se seleccionaron 18 empleados al azar, y se les
pidi lo probaran. La tasa de produccin promedio muestral para los 18 empleados fue 80
partes por hora, y la desviacin estndar muestral fue de 10 partes por hora. Suponiendo que
la poblacin tiene una distribucin de probabilidad normal.
a. Determine un intervalo de confianza de 90% de la tasa de produccin promedio
poblacional con el nuevo mtodo, Interprete los resultados y Represente
grficamente.
b. Construya un intervalo de confianza de 95% de la tasa de produccin promedio
poblacional con el nuevo mtodo, Interprete los resultados y Represente
grficamente.
c. Construya un intervalo de confianza de 99% de la tasa de produccin promedio
poblacional con el nuevo mtodo, Interprete los resultados y Represente
grficamente.
d. Cul es estimado puntual de la tasa de produccin promedio poblacional con el
nuevo mtodo?
Caso VI.
Media Metrix, Inc., vigila a los usuarios de Internet en siete pases: Australia, Gran Bretaa,
Canad, Francia, Alemania, Japn y Estados Unidos. Segn las cifras de medicin recientes,
los usuarios estadounidenses ocupan el primer lugar en el uso de Internet con un promedio
de 13 horas por mes. Suponga que en un estudio de seguimiento en el participaron 145
usuarios de Internet canadienses, la media muestral fue de 10.8 horas por mes y la desviacin
estndar muestral fue de 9.2 horas.
a. Formule las hiptesis nula y alternativa que servirn para determinar si los datos de la
muestra sustentan la conclusin de que los usuarios de Internet canadienses tienen una
media poblacional menor que el promedio estadounidenses de 13 horas por mes.
b. Con un nivel de significancia de 0.01 Cul es el valor crtico para comprobar la
estadstica de prueba, y cul es la regla de rechazo?
c. Basado en la estadstica de prueba y regla de decisin la informacin es correcta?
d. Interprete los resultados, de sus conclusiones.
e. Represente grficamente la situacin.
Caso VII.
Una compaa de comunicaciones esta considerando un proyecto para prestar servicio
telefnico de larga distancia. Se le pide a usted realizar un sondeo de opinin para estimar el
porcentaje de los consumidores que esta satisfecho con su servicio telefnico de larga
distancia actual. Usted quiere tener una confianza del 90% en que su porcentaje de muestra
estar a menos de 2.5 puntos porcentuales del valor real para la poblacin, y un sondeo
sugiere que el porcentaje en cuestin anda alrededor del 85%. Que tan grande deber ser la
muestra?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 143
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

144
Estimadores y Estimaciones.
Un estimador es el proceso mediante el cual se obtiene la estimacin. Una estimacin
es el resultado numrico del estimador.
Estimador: es una estadstica de muestra (como la media de muestra) que se usa para
aproximar un parmetro de poblacin.
Existen dos tipos de estimadores que se utilizan normalmente:
- Estimador puntual
- Estimador por intervalo
Estimado puntual: es un valor individual (o punto) que se usa para aproximar un parmetro
de poblacin.
Estimador Puntual: utiliza un nmero nico o valor para localizar una estimacin del
parmetro.
La media de muestra es el mejor estimado de la media de poblacin.
Podemos decir que la media de la muestra es un estimador no predispuesto de la
media de la poblacin, lo que quiere decir que la distribucin de las medias de muestra tiende
a centrarse alrededor del valor de la media de la poblacin. (Es decir, las medias de muestra
no tienden a sobreestimar sistemticamente el valor de , y tampoco tienden a subestimar
sistemticamente dicho valor. En vez de ello, tienden a centrarse en el valor de misma).
Estimacin por intervalo: especifica el rango dentro del cual est el parmetro desconocido.
Intervalo de Confianza: denota un rango dentro del cual puede encontrarse el parmetro.
Los Estimadores deben ser:
1) Insesgados
2) Eficientes
3) Consistentes
4) Suficientes
Estimador Insesgado. Un estimador es insesgado si la media de su distribucin muestral es
igual al parmetro correspondiente.
E(') =
= al parmetro que se intenta estimar
'= estimador
E(X') = X" =
E(X') - = 0
X"= estndar de las medias mustrales.
Si E(X') - 0 , si excede es un estimador sesgado (hacia arriba).
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 144
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

145
REPASO:
Distribuciones de Datos Sesgadas.
Una distribucin de datos esta sesgada, si no es simtrica y se extiende ms hacia un
lado que hacia otro.
Sesgo describe la falta de simetra en una distribucin.

Los datos sesgados a la izquierda se dice que tienen sesgo negativo; la media y la
mediana estn a la izquierda de la moda. Generalmente tiene la media a la izquierda de la
mediana.
Sesgo negativo describe distribuciones asimtricas en la que la mediana excede a la media; la
cola de la distribucin es hacia los valores bajos.
Los datos sesgados a la derecha se dice que tienen sesgo positivo; la media y la
mediana estn a la derecha de la moda.
Sesgo positivo describe distribuciones asimtricas en las que la media excede la mediana; los
valores se alargan hacia los valores altos.
En ambos casos, la moda es por definicin la observacin que ocurre con mayor
frecuencia, por tanto esta en el pico de la distribucin.
Coeficiente de Sesgo de Pearson.
P = 3 (Media - Mediana)
s
Si P < 0, los datos estn sesgados a la izquierda.
Si P > 0, los datos estn sesgados a la derecha.
Si P = 0, los datos estn distribuidos normalmente.
Estimador Eficiente.
La eficiencia de un estimado depende de su varianza.
'1 y '2 son dos estimadores insesgados, pero ser un estimador eficiente aquel cuya
varianza en muestreo repetidos con un tamao muestral dado es menor.
Varianza de la Distribucin Muestral de las Medias Mustrales:
x'=(X'-X")/K
Si '1 es un estimador eficiente en relacin a '2, la varianza de la distribucin muestral
de '1 es menor que la de '2. Los valores posibles para '2 estn ms dispersos.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 145
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

146
Estimador consistente.
Un estimador es consistente si, a medida que n aumenta, el valor del estadstico se
aproxima al parmetro.
Para que un estimado sea consistente, debe ser insesgado y su varianza debe
aproximarse a cero a medida que n aumenta. La varianza de la distribucin muestral de las
medias mustrales es x' es /n.
A medida que n aumenta, x' se aproximara a cero. Por tanto, se puede decir que X'
es un estimador consistente de .
Estimador suficiente.
Un estimador es suficiente si utiliza toda la informacin relevante sobre el parmetro
contenido en la muestra. Es decir, ningn otro estimador puede proporcionar ms
informacin sobre el parmetro.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 146
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

147
Prueba de Hiptesis (Hypothesis Testing - STOH Statistical Test of Hipothesis)
Las hiptesis indican lo que estamos buscando o tratando de probar y pueden definirse como
explicaciones tentativas del fenmeno investigado formuladas a manera de proposiciones.
Las hiptesis no necesariamente son verdaderas, pueden o no serlo, pueden o no comprobarse
con hechos. Son explicaciones tentativas, no los hechos en s.
Dentro de la investigacin cientfica, las hiptesis son proposiciones tentativas acerca de las
relaciones entre dos o ms variables y se apoyan en conocimientos organizados y sistematizados.
Una hiptesis en el contexto de la estadstica inferencial es una proposicin respecto a uno o
varios paramtros, y lo que el investigador hace por medio de la Prueba de Hiptesis es determinar si la
hiptesis poblacional es congruente con los datos obtenidos en la muestra (Wiersma y Jurs, 2008;
Gordon, 2010).
Una hiptesis de investigacin establece las expectativas del investigador. Es una
declaracin tentativa acerca de un fenmeno. Con mucha frecuencia es un pensamiento bien
fundamentado, basado en una teora o en un modelo o derivado de la fase exploratoria de la
investigacin. Para que sea til, debe apoyarse en una prueba estadstica de hiptesis y una
defensa lgica fundamentada en los datos recolectados. La hiptesis de investigacin se
deriva directamente de una definicin de problema bien meditada y especificada. Una
hiptesis de investigacin debe ser declaratoria y operacional, as como reflejar una
posibilidad de solucin basada en cierto conocimiento, investigacin previa o necesidades
identificadas de la poblacin en estudio. Sin embargo, y an ms importante, una hiptesis
de investigacin tiene que ser probable.
Sampieri H., Roberto. "Metodologa de la Investigacin". McGraw Hill: Quinta Edicin. 2010
BEST SELLER INTERNACIONAL.
DAVIS Duane. Investigacin en Administracin para la toma de decisiones. International
Thomson Editores: Quinta Edicin. 2001.
Hiptesis nulas son, en cierto modo, el reverso de las hiptesis de investigacin. Tambin
constituyen proposiciones acerca de la relacin entre variables; que sirven solo para refutar o
negar lo que afirma la hiptesis de investigacin.
Hiptesis alternativas, como su nombre lo indica, son posibilidades "alternas" ante las
hiptesis de investigacin y nula: Ofrece otra descripcin o explicacin distintas a las que
proporcionan estos tipos de hiptesis.
Si la hiptesis de investigacin establece: "esta silla es roja", y podran formularse una o
ms hiptesis alternativas: ""esta silla es azul", "esta silla es verde", "esta silla es amarilla",
etctera.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 147
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

148
Hiptesis estadsticas son las transformaciones de las hiptesis de investigacin, nulas y
alternativas en smbolos estadsticos. Se pueden formular solo cuando los datos del estudio
que se van a recolectar y analizar para probar o rechazar las hiptesis son cuantitativos
(nmeros, porcentajes, promedios). Es decir, el investigador traduce su hiptesis de
investigacin y su hiptesis nula (y cuando se formulan hiptesis alternativas, tambin estas)
en trminos estadsticos.
En estadstica, una hiptesis es una afirmacin o declaracin que se hace acerca de una
propiedad de una poblacin.
Componentes de una Prueba de Hiptesis.
Hiptesis nula - denotada por Ho (Null Hypothesis) es una declaracin acerca del valor de
un parmetro de poblacin (como la media) y debe contener la condicin de igualdad escrita
con el smbolo =, o . (Al efectuar realmente la prueba, operaremos bajo el supuesto de que
el parmetro es igual a algn valor especfico.) En el caso de la media, la hiptesis nula se
expresara en una de estas tres posibles formas:
Ho: = algn valor
Ho: algn valor
Ho: algn valor
Por ejemplo, la hiptesis nula que corresponde a la creencia comn de que la temperatura
corporal media es 98.6F se expresa como Ho:=98.6. Probamos la hiptesis nula
directamente en el sentido de que suponemos que es verdad y llegamos a una conclusin que
puede ser rechazar Ho o bien en no rechazar Ho.
Nunca se puede aceptar la hiptesis nula como verdadera. El no rechazo de la hiptesis nula
solamente significa que la evidencia muestral no es lo suficientemente fuerte como para llegar
a su rechazo.
Antes que se rechace la hiptesis nula, la media muestral debe diferir
significativamente de la media poblacional planteada como hiptesis. Es decir, que la
evidencia debe ser muy convincente y concluyente. Una conclusin con base en un rechazo
de la hiptesis nula es ms significativa que una que termine en una decisin de no rechazo.
Diferencia estadsticamente insignificante
En la diferencia entre el valor de la media poblacional bajo la hiptesis y el valor de la
media muestral que es lo suficientemente pequea como para atribuirla a un error de
muestreo.
Hiptesis Alternativa - denotada por Ha (Alternative Hypothesis) es la declaracin que
debe ser verdad si la hiptesis nula es falsa. En el caso de la media, la hiptesis alternativa se
expresara en una de tres posibles formas:
Ha: algn valor
Ha: > algn valor
Ha: < algn valor
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 148
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

149
Obsrvese que Ha es lo contrario de Ho. Por ejemplo, si Ho se da como =98.6, se sigue que
la hiptesis alternativa est dada por Ha98.6.
Errores Tipo I y Tipo II.
Al probar una hiptesis nula, llegamos a una conclusin de rechazarla o no rechazarla.
Tales conclusiones a veces son correctas y a veces equivocadas. Hay dos tipos de errores que
podemos cometer.
Error Tipo I.
El error de rechazar la hiptesis nula, dado que es verdadera.
La probabilidad de cometer un error tipo I es igual al nivel de significancia, o valor
en el que se prueba la hiptesis.
Error Tipo II.
Es no rechazar una hiptesis nula que es falsa. Usamos el smbolo para representar
la probabilidad de error tipo II.
Para el responsable de las decisiones administrativas, cometer un error al depender de una
propuesta de decisin dbilmente comprobada podra significar prdidas importantes para la
empresa. De igual manera, una decisin equivocada tambin significara la prdida de
oportunidades. El tomador de decisiones suele estar ms consciente de las prdidas de
efectivo que de las prdidas de oportunidades porque las primeras son ms visibles. Es por
esto que la mayora de los investigadores y los gerentes se esfuerzan por evitar un error tipo I.
Como controlar los errores tipo I y tipo II. Consideraciones prcticas que podran ser
pertinentes:
1. Para cualquier fija, un aumento en el tamao de muestra n hace que disminuya. Es
decir, una muestra ms grande reduce la posibilidad de cometer el error de no rechazar la
hiptesis nula, dado que en realidad es falsa.
2. Para cualquier tamao de muestra fijo n, una disminucin de causar un incremento en
. Por otra parte, un incremento en causar una disminucin en .
3. Si queremos reducir tanto como , deberemos aumentar el tamao de muestra.
Estadstica de Prueba.
Una estadstica de muestra o un valor basado en los datos de una muestra. Se utiliza
una estadstica de prueba para tomar la decisin de rechazar o no la hiptesis nula.
= (X' - )/(/n)
= (X' - )/(s/n)
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 149
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

150
Regin critica. El conjunto de todos los valores de la estadstica de prueba que nos haran
rechazar la hiptesis nula.
Valor crtico. El valor o valores que separan la regin crtica de los valores de la estadstica de
prueba que no nos haran rechazar la hiptesis nula. Los valores crticos dependen de la
naturaleza de la hiptesis nula, la distribucin de muestreo pertinente y el nivel de
significancia .
Prueba de dos colas para
Hay cuatro pasos involucrados en una prueba:
Paso 1: Plantear las hiptesis.
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z.
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z.
Paso 4: Interpretacin y conclusiones.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 150
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

151
Caso I.
Como gerente de compras de una gran empresa de seguros usted debe decidir si actualizar o
no los computadores de la oficina. A usted se le ha dicho que el costo promedio de los
computadores es de US$2,100. Una muestra de 64 minoristas revela un precio promedio de
US$2,251, con una desviacin estndar de US$812. A un nivel de significancia del 5% parece
que su informacin es correcta?
Datos:
Ho:=US$2,100
n=64 minoristas
X'=US$2,251 precio promedio (de los computadores)
de la muestra
s=US$812
=5%=0.05 (nivel de significancia)
Paso 1: Plantear las hiptesis.
El gerente de compra desea probar la hiptesis de que la media poblacional es =US$2,100
bajo un nivel de significancia =5%=0.05. Debido a que se plantea la hiptesis de que
=US$2,100, la hiptesis nula y la alternativa son:
Ho: = 2,100
Ha: 2,100
Paso 2: Con base en los resultados de la muestra,
calcular el valor del estadstico de
prueba Z.
Para probar la hiptesis, se calcula el estadstico de prueba Z, y se compara con los
valores crticos de Z.
= (X' - H)/(/n)
= (X' - H)/(s/n)
en donde
X' es la media muestral
H es el valor de la media poblacional
bajo hiptesis nula
/n es el error estndar de la distribucin muestral
Ho: = 2,100
n=64 minoristas
X'=US$2,251
s=US$812
= (2,251 - 2,100)/(812/8)
= (151)/(101.5)
= 1.49
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z.
El nivel de significancia del 5% se divide en dos colas. El 95% restante se divide por 2 para
hallar el rea de 0.4750. En la tabla Z esta rea de 0.4750 da los valores crticos de Z de 1.96.
La Regla de Decisin es: "No se rechaza la hiptesis nula s -1.96 Z 1.96. Se rechaza s Z<1.96 o Z>1.96.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 151
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

152
Vale la pena destacar que las zonas de rechazo estn en ambas colas. Si Z<-1.96 o
Z>1.96, se rechaza la hiptesis nula.
Paso 4: Interpretacin y conclusiones.
El paso final en la prueba de hiptesis es donde cae el valor del estadstico para la
muestra y determinar si la hiptesis nula debera rechazarse o no. El valor del estadstico
para la muestra es X'=US$2,251 produce una Z=1.49 ==> 1.49<1.96 y cae dentro de la zona de
no rechazo.
Interpretacin:
La diferencia entre el valor de la media poblacional bajo la hiptesis nula de = 2,100 y
el valor de la media muestral de X'=US$2,251 es estadsticamente insignificante. Podra
resultar simplemente del error de muestreo. De hecho s =2,100; el 95% de todas las
muestras de tamao n=64 producirn valores de Z entre 1.96.
Caso II.
Un contrato de manejo laboral exige una produccin diaria de 50 unidades. Una muestra de
150 das revela una media de 47.3, con una desviacin estndar de 5.7 unidades. Fije =5% y
determine si se cumple con la disposicin del contrato.
Caso III.
Un gerente de una empresa considera que los empleados gastan un promedio de 50 minutos
para llegar al trabajo. Se toma una muestra de 70 empleados que se toman en promedio 47.2
minutos con una desviacin estndar de 18.9 minutos. Fije en 1% y pruebe la hiptesis.
TAREA: Ejercicios 1 al 16 Pgs. 204-205. Para entregar en la prxima clase.
Las colas de una distribucin son las regiones extremas delimitadas por valores
crticos. Rechazamos la hiptesis nula Ho si nuestra estadstica de prueba est en la regin
crtica o rea de rechazo porque eso indica una discrepancia significativa entre la hiptesis
nula y los datos de la muestra.
Algunas pruebas son de cola izquierda, con la regin crtica situada en la regin de
extrema izquierda de la curva; otras podran ser de cola derecha, con la regin critica en la
regin de la extrema derecha bajo la curva.
En las pruebas de dos colas, el nivel de significancia se divide equitativamente entre
las dos colas que constituyen la regin crtica o rea de rechazo. En las pruebas de cola
derecha o izquierda, el rea de la regin crtica es .
Si examinamos la hiptesis nula Ho, deberemos poder deducir si una prueba es de cola derecha, de
cola izquierda o de dos colas. La cola corresponder a la regin crtica que contenga los valores que
podran contradecir significativamente la hiptesis nula.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 152
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

153
Vale la pena destacar que tanto en la prueba de cola a la izquierda como a la derecha el
signo igual se coloca en la hiptesis nula. Esto es porque la hiptesis nula se est probando a
un valor especfico (como 5%) y el signo igual da a la hiptesis nula un valor especfico para
probarla.
Una prueba de cola a la izquierda tiene una zona de rechazo solo en la cola izquierda y se da
bajo la condicin de:
Ho: algn valor
Ha: < algn valor
Una prueba de cola a la derecha tiene una zona de rechazo solo en la cola derecha y se da bajo
la condicin de:
Ho: algn valor
Ha: > algn valor
Caso I.
Determinacin de valores crticos o zona de no rechazo: Muchos pasajeros de cruceros usan
parches cutneos que suministran dramamina al cuerpo con el fin de evitar el mareo. Se
prueba una aseveracin respecto a la dosis media con un nivel de significancia de = 0.05.
Las condiciones son tales que es posible usar la distribucin normal estndar (porque aplica
el teorema del lmite central). Encuentre el o los valores crticos de z si la prueba es (a) de dos
colas, (b) de cola izquierda y (c) de cola derecha. Represente grficamente el valor crtico y la
regin crtica.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 153
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

154
Caso II.
Baskin-Robbins, la franquicia de helados, afirma que el nmero de tiendas que se abre se ha
incrementado por encima del promedio semanal de 10.4 experimentado en tiempo de escasez
(The Wall Street Journal, febrero de 1997). Existe alguna evidencia para sustentar esta
afirmacin si 50 semanas muestran una media de 12.5 y una desviacin estndar de 0.66
tiendas? La gerencia est dispuesta a aceptar una probabilidad del 4% de rechazo de la
hiptesis nula si esta es cierta.
Datos:
n=50 semanas
X'=12.5 tiendas de la muestra
s=0.66 tiendas
=4%=0.04 (nivel de significancia)
Paso 1: Plantear las hiptesis.
La afirmacin de que el incremento es por encima del promedio semanal de 10.4 sirve como
hiptesis alternativa debido a que >10.4 no contiene el signo igual.
Una prueba de cola a la derecha tiene una zona de rechazo solo en la cola derecha y se da bajo
la condicin de:
Ho: algn valor
Ha: > algn valor
Ha: > 10.4 tiendas semanal
Ho: 10.4 tiendas semanal
Paso 2: Con base en los resultados de la muestra,
calcular el valor del estadstico de prueba Z.
Para probar la hiptesis, se calcula el estadstico de prueba Z, y se compara con los
valores crticos de Z.
= (X' - H)/(/n)
= (X' - H)/(s/n)
en donde
X' es la media muestral
H es el valor de la media poblacional
bajo hiptesis nula
/n es el error estndar de la distribucin muestral
Ho: 10.4 tiendas semanal
n=50 semanas
X'=12.5 tiendas de la muestra
s=0.66 tiendas
=4%=0.04 (nivel de significancia)
= (12.5 - 10.4)/(0.66/50)
= 2.1/0.093
= 22.5

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 154
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

155
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z.
El nivel de significancia del 4%. El 50% se resta de 4% para hallar el rea de 0.46. En la tabla
Z esta rea de 0.46 da el valor crtico de Z de 1.75.
La Regla de Decisin es: "No se rechaza la hiptesis nula s Z 1.75. Se rechaza s Z>1.75.
Paso 4: Interpretacin y conclusiones.
El paso final en la prueba de hiptesis es donde cae el valor del estadstico para la
muestra y determinar si la hiptesis nula debera rechazarse o no. El valor del estadstico
para la muestra produce una Z=22.5 ==> 22.5>1.75 y cae dentro de la zona de rechazo o
regin critica.
Interpretacin:
La hiptesis nula se rechaza ya que en tiempo de escasez no se abren ms de 10.4
tiendas semanal
Caso III.
Segn Wall Street Journal (mayo 12 de 1997) muchas compaas de ropa deportiva estn
tratando de comercializar sus productos entre los ms jvenes. El articulo sugiri que la edad
promedio de los consumidores haba cado por debajo de la media de 34.4 aos que
caracterizo los comienzo de la dcada. Si una muestra de 1000 clientes reporta una media de
33.2 aos y una desviacin de 9.4, qu se concluye a un nivel de significancia de del 4%?
Datos:
n=1000 clientes
X'=33.2 aos (edad promedio de la muestra de los consumidores de ropa deportiva)
s=9.4 aos
=4%=0.04 (nivel de significancia)
Paso 1: Plantear las hiptesis.
La afirmacin de que la edad de los consumidores estaba por debajo de 34.4 aos sirve como
hiptesis alternativa debido a que < 34.44 no contiene el signo igual.
Una prueba de cola a la izquierda tiene una zona de rechazo solo en la cola izquierda y se da
bajo la condicin de:
Ho: algn valor
Ha: < algn valor
Ha: < 34.4 aos (edad promedio de los consumidores de ropa deportiva)
Ho: 34.4 aos

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 155
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

156
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z.
Para probar la hiptesis, se calcula el estadstico de prueba Z, y se compara con los
valores crticos de Z.
= (X' - H)/(/n)
= (X' - H)/(s/n)
en donde
X' es la media muestral
H es el valor de la media poblacional bajo hiptesis nula
/n es el error estndar de la distribucin muestral
Ho: 34.4 aos
n=1000 clientes
X'=33.2 aos (edad promedio de la muestra de los consumidores de ropa deportiva)
s=9.4 aos
=4%=0.04 (nivel de significancia)
= (33.2 - 34.4)/(9.4/1000)
= -1.2/0.297254
= -4.04
Paso 3: Determinar la regla de decisin con base
en los valores crticos de Z.
El nivel de significancia del 4%. El 50% se resta de 4% para hallar el rea de 0.46. En la tabla
Z esta rea de 0.46 da el valor critico de Z de 1.75.
La Regla de Decisin es: "No se rechaza la hiptesis nula s Z 1.75. Se rechaza s Z<1.75.
Paso 4: Interpretacin y conclusiones.
El paso final en la prueba de hiptesis es donde cae el valor del estadstico para la
muestra y determinar si la hiptesis nula debera rechazarse o no. El valor del estadstico
para la muestra produce una Z=-4.04 ==> -4.04<1.75 y cae dentro de la zona de rechazo o
regin critica.
Interpretacin:
La hiptesis nula se rechaza ya que la edad promedio no ha cado por debajo del grupo
de edad de 34.4 aos.
Ejercicios 17 al 26 - Pg. 209 para entregar en la prxima clase.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 156
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

157
Condiciones para usar la Distribucin t de Student en Prueba de Hiptesis.
1.- La muestra es pequea (n30).
2.- Se desconoce .
3.- La poblacin padre tiene una distribucin esencialmente normal. (Dado que a menudo se
desconoce la distribucin de la poblacin padre, la estimamos construyendo un histograma
con datos de muestra.)
Propiedades importantes de la Distribucin t de Student.
1.- La distribucin t de Student es diferente para los diferentes tamaos de muestra. (Ver
Figura 7.3 en la Pg. 177).
2.- La distribucin t de Student tiene la misma forma general de campana simtrica que la
distribucin normal estndar, pero refleja la mayor variabilidad (con distribuciones ms
amplias) que cabe esperar cuando la muestra es pequea.
3.- La distribucin t de Student tiene una media t=0 (as como la distribucin normal estndar
tiene una media de Z=0).
4.- La desviacin estndar de la distribucin t de Student varia con el tamao de la muestra,
pero es mayor que 1 (a diferencia de la distribucin normal estndar, que tiene =1).
Al igual que la distribucin Z, la distribucin t tiene una media de cero, es simtrica
respeto a la media y oscila entre - y + . Sin embargo, mientras que la distribucin Z tiene
una varianza de =1, la varianza de la distribucin t es mayor que 1.
5.- A medida que aumenta el tamao de muestra n, la distribucin t de Student se acerca ms
a la distribucin normal estndar. Con valores de n > 30, las diferencias son tan pequeas
que podemos utilizar los valores crticos de z en lugar de crear una tabla mucho ms grande
de valores crticos de t.
Grados de libertad. El nmero de grados de libertad de un conjunto de datos corresponde al
nmero de puntajes que puede variar despus de haber impuestos ciertas restricciones a
todos los puntajes. Es el nmero de observaciones menos el nmero de restricciones
impuestas sobre tales observaciones.
g.l. = n - 1
Podra parecer un poco extrao que, con una poblacin distribuida normalmente, a
veces utilicemos la distribucin t para encontrar valores crticos, pero cuando se desconoce
el uso de s de una muestra pequea incorpora otra fuente de error. A fin de mantener el grado
de confianza deseado, compensamos la variabilidad adicional ensanchando el intervalo de
confianza mediante un proceso que sustituye el valor crtico Z por el valor crtico ms grande
de t.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 157
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

158
El estadstico t
t = (X'-)/(s/n)
Prueba de dos colas para
Hay cuatro pasos involucrados en una prueba:
Paso 1: Plantear las hiptesis.
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z.
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z.
Paso 4: Interpretacin y conclusiones.
Caso I
Un distribuidor de bebidas plantea la hiptesis de que las ventas por mes promedian
US$12,000. Diez meses seleccionados como muestra reportan una media de US$11,277 y una
desviacin estndar de US$3,772. Si se utiliza un valor del 5%. Qu puede concluir acerca
de la impresin que tienen el distribuidor sobre las condiciones del negocio?
Ejercicios 33 al 40 Pgs. 215-216.
El Mtodo de valor P para probar hiptesis (P-Value Method of Testing Hypotheses).
Dado una hiptesis nula y datos de muestra, el valor p refleja la verosimilitud de
obtener los valores de muestra en cuestin suponiendo que la hiptesis nula realmente es
verdad.
Valor P (o valor de probabilidad) es la probabilidad de obtener un valor de la estadstica de
prueba que ser al menos tan extremo como se obtiene a partir de los datos de muestra,
suponiendo que la hiptesis es verdad.
Valor P es el nivel ms bajo de significancia (valor mnimo) al cual se puede rechazar la
hiptesis nula. Es el rea en la cola que est ms all del valor del estadstico para la muestra.
Los valores P miden la confianza que sentimos al rechazar una hiptesis nula. Por
ejemplo, un valor P de 0.0002 nos llevara a rechazar la hiptesis nula, pero tambin sugerira
que los resultados de muestra son extremadamente inusitados si el valor que se asegura que
tiene es en realidad correcta. En contraste, dado un valor P de 0.40, no rechazamos la
hiptesis nula porque los resultados de muestra podran ocurrir fcilmente si el valor que se
asegura que tiene si es el correcto.
Algunos criterios de decisin basados exclusivamente en el valor P:
- Rechazar la hiptesis nula si el valor P es menor que el nivel de significancia, o igual a l.
- No rechazar la hiptesis nula si el valor P es mayor que el nivel de significancia.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 158
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

159
Valor P

Interpretacin

Menor que 0.01

Muy significativo estadsticamente Indicios muy claros en contra


de la hiptesis nula

0.01 a 0.05

Estadsticamente significativo
Suficientes indicios en contra de la hiptesis nula

Mayor que 0.05

Insuficientes indicios en contra de la hiptesis nula

Caso I.
A comienzo de los aos 90 Sony Corporation introdujo su Play Station de 32 bits en el
mercado de los juegos de video. La gerencia esperaba que el nuevo producto incrementara
las ventas mensuales en Estados Unidos por encima de los US$283,000,000 que Sony haba
experimentado en la dcada anterior. Una muestra de 40 meses reporto una media de
US$297,000,000. Se asume una desviacin estndar de US$97,000,000. Pruebe la hiptesis
nula a un nivel de significancia del 1%. Calcule e interprete el valor p.
Datos:
n=40 meses
X'=US$297,000,000 ventas de la muestra
s=US$97,000,000
=1%=0.01 (nivel de significancia)
Paso 1: Plantear las hiptesis.
La afirmacin de que el nuevo producto incrementara las ventas por encima de
US$283,000,000 sirve como hiptesis alternativa debido a que > US$283,000,000 no
contiene el signo igual.
Una prueba de cola a la derecha tiene una zona de rechazo solo en la cola derecha y se da bajo
la condicin de:
Ho: algn valor
Ha: > algn valor
Ha: > US$283,000,000 (ventas mensuales)
Ho: US$283,000,000 (ventas mensuales)
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z.
Para probar la hiptesis, se calcula el estadstico de prueba Z, y se compara con los
valores crticos de Z.
= (X' - H)/(/n)
= (X' - H)/(s/n)
en donde
X' es la media muestral
H es el valor de la media poblacional bajo hiptesis nula
/n es el error estndar de la distribucin muestral
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 159
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

160
Ho: US$283,000,000 (ventas mensuales)
n=40 meses
X'=US$297,000,000 ventas de la muestra
s=US$97,000,000
=1%=0.01 (nivel de significancia)
= (297,000,000 - 283,000,000)/(97,000,000/40)
= 14,000,000/15,337,047.42
= 0.91
El valor Z para el nivel de insignificancia de 1% se obtiene en la tabla despus de restar 0.50.01= 0.49, el cual corresponde a 2.33
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z.
En la tabla Z el valor Z de 0.91 tiene el rea de 0.3186. Por lo tanto el:
valor P = 0.5 - 0.3186 = 0.1814
La Regla de Decisin es:
- Rechazar la hiptesis nula si el valor P es menor que el nivel de significancia, o igual a l.
- No rechazar la hiptesis nula si el valor P es mayor que el nivel de significancia.
Paso 4: Interpretacin y conclusiones.
El paso final en la prueba de hiptesis es donde cae el valor del estadstico para la
muestra y determinar si la hiptesis nula debera rechazarse o no. Como el valor de
significancia es menor que 0.1814 para la muestra de Z=0.91 cae en la zona de no rechazo.
Interpretacin:
La hiptesis nula no se rechaza.
Ejercicios 27 al 32 Pg. 213.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 160
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

161
Caso II.
En el verano de 1997, el Congreso de USA aprob un presupuesto federal que contena varias
partidas para reducciones de impuestos.
Los analistas afirmaron que ahorrara al
contribuyente promedio US$800.00 dlares. Una muestra de 500 contribuyentes demostr
una reduccin promedio en los impuestos de US$785.10 con una desviacin estndar de
US$277.70. Pruebe la hiptesis a un nivel de significancia del 5%. Calcule e Interprete el
valor p.
Datos:
n= 500 contribuyentes
X'=US$785.10
s=US$277.70
=5%=0.05 (nivel de significancia)
Paso 1: Plantear las hiptesis.
Ha: = US$800.00
Ho: US$800.00
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z.
= (X' - H)/(/n)
= (X' - H)/(s/n)
= (785.10 800.00)/(277.70/500)
= -14.9/12.42
= - 1.20
El valor Z para el nivel de insignificancia de 5% se divide entre dos. Se obtiene en la tabla el
valor de Z = 1.96.
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z.
En la tabla Z, el valor Z de 1.20 tiene el rea de 0.3849. Por lo tanto el:
0.5 - 0.3849 = 0.1151
valor P = 2 * 0.1151 = 0.2302
La Regla de Decisin es:
- Rechazar la hiptesis nula si el valor P es menor que el nivel de significancia, o igual a l.
- No rechazar la hiptesis nula si el valor P es mayor que el nivel de significancia.
Paso 4: Interpretacin y conclusiones.
El paso final en la prueba de hiptesis es donde cae el valor del estadstico para la
muestra y determinar si la hiptesis nula debera rechazarse o no. Como el valor de
significancia es menor que 0.2302 para la muestra de Z = -1.20 cae en la zona de no rechazo.
Interpretacin:
La hiptesis nula no se rechaza.
Ejercicios 27 al 32 Pg. 213.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 161
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

162
Caso III. Forbes (Septiembre 1996) report que Freddie Maman, representante de la cantante
de pop Madonna, estim que las ventas diarias de su nuevo lbum excedera las de su xito
ms grande de 1994, Like a Virgin, el cual tuvo un promedio de ventas de 27,400 copias.
Freddie est en lo cierto a un nivel de significancia del 10% si 50 observaciones (das) poseen
un media de 28,788 copias con una desviacin estndar de 3,776? Calcule e interprete el valor
p. Y Represente grficamente incluyendo el valor P.
Caso IV. La Asociacin Internacional de Transporte Areo pide a los viajeros de negocios
que califiquen los aeropuertos internacionales trasatlnticos. La calificacin mxima posible
es 10. Una revista dedicada a los viajes desea clasificar a los aeropuertos segn la calificacin
que reciben.

De los que tienen una calificacin de media de poblacin de 7 ms se

consideran que ofrecen un servicio superior. Suponga que a una muestra aleatoria de 12
viajeros se les pidi calificar al aeropuerto Heathrow de Londres, y que las calificaciones
obtenidas son 7, 8, 10, 8, 6, 9, 6, 7, 7, 8, 9 y 8. Suponiendo que la poblacin de calificaciones se
puede aproximar con una distribucin normal, puede decirse que Heathrow ofrece un
servicio superior?
Usando un nivel de significancia de 0.05, necesitamos una prueba que determine si la media
de la poblacin de calificaciones para el aeropuerto es mayor de 7.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 162
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

163

Distribucin Chi-cuadrada (Chi-Square Distribution)


En secciones anteriores determinamos (1) el estimado puntual, (2) intervalo de confianza y (3)
determinamos el tamao de la muestra para medias y proporciones, en esta seccin los
aplicaremos a la varianza de poblacin o desviacin estndar de poblacin .
Muchas situaciones reales, como el control de calidad en un proceso de fabricacin,
requiere estimar valores de varianzas o desviaciones estndar de poblacin. Adems de
fabricar productos cuyas mediciones producen una media deseada, el fabricante debe
elaborar productos con una calidad uniforme que no abarquen toda la gama desde
extremadamente buenos hasta extremadamente deficientes. Dado que tal uniformidad a
menudo se puede medir por la varianza o la desviacin estndar, estas se convierten en
estadsticas vitales para mantener la calidad de los productos.
Distribucin Chi cuadrada. En una poblacin distribuida normalmente con varianza ,
seleccionamos aleatoriamente muestras independientes de tamao n y calculamos la varianza
de muestras s para cada muestra. La estadstica de muestra =(n-1)s/ tiene una
distribucin llamada distribucin Chi cuadrada.
=(n-1)s/
n = tamao de muestra
s= varianza de muestra
= varianza de poblacin
La distribucin Chi cuadrada est determinada por el nmero de grados de libertad,
por el momento usaremos n-1 grados de libertad.
Propiedades de la Distribucin de la estadstica Chi cuadrada.
1.- La Distribucin Chi cuadrada no es simtrica, a diferencia de las distribuciones normal y t
Student (A medida que aumenta el nmero de grados de libertad, la distribucin se vuelve
ms simtrica).
2.- Los valores de Chi cuadrada pueden ser cero o positivos, pero no pueden ser negativos.
3.- La distribucin Chi cuadrada es diferente para cada nmero de grados de libertad, que es
gl=n-1. A medida que aumenta el nmero de grados de libertad, la distribucin Chi
cuadrada se acerca a una distribucin normal.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 163
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

164
Caso I.
Usando la tabla H Distribucin Chi-cuadrado.
Encuentre los valores crticos de que determinan regiones crticas que contienen un rea de
0.025 en cada cola. Suponga que el tamao de muestra pertinente es de 10, de modo que el
nmero de grados de libertad es 10-1=9
Solucin: El valor crtico de la derecha (=19.023) se obtiene directamente localizando 9 en la
columna de grados de libertad de la izquierda y 0.025 en la fila superior. El valor critico de
=2.700 de la izquierda tambin corresponde a 9 en la columna de grados de libertad, pero es
preciso localizar 0.975 (que se obtiene de restar 0.025 a 1) en la fila superior porque los valores
de esa fila siempre son reas a la derecha del valor crtico.
Al obtener valores crticos de Chi cuadrada de la H Distribucin Chi-cuadrado, obsrvese que
los nmeros de grados de libertad son enteros consecutivos del 1 al 30, seguidos de 40, 50, 60,
70, 80, 90 y 100. Si no se encuentra en la tabla un numero de grados de libertad (digamos 52),
por lo regular puede usarse el valor critico ms cercano. Por ejemplo, si el nmero de grados
de libertad es 52, remtase a la tabla y use 50 grados de libertad. (Si el nmero de grados de
libertad esta exactamente a la mitad entre dos valores de la tabla, como 55, simplemente
calcule la media de los dos valores de .) Para nmeros de grados de libertad mayores que
100, use la ecuacin siguiente:
=1/2 [Z+(2k-1)]
donde k es el nmero de grados de libertad.
Caso II.
Encuentre los valores crticos L y R que corresponden al grado de confianza y tamao de
muestra dados.
1. 95%;n=26
3. 90%;n=60

2. 99%;n=17
4. 95%;n=50

Estimadores de .
Dado que las varianzas de muestras s (que se obtienen con la formula s=[(x-x')]/(n1)) tienden a centrarse alrededor del valor de la varianza de la poblacin , decimos que s es
un estimador no predispuesto de . Es decir, las varianzas de muestras s no tienden a
sobreestimar sistemticamente ; en vez de ello, tienden a centrarse en el valor de mismo.
Adems, los valores s tienden a producir errores ms pequeos al estar ms cerca de que
otras medidas de variacin. Por estas razones, el valor s es el mejor valor individual (o
estimado puntual) de las diversas estadsticas que podramos usar para estimar .
La varianza de muestra s es el mejor estimado puntual de la variacin de la
poblacin .
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 164
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

165
Dado que s es el mejor estimado puntual de , seria natural esperar que s sea el mejor
estimado puntual de , pero no sucede as, porque s es un estimador predispuesto de . Por
otra parte, si el tamao de muestra es grande, la predisposicin es tan pequea que podemos
usar s como un estimado razonablemente bueno de .
Aunque s es el mejor estimado puntual de , no tenemos una indicacin de lo bueno
que es realmente. Para compensar esta deficiencia, deducimos un estimado de intervalo (o
intervalo de confianza) que es ms revelador.
Intervalo de confianza (o estimado de intervalo) para la varianza de poblacin .
=(n-1)s/
Despeje:

=(n-1)s/
El intervalo de confianza es:
(n-1)s/R < < (n-1)s/L

El intervalo de confianza para la desviacin estndar se obtiene calculando la


raz cuadrada de cada componente anterior:
[(n-1)s/R] < < [(n-1)s/L]
Con un rea total de dividida equitativamente entre las dos colas de una distribucin
Chi cuadrada, L denota el valor critico de cola izquierda y R denota el valor critico de cola
derecha.
Los lmites de intervalos de confianza para y se deben redondear aplicando la
regla de redondeo siguiente:
1. Si usa el conjunto de datos original para construir un intervalo de confianza, redondee los
lmites del intervalo de confianza a una posicin decimal ms que las empleadas en el
conjunto de datos original.
2. Si desconoce el conjunto de datos original y solo usa las estadsticas resumidas (n,s),
redondee los lmites del intervalo de confianza al mismo nmero de posiciones decimales que
se usan para la desviacin estndar o varianza de muestra.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 165
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

166
Caso I.
La Panificadora Pepn produce bizcochos que se empacan en cajas cuyos rtulos dicen
contienen 12 bizcochos con un total de 42 onzas. Si la variacin entre los bizcochos es
demasiado grande, algunas cajas pesaran menos de lo debido (engaando a los clientes) y
otras pesaran ms (reduciendo las utilidades). El supervisor de control de calidad determino
que puede evitar problemas si los bizcochos tienen una media de 3.50 onzas y una desviacin
estndar de 0.06 onzas o menos. Se seleccionan aleatoriamente doce bizcochos de la lnea de
produccin y se pesan, con los resultados que se dan aqu (en onzas). Construya un intervalo
de confianza del 95% para y un intervalo de confianza del 95% para , y luego determine si
el supervisor de control de calidad est en problemas.
3.43 3.37 3.58 3.50 3.68 3.61
3.42 3.52 3.66 3.50 3.36 3.42
Solucin:
Con base en los datos de muestra, la media de X'=3.504 parece excelente porque est muy
cerca del valor deseado. Los puntajes dados tienen una desviacin estndar de s=0.109, que
podra parecer mayor que el valor deseado de 0.06 o menos. Procedamos a obtener el
intervalo de confianza para .
Con una muestra de 12 puntajes tenemos 11 grados de libertad. Con un grado de confianza
del 95%, dividimos =0.05 equitativamente entre las dos colas de la distribucin y nos
remitimos a los valores de 0.975 y 0.025 en la fila superior.
Los valores crticos de son L=3.816 y R=21.920. Utilizando estos valores crticos junto
con la desviacin estndar de muestra s=0.109 y el tamao de muestra de 12 construimos el
intervalo de confianza del 95% evaluando lo siguiente:
(n-1)s/R < < (n-1)s/L
(12-1)(0.109)/21.920 << (12-1)(0.109)/(3.816)
0.006 < < 0.034
Si sacamos la raz cuadrada de cada parte (antes de redondear) obtenemos:
0.077 < < 0.185
Con base en el intervalo de confianza del 95% para , parece que la desviacin
estndar es mayor que el valor deseado de 0.06 o menos, as que el supervisor de control de
calidad est en problemas y deber tomar medidas correctivas para hacer que el peso de los
bizcochos sea ms uniforme.
El intervalo de confianza de 0.077 < < 0.185 tambin puede expresarse como
(0.077,0.185), pero el formato de =sE no puede usarse porque el intervalo de confianza no
tiene a s en su centro.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 166
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

167
Caso II.
Un recipiente anticongelante para automvil supuestamente contiene 3,785 ml del lquido.
Consciente de que las fluctuaciones son inevitables, la gerente de control de calidad quiere
estar muy segura de que la desviacin estndar sea de menos de 30 ml; De lo contrario,
algunos recipientes se desbordaran, mientras que otros no tendrn suficiente anticongelantes.
Ella selecciona aleatoriamente una muestra, con los resultados que se dan aqu. Utilice estos
resultados para construir el intervalo de confianza del 99% para el verdadero valor de .
Sugiere este intervalo de confianza que las fluctuaciones estn en un nivel aceptable?
3,761 3,861 3,769 3,772 3,675 3,861
3,888 3,819 3,788 3,800 3,720 3,748
3,753 3,821 3,811 3,740 3,740 3,839
Caso III.
a) Los valores que se listan son tiempos de espera (en minutos) de clientes del BHD, donde
los clientes se forman en una sola fila que alimenta tres ventanillas. Construya un intervalo
de confianza del 95% para la desviacin estndar de la poblacin.
6.5
6.6. 6.7
6.8
7.1
7.3
7.4
7.7
7.7
7.7
b) Los valores que se listan son tiempos de espera (en minuto) de clientes del Banco Popular,
donde los clientes pueden formarse en cualquiera de tres filas distintas que se han formado
frente a tres ventanillas distintas. Construya un intervalo de confianza del 95% para y
compare los resultados con el intervalo de confianza para los datos del Banco BHD.
Sugieren los intervalos de confianza alguna diferencia en la variacin de los tiempos de
espera de cada banco? Cul sistema parece mejor: el de fila nica o el de mltiples filas?
4.2
5.4
5.8
6.2
6.7
7.7
7.7
8.5
9.3
10.0
Caso IV.
Se espera que un proceso estandarizado produzca arandelas con una desviacin muy
pequea en su espesor. Suponga que se tomaron 10 de estas arandelas y sus espesores, en
pulgadas fueron:
0.123 0.124 0.126 0.120 0.130 0.133 0.125 0.128 0.124 0.126
Cul es un intervalo de confianza de 90 por ciento para la desviacin estndar del espesor
de una arandela producida mediante este proceso?
Caso V.
Al disear una nueva mquina que se usar en una lnea de ensamble de un planta de la
General Motors, un ingeniero obtiene mediciones de la longitud de los brazos de una muestra
aleatoria de operadores de mquina de sexo masculino. Los resultados obtenidos en
centmetros se dan en seguida. Construya un intervalo de confianza del 95% para la longitud
media de los brazos de todos los empleados de este tipo.
76.80
70.90

75.60
69.40

69.30
71.70

75.70
72.50

75.50
72.20

71.20
68.50

72.50
75.90

71.90
73.00

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 167
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

168
Caso VI.
El cuerpo de cadete de la Marina est revisando sus pedidos de uniformes porque tiene un
excedente de uniformes para reclutas altos y una escasez de uniformes para los reclutas bajos.
Su revisin se basa en una muestra aleatoria de estaturas de reclutas de sexo masculino con
edades entre los 18 y los 24 aos, que se lista aqu (en pulgadas):
69.90
69.00
70.40

69.40
68.40
66.80

72.60
68.30
69.90

70.00
69.60
69.20

70.20
71.70
70.50

71.80
69.20
70.20

70.60
70.80
70.80

72.80
71.00
70.00

Construya un intervalo de confianza del 99% para la desviacin estndar con un valor alfa del
0.05.

Determinacin del tamao de muestra. (Sample Sizes)


Los procedimientos para encontrar el tamao de muestra necesario para estimar son
muchos ms complejos que los procedimientos que se dieron antes para las medias y
proporciones. En lugar de aplicar procedimientos muy complicados, usaremos la tabla 6-2.
Caso I.
Con una confianza del 95%, queremos estimar dentro de un margen de error del 10%. Qu
tamao deber tener la muestra?
Supongamos que la poblacin est distribuida
normalmente.
Solucin: En la tabla 6-2 vemos que una confianza del 95% y un error del 10% para
corresponde a un tamao de muestra de 191. Deberemos seleccionar aleatoriamente 191
valores de la poblacin.
Caso II.
Determine el tamao de muestra mnimo necesario para tener una confianza del 95% en que
la desviacin estndar de la muestra s estar a menos del 30% de .
Caso III.
Determine el tamao de muestra mnimo necesario para tener una confianza del 99% en que
la desviacin estndar de la muestra s estar a menos del 20% de .
Caso IV.
Determine el tamao de muestra mnimo necesario para tener una confianza del 99% en que
la varianza de la muestra estar a menos del 30% de la varianza de la poblacin.
Caso V.
Determine el tamao de muestra mnimo necesario para tener una confianza del 95% en que
la varianza de la muestra estar a menos del 40% de la varianza de la poblacin.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 168
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

169

El anlisis de varianza ANOVA (Analysis of Variance)


Es un mtodo para probar la igualdad de dos o ms medias de poblacin analizando
varianzas de muestra.
Es una prueba estadstica para analizar si ms de dos grupos difieren
significativamente entre s en cuanto a sus medias y varianzas.
El uso del diseo experimental del anlisis de la varianza es cada vez mayor en
investigacin de mercados. El anlisis de la varianza se basa en mantener la independencia
de las variables de tratamiento.
Distribucin F
Los mtodos de ANOVA emplean la distribucin F, que tiene las siguientes propiedades:
1. La distribucin F no es simtrica; esta sesgada hacia la derecha.
2. Los valores de F pueden ser 0 o positivos, pero no pueden ser negativos.
3. Hay una distribucin F distinta para cada par de grados de libertad del numerador y el
denominador.
Esta fue denominada as en 1924 en honor a Sir Ronald A. Fisher (1890-1962).
La estadstica de prueba F es el cociente de dos estimados, de modo que una estadstica
de prueba F significativamente grande (situada muy a la derecha en la grfica de la
distribucin F) es un indicio en contra de que las medias de poblacin sean iguales.
Estadstica de Prueba para ANOVA.
F=varianza entre muestras/varianza dentro de las muestras
El numerador mide la variacin entre las medias de muestra. El estimado de la varianza del
denominador depende solo de las varianzas de las muestras y no resulta afectado por las
diferencias entre las medias de las muestras. Por consiguiente, si las medias de muestra
tienen valores muy parecidos, la estadstica de prueba F tiene un valor cercano a 1, y
concluimos que no hay diferencias significativas entre las medias de muestra. En cambio, si
el valor de F es excesivamente grande, rechazamos la afirmacin de que las medias son
iguales.
Clculos con tamaos de muestra iguales.
F=varianza entre muestras/varianza dentro de las muestras
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 169
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

170
Si todos los conjuntos de datos tienen el mismo tamao de muestra, como se presenta
en la tabla a continuacin. Primero calculamos la varianza entre muestras evaluando ns,
donde s es la varianza de las medias de muestra.
INTERVALOS DE TIEMPO (EN MINUTOS ENTRE
ERUPCIONES DEL VOLCAN "EL VIEJO FIEL"
GEISER OLD FAITHFUL - PARQUE NAC. YELLOWSTONE

N
MEDIA X'
DESVIACION

1951
74
60
74
42
74
52
65
68
62
66
62
60

1985
89
90
60
65
82
84
54
85
58
79
57
88

1995
86
86
62
104
62
95
79
62
94
79
86
85

1996
88
86
85
89
83
85
91
68
91
56
89
94

12
63,3
9,4

12
74,3
14,2

12
81,7
13,7

12
83,8
10,9

BASADOS EN DATOS DEL GEOLOGO RICK HUTCHINSON


Y EL SERVICIO NACIONAL DE ESTADOS UNIDOS
Descriptive statistics

count
mean
sample variance
sample standard
deviation

#1
#2
#3
#4
12
12
12
12
63.25 74.25 81.67 83.75
89.30 200.75 188.24 119.11
9.45

14.17

13.72

10.91

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 170
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

171
La Varianza para una muestra de datos no agrupados (s).
_
s = [(Xi-X)]/n-1

X"

X
X-X"
63.25 -12.48
74.25 -1.48
81.67
5.94
83.75
8.02
75.73 VAR.
DESV.

(X-X")^2
155.75
2.1904
35.284
64.32
85.848
9.2654

s =[(63.25-75.73)+(74.25-75.73) +(81.67-75.73) +(83.75-75.73)]/(4-1)=85.85 = x'


x'=/n
Por tanto:

=n * x'

Paso I.
Por ejemplo las medias de las muestras de la tabla anterior son 63.3, 74.3, 81.7, 83.8.
Esos cuatro valores tienen una desviacin estndar de s=9.26116, as que:
Varianza entre muestras = ns = 12 (9.26116) = 1,029.23
Estimacin de la varianza entre tratamientos:
Por tanto: = n * x' = 12 * 85.85 = 1,030.2
Paso II.
A continuacin, estimamos la varianza dentro de las muestras calculando sp, que es la
varianza conjunta que se obtiene calculando la media de las varianzas de muestra. Las
desviaciones estndar de muestra son 9.4, 14.2, 13.7 y 10.9, as que
Descriptive statistics

Count
Mean
sample variance
sample standard
deviation

#1
#2
#3
#4
12
12
12
12
63.25 74.25 81.67 83.75
89.30 200.75 188.24 119.11
9.45

14.17

13.72

10.91

Varianza dentro de las muestras = s/K =(9.4 + 14.2 + 13.7 + 10.9)/4 = 149.13
Estimacin de la varianza
Dentro de los tratamientos = (89.3+74.25+81.67+83.75)/4=597.4/4=149.35

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 171
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

172
Paso III.
Por ltimo, evaluamos la estadstica de prueba F como sigue:
F=varianza entre muestras/varianza dentro de las muestras
F= Estimacin de la varianza entre tratamientos / Estimacin de la varianza Dentro de los tratamientos

F=1,029.23/149.125 = 6.9018
F=1,030.02/149.35 = 6.8967
Si llevamos ms posiciones decimales obtendremos una estadstica de prueba ms exacta:
F=6.9018
Paso IV.
El valor crtico de F se obtiene suponiendo una prueba de cola derecha, ya que los valores
grandes de F corresponden a diferencias significativas entre las medias. Con k muestras cada
una de las cuales tiene n puntajes, los nmeros de grados de libertad se calculan como sigue:
Grados de libertad con k muestras del mismo tamao n.
Grados de libertad del numerador = k - 1
Grados de libertad del denominador = k * (n-1) = N - k
Para los datos de muestra de la tabla anterior k=4 y n=12, as que los grados de libertad son 3
para el numerador y 44 para el denominador. Con un =0.05, 3 grados de libertad para el
numerador y 44 grados de libertad para el denominador, el valor critico es F = 2.84 (La tabla
de Distribucin F no incluye 44 grados de libertad para el denominador, as que usamos el
valor ms cercano, que corresponde a 40 grados de libertad).
Regla de decisin: "No rechazar si F 2.84. Rechazar s F > 2.84".
Paso V.
Con base a estos resultados, rechazamos la hiptesis nula de que las medias son
iguales. Hay suficientes indicios para justificar que se rechace la afirmacin de que las cuatro
muestras provienen de poblaciones cuyas medias son iguales.
One factor ANOVA

ANOVA table
Source
Treatment
Error
Total

Mean

Std. Dev

63.3

12

9.45 Group 1

74.3

12

14.17 Group 2

81.7

12

13.72 Group 3

83.8
75.7

12
48

10.91 Group 4
14.34 Total

SS
3,090.06
6,571.42
9,661.48

df
3
44
47

MS
1,030.021
149.350

F
6.90

p-value
.0007

Tabla de Anlisis de Varianza Tabla ANOVA


Fuentes de
Variacion

Causas
Posibles
Error
Muestral

Suma de
Cuadrados

Factor A

3,090.06

Error E

6,571.42

Grados de
Libertad

Cuadrados
medios

F
de Prueba

3 1030.02083 6.89667373

F
Terica
2.82

Valor-p

.0007

44 149.350379

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 172
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

173

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 173
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

174

Anlisis de Varianza con un Factor (One-Factor ANOVA)


Caso I.
Supongamos que queremos medir la blancura de tres marcas de detergentes en el lavado A1,
A2, y A3. Con un nivel de significancia del 5% deseamos probar que el que el inters
promedio por cada marca segn la blancura que producen es igual. En el centro de la tabla,
aparece la escala de 0 a 10, el inters por cada marca segn la blancura que producen las
distintas marcas en el lavado.
POR CADA MARCHA SEGUN LA BLANCURA QUE PRODUCEN

ANALISIS DE VARIANZA - ANOVA


INDEPENDENCIA DE LAS VARIABLES DE TRATAMIENTO

PERSONAS ELEGIDAS
ALEATORIAMENTE
1
2
3
4
5
MEDIA = X'
EFECTO DEL TRATAMIENTO

TRATAMIENTOS
EXPERIMENTOS
MARCAS DE DETERGENTES
A1
A2
A3
4
7
3
4
6
1
5
8
4
5
6
3
7
8
4
5
7
3
0
2
-2

X"
5

INTERES POR CADA MARCHA SEGUN LA BLANCURA QUE PRODUCEN


DISTINTAS MARCAS.
ESCALA DE 0 A 10.
Ho: A MEDIAr = MEDIAs
Ho: MEDIA1 = MEDIA2 = MEDIA3
Ha: MEDIAr MEDIAs
(Al menos existen don medias que son diferentes)
k = n. de poblaciones =
n = n. de observaciones muestrales =
k * n = n. total de observaciones muestrales =

k>2

5
15

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 174
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

175
Paso I.
Descriptive statistics
ANALISIS VARIANZA DENTRO DE LAS MUESTRAS
A1

A2

A3

Count

Mean

5.00

7.00

3.00

sample variance
sample standard
deviation

1.50

1.00

SUM VAR.
4.00
1.50

1.22

1.00

1.22

Mnimum

Mximum

Range

Paso II.

EFECTO DEL
FACTOR

TRATAMIENTO

ANALISIS VARIANZA ENTRE MUESTRA


X'

A1
A2
A3
X"

5.00
7.00
3.00

5.00

Mean

5.0

1.22 A1

7.0

1.00 A2

3.0

1.22 A3

5.0

15

X'-X"
0.00
2.00
-2.00
SUMATORIA
VARIANZA
DESVIACION

(X'-X")^2
0.00
4.00
4.00
8.00
4
2

Std. Dev

2.00 Total

Paso III.
F=varianza entre muestras/varianza dentro de las muestras = ns/(s/K)
Varianza entre muestras = ns = 5 * 4 = 20
Varianza dentro de las muestras = s/K = 4/3 = 1.3333
F = 15
ANOVA table
Source

SS

Df

MS

p-value

15.00

.0005

Treatment

40.00

20.000

Error

16.00

12

1.333

Total

56.00

14

Suma de
Cuadrados

Grados de
Libertad

Fuentes
de
Variacion

Causas
Posibles
Error Muestral

Factor A
Error E

40.00
16.00

2
12

Cuadrados
medios
20.000
1.333

F
de Prueba
15

F
Terica
3.89

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 175
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

176

MEDIA

SUMA CUADRADOS DENTRO DE LAS MUESTRAS - ERROR


(X(X(XA1
X')^2 A2 X')^2 A3 X')^2
4
1
7
0
3
0
4
1
6
1
1
4
5
0
8
1
4
1
5
0
6
1
3
0
7
4
8
1
4
1
5
7
3
SCD
Error
SUMATORIA DE
CUADRADOS
6
4
6
16
SUMA
SUMA
CUADRADOS
DENTRO
MUESTRAS

SUMA DE CUADRADOS ENTRE LAS MUESTRAS

A1
A2
A3
X"

MEDIA - X'
5
7
3
5
Treatment

n*(X'-X")^2
0
20
20
40
SUMA
SCE
SUMA CUADRADOS
ENTRE MUESTRAS

SUMA DE LOS CUADRADOS DE LA MUESTRA TOTAL


A1
(X-X")^2 A2 (X-X")^2 A3 (X-X")^2
4
1
7
4
3
4
4
1
6
1
1
16
5
0
8
9
4
1
5
0
6
1
3
4
7
4
8
9
4
1
SUMATORIA
6
24
26
SCT = SCD +
SCE
SCT =
56
SCD =
16
SCE =
40

X" = 5

SCT
56
SUMA DE CUADRADOS
DE LA MUESTRA TOTAL

Fo = F observada = F emprica
Fo =

(SCE / (k-1))
(SCD / (k*(n-1)))

Numerador
Denominador

Dividendo
40.00
16

Divisor

Resultado
2
20.00
12
1.33

15.00

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 176
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

177
Paso IV.
G.L. NUMERADOR
G.L. DENOMINADOR

F-distribution
df1 = 2
df2 = 12

K-1
K*(N-1)

2
12

P(lower)

P(upper)

.9500

.0500

3.89

Regla de decisin: "No rechazar si F 3.89. Rechazar s F > 3.89".

Factor (Variable independiente): Causa posible de la heterogeneidad de las poblaciones (A).


Niveles del Factor (Tratamientos): Cada uno de los valores posibles del Factor (A1, A2,
A3Ak).
Variables dependientes o Variable respuesta: Son los valores de las observaciones.
Efectos: Sern la medida de influencia del factor y, por tanto, de los tratamientos. (X-X)
Error muestral: Es el error debido a la aleatoriedad en la seleccin de los elementos
mustrales.
Unidades experimentales (Rplicas): En este caso las personas seleccionadas para el
experimento.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 177
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

178
La homogeneidad de los datos xi se puede medir con su varianza, ya que cuanto menor sea la
varianza, esto es, cuanto menos sea la dispersin alrededor de su media global X ms
homogneas son las observaciones xi.
Suma de Cuadrados Dentro de las Muestras (SCD) = (Xi X)^2
Suma de Cuadrados Entre las Muestras (SCE) = n * (Xi X)^2
Grados de libertad con k muestras del mismo tamao n.
Grados de libertad del numerador = k - 1
Grados de libertad del denominador = k * (n-1) = N - k

Estas sumas divididas entre sus correspondientes grados de libertad proporcionan los
valores de los cuadrados medios.
Suma de Cuadrados Medios Dentro de las Muestras (SCMD) = [ (Xi X)^2]/(k 1)
Suma de Cuadrados Medios Entre las Muestras (SCME) = [ n * (Xi X)^2]/(N k)

F = SCME / SCMD
Fuentes
de
Variacion

Causas
Posibles
Error Muestral

Factor A
Error E

Suma de
Cuadrados
SCE =
40.00
SCD =
16.00

Grados de
Libertad

Cuadrados
medios

F
de Prueba

F
Terica

SCME =

(k 1) = 2
(N k) =

SCMD =

12

1.333

20.000

15

3.89

Paso V.
Con base a estos resultados, rechazamos la hiptesis nula de que el inters promedio
por cada marca segn la blancura que producen es igual.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 178
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

179
Caso II. Se desea contrastar si el comportamiento de los consumidores es homogneo en
funcin del da de la semana en que realizan su compra en un supermercado. Para ello se
eligen al azar observaciones mustrales de cinco clientes, de lunes a sbado. El volumen de
compra medido en miles de unidades monetarias (u.m.) de cada una de las observaciones se
recoge en la tabla siguiente:

Poblaciones

Volumen de compra de 5 clientes de


lunes a sbado en el Supermercado

L
M
MI
J
V
S

a
5
7
8
4
6
6

Observaciones
b
c
d
6
4
2
3
3
5
4
4
7
6
2
5
2
3
7
5
6
3

e
3
2
2
5
5
7

Contrastar si el comportamiento es
homogneo en funcin del da de la
semana
A un nivel de significancia de 10%
k = n. de poblaciones =
6
n = n. de observaciones muestrales =
5
N = k * n = n. total de observaciones muestrales
=
Ho: A MEDIAr = MEDIAs
Ho: MEDIA1 = MEDIA2 = MEDIA3
Ha: MEDIAr MEDIAs
(Al menos existen don medias que son diferentes)
L
M
MI
J
V
A
5
7
8
4
6
B
6
3
4
6
2
C
4
3
4
2
3
D
2
5
7
5
7
E
3
2
2
5
5

30

S
6
5
6
3
7

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 179
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

180
Caso III.
Se desea contrastar si el comportamiento de los consumidores es homogneo en funcin del
da de la semana en que realizan su compra en un supermercado. Para ello se eligen al azar
observaciones mustrales de cinco clientes, de lunes a sbado. El volumen de compra
medido en miles de unidades monetarias (u.m.) de cada una de las observaciones se recoge
en la tabla siguiente:

Poblaciones

Volumen de compra de 5 clientes de


lunes a sbado en el Supermercado
a
4
3
4
6
7
5

L
M
MI
J
V
S

b
2
3
5
7
8
4

Observaciones
c
d
3
4
4
4
4
3
8
5
5
5
4
5

e
2
3
4
6
9
4

Contrastar si el comportamiento es
homogneo en funcin del da de la
semana
A un nivel de significancia de 1%
k = n. de poblaciones =
n = n. de observaciones muestrales =
k * n = n. total de observaciones muestrales
=

6
5
30

Ho: A MEDIAr = MEDIAs


Ho: MEDIA1 = MEDIA2 = MEDIA3
Ha: MEDIAr MEDIAs
(Al menos existen don medias que son diferentes)

a
b
c
d
e

L
4
2
3
4
2

M
3
3
4
4
3

MI
4
5
4
3
4

J
6
7
8
5
6

V
7
8
5
5
9

S
5
4
4
5
4

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 180
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

181
Caso IV.
Con la particularidad de que el nmero de observaciones recogida cada da es distinto. Se
desea contrastar si el comportamiento de los consumidores es homogneo en funcin del da
de la semana en que realizan su compra en un supermercado. Para ello se eligen al azar
observaciones mustrales de cinco clientes, de lunes a sbado. El volumen de compra
medido en miles de unidades monetarias (u.m.) de cada una de las observaciones se recoge
en la tabla siguiente:

Poblaciones

Volumen de compra de 5 clientes de


lunes a sbado en el Supermercado

L
M
MI
J
V
S

a
5
8
5
7
4
5

b
4
6
6
3
5
2

Observaciones
c
d
3
7
5
8
9
7
3
7
4
2

4
5

Contrastar si el comportamiento es
homogneo en funcin del da de la
semana
A un nivel de significancia de 10%
k = n. de poblaciones =
n = n. de observaciones muestrales =
k * n = n. total de observaciones muestrales
=

6
5
30

Ho: A MEDIAr = MEDIAs


Ho: MEDIA1 = MEDIA2 = MEDIA3
Ha: MEDIAr MEDIAs
(Al menos existen don medias que son diferentes)

A
B
C
D
E

L
5
4
3

M
8
6
7
5

MI
5
6
8
9
4

J
7
3
7
3

V
4
5
7
4
5

S
5
2
2

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 181
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

182
Caso V.
Queremos contrastar si la compra media por da es homognea en funcin del da del mes en
que se realiza la compra en un supermercado. Para abaratar los costes de la experimentacin
elegimos al azar diez das, y en cada uno de ellos tomamos un nmero distinto de
observaciones mustrales.
La compra en miles de u.m., de cada una de las observaciones, aparece en la tabla siguiente.

1
2
3
4
5
6

A1
6
6
7
6
5

A2
8
5
5
5
6
7

A3
6
8
9
7
5

A4
5
6
3
2
4
4

A5
4
7
7
4
5
3

A6
5
6
4
5

A7
8
5
5
6

A8
9
8
8
7
8

A9
4
5
6
3
2
4

A10
5
4
5
4
2

Contrastar con un nivel de significacin del 5% la homogeneidad de la compra diaria durante


el mes.
Caso VI.
El vicepresidente de mercado del Banco BHD Len en los recientes esfuerzos promocionales
para atraer nuevos depositantes incluye algunos juegos y premios en cuatro sucursales del
banco. Est convencido que diferentes tipos de premios atraeran a diferentes grupos de
grupos de ingreso. Las personas de un nivel de ingreso prefieren los regalos, mientras que
los de otro grupo de ingreso pueden sentirse ms atradas por viajes gratuitos a sitios
favoritos para pasar vacaciones. Este decide utilizar el monto de los depsitos como una
medida representativa del ingreso. El desea determinar si existe una diferencia en el nivel
promedio de depsitos entre las cuatro sucursales. Si se halla alguna diferencia, ofrecer una
diversidad de premios promocionales.
Aqu aparecen siente depsitos seleccionados aleatoriamente de cada sucursal en unidades de
US$100 ms cercano.
Depsito
1
2
3
4
5
6
7

Sucursal1
5.1
4.9
5.6
4.8
3.8
5.1
4.8

Sucursal2
1.9
1.9
2.1
2.4
2.1
3.1
2.5

Sucursal3
3.6
4.2
4.5
4.8
3.9
4.1
5.1

Sucursal4
1.3
1.5
0.9
1
1.9
1.5
2.1

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 182
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

183
Caso VII.
Un productor de pinturas para vivienda desea comparar el factor brillo de su pintura
utilizando cuatro emulsiones diferentes. Se pintan cinco tablas con cada tipo de emulsin y la
clasificacin que se dio a cada una aparece aqu:
A un nivel del 1%, existe alguna diferencia en la clasificacin promedio?
Tablas
1
2
3
4
5

Emulsion1
79
82
57
79
83

Emulsion2
69
52
62
61
60

Emulsion3
83
79
85
78
75

Emulsion4
75
78
78
73
71

Caso VIII.
Un estudio reciente realizado por American Assembly of Collegiate Scholls of Business
compar los salaries de los nuevos graduados en diversos campos. Una parte de sus
resultados se representa en la tabla siguiente. A un nivel del 5%, parece que hay diferencia
en los salarios promedios (en miles de dlares) de los graduados en los diferentes campos?
SIC = Sistemas de Informacin por Computador.
MC = Mtodos Cuantitativos
Graduado
1
2
3
4
5
6
7

Finanzas
23.2
24.7
24.2
22.9
25.2
23.7
24.2

Mercadeo
22.1
19.2
21.3
19.8
17.2
18.3
17.2

SIC
23.3
22.1
23.4
24.2
23.1
22.7
22.8

MC
22.2
22.1
23.2
21.7
20.2
22.7
21.8

Caso IX.
NCP fabrica impresoras y aparatos de fax en sus tres plantas situadas en Atlanta, Dallas y
Seattle. Con el fin de medir el conocimiento de los empleados de estas tres plantas acerca de
la administracin de la calidad, se toma una muestra aleatoria de seis empleados de cada
planta y se le explica el examen acerca de su conocimiento de calidad. En la tabla a
continuacin se muestran las puntuaciones obtenidas en los exmenes de 18 empleados. Los
gerentes de la empresa quieren usar los datos para probar la hiptesis de que la media de las
puntuaciones de los exmenes es la misma en las tres plantas. A un nivel del 5%.
EMPLEADOS
1
2
3
4
5
6

PLANTA1
ATLANTA
85
75
82
76
71
85

PLANTA2
DALLAS
71
75
73
74
69
82

PLANTA3
SEATTLE
59
64
62
69
75
67

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 183
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

184
Caso X.
En una auditora, los auditores tienen que emitir opiniones acerca de diversos aspectos con
base en sus propias experiencias directas (Direct), indirectas (Inderect) o la combinacin
(Combination) de ambas. En un estudio se pidi a los auditores que dieran su opinin acerca
de la frecuencia con que se presentan errores en una auditora. Luego se compararon estas
opiniones con los resultados reales. Suponga que los resultados que se presentan a
continuacin de un estudio similar; los valores bajos indican opiniones ms acertadas. Use
= 0.05 para determinar si el tipo de experiencia en que se basa la opinin afecta su calidad.
Cul es su conclusin?
Auditores
1
2
3
4
5
6
7

Direct
17
18.5
15.8
18.2
20.2
16
13.3

Indirect
16.6
22.2
20.5
18.3
24.2
19.8
21.2

Combination
25.2
24
21.5
26.8
27.5
25.8
24.2

Caso XI.
En la publicidad de cuatro pinturas (Paint 1, 2, 3 y 4) se dice que tienen el mismo tiempo de
secado. Para verificarlo, se prueban cinco muestras de cada una de las pinturas. Se registra el
tiempo en minutos necesarios para que el secado sea suficiente para la aplicacin de una
segunda mano. Los datos obtenidos se listan a continuacin. Con un = 0.05 como nivel de
significancia, realice una prueba para determinar si la media de los tiempos de secado es la
misma en cada tipo de pintura.
Paint1
128
137
135
124
141

Paint2
144
133
142
146
130

Paint3
133
143
137
136
131

Paint4
150
142
135
140
153

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 184
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

185
Caso XII.
La encuesta de satisfaccin de clientes de restaurantes de Consumer Reports se basa en ms
de 148,599 visitas a diferentes cadenas de restaurantes de servicio completo (sitio web de
Consumer Reports). Una de las variables en el estudio es el precio de los alimentos, la
cantidad promedio que paga una persona por la comida y la bebida, menos propina. Se
selecciona una muestra de ocho restaurantes de mariscos (Seafood), ocho italianos (Italian) y
ocho de carnes (Steakhouse). Los datos a continuacin muestran los precios de la comida en
dlares de los 24 negocios muestreados. Utilice un = 0.05 para probar si hay una diferencia
significativa entre el precio medio de la comida en los tres tipos de restaurantes.
Restaurantes
1
2
3
4
5
6
7
8

Italian
12
13
15
17
18
20
17
24

Seafood
16
18
17
26
23
15
19
18

Steakhouse
24
19
23
25
21
22
27
31

Caso XIII.
Con el fin de probar si la media del tiempo necesario para mezclar un lote de un material es la
misma si emplea las mquinas de tres fabricantes. Jacobs Chemical obtiene los datos
siguientes sobre el tiempo (en minutos) requeridos para mezclar el material. Use los datos
para probar si las medias poblacionales de los tiempos necesarios para mezclar un lote de
material usando las mquinas de estos tres fabricantes difieren. Use un = 5%.
FABRICANTE1 FABRICANTE2
20
28
26
26
24
31
22
27

FABRICANTE3
20
19
23
22

Caso XIV.
En un experimento diseado para investigar la percepcin de los valores ticos corporativos
entre personas especializadas en Marketing, se obtuvieron los datos siguientes (las
puntuaciones ms altas indican valores ticos ms elevados). Use un = 5% para probar si
existe una diferencia significativa de percepcin entre los tres grupos.
Gerentes de
Marketing
6
5
4
5
6
4

Investigacin
de Mercados
5
5
4
4
5
4

Publicidad
6
7
6
5
6
6

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 185
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

186
Caso XV.
Para probar si existe una diferencia significativa entre cuatro mquinas respecto del nmero
de horas entre dos averas, se obtuvieron los datos siguientes. Con = 5%, como nivel de
significancia, cul es la diferencia, si hay alguna, entre las medias poblacionales de los
tiempos de las cuatro mquinas?
Mquina1
6.4
7.8
5.3
7.4
8.4
7.3

Mquina2
8.7
7.4
9.4
10.1
9.2
9.8

Mquina3
11.1
10.3
9.7
10.3
9.2
8.8

Mquina4
9.9
12.8
12.1
10.8
11.3
11.5

Caso XVI.
Suponga que se selecciona una muestra de 10 empleados de agencias de publicidad con su salario
anual, para investigar si hay alguna diferencia en la compensacin promedio anual de directores
artsticos con un 5% de nivel de significancia en las cuatro regiones: Oeste, Sur, Norte y Noreste. El
salario base (en miles de dlares) para cada uno de los individuos muestreados es:
OESTE
60.9
45.9
62.1
66.6
68
65
49.4
62.3
62.6
57.2

SUR
50.8
39.6
44.2
40
53.9
45.4
61.1
42.3
38.4
38.3

NORTE
49.5
42.3
35.5
49.1
56.7
41.4
51.3
49.4
42.1
55.7

NORESTE
65.9
58.6
49.3
53.9
48.5
52.9
52.4
48.1
46.5
45.9

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 186
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

187
Caso XVII.
Es ampliamente sabido que lso excesos o picos de voltaje pueden causar daos en equipos
electrnicos sensibles. Se realiza un estudio de los picos de voltaje para indagar si existe
diferencias en su frecuencia promedio entre los siete das de la semana o nocon un alfa de
0.05. En un periodo de 10 semanas seleccionadas aleatoriamente, se observa el nmero de
picos de voltaje durante 10 perodos de 24 horas para cada uno de los siete das de la semana.
LUNES
25
21
20
20
21
20
25
21
18
22

MARTES
24
20
19
16
21
19
24
15
20
14

MIERCOLES
16
20
19
21
17
13
23
23
23
23

JUEVES
22
17
19
21
19
13
27
15
20
20

VIERNES
33
28
44
33
22
36
28
27
22
16

SABADO
28
28
31
21
33
22
22
20
22
26

DOMINGO
35
20
29
19
26
23
26
30
29
29

Caso XVIII.
Que concluye usted acerca de la aseveracin de que las tres poblaciones correspondientes a
los tres grupos de edades tienen la misma temperatura corporal media?
TEMPERATURAS CORPORALES (F) POR EDAD
18-20

n
X'
s

21-29

30 o ms

98,0
98,4
97,7
98,5
97,1

99,6
98,2
99,0
98,2
97,9

98,6
98,6
97,0
97,5
97,3

5
97,940
0,568

5
98,580
0,701

5
97,800
0,752

BASADOS EN DATOS DEL DOCTOR PHILIP MACKOWIAK,


EL DR. STEVEN WASSERMAN Y EL DR. MYRON LEVINE
DE LA UNIVERSITY OF MARYLAND.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 187
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

188
Caso XIX.
La City Resouce Recovery Company (CRRC) recolecta desperdicios desechados por los
hogares de la regin. Los desperdicios deben separarse en las categoras de metal, papel,
plstico y vidrio. Al planificar que equipo necesita para recolectar y procesar la basura, la
CRRC consulta los datos que se resumen en la siguiente tabla:
En el nivel de significancia de 0.05, pruebe la afirmacin de que las cuatro poblaciones
especficas tienen la misma media. Con base en los resultados, cree usted que las cuatro
categoras requieran los mismos recursos para su recoleccin y procesamiento?

N
X'
S

METAL PAPEL PLASTICO VIDRIO


62
62
62
62
2,218
9,428
1,911
3,752
1,091
4,168
1,065
3,108

Clculos con tamaos de muestra desiguales.


F=varianza entre muestras/varianza dentro de las muestras
F= [ (ni(X'i-X")) / k-1 ] / [ ((ni-1)si) / (ni-1)]
donde:
X" = media de todos los puntajes de muestra combinados
k = nmero de medias de poblacin que se comparan
ni = nmero de valores en la i-esima muestra
N = nmero total de valores en todas las muestras combinadas
X'i = media de los valores de la i-esima muestra
si = varianza de los valores de la i-esima muestra

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 188
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

189
Anlisis de Varianza con un Factor en Bloques (Randomized Blocks ANOVA)

En un estudio de investigacin de mercados se plantea contrastar si el consumo medio de


cuatro vehculos es homogneo. Para ello se realizan pruebas experimentales con tres
conductores distintos. Para eliminar el efecto que puedan tener los conductores sobre el
consumo de los vehculos se recoge la informacin, de tal manera que todos los conductores
realizan pruebas con todos los vehculos. En la siguiente tabla se exponen los consumos de
combustibles por cada 100 km de cada automvil con cada conductor.
Contrastar con un nivel de significancia del 5%.
1. La hiptesis de igualdad de consumos medios con los cuatro automviles.
2. La hiptesis de igualdad de consumos medios de los tres conductores.
SCTR = Suma de Cuadrados debido a los Tratamientos = b * (Xi X)^2
SCBL = Suma de Cuadrados debido a los Bloques = a * (Xi X)^2
SCE = Suma de Cuadrados debido al Error
= [(X^2)] - [b * (Xi X)^2] [a * (Xi X)^2] [a*b*X^2 ]

A1
8
7
6

B1
B2
B3

A2
7
6
5

BLOQUES

A3
5
6
4

A4
6
7
5

TRATAMIENTOS

B=3

K=A=4

A2
7
6
5

A3
5
6
4

A4
6
7
5

SUMATORIA

(X-X")^2

X^2

B1
B2
B3

A1
8
7
6

26

6.5

0.25

42.25

26

6.5

0.25

42.25

20

25

SUMATORIA
X
(X-X")^2
X^2

21
7
1
49

18
6
0
36

15
5
1
25

18
6
0
36

SUM Xi
72
2
146

MEDIA Xi

1.5

109.5

SCTR
SUMA CUADRADO
TRATAMIENTOS

6
6

6
36
SCBL
6
SUMA CUADRADO
6
BLOQUES

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 189
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

190

SCE = Suma de Cuadrados debido al Error


= [(X^2)] - [b * (Xi X)^2] [a * (Xi X)^2] [a*b*X^2 ]
Estas sumas divididas entre sus correspondientes grados de libertad proporcionan los
valores de los cuadrados medios.
BLOQUES

TRATAMIENTOS

A1
8
7
6

B1
B2
B3

A2
7
6
5

X^2
64
49
36

X^2
49
36
25

149
SUMATORIA

A3
5
6
4

110

A4
6
7
5

X^2
25
36
16
77

SCE
2
SUMA CUADRADO
ERROR

Randomized blocks ANOVA


n Std. Dev
3
1.000
3
1.000
3
1.000
3
1.000

A1
A2
A3
A4

6.500
6.500
5.000
6.000

4
4
4
12

1.291
0.577
0.816
1.128

Source

SS

df

MS

pvalue

Treatments

6.00

2.000

6.00

.0308

Blocks

B1
B2
B3
Total

6.00

3.000

9.00

.0156

2.00
14.00

6
11

0.333

ANOVA
table

Error
Total

Causas Posibles

Factor A

Suma de
Cuadrados
6.00

Bloques

Factor B

6.00

Error E

2.00

Fuentes de
Variacion

Error Muestral

Grados de
Libertad
3

Cuadrados
F
medios
de Prueba
2
6
3
9
0.33333333

36
49
25
110

446

Mean
7.000
6.000
5.000
6.000

X^2

F
Terica
4.76
5.14

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 190
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

191
Fuentes de
Variacion

Causas Posibles

Factor A

Bloques

Factor B

Error Muestral

Error E

Suma de
Cuadrados

SCTR
SCBL
SCE

Grados de
Libertad
K1

Cuadrados
medios
CMTR=SCTR/(K-1)

B1

CMBL=SCBL/(B-1)

(K-1)*(B-1)

CME=SCE/(K-1)(B-1)

F
de Prueba
CMTR/CME

F
Terica

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 191
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

192

Causas Posibles

Factor A

Suma de
Cuadrados
6.00

Bloques

Factor B

6.00

Error E

2.00

Fuentes de
Variacion

Error Muestral

Grados de
Libertad
3

Cuadrados
medios
2
3
0.33333333

F
de Prueba
6

F
Terica

5.14

4.76

Contrastes y Conclusiones:
1)
Visto que F del Factor A es mayor FA = 6 > 4.76 = F (3,6-0.05)
Por tanto, rechazamos que los consumos medios de la conduccin de los cuatro automviles
sean homogneos, con un nivel de significancia del 5%.
2)
Visto que F del Factor B es mayor FB = 9 > 5.14 = F (2,6-0.05)
Por tanto, rechazamos que los consumos medios de la conduccin de la conduccin de los
tre conductores sean homogneos, con un nivel de significancia del 5%.
Caso II.

Prueba de estrs para controladores de trfico areo.


Como resultado de un estudio para medir la fatiga y el estrs de los controladores de trfico
areo, se propusieron modificaciones y rediseos a su estacin de trabajo. Despus de
evaluar diversos diseos, se seleccionaron tres alternativas consideradas con el mayor
potencial para reducir el estrs en los controladores. La pregunta clave es con = 5%: en
qu medida difieren estas tres alternativas en su efecto sobre el estrs de los sujetos de
estudio
Controller1
Controller2
Controller3
Controller4
Controller5
Controller6

System1
15
14
10
13
16
13

System2
15
14
11
12
13
13

System3
18
14
15
17
16
13

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 192
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

193
Caso III.
Un vendedor de automviles realiza una prueba para determinar si el tiempo en minutos que se necesita
para afinar un motor pequeo depende de si se utiliza un analizador de motor computarizado o uno
electrnico. Debido a que el tiempo de afinacin vara entre automviles compactos, medianos y
grandes, en el experimento se utilizaron los tres tipos de vehculos como bloques. Los datos obtenidos
se indican a continuacin.
Tratamientos
Analizador
Computarizado
Electrnico
50
42
55
44
63
46

Bloques
Automvil
Compacto
Mediano
Grande

Caso IV.
El U.S Department of Housing and Urban Development publica datos que reflejan el Mercado de
rentas mensuales en las reas metropolitanas. Los datos siguientes representan los precios de alquiler
($) mensuales aceptables en cinco zonas metropolitanas para departamentos de 1, 2 y 3 habitaciones
(The New York Times Almanac, 2006).
1 HABITACION
2 HABITACIONES
3 HABITACIONES

BOSTON
1,077.00
1,266.00
1,513.00

MIAMI
775.00
929.00
1,204.00

SAN DIEGO
975.00
1,183.00
1,725.00

SAN JOS
1,107.00
1,313.00
1,889.00

WASHINGTON
1,045.00
1,187.00
1,537.00

Caso V.
El Instituto Nacional de Salud practic encuestas a 1,060 adultos para determinar cmo pasaban su
tiempo libre. Los datos han sido desglosados por grupos de edad y se han condensados a slo 16
observaciones para efectos de computacin. Parece haber alguna diferencia en el tiempo promedio
que se pasa en las diferentes actividades? Las observaciones estn en horas por semana. Haga una
prueba para determinar si debera utilizarse el bloqueo. Use el valor alfa 0.05.
ENCUESTADOS
POR EDAD
15-18
19-25
26-35
36 Y MS AOS

TV
35
22
25
27

LECTURA
12
13
15
20

ACTIVIDAD
DEPORTES
TIEMPO CON LA FAMILIA
10
6
12
8
8
15
5
20

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 193
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

194
Caso VI.
El concesionario Martin Motors tiene tres automviles de la misma marca y modelo. El director desea
comparar el consumo de combustible de ellos (designados automvil A, B y C) con cuatro tipos de
gasolina. En cada prueba se puso un galn de gasolina al tanque vaco de los automviles y se
condujeron hasta que se agot. En la siguiente tabla se muestra el nmero de millas que se recorrieron
en cada prueba.
TIPO DE
GASOLINA
REGULAR
SUPER REGULAR
SIN PLOMO
PREMIUM SIN PLOMO

DISTANCIA (MILLAS)
AUTO A
AUTO B
AUTO C
22.40
20.80
21.50
17.00
19.40
20.70
19.20
20.20
21.20
20.30
18.60
20.40

A un nivel de significancia del 0.05:


1) Hay alguna diferencia entre los tipos de gasolina?
2) Hay alguna diferencia entre los automviles?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 194
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

195
Anlisis de Varianza con dos Factores (Two Factors ANOVA) Experimentos Factoriales

En algunos experimentos tal vez se quieran formular conclusiones acerca de ms de una


variable o factor. Un experimento factorial es el diseo que permite obtener conclusiones
simultneas acerca de dos o ms factores.

El trmino factorial se utiliza porque las

condiciones experimentales incluyen todas las posibles combinaciones de los factores. Por
ejemplo, para a niveles de un factor A y b niveles de un factor B, el experimento incluir
una coleccin de datos en el tratamiento de las combinaciones ab.
En numerosos experimentos, se investigan dos o ms factores. No se considera extrao
ninguno de ellos y cada uno interesa primordialmente al experimentador. En tal caso, se
habla de un experimento factorial, para resaltar el hecho de inters se centra en el efecto de
esos dos o ms factores en una respuesta medida.
Caso I.
Un estudio acerca del examen de admisin de graduados en administracin (GMAT, por su
siglas en ingls), una prueba estandarizada que utilizan las escuelas de negocios para
evaluar una habilidad de los aspirantes a cubrir un programa de grado en ese campo. Las
puntuaciones del GMAT estn en el rango de 200 a 800; las de nivel ms elevado significan
una aptitud ms alta. Con la intensin de mejorar el desempeo de los estudiantes en el
GMAT, una de las principales universidades de Texas considera ofrecer los siguientes tres
programas de preparacin para ese examen:
1. Una sesin de repaso de tres horas, en la que se revisa el tipo de preguntas que suele
encontrarse en el GMAT.
2. Un programa de un da en el que se ve el material ms relevante del examen, junto con
un examen muestra que se califica.
3. Un curso intensivo de 10 semanas en el que se identifican las debilidades de cada
estudiante y se establecen programas individualizados de mejora.
Por tanto, un factor en este estudio es el programa de preparacin, el cual tiene tres
tratamientos: un repaso de tres horas, un programa de un da y un curso de 10 semanas.
Por lo general, los aplicantes del GMAT son estudiantes de tres licenciaturas: negocios,
ingeniera y artes y ciencias.

En consecuencia el segundo factor de inters en el

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 195
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

196

experimento es si la licenciatura influye en la calificacin del GMAT. Para este segundo


factor hay tambin tres tratamientos: negocios, ingeniera y artes y ciencias. Pruebe la
influencia de estos factores con un = 0.05.
Factor A:
Preparation Program
Three-hour review
One-day program
10-week course

Factor B: College
Business
500
580
460
540
560
600

Engineering
540
460
560
620
600
580

Arts and Sciences


480
400
420
480
480
410

a = nmero de niveles del factor A = 3 programas


b = nmero de niveles del factor B = 3 licenciaturas
r = nmero de replicaciones = 2 sujetos por combinaciones de tratamientos
N = nmero total de observaciones en el experimento = 18
SCT = Suma de Cuadrados Total = (Xij X)^2
SCA = Suma de Cuadrados del Factor A = br * (Xi X)^2
SCB = Suma de Cuadrados del Factor B = ar * (Xj X)^2
SCAB = Suma de Cuadrados debido a la interaccin
= r * (Xij Xi Xj + X)^2
SCE = STC - SCA SCB SCAB
Los clculos de anlisis de varianza con los datos de la tabla anterior permitirn contestar
las siguientes preguntas:
Efecto Principal (Factor A): Difieren los programas de preparacin en cuanto a sus efectos
sobre las calificaciones en la prueba GMAT?
Efecto Principal (Factor B): Difieren las licenciaturas en cuanto a las puntuaciones de la
prueba GMAT?
Efecto Interaccin (Factores A y B): Se desempean mejor los alumnos de algunas
licenciaturas en determinado tipo de programas de preparacin, y los de otras licenciaturas
en otro tipo de programa de preparacin?
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 196
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

197
Factor A:
Factor B: College
Preparation Program Business
Engineering
Three-hour review
500
540

Arts and Sciences


480

SUM

SUM
MEAN (Xij)

580
1,080
540
460
540
1,000
500
560
600
1,160
580

460
1,000
500
560
620
1,180
590
600
580
1,180
590

400
880
440
420
480
900
450
480
410
890
445

SUM

3,240

3,360

2,670

9,270

MEAN (Xj)
(Xj-X")^2
SUM

540
625
7,550

560
2,025

445
4,900

X"

SCB

45,300

Factor 2 (B)

SUM
MEAN (Xij)
One-day program
SUM
MEAN (Xij)
10-week course

469.44
1,469.44
277.78

1,469.44
1,002.78
44.44

2,960

MEAN (X"i)
Factor 1 (A)
(Xi-X")^2
493.33
469.44

3,080
513.33

2.78

3,230
538.33
SUM.
GRAL.

544.44

515
1,016.67
6,100.00

277.78
44.44
544.44

5,600.00
11,200.00

SUM
SCAB

SCA = Suma de Cuadrados del Factor A = br * (Xi X)^2


SCB = Suma de Cuadrados del Factor B = ar * (Xj X)^2
SCAB = Suma de Cuadrados debido a la interaccin
= (Xij Xi Xj + X)^2

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 197
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

SUM
SCA

198
Factor A:

Factor B: College

Preparation Program
Three-hour review
One-day program
10-week course

Business
500
580
460
540
560
600

(X-X")^2
225
4,225
3,025
625
2,025
7,225
17,350

X"

515

Engineering
540
460
560
620
600
580

(X-X")^2
625
3,025
2,025
11,025
7,225
4,225
28,150

Arts and
Sciences
480
400
420
480
480
410

(X-X")^2
1,225
13,225
9,025
1,225
1,225
11,025
36,950

SCT = Suma de Cuadrados Total = (Xij X)^2


SCE = STC - SCA SCB SCAB = 82,450 6,100 45,300 11,200 = 19,850
Estas sumas divididas entre sus correspondientes grados de libertad proporcionan los
valores de los cuadrados medios.
Suma de
Variacion Cuadrados
Factor 1 (A) 6,100.0000

Fuentes de

Causas Posibles
Causas Posibles Factor 2 (B) 45,300.0000
Interaccin

Error Muestral

Interaccin 11,200.0000

Error E

19,850.0000

Grados de
Libertad
2
2
4

Cuadrados
F
medios
de Prueba
3,050.0000
1.3829
22,650.0000 10.2695
2,800.0000
1.2695
2,205.5556

F
Terica
4.2565
4.2565
3.6331

Two factor ANOVA


Factor 2
Means:
Business

Factor 1

Three-hour
review
One-day
program
10-week course

Engineering Arts and Sciences

540.0

500.0

440.0

493.3

500.0
580.0
540.0

590.0
590.0
560.0

450.0
445.0
445.0

513.3
538.3
515.0

MS
3,050.000
22,650.000
2,800.000
2,205.556

F
1.38
10.27
1.27

pvalue
.2994
.0048
.3503

replications per
2 cell
ANOVA table
Source
Factor 1
Factor 2
Interaction
Error
Total

SS
6,100.00
45,300.00
11,200.00
19,850.00
82,450.00

df
2
2
4
9
17

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 198
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

STC
82,450

199

Suma de
Variacion Cuadrados
Factor 1 (A)
SCA
SCB

b-1

Cuadrados
medios
SCA/(a-1)
SCB/(b-1)

Fuentes de

Causas Posibles
Causas Posibles Factor 2 (B)

Grados de
Libertad
a-1

F
de Prueba

F
Terica

SCA/(a-1) /
SCE/[ab(n-1)]
SCB/(b-1) /
SCE/[ab(n-1)]
SCAB/[(a-1)(b-1)] /

Interaccin

Interaccin

SCAB

(a-1)(b-1)

SCAB/[(a-1)(b-1)]

Error Muestral

Error E

SCE

ab(n-1)

SCE/[ab(n-1)]

SCE/[ab(n-1)]

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 199
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

200
ANOVA table
Source

pvalue

3,050.000

1.38

.2994

22,650.000

10.27

.0048

1.27

.3503

SS

df

MS

Factor 1

6,100.00

Factor 2

45,300.00

Interaction

11,200.00

2,800.000

Error
Total

19,850.00
82,450.00

9
17

2,205.556

Para hacer la prueba de hiptesis de dos factores en este estudio se utiliz un nivel de
significancia del = 0.05. El valor-p utilizado para probar si hay diferencias significativas
entre los tres programas de preparacin Factor 1 (A) es de .2994 es mayor que = 0.05, no
existe diferencia significativa entre las medias de las puntuaciones obtenidas en el GMAT
para los tres programas de preparacin. Sin embargo, en relacin con el efecto de la
licenciatura, Factor 2 (B), el valor-p = 0.0048 es menor que = 0.05; por tanto, si hay una
diferencia significativa en las medias de las puntuaciones en el GMAT entre las tres
licenciaturas.
Por ltimo, debido a que el valor-p de 0.3503 corresponde al efecto de la interaccin es
mayor que = 0.05, no hay efecto significativo de interaccin. Por tanto, en este estudio
No se encuentran razones para pensar que los tres programas de preparacin difieren en su
capacidad para capacitar a estudiantes de las distintas licenciaturas para el GMAT.
Se encontr que la licenciatura s es factor significativo. Al revisar los clculos de la tabla,
vemos que las medias muestrales son: estudiantes de negocios X=540, ingeniera X=560 y
artes y ciencias X=445. Se pueden realizar pruebas para los distintos tratamientos; sin
embargo, despus de observar las tres medias muestrales es posible anticipar que no hay
diferencia entre los alumnos con las licenciaturas en ingeniera y negocios. Pero los de
artes y ciencias parecen estar menos preparados para este examen que los de las otras dos
licenciaturas. Quizs esta observacin haga que la universidad busque otras opciones para
ayudar a este grupo a prepararse para el GMAT.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 200
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

201

Grfica de Interaccin por el Factor 2.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 201
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

202
Caso II.

Supongamos que el investigador de mercados se interese por el efecto de dos variables que
influyen en la compra de un producto. Por ejemplo, consideremos un punto de venta donde
existe servicio de cafetera, venta de prensa, Alimentacin y restaurante, etc., abierto los
siete das de la semana. Si deseamos investigar el mercado de alquiler de vdeos en este
centro dependiendo de dos factores.
A. Que el alquiler se realice en da laborable, vspera de festivo o festivo.
B. La zona local, donde se ubican los estantes que contienen los vdeos, con tres niveles:
cerca de la cafetera, prximo a la seccin de venta de prensa o cerca del restaurante.
Trataremos de estudiar la influencia de los factores A y B sobre la variable dependiente que
mide el volumen de alquiler de vdeos.

Estos dos factores actan de forma no

independiente, puesto que puede existir influencia o interaccin entre que sea da festivo y
que el punto de alquiler de vdeos est situado cerca del restaurante, o que sea da laborable
y el punto de alquiler de vdeos est prximo a la seccin de venta de prensa. Estudiamos,
por tanto, la influencia de forma conjunta, esto es, interactuando y no marginalmente.
Las poblaciones consideradas seran, por tanto, (A, B):
A indica el da de la semana, con tres niveles: Laborales (L), vspera de festivo (VF) o
festivo (F)
B indica dnde situamos el punto de alquiler tambin con tres niveles: Prximo a la
cafetera , Prensa (P) o restaurante .
Situacin 1:
Supongamos que queremos analizar si el nmero medio de cintas de video alquiladas por
da depende de que sea da laborable, vspera de festivo o festivo, y tambin si depende de
la ubicacin de los estantes donde estn colocadas las cintas, esto es, cerca del punto de
venta de prensa, del restaurante o de la cafetera de un centro comercial abierto los siete
das de la semana. Para ello se toman las siguientes observaciones, que expresan el nmero
de cintas de vdeo alquiladas dependiendo del da de la semana y de la ubicacin de las
cintas. Tomando tres observaciones mustrales para cada combinacin de fila columna.
Contrastar con un nivel de significancia del 1%.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 202
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

203

VF

C
30
25
20
24
28
30
32
35
28

P
10
15
10
32
30
21
25
35
40

R
15
20
10
32
28
25
20
25
30

Caso III.

Un concesionario de automviles desea hacer una investigacin de mercado sobre el


nmero medio de vehculos vendidos en funcin de dos factores:
A = la gama a la que pertenecen los vehculos.
B = el color de esos vehculos.
Dado que el nmero de gamas es grande, elegimos al azar las tres ms representativas, y por
el mismo motivo, elegimos al azar tres colores. Los vehculos vendidos de esas gamas con
esos colores se eligen al azar entre los coches matriculados, en tres perodos de tiempo
iguales. Los datos obtenidos figuran en la tabla siguiente.
Contrastar con un nivel de significacin del 1%.

A1

A2

A3

B1
4
4
4
4
3
3
2
2
1

B2
2
2
1
3
3
2
1
1
1

B3
1
1
1
3
3
2
1
1
0

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 203
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

204
Caso IV.
En un experimento factorial con dos niveles para el factor A y tres niveles para el factor B se
obtuvieron los datos siguientes.
FACTOR A
NIVEL1

NIVEL1
135
165
125
95

NIVEL2

FACTOR B
NIVEL2
90
66
127
105

NIVEL3
75
93
120
136

Realice una prueba para determinar si hay algunos efectos principales significativos y algn efecto de
interaccin. Use valor de significancia del 5%.
Caso V.
Una empresa de ventas por catlogo realiz un experimento factorial para probar el efecto del tamao
de un anuncio de revista y su diseo sobre el nmero de solicitudes de catlogos recibido (datos en
miles). Se pusieron a consideracin tres diseos publicitarios y dos tamaos. Los datos obtenidos se
presentan a continuacin. Pruebe si hay efectos significativos debido al tipo de diseo, al tamao del
anuncio o a la interaccin. Valor alfa 0.05.
DISEO
A
B
C

TAMAO DEL ANUNCIO


PEQUEO
GRANDE
8
12
12
8
22
26
14
30
10
18
18
14

Caso VI.
Un parque de diversin estudi algunos mtodos para reducir el tiempo de espera (en minutos) al bajar
y subir a los pasajeros a los juegos. Se propusieron dos mtodos para realizar estas tareas. Para tomar
en cuenta las diferencias potenciales debido al tipo de juego y a la interaccin que puede haber entre
tipo de juego y mtodo de subir y bajar a los pasajeros, se dise un experimento factual. Use los datos
siguientes para probar cualquier efecto significativo debido al mtodo de subir y bajar a los pasajeros,
el tipo de juego y la interaccin. Use valor de significancia del 5%.
MTODOS
SUBIR Y BAJAR
MTODO1
MTODO2

MONTAA RUSA
41
43
49
51

TIPO DE JUEGO
RUEDA DE LA FORTUNA
52
44
50
46

TOBOGN
50
46
48
44

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 204
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

205
Caso VII.
Para identificar si hay alguna diferencia significativa en la rapidez de dos sistemas de software para
traducir el ingls en otros idiomas, se dise un experimento factorial. Como el idioma al que se
traduzca es tambin un factor importante, los sistemas se prueban traduciendo tres: espaol, francs y
alemn. Utilice los datos siguientes del tiempo en horas necesario para efectuar esta tarea.
SOFTWARE
SISTEMA1
SISTEMA2

ESPAOL
8
12
6
10

IDIOMA
FRANCS
10
14
14
16

ALEMN
12
16
16
22

Realice una prueba para determinar si hay alguna diferencia significativa debido al idioma al que se
traduce y si hay algn efecto de interaccin. Use valor de significancia del 5%.
Caso VIII.
En una fbrica se disea un experimento factorial para determinar si hay diferencia entre el nmero de
partes defectuosas producidas por dos mquinas y si el nmero de defectos depende tambin de si a
estas mquinas se les suministra la materia prima manualmente o mediante un sistema de alimentacin
automtico. A continuacin se presentan los datos del nmero de partes defectuosas producidas. Use el
valor alfa 0.05 para probar si hay algn efecto significativo debido a la mquina, al sistema de
suministro de la materia prima y a la interaccin.

MQUINA 1
MQUINA 2

SUMINISTRO DE MATERIA PRIMA


MANUAL
AUTOMTICO
30
30
34
26
20
24
22
28

Caso IX.
Robert Altoff es Vicepresidente de Ingeniera de un fabricante de mquinas lavadoras domsticas.
Como parte del desarrollo de un producto nuevo, Altoff desea determinar el tiempo ptimo del ciclo de
lavado. Parte del desarrollo es estudiar la relacin entre el detergente empleado (cuatro marcas) y la
duracin del ciclo de lavado (18, 20, 22 o 24 minutos). A fin de realizar el experimento se asignan 32
cargas estndar de ropa (con igual contenido de suciedad y pesos totales iguales) a las 16
combinaciones detergente-ciclo de lavado. Los resultados (en libras de suciedad eliminada) se
muestran en la siguiente tabla.
MARCA DEL
DETERGENTE
A
B
C
D

18
0.13
0.11
0.14
0.10
0.16
0.17
0.09
0.13

TIEMPO DEL CICLO (MIN)


20
22
0.12
0.19
0.11
0.17
0.15
0.18
0.14
0.17
0.15
0.18
0.14
0.19
0.12
0.16
0.13
0.16

24
0.15
0.18
0.20
0.18
0.19
0.21
0.15
0.17

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 205
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

206
A un nivel de siginificancia de 0.05.
1) Pruebe el efecto de interaccin de la marca y el tiempo del ciclo sobre la suciedad eliminada.
2) Con base a los resultados anteriores, realice las pruebas de hiptesis apropiadas para detectar las
diferencias entre las medias de los factores.
Caso X.
La American Accounting Association realize un studio para comparer los salaries semanales de
hombres y mujeres empleados en el sector pblico o privado en contabilidad.
GNERO
HOMBRES

MUJERES

SECTOR
PUBLICO
PRIVADO
978.00

1,335.00

1,035.00

1,167.00

964.00

1,236.00

996.00

1,317.00

1,117.00

1,192.00

863.00

1,079.00

975.00

1,160.00

999.00

1,063.00

1,019.00

1,110.00

1,037.00

1,093.00

1) Pruebe el efecto de interaccin del gnero y el sector en los salarios. A un nivel del 5% de
significancia.
2) Con base a los resultados anteriores, realice las pruebas de hiptesis adecuadas para detectar las
diferencias entre las medias de los factores.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 206
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

207
Caso XI.
Supongamos que se realiza un estudio para probar la efectividad de tres tipos de sistemas de incentivos
en la productividad de los empleados. La gerencia considera que las diferencias de productividad
podran ser distintas entre hombres y mujeres. Se obtuvo la siguiente tabla de resultados.
Gnero
Hombres

Mujeres

I
26
34
46
48
42
49
74
61
51
53

Sistema de Incentivos
II
51
50
33
28
47
50
48
60
71
42

III
52
64
39
54
58
53
77
56
63
59

1) Pruebe el efecto de interaccin del gnero y el sistema de incentivos. A un nivel del 5% de


significancia.
2) Con base a los resultados anteriores, realice las pruebas de hiptesis adecuadas para detectar las
diferencias entre las medias de los factores.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 207
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

208

Anlisis de Regresin y Correlacin (Correlation and Regression)


El modelo estadstico que nos permite representar la relacin entre dos variables
(dependiente e independiente) se denomina Ecuacin de Regresin, ya que a travs de este
modelo podemos regresar o proyectar datos sobre el posible comportamiento futuro del
fenmeno.
El primero en desarrollar el anlisis de regresin fue el cientfico ingls Sir Francis Galton
(1822-1911). Este estudio el fenmeno de la herencia y demostr que cuando matrimonios con
estaturas altas o bajas tienen hijos, las estaturas de esos hijos tienden a exhibir regresin, es decir, a
desplazarse hacia una estatura media ms representativa.
Dada una coleccin de datos de muestra apareados, la ecuacin de regresin
y = bo + bix
y = f(x)
describe la relacin entre dos variables. La grafica de la ecuacin de regresin se denomina
lnea de regresin (o lnea de mejor ajuste, o lnea de mnimos cuadrados).
Esta definicin expresa una relacin entre "x" (variable independiente o variable
predictoria) y "y" (llamada variable dependiente o variable de respuesta).
Variable dependiente (Y): Es la variable que se desea explicar o predecir; tambin se le
denomina regresando o variable de respuesta.
Variable independiente (X): se utiliza para explicar a Y.
Notacin para la ecuacin de regresin.
Parmetro Estadstica
de Poblac. de Muestra
Ordenada al origen de
la ecuacin de regresin o
bo
Pendiente de la
la ecuacin de regresin 1
b1
Ecuacin de la lnea
de Regresin
Y=o+ix
y=bo+bix
Donde bo es la ordenada de origen y bi es la pendiente.
bo y bi son estadsticas de muestra que sirven para estimar los parmetros de poblacin o y
ix.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 208
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

209
Mnimos cuadrados ordinarios (MCO).
El propsito del anlisis de regresin es determinar una recta que se ajuste a los datos
mustrales mejor que cualquier otra recta que pueda dibujarse.
bo y bi estos valores los podemos determinar a travs de un procedimiento matemtico que
se denomina Mnimos Cuadrados Ordinarios (MCO). MCO producir una recta que se
extiende por el centro del diagrama de dispersin aproximndose a todos los puntos de datos
mas que cualquier otra recta.
Suma de los cuadrados de X.
SCx = (Xi-X')
SCx = X - [(X)/n]
Suma de los cuadrados de Y.
SCy = (Yi-Y')
SCy = Y - [(Y)/n]
Suma de los productos cruzados de X y Y.
SCxy = (Xi-X')(Yi-Y')
SCxy = XY - [(X)(Y)/n]
Vale la pena notar que las primeras porciones de cada una de estas frmulas:
SCx = (Xi-X')
SCy = (Yi-Y')
SCxy = (Xi-X')(Yi-Y')
Ilustran como la recta MCO se basa en las desviaciones de las observaciones a partir de su
media.
Dadas las sumas de cuadrados y los productos cruzados, es sencillo calcular la pendiente de
la recta de regresin y el intercepto, as:
La Pendiente de la recta de regresin.
bi = SCxy/SCx
El intercepto de la recta de regresin.
bo = Y' - biX'
donde Y' y X' son las medias de los valores de Y y los valores de X.
NOTA: Estos clculos son extremadamente sensibles a la aproximacin. Por tanto, se
aconseja en aras de la exactitud, efectuar los clculos hasta con cinco o seis cifras decimales.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 209
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

210
El error estndar de estimacin Se.
Es una medida del grado de dispersin de los valores Yi alrededor de la recta de
regresin. Mide la variacin de los puntos de datos por encima y por debajo de la recta de
regresin. Refleja la tendencia a desviarse del valor real de Y cuando se utiliza el modelo de
regresin para fines predictivos.
El error estndar de estimacin mide la variacin promedio de los puntos de datos
alrededor de la recta de regresin que se utiliza para estimar Y y por ende proporciona una
medida del error que se presentara en dicha estimacin.
Se = (Yi-Y^i)/n-2
Suma de Cuadrados del Error - SCE
SCE = SCy - (SCxy)/SCx
En un modelo de regresin simple, se imponen dos restricciones en el conjunto de
datos, debido a que se deben dos parmetros, o y ix. Por tanto hay n-2 grados de libertad y
CME es
Cuadrado Medio del Error
CME = SCE/n-2
El Error Estndar
Se = CME
El error estndar siempre se expresa en las mismas unidades que la variable dependiente Y.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 210
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

211
Caso I.
La gerencia de Aeromar, considera que existe una relacin directa entre los gastos
publicitarios y el nmero de pasajeros que escogen viajar por Aeromar. Para determinar si
esta relacin existe, y si es as cual podra ser la naturaleza exacta, los analistas decidieron
utilizar los procedimientos de MCO para determinar el modelo de regresin. Represente
grficamente los resultados.
y=bo+bix
Datos de Regresin para AEROMAR
Observacin Publicidad Pasajeros
Mes
En miles US$ En miles
X
Y
1
10
15
2
12
17
3
8
13
4
17
23
5
10
16
6
15
21
7
10
14
8
14
20
9
19
24
10
10
17
11
11
16
12
13
18
13
16
23
14
10
15
15
12
16
TOTALES
187
268

XY

X^2

Y^2

Coeficiente de Correlacin de Pearson


Es una prueba estadstica para analizar la relacin entre dos variables medidas en un nivel
por intervalos o de razn.
El valor positivo para un bi indica una relacin directa. A medida que la publicidad aumenta,
tambin lo hace el nmero de pasajeros. Ahora es til obtener una medida de la fuerza de esa
relacin. Esta es la funcin del Coeficiente de Correlacin, desarrollada por Carl Pearson, a
veces se le llama el Coeficiente de Correlacin producto-momento de Pearson.

El Coeficiente de Correlacin r puede asumir cualquier valor entre -1 y +1, es decir,


-1 r +1
Un valor de r= -1 indica una relacin negativa entre X y Y.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 211
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

212
Interpretacin: El Coeficiente r de Pearson puede variar de -1 a +1, donde:
-1.00 = Correlacin negativa perfecta. (a mayor X, menor Y, de manera
proporcional. Es decir, cada vez que X aumenta una unidad, Y disminuye siempre
una cantidad constante) Esto tambin se aplica a menor X, mayor Y.
-0.90 = Correlacin negativa muy fuerte.
-0.75 = Correlacin negativa considerable.
-0.50 = Correlacin negativa media.
-0.25 = Correlacin negativa dbil.
-0.10 = Correlacin negativa muy dbil.
-0.00 = No existe Correlacin alguna entre las variables.
+ 0.10 = Correlacin positiva muy dbil.
+ 0.25 = Correlacin positiva dbil.
+ 0.50 = Correlacin positiva media.
+ 0.75 = Correlacin positiva considerable.
+ 0.90 = Correlacin positivia muy fuerte.
+1.00 = Correlacin positiva perfecta. (a mayor X, mayor Y o a menor X, menor
Y, de manera proporcional. Cada vez que X aumenta una unidad, Y aumenta
siempre una cantidad constante).
Suma de Cuadrados Total
SCT = (Yi-Y')
SCR = (Y^i-Y')
SCE = (Yi-Y^i)

Suma de Cuadrados de la Regresin

Suma de Cuadrado de Error

Coeficiente de Correlacin de Pearson


r = SCR/SCT
r = SCxy / (SCx)(SCy)

Consideraciones: cuando el coeficiente r de Pearson se eleva al cuadrado (r^2), se obtiene el


coeficiente de determinacin y el resultado indica la varianza de factores comunes. Esto es, el
porcentaje de la variacin de una variable debido a la variacin de la otra variable y viceversa
(o cunto explica o determina una variable de la otra. Por ejemplo si la correlacin entre
productividad y asistencia al trabajo es de r=0.80 y r^2=0.64. La productividad
constituye a, o explica, 64% de la variacin de la asistencia al trabajo.
0.66 r^2 0.85 indica Buena prediccin.
r^2 > 0.85 ambas variables miden casi el mismo concepto.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 212
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

213
Anlisis de Varianza en la Regresin.
El procedimiento ANOVA mide la cantidad de variacin en el modelo de muestreo.
Suma de Cuadrados de la Regresin.
SCR = (SCxy) /Scx
Suma de Cuadrados del Error.
SCE = SCy - (SCxy)/SCx
Suma de los Cuadrados Total.
SCT = SCR + SCE

Causas
Posibles
Error Muestral

ANOVA table
Source
Regression
Residual
Total

Causas
Posibles
Error Muestral

Fuentes
de

Suma de

Grados de

Cuadrados

Variacion

Cuadrados

Libertad

medios

Regresin
Error
Total

SCR
SCE
SCT

SS
161.0441
10.6893
171.7333

df
1
13
14

K
n-k-1
n-1

MS
161.0441
0.8223

Terica

F
195.86

Suma de

Grados de

Cuadrados

Variacion

Cuadrados

Libertad

medios

Regresin
Error
Total

161.0441
10.6893

CMR = SCR/K CMR/CME


CME=SCE/n-k-1

Fuentes
de

171.7333

F
de
Prueba

1
13
14

161.0441

F
de
Prueba
195.86

F
Terica
4.67

0.8223

Ho: La publicidad no tiene poder explicativo sobre las ventas de tickets.


Ha: La publicidad si tiene poder explicativo sobre las ventas de tickets.
Si el nivel de significancia es de 0.05.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 213
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

214

Prueba para la Bi (Pendiente).


Si la pendiente de la recta de regresin poblacional real pero desconocida es cero, no existe
relacin entre los pasajeros y la publicidad contraria a los resultados mustrales.
Ho: Bi = 0
Ho: Bi 0
Esta prueba emplea es estadstico t.
La prueba t para el coeficiente de regresin poblacional.
t = (bi Bi)/Sbi
Error Estndar del Coeficiente de Regresin Sbi.
Sbi = Se/SCx
Sbi = Se/SCx = 0.907 / 137.73333 = 0.07726
t = (bi Bi)/Sbi
t = (1.0813 0)/0.07726 = 13.995
Si nivel de significancia es 0.05 t 0.05,13 = 2.160
Debido a que t = 13.995, la Ho de Bi = 0 se rechaza. Al nivel del 5% parece existir una relacin
entre pasajeros y publicidad.
I.C. par Bi = bi t * Sbi = 1.08 (2.160) (0.07726)
0.913 Bi 1.247

Regression output
variables
Intercept
Publicidad

coefficients std. error


4.3863
0.9913
1.0813

0.0773

t (df=13)
4.425
13.995

p-value
.0007
3.24E09

confidence interval
95%
95%
lower
upper
2.2447
6.5278
0.9144

1.2482

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 214
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

215
Caso II.
Para apoyar las ventas de un producto de consumo masivo en un mercado altamente
competitivo una empresa inicio a comienzos de ao una intensa campaa publicitaria. La
comparacin entre la inversin publicitaria y las ventas del producto en 12 meses se colocan
en la siguiente tabla:
a) Formule la ecuacin de regresin.
b) Si invertimos en publicidad $400,000 cul debera ser las posibles ventas?
VENTAS PUBLICIDAD
MESES
EN MILES EN MILES
Y
X
ENERO
350
200
FEBRERO
300
250
MARZO
630
300
ABRIL
840
250
MAYO
930
330
JUNIO
1060
180
JULIO
1280
150
AGOSTO
850
350
SEPTIEMBRE
700
200
OCTUBRE
1160
250
NOVIEMBRE
1180
250
DICIEMBRE
1500
170
TOTALES
10780
2880

XY

X^2

Y^2

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 215
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

216
Caso III.
El departamento de ventas de una Compaa realiza un anlisis comparativo entre el
volumen de pedidos levantados y nmero de visitas efectuadas. Por sus diez vendedores en
cierto periodo de tiempo, todos los vendedores trabajan en zonas similares, en lo referente al
nmero de clientes que maneja cada uno y potencial de compra de dichos clientes. Los
resultados obtenidos son los siguientes:
a) Formule la ecuacin de regresin.
b) Cunto ascendera el posible monto de los pedidos si las visitas fueran 250?
c) Cul es el grado de relacin entre las variables?
d) Determine el error estndar.
e) Haga el diagrama de dispersin.
f) Grafique la recta de regresin.

PEDIDOS
EN MILES VISITAS
VENDEDOR
US$
REALIZADAS
1
13,4
245
2
10,3
172
3
15,1
291
4
6,9
124
5
7,3
191
6
14,2
218
7
5,2
101
8
11,8
259
9
14,3
307
10
5,5
142

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 216
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

217
Caso IV.
Suponga que se reunieron datos de una muestra de 10 restaurantes ubicados cerca de centros
educativos. Para i-sima observacin o restaurante de la muestra, xi es el tamao de la
poblacin estudiantil, en miles, y yi son las ventas trimestrales (en miles de dlares). Los
valores de xi y yi para los 10 restaurantes de la muestra se resumen en la siguiente tabla:
Ventas
Poblacin de
Trimestrales
Restaurante Estudiantes (miles) (miles de dlares
1
2
58
2
6
105
3
8
88
4
8
118
5
12
117
6
16
137
7
20
157
8
20
169
9
22
149
10
26
202
a. Trace un diagrama de dispersin para estos datos.
b. Qu indica el diagrama de dispersin que traz anteriormente, acerca de la relacin
entre las dos variables?
c. Formule la ecuacin de regresin.
d. Realice una interpretacin de la pendiente de la ecuacin de regresin.
e. Cul es el grado de relacin entre las variables?
f. Determine el error estndar.
g. Grafique la recta de regresin.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 217
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

218
Caso V.
Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de publicidad (en
millones de dlares) para 7 marcas principales de refrescos (Superbrands 98, 20 de octubre
de 1997).
Gastos de
Publicidad
Ventas de cajas
Marca
(millones de dlares) (en millones)
Coca-Cola Classic
131.3
1,929.2
Persi-Cola
92.4
1,384.6
Diet Coke
40.4
811.4
Sprite
55.7
541.5
Dr. Pepper
40.2
536.9
Mountain Dew
29.0
535.6
7-Up
11.6
219.5
a. Trace un diagrama de dispersin para estos datos.
b. Formule la ecuacin de regresin.
c. Realice una interpretacin de la pendiente de la ecuacin de regresin.
d. Cul es el grado de relacin entre las variables?
e. Determine el error estndar.
f. Prediga las ventas para una marca que gaste 70 millones de dlares en publicidad.
g. Grafique la recta de regresin.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 218
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

219
Caso VI.
En The Wall Street Journal Almanac 1998 aparecieron datos sobre el desempeo de las
aerolneas estadounidenses. A continuacin vemos los datos sobre el porcentaje de vuelos
que llegan puntuales y la cantidad de quejas por 100,000 pasajeros.
Aerolnea
% de Puntualidad
Quejas
Southwest
81.8
0.21
Continental
76.6
0.58
Northwest
76.6
0.85
US Airways
75.7
0.68
United
73.8
0.74
American
72.2
0.93
Delta
71.2
0.72
American West
70.8
1.22
TWA
68.5
1.25
a. Trace un diagrama de dispersin para estos datos.
b. Qu indica el diagrama de dispersin que traz en el inciso a)?
c. Formule la ecuacin de regresin, que indique cmo se relaciona el nmero de quejas
por cada 100,000 pasajeros con el porcentaje de vuelos que llegan a tiempo.
d. Realice una interpretacin de la pendiente de la ecuacin de regresin.
e. Cul es el grado de relacin entre las variables?
f. Determine el error estndar.
g. Cul es la cantidad estimada de quejas por 100,000 pasajeros, si el porcentaje de
vuelos puntuales es de 80 porciento?
h. Grafique la recta de regresin.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 219
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

220
Caso VII.
La empresa Nielsen Media Research rene datos que muestran qu publicistas obtienen la
mayor difusin durante las horas estelares de transmisin en 6 redes televisivas. A
continuacin se presentan los datos de la cantidad de familias espectadoras, en millones, y la
cantidad de veces que sali el anuncio al aire durante la semana del 28 de abril al 4 de mayo
de 1997 (USA Today, 5 de mayo de 1997).
Veces que sali al
Familias
Marca Anunciada
aire
espectadoras
Wendy's
28
191.7
Ford Escort
20
174.6
Ausin Powers movie
14
161.3
Nissan
16
161.1
Pizza Hut
16
147.7
Saturn
16
146.3
Father's Day Movie
11
138.2
a. Forme la ecuacin de regresin estimada que describa cmo se relaciona la cantidad de
veces que sale un anuncio con la cantidad de familia espectadoras.
b. Proponga una interpretacin de la pendiente de la ecuacin de regresin estimada.
c. Cul es la cantidad estimada de familias espectadoras si un anuncio sale 15 veces al
aire en una semana.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 220
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

221
Caso VIII.
Un gerente de ventas reuni los datos siguientes relacionados con las ventas anuales y aos
de experiencia.
Aos de
Ventas anuales
Vendedor
Experiencia
(miles de dlares)
1
1
80
2
3
97
3
4
72
4
4
102
5
6
103
6
8
111
7
10
119
8
10
123
9
11
117
10
13
136
a. Trace un diagrama de dispersin para estos datos.
b. Formule una ecuacin de regresin estimada con la que se puedan predecir las ventas
anuales, dados los aos de experiencia.
c. Use la ecuacin de regresin para predecir las ventas anuales de un vendedor con 9
aos de experiencia.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 221
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

222
Caso IX.
El gerente de ventas de Copier Sales of America, que tiene una fuerza de ventas muy
numerosa en Estados Unidos y Canad, quiere determinar si existe una relacin entre el
nmero de llamadas de ventas que se realizan al mes y el nmero de copiadoras que se
venden durante ese mes. El gerente selecciona una muestra aleatoria de 10 representantes y
determina el nmero de llamadas de ventas que cada uno hizo el pasado y la cantidad de
copiadoras vendidas. La informacin de la muestra se presenta a continuacin:
Nmero de Nmero de
Llamadas Copiadoras
Representante de Ventas
de Ventas
Vendidas
Tom Keller
20
30
Jeft Hall
40
60
Brian Virost
20
40
Greg Fish
30
60
Susan Welch
10
30
Carlos Ramrez
10
40
Rich Niles
20
40
Mike Kiel
20
50
Mark Reynolds
20
30
Soni Jones
30
70
h. Trace un diagrama de dispersin para estos datos.
i. Qu indica el diagrama de dispersin que traz anteriormente, acerca de la relacin
entre las dos variables?
j. Formule la ecuacin de regresin.
k. Realice una interpretacin de la pendiente de la ecuacin de regresin.
l. Cul es el grado de relacin entre las variables?
m. Determine el error estndar.
n. Grafique la recta de regresin.
o. Prediga las ventas para 15, 35 y 60 llamadas.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 222
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

223
Caso X.
La humedad influye en la evaporacin, de modo que el equilibrio de solventes de las pinturas
base agua durante su roco se ve afectado por la humedad. Se emprende un estudio
controlado para examinar la relacin de la humedad con la magnitud de la evaporacin del
solvente. El conocimiento de esta relacin es til para que el pintor ajuste el aspersor de
pintura de modo de considerar la humedad. Se obtienen los datos siguientes:
HUMEDAD EVAPORACION
RELATIVA SOLVENTE
OBSERVACION
(%)
(% DE PESO)
1
35.3
11.0
2
29.7
11.1
3
30.8
12.5
4
58.8
8.4
5
61.4
9.3
6
71.3
8.7
7
74.4
6.4
8
76.7
8.5
9
70.7
7.8
10
57.5
9.1
11
46.4
8.2
12
28.9
12.2
13
28.1
11.9
14
39.1
9.6
15
46.8
10.9
16
48.5
9.6
17
59.3
10.1
18
70.0
8.1
19
70.0
6.8
20
74.4
8.9
21
72.1
7.7
22
58.1
8.5
23
44.6
8.9
24
33.4
10.4
25
28.6
11.1
Las estadsticas de resumen para estos datos son:
Sumatoria de x = 1,314.90
Sumatoria de y = 235.70
Sumatoria de x*x = 76,308.53
Sumatoria de y*y = 2,286.07
Sumatoria de x*y = 11,824.44
i. Trace un diagrama de dispersin para estos datos.
j.
Qu indica el diagrama de dispersin que traz en el inciso a)?
k. Formule la ecuacin de regresin, que indique cmo se relaciona la humedad con la evaporacin.
l. Realice una interpretacin de la pendiente de la ecuacin de regresin.
m. Cul es el grado de relacin entre las variables?
n. Determine el error estndar.
o. Cul es la magnitud de la evaporacin del solvente cuando la humedad relativa es 50%?
Grafique la recta de regresin.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 223
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

224

Pruebas no paramtricas (Nonparametric Statistics)


En la prctica, surgen muchas situaciones en las cuales simplemente no es posible hacer de
forma segura ningn supuesto sobre el valor de un parmetro o sobre la forma de la
distribucin poblacional. Ms bien se deben utilizar otras pruebas que no dependan de un
solo tipo de distribucin o de valores de parmetros especficos. Estas pruebas se denominan
Pruebas no paramtricas o libres de distribucin.
Pruebas no paramtricas.
Son procedimientos estadsticos que pueden utilizarse para contrastar hiptesis
cuando no son posibles los supuestos respecto a los parmetros o a las distribuciones
poblacionales.
Experimento multinomial.
Es un experimento que satisface las siguientes condiciones.
1. El nmero de ensayos es fijo.
2. Los ensayos son independientes.
3. Todos los resultados de ensayos individuales se deben clasificar en una y slo una de
varias categoras distintas.
4. Las probabilidades de las diferentes categoras se mantienen constantes para cada ensayo.
Distribucin Chi-cuadrado
Las dos aplicaciones ms comunes de Chi-cuadrado son:
1. Pruebas de bondad de ajuste.
2. Pruebas de independencia.
Prueba de bondad de ajuste.
Sirve para probar la hiptesis de que una distribucin de frecuencia observada se
ajusta a (o concuerda con) alguna distribucin propuesta.
Medidas sobre qu tan cerca se ajustan los datos mustrales observados a una forma de
distribucin particular planteada como hiptesis. Si el ajuste es razonablemente cercano,
puede concluirse que si existe la forma de distribucin planteada como hiptesis.
Por ejemplo, se puede plantear la hiptesis que la distribucin poblacional es uniforme
y que todos los valores posibles tienen la misma probabilidad de ocurrir. Las hiptesis que se
probaran son:

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 224
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

225
Ho: La distribucin poblacional es uniforme.
Ha: La distribucin poblacional no es uniforme.
Si existe una gran diferencia entre lo que realmente se observa en la muestra y lo que
se esperara observar si la hiptesis nula fuera correcta, en tal caso es menos probable que la
hiptesis nula sea verdadera. Es decir, la hiptesis nula debe rechazarse cuando las
observaciones obtenidas en la muestra difieren mucho del patrn que se espera que ocurra si
la distribucin planteada como hiptesis si se presenta.
En las pruebas de bondad de ajuste usaremos la siguiente notacin:
Oi representa la frecuencia observada de un resultado.
E representa la frecuencia esperada de un resultado.
k representa el nmero de diferentes categoras o resultados.
n representa el nmero de ensayos total.
La prueba Chi-cuadrado tiene k-m-1 grados de libertad, en donde m es el nmero de
parmetros a estimar.
En muchos casos, podemos determinar una frecuencia esperada multiplicando la
probabilidad p de una categora por el nmero de ensayos distintos n:
E = np
Por ejemplo, si probamos la aseveracin de que un dado es equitativo lanzndolo 60 veces,
tendremos n = 60 (porque hay 60 ensayos) y p = 1/6 (porque un dado es equitativo s los seis
posibles resultados son igualmente probables, con la misma probabilidad de 1/6). Por tanto,
la frecuencia esperada para cada categora o celda es:
E = np
E = 60(1/6) = 10
Supuestos.
Los supuestos siguientes aplican cuando probamos una hiptesis de que la proporcin
de poblacin para cada una de las k categoras (de un experimento multinomial) es la que se
asegura.
1. Los datos constituyen una muestra aleatoria.
2. Los datos de muestra consisten en conteos de frecuencia para las k diferentes categoras.
3. Para cada una de las k categoras, la frecuencia esperada es por lo menos 5.
La prueba de Chi-cuadrado de bondad de ajuste es confiable solo si todo Ei es por lo menos 5.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 225
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

226
Estadstica de prueba para pruebas de bondad del ajuste en experimentos multinomiales.
=[(Oi-Ei)/Ei]
Valores Crticos.
1. Los valores crticos se encuentran en la tabla de Chi-cuadrado usando k-1 grados de
libertad, donde k es el nmero de categoras.
2. Las pruebas de hiptesis de bondad del ajuste siempre son de cola derecha.
La forma de la estadstica de prueba es tal que una concordancia cercana entre los
valores observados y los esperados produce un valor pequeo de . Un valor grande de
indica una fuerte discrepancia entre los valores observados y los esperados. Por tanto, un
valor significativamente alto de har que se rechace la hiptesis nula de que no hay
diferencia entre las frecuencias observadas y esperadas. Entonces, la prueba es de cola
derecha porque el valor crtico y la regin crtica se encuentran a la extrema derecha de la
distribucin.
A diferencia de pruebas de hiptesis previas en las que tenamos que determinar si la
prueba era de cola izquierda, de cola derecha o de dos colas, todas estas pruebas de bondad
del ajuste son de cola derecha.
Caso I.
Jennifer Calcao gerente de crdito del BHD, en la torre Principal en Santo Domingo, trata de
seguir una poltica de extender un 60% de sus crditos a empresas comerciales, un 10% a
personas naturales y un 30% a prestatarios extranjeros.
Para determinar si la poltica se estaba siguiendo, Jos Rondn, vicepresidente de
mercadeo, selecciona 85 crditos que se aprobaron recientemente. Encuentra que 62 de tales
crditos se otorgaron a negocios, 10 a personas naturales, y 13 a prestatarios extranjeros. Al
nivel del 10%, parece que el patrn de cartera deseado se preserva? Pruebe la hiptesis de
que:
Ho: Se mantuvo el patrn deseado: 60% son crditos comerciales, 10% son prstamos
personales y 30% son crditos extranjeros.
Ha: El patrn deseado no se mantuvo.
Tabla de Tipo de Crdito.
Tipo de Crdito

Oi

Ei

Comercial
Personal
Extranjero

62,00
10,00
13,00

51,00
8,50
25,50

Total

85,00

85,00

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 226
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

227
Estadstica de prueba para pruebas de bondad del ajuste en experimentos multinomiales.
El valor es
=[(Oi-Ei)/Ei]
=[(62-51)/51]+[(10-8.5)/8.5]+[(13-25.5)/25.5] = 8.76
Valores Crticos.
1. Los valores crticos se encuentran en la tabla de Chi-cuadrado usando k-1 grados de
libertad, donde k es el nmero de categoras.
2. Las pruebas de hiptesis de bondad del ajuste siempre son de cola derecha.
Con un = 10% y k = 3 categoras de crdito (comerciales, privados y extranjeros), existen km-1= 3-0-1=2 grados de libertad, el valor critico es
0.10,2 = 4.605
Regla de decisin: "No rechazar la hiptesis nula 4.605. Rechazar s la hiptesis nula >
4.605.
Interpretacin.
Las diferencias entre lo que el VP Jos Rondn observo y lo que esperaba observar si el
patrn de crdito deseado se alcanzaba era demasiado grande como para ocurrir por simple
azar. Existe solo un 10% de probabilidad de que una muestra de 85 crditos seleccionados
aleatoriamente pudieran producir las frecuencias observadas aqu demostradas, si el patrn
deseado en la cartera de crdito del banco se estuviera manteniendo.
Caso II. Prueba de normalidad.
Las especificaciones para la produccin de tanques de aire utilizados en inmersin
requieren que los tanques se llenen a una presin de 600 libras por pulgadas cuadradas (psi).
Se permite una desviacin de 10 psi. Las especificaciones de seguridad permiten una
distribucin normal en los niveles de llenado. Usted acaba de ser contratado por Aqua Lung,
un importante fabricante de equipos de inmersin. Su primera tarea es determinar si los
niveles de llenado se ajustan a una distribucin normal. Aqua Lung est seguro de que
media de 600 psi y la desviacin estndar de 10 psi prevalece. En este esfuerzo se miden
n=1000 tanques y se halla la distribucin presentada en la siguiente tabla.
Sus hiptesis son:
Ho: Los niveles de llenado estn distribuidos normalmente.
Ha: Los niveles de llenado no estn distribuidos normalmente.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 227
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

228
Tabla de llenado para los tanques de buceo.
Frecuencia Probabilidades Frecuencias
PSI
Real Oi
pi
Esperadas Ei
0 y por debajo de 580
20
580 y por debajo de 590
142
590 y por debajo de 600
310
600 y por debajo de 610
370
610 y por debajo de 620
128
6200 y por encma
30
Totales
1000

O-E

(O-E)^2 [(O-E)^2]/E

Determine la probabilidad para cada clase mediante la frmula Z y complete la tabla de


probabilidades y frecuencias esperadas.
Valor Crtico.
Se desea probar la hiptesis al nivel del 5%. Debido a que tanto la media poblacional como la
desviacin estndar son dadas y no tienen que estimarse, m = 0. Existe k = 6 clases en la tabla
de frecuencias, de manera que los grados de libertad son k-1=5. Se encuentra que el valor
critico es 0.05,5 =11.07
Regla de decisin: "No rechazar la hiptesis nula si es menor que 11.07. Rechazar la
hiptesis nula si es mayor que 11.07"
Estadstica de prueba para pruebas de bondad del ajuste en experimentos multinomiales.
Determine el valor

=[(Oi-Ei)/Ei]
Interpretacin:
Si la hiptesis nula se acepta. Las diferencias entre lo que se observ y lo que se espera
observar si los contenidos estuvieran distribuidos normalmente con una media de 600 y una
desviacin estndar de 10 pueden atribuirse al error de muestreo.
Si la media poblacional y la desviacin estndar no fueran conocidas, se hubieran tenido que
estimar de los datos mustrales de la tabla. Entonces m=2, y los grados de libertad serian k2-1 o 6-2-1=3.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 228
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

229
Tablas de contingencia o Tabulacin Cruzada. Una prueba de independencia.
Tabla de Contingencia o tabla de frecuencia bidireccional (Contingency Table).
Es una tabla en la que las frecuencias corresponden a dos variables. (Se utiliza una
variable para clasificar las filas y otra para clasificar las columnas).
Las tablas contingencias son aquellas que sirven para comparar dos variables.
Es un cuadro de dos dimensiones, y cada dimensin contiene una variable. A su vez,
cada variable se subdivide en dos o ms categoras.
Prueba de independencia.
Una prueba de independencia prueba la hiptesis nula de que la variable de fila y la
variable de columna de una tabla de contingencia no estn relacionadas. (La hiptesis nula es
la declaracin de que las variables de fila y de columna son independientes.)
Es muy importante reconocer que, en este contexto, la palabra contingencia se refiere a
dependencia, pero solo se trata de una dependencia estadstica y no puede usarse para
establecer un vnculo directo de causa y efecto entre las dos variables en cuestin.
Supuestos.
Al probar la hiptesis nula de independencia entre las variables de fila y de columna de una
tabla de contingencia, aplican los supuestos siguientes (Obsrvese que estos supuestos no
exigen que la poblacin padre tenga una distribucin normal ni alguna otra distribucin
especifica.)
1. Los datos de muestra se escogen aleatoriamente.
2. La hiptesis nula Ho es la declaracin de que las variables de fila y de columna son
independientes; la hiptesis alternativa Ha es la declaracin de que las variables de fila y de
columna son dependientes.
3. Para cada celda de la tabla de contingencia, la frecuencia esperada E es de por lo menos 5.
Estadstica de prueba para prueba de independencia.
El valor es
Chi-cuadrada es una prueba estadstica para evaluar hiptesis acerca de la relacin
entre dos variables categricas.
=[(Oi-Ei)/Ei]

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 229
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

230
Valores crticos.
1. Los valores crticos se encuentran en la tabla usando:
grados de libertad = (r-1)(c-1)
2. Las pruebas de independencia con tablas de contingencia solo implican regiones criticas de
cola derecha.
Frecuencia esperada para una tabla de contingencia.
Frecuencia esperada (E)= [(Total de fila)*(Total de columna)]/Gran Total
La estadstica de prueba nos permite medir el grado de discrepancia entre las
frecuencias observadas y las que esperaramos en teora si las dos variables son
independientes. Valores pequeos de la estadstica de prueba indican coincidencia entre
las frecuencias observadas y las frecuencias esperadas con variables de fila y de columna
independientes. Los valores grandes de la estadstica de prueba estn a la derecha de la
distribucin Chi-cuadrada y reflejan diferencias significativas entre las frecuencias
observadas y las esperadas.
En muestreos grandes repetidos, la distribucin de la estadstica de prueba se puede
aproximar con la distribucin Chi-cuadrada, siempre que todas las frecuencias esperadas
sean de por lo menos 5.
Caso I.
Santo Domingo Motors desea determinar si existe alguna relacin entre el ingreso de los
clientes y la importancia que dan al precio de los automviles de lujo. Los gerentes de la
compaa desean probar la hiptesis de que:
Ho: Ingreso e importancia del precio son independientes.
Ha: Ingreso e importancia del precio no son independientes.
Atributo b:
Atributo a:

Ingresos

Nivel de Importancia
Grande
Frecuencia Esperada

Bajo
83

Medio
62

Alto
37

Total
182

Moderado
Frecuencia Esperada

52

71

49

172

63

58

63

184

198

191

149

538

Poco
Frecuencia Esperada
Totales

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 230
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

231
Los clientes estn agrupados en tres niveles de ingreso y se les pide asignar un nivel de
significancia para poner precio a la decisin de compra. Los resultados se muestran en la
siguiente tabla de contingencia.
Debido a que 182/538=33.83% de todos los datos que respondieron a la encuesta
agregan a un nivel de importancia "grande" al precio, entonces si el ingreso y el precio no
estn relacionados, se esperara que 33.83% de ellos, en cada clasificacin de ingresos
respondan que el precio era de "gran" importancia. Por tanto, los Ei para un nivel de
importancia "bajo" son (198)(0.3383)=66.98, (191)(0.3383)=64.62 y (149)(0.3383)=50.41
De forma similar los dems niveles de importancia.
Determine:
El valor es

=[(Oi-Ei)/Ei]

Valores crticos.
1. Los valores crticos se encuentran en la tabla usando:
grados de libertad = (r-1)(c-1)
2. Las pruebas de independencia con tablas de contingencia solo implican regiones crticas de
cola derecha.
Si se determina en 1%, y con (f-1)(c-1)=(3-1)(3-1)=4 grados de libertad 0.01,4=13.277
Regla de decisin: "No rechazar la hiptesis nula si es menor que 13.277. Rechazar la
hiptesis nula si es mayor que 13.277"
Interpretacin.
La hiptesis nula se rechaza. Existe solo 1% de probabilidad de que si no existe
relacin entre ingreso y significancia del precio, las diferencias entre Oi y Ei serian lo
suficientemente grandes como para producir un Chi-cuadrado ms grande que 13.277. Existe
evidencia de una relacin entre el ingreso de los clientes y la importancia dada al precio de un
auto de lujo.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 231
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

232
Caso I
Jess Diequez, Gerente de Calidad de Mars, Inc. asegura que sus dulces M&M estn
distribuidos segn los porcentajes de color de 30% marrn, 20% amarillo, 20% rojo, 10%
anaranjado, 10% verde y 10% azul. Usando los datos de muestra de la siguiente tabla y un
nivel de significacin de 0.05 pruebe la afirmacin de que la distribucin de colores es la que
el gerente de calidad asegura.
FRECUENCIAS DE LOS DULCES M&M
CATEGORA
DE COLOR

FREC.
OBSERVADA

MARRON
AMARILLO
ROJO
ANARANJADO
VERDE
AZUL

33
26
21
8
7
5

FREC.
ESPERADA

Caso II.
A los compradores del centro comercial local se les pide calificar un nuevo producto en una
escala continua que comienza en cero. Con base en los siguientes datos agrupados, puede
usted concluir al nivel del 5% que los datos estn distribuidos normalmente, con una media
de 100 y una desviacin estndar de 25?
CALIFICACIN FRECUENCIA
MENOS DE 50
50-70
70-90
90-110
110-130
130-150
150-170
MAS DE 170

1
51
112
151
119
43
21
2

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 232
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

233
Caso III.
Ada Henrquez, gerente de mercadeo de Trans World Airways (TWA) desea determinar si
existe alguna relacin entre el nmero de vuelos que las personas toman y su ingreso. A qu
conclusin llega al nivel del 1% con base en los datos para 100 viajeros en la tabla de
contingencia?
FRECUENCIA DE VUELOS
INGRESO
NUNCA RARA VEZ CON FRECUENCIA TOTALES
MENOS DE US$30,000
20
15
2
US30,000-US$50,000

US50,000-US70,000

12

MAS DE US$70,000

15

Totales

Caso IV.
A los compradores del centro comercial local se les pide calificar un nuevo producto en una
escala continua que comienza en cero. Con base a los siguientes datos agrupados, puede
usted concluir al nivel del 5% que los datos estn distribuidos normalmente, con una media
de 100 y una desviacin de 25?
CALIFICACION FRECUENCIA
MENOS DE 50
1
50-70
5
70-90
112
90-110
151
110-130
119
130-150
43
150-170
21
MAS DE 170
2

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 233
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

234
Caso V.
En un anlisis de segmentacin de mercado para tres cervezas, el grupo de investigacin
encargado ha planteado la duda de si las preferencias para las tres cervezas son diferentes
entre los consumidores hombres y mujeres. Si la preferencia de las cervezas fuera
independiente del sexo del consumidor, se iniciara una campaa publicitaria para todas las
cervezas. Sin embargo, si la preferencia depende del sexo del consumidor, se ajustarn los
promociones para tener en cuenta los distintos mercados metas. Pruebe el supuesto a un nivel
de significancia de un 5%.
Los datos de la tabla constituyen las frecuencias observadas para las seis clases o
categoras.

SEXO
HOMBRE
MUJER

CERVEZA PREFERIDA
LIGERA
CLARA
OSCURA
20
40
20
30
30
10

Caso VI.
La empresa National Computer Products, Inc. (NCP) fabrica impresoras y mquinas de fax en
plantas de Atlanta, Dallas y Seattle, Estados Unidos. Para evaluar los conocimientos de sus
empleados acerca de administracin de calidad total se tom una muestra aleatoria de seis
empleados en cada planta y se les someti a un examen de conciencia de la calidad. Las
calificaciones de esos 18 empleados se presentan a continuacin.
Con estos datos, los
gerentes desean probar la hiptesis de que la media de la calificacin del examen es igual
para las tres plantas con un nivel de significancia de un 5%.

PLANTA PLANTA
PLANTA 1
2
3
ATLANTA DALLAS SEATTLE
85
71
59
75
75
64
82
73
62
76
74
69
71
69
75
85
82
67

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 234
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

235
Caso VII.
Proqun contrata, anualmente, unos 400 empleados para sus cuatro plantas en todo el pas. El
director de personal pregunta si se podra aplicar una distribucin normal a la poblacin de
las calificaciones obtenidas.
Si se pudiera aplicar esa distribucin, sera muy til para
evaluar calificaciones especficas. Esto es, las calificaciones de 20% superior, 40% inferior,
etc., se podran identificar con rapidez. En consecuencia se desea probar la hiptesis nula de
que la poblacin de calificaciones en la prueba de actitud se apega a una distribucin de
probabilidad normal. Si se toma una muestra una muestra de 50 calificaciones, cuya media es
de 68.42 y su desviacin estndar es de 10.41. Los datos se muestra a continuacin en la
siguiente tabla. Interprete los resultados.
INTERVALO DE FRECUENCIA
CALIFICACIONES OBSERVADA
MENOS DE 55.1
5
55.1
59.68
5
59.68
63.01
9
63.01
65.82
6
65.82
68.42
2
68.42
71.02
5
71.02
73.83
2
73.83
77.16
5
77.16
81.74
5
81.74
O MAS
6
TOTAL
50

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 235
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

236
Caso VIII.
Decoracin Ruddy se especializa en arreglos de jardines residenciales. El costo estimado de
mano de obra en determinada oferta de decoracin se basa en la cantidad de rboles,
arbustos, etc., que se plantan en el proyecto. Para fines de estimacin de costos, los gerentes
aplican dos horas de mono de obra plantar un rbol mediano. Los tiempos reales, en horas,
para una muestra de 10 rboles plantados durante el mes pasado son los siguientes:
1.9
1.7
2.8
2.4
2.6
2.5
2.8
3.2
1.6
2.5
Con un nivel de significancia de 0.05, pruebe si la media del tiempo de plantacin de
rboles es mayor de dos horas.
A. Establezca las hiptesis nula y alternativa.
B. Cul es el valor crtico para la prueba y cul es la regla de decisin?
C. Calcule la media muestral.
D. Determine la desviacin estndar.
E. Calcule el valor del estadstico de prueba.
F. Cul es su conclusin?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 236
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

237

Pruebas con dos Poblaciones. Estimacin con muestras grandes.


Intervalo de confianza para la diferencia entre dos medias poblacionales para muestras
grandes:
I.C. para (1-2) = (X1 X2) Zx1-x2
Error Estndar de las diferencias entre medias mustrales:
x1-x2 = (12/n1) + (22/n2)
Estimacin del error estndar de la diferencia entre medias mustrales:
sx1-x2 = (s12/n1) + (s22/n2)
Intervalo de confianza cuando las varianzas son desconocidas:
I.C. para (1-2) = (X1 X2) Zsx1-x2
Caso I.
Vimenca transporta remesas entre Santo Domingo y Saman por dos rutas. Una muestra de
100 camiones enviados por la ruta del Este revel un tiempo promedio de trnsito Xeste=17.2
horas con una desviacin estndar Seste=5.3 horas, mientras que 75 camiones que utilizan la
ruta Norte necesitaron un promedio de Xnorte=19.4 horas con una desviacin estndar de
Snorte=4.5horas. El transportador de Vimenca, desea desarrollar un intervalo de confianza
del 95% para la diferencia en el tiempo promedio entre estas dos rutas alternas.
N este = 100 camiones

Nnorte= 75 camiones

Xeste = 17.2 horas

Xnorte= 19.4 horas

Seste = 5.3 horas

Snorte= 4.5 horas

N.C. 95%
RUTA
ESTE
NORTE
UNIDADES
X'
17.2
19.4
HORAS
S
5.3
4.5
HORAS
N
100
75
CAMIONES
Debido a que las desviaciones poblacionales son desconocidas, el error estndar es:
sx1-x2 = (s12/n1) + (s22/n2)
sx1-x2 = (5.32/100) + (4.52/75)
sx1-x2 = (0.2809) + (0.27)
sx1-x2 = 0.7422

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 237
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

238
Intervalo de confianza cuando las varianzas son desconocidas:
I.C. para (1-2) = (X1 X2) Zsx1-x2
I.C. para (1-2) = (17.2 19.4) (1.96)(0.7422)
I.C. para (1-2) = 2.2 1.4547
-3.7 (1-2) -0.75 horas
El transportador puede tener un 95% de confianza en que la ruta del norte toma entre 0.75
horas y 3.7 horas ms.

Pruebas con dos Poblaciones


Estimacin con muestras pequeas con varianzas poblacionales iguales
Estimado mancomunado de la varianza comn a ambas poblaciones:
Sp2 = s12 (n1 - 1) + s22 (n2 - 1)
n1 + n2 2
Intervalo de confianza para la diferencia entre medias poblacionales cuando 12 = 22
desconocidas:
I.C. para (1-2) = (X1 X2) t (sp2/n1) + (sp2/n2)
Caso II.
En la cafetera de los estudiantes de PUCMM, una mquina expendedora de bebidas dispensa
bebidas en tazas de papel. Una muestra de 15 tazas da una media de 15.3 onzas con una
varianza de 3.5.

Despus de ajustar la mquina, una muestra de 10 tazas produce un

promedio de 17.1 onzas con una varianza de 3.9. Si se asume que s2 (varianza) es constante
antes y despus del ajuste, construya un intervalo de confianza del 95% para la diferencia
entre los contenidos promedio de llenado. Se asume que las cantidades dispensadas estn
distribuidas normalmente.
Entonces,
N1 = 15 tasas

N2 = 10 tazas

X1 = 15.3 onzas

X2 = 17.1 onzas

S12 = 3.5 onzas

S22 = 3.9 onzas

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 238
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

239
TIPO
X'
S2
N

llenado llenado
1
2
UNIDADES
15.3
17.1
ONZAS
3.5
3.9
ONZAS
15
10
TAZAS
Sp2 = s12 (n1 - 1) + s22 (n2 - 1)
n1 + n2 2
Sp2 = 3.5 (15 - 1) + 3.9 (10 - 1)
15 + 10 2
Sp2 = 3.66

Intervalo de confianza para la diferencia entre medias poblacionaes cuando 12 = 22


desconocidas:
Con un = 0.05 (un nivel de confianza del 95%) y n1 + n2 2 = 23 g.l., la tabla t indica un
valor de 2.069.

I.C. para (1-2) = (X1 X2) t (sp2/n1) + (sp2/n2)


I.C. para (1-2) = (15.3 17.1) 2.069 (3.66/15) + (3.66/10)
I.C. para (1-2) = 1.8 1.61
-3.41 (1-2) -0.19 onzas
Se puede tener un nivel de confianza del 95% en que el ajuste increment el nivel del
contenido entre 0.19 onzas y 3.41 onzas.

Pruebas con dos Poblaciones


Estimacin con muestras pequeas con varianzas poblacionales desiguales
Grados de libertad cuando las varianzas poblacionales non son iguales.
g.l. =

(s12/n1 + s22/n2)2______
(s12/n1) 2 / (n1- 1) + (s22/n2) 2 / (n2- 1)

Intervalo para la diferencia entre medias poblacionales:


I.C. para (1-2) = (X1 X2) t (s12/n1) + (s22/n2)

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 239
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

240
Caso III. El Listin Diario describi dos programas de entrenamiento utilizados por GBM
Dominicana. Doce ejecutivos a quienes se les dio primer tipo de entrenamiento obtuvieron
un promedio de 73.5 en la prueba de competencia. Aunque el artculo de noticias no report
la desviacin estndar para estos 12 empleados, se asume que la varianza en los puntajes para
este grupo fue de 100.2. Quince ejecutivos a quienes se les administr el segundo programa
de entrenamiento obtuvieron un promedio 79.8. Se asume una varianza de 121.3 para este
segundo grupo. Haga un intervalo de confianza del 95% para la diferencia en los puntajes
promedio para todos los ejecutivos que ingresaron a estos programas:
N1 = 12 ejecutivos

N2 = 15 ejecutivos

X1 = 73.5 puntos

X2 = 79.8 puntos

S12 = 100.2 puntos

S22 = 121.3 puntos

PROGRAM PROGRAM
TIPO
1
2
UNIDADES
X'
73.5
79.8
EJECUTIVOS
S
100.2
121.3
PUNTOS
N
12
15
PUNTOS
Grados de libertad cuando las varianzas poblacionales non son iguales.
g.l. =

(s12/n1 + s22/n2)2______
(s12/n1) 2 / (n1- 1) + (s22/n2) 2 / (n2- 1)

g.l. =

(100.2/12 + 121.3/15)2______ = 24.55


(100.2/12)2 / (12-1) + (121.3/15) 2 / (14-1)

Si g.l. es fraccionario, se aproxima hacia abajo, hacia el entero inmediatamente anterior. G.L.
= 24.
Con un = 0.05 (un nivel de confianza del 95%) y g.l. = 24, la tabla t indica un valor de 2.064.
Intervalo para la diferencia entre medias poblacionales:
I.C. para (1-2) = (X1 X2) t (s12/n1) + (s22/n2)
I.C. para (1-2) = (73.5 79.8) 2.064 (100.2/12) + (121.3/15)
I.C. para (1-2) = - 6.3 8.36
-14.66 (1-2) 2.06 puntos
Debido a que el intervalo contiene cero, no existe una fuerte evidencia de que exista
diferencia alguna en la efectividad de los programas de entrenamiento.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 240
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

241

Pruebas con dos Poblaciones


Intervalos de confianza para la diferencia entre dos Proporciones
Error Estndar de la diferencia entre dos proporciones mustrales:
Sp1-p2 = (p1(1-p1))/n1) + p2(1-p2))/n2)
Intervalo para la diferencia entre proporciones poblacionales:
I.C. para 1 2 = (p1 p2) (Z) Sp1-p2
Caso IV.
Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el
turno del da es diferente al de los trabajadores del turno de la noche.

Se realiza una

comparacin de 150 trabajadores de cada turno. Los resultados muestran que 37 trabajadores
diurnos han estado ausentes por lo menos cinco veces durante el ao anterior, mientras que
52 trabajadores nocturnos han faltado por lo menos cinco veces. Qu revelan estos datos
sobre la tendencia al ausentismo entre los trabajadores? Calcule un intervalo de confianza del
90% para la diferencia entre las proporciones de trabajadores de los dos turnos que faltaron
cinco veces o ms.
N turno da = 150
N turno noche = 150

p1 = 37/150 = 0.25
p2 = 52/150 = 0.35

Error Estndar de la diferencia entre dos proporciones mustrales:


Sp1-p2 = (0.25*0.75/150) + (0.35*0.65/150) = 0.0526
Intervalo para la diferencia entre proporciones poblacionales:
I.C. para 1 2 = (p1 p2) (Z) Sp1-p2
I.C. para 1 2 = (0.25 0.35) (1.65) (0.0526)
I.C. para 1 2 = 0.10 0.087
-18.7% (1 2) - 1.3%
La empresa puede estar 90% segura de que la proporcin de trabajadores nocturnos ausentes
en cinco o ms oportunidades est entre 1.3% y 18.7% ms alta que los del turno diurno.
Pruebas de Hiptesis para dos medias con muestras independientes
Hay cuatro pasos involucrados en una prueba:
Paso 1: Plantear las hiptesis.
Ho:1 = 2
Ha:1 2
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 241
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

242
O el equivalente
Ho:1 - 2 = 0
Ha:1 - 2 0
Paso 2: Con base en los resultados de la muestra,calcular el valor del estadstico de
prueba Z o t.
Z = (X1-X2) (1-2)
SX1-X2
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z o t.
Paso 4: Interpretacin y conclusiones.
Caso V.
Weaver Ridge Golf Course desea ver si el tiempo promedio en horas que requieren los
hombres para jugar los 18 hoyos es diferente al de las mujeres. Se mide el tiempo de
cincuenta partidos dobles de hombres y 45 de mujeres obteniendo, pruebe a nivel de
confianza del 95%:
SEXO
HOMBRES MUJERES
X'
3.5
4.9
S
0.9
1.5
N
50
45
Paso 1: Plantear las hiptesis.
Ho:1 = 2
Ha:1 2
Paso 2: Con base en los resultados de la muestra,
calcular el valor del estadstico de
prueba Z o t.
Z = (X1-X2) (1-2)
SX1-X2
Estimacin del error estndar de la diferencia entre medias muestrales:
sx1-x2 = (s12/n1) + (s22/n2)
sx1-x2 = (0.92/50) + (1.52/45) = 0.257
Z = (3.5-4.9) (0)
0.257
Z = - 5.45

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 242
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

243
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z o t.
Si = 0.05 (con un nivel de confianza del 95%), el valor crtico de Z es 1.96.
Regla de decisin: No rechazar Z si esta entre 1.96. Rechazar si Z es menor que -1.96 o
mayor que 1.96.
La Ho se rechaza porque la Z de la estadstica de prueba es menor que 1.96 de la Regla de
Decisin.
Paso 4: Interpretacin y conclusiones.
La evidencia sugiere que las mujeres toman ms tiempo en promedio. Vale la pena notar
tambin que el valor p relacionado con la prueba es virtualmente cero.
Pruebas de Hiptesis para dos medias con muestras pequeas con varianzas iguales
Prueba de hiptesis con muestras pequeas cuando 22 = 22 (desconocidas):
t = (X1-X2) (1-2)
(sp2/n1) + (sp2/n2)
Caso VI. Las negociaciones salariales entre su empresa y el sindicato de sus trabajadores
estn a punto de romperse.

Existe un desacuerdo considerable sobre el nivel salarial

promedio de los trabajadores en la planta de Atlanta y en la planta de Newport News,


Virginia. Los salarios fueron fijados por el antigua acuerdo laboral de hace tres aos y se
basan estrictamente en la antigedad. Debido a que los salarios estn controlados muy de
cerca por el contrato laboral, se asume que la variacin en los salarios es la misma en ambas
plantas y que los salarios estn distribuidos normalmente. Sin embargo, se siente que existe
una diferencia entre los niveles salariales promedio debido a los patrones de antigedad
diferentes entre las dos plantas.
El negociador laboral que representa a la gerencia desea que usted desarrolle un intervalo de
confianza del 98% para estimar la diferencia entre los niveles salariales promedio. Si existe
una diferencia en las medias, deben hacerse ajustes para hacer que los salarios ms bajos
alcancen el nivel de los ms altos. Dados los siguientes datos, qu ajustes se requieren, si es
el caso?

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 243
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

244
Las muestras de trabajadores tomadas de cada planta revelan la siguiente informacin:
Planta de Atlanta

Planta de Newport News

N1 = 23 empleados

N2 = 19 empleados

X1 = US$17.53 por hora

X2 = US$15.5 por hora

S12 = 92.10

S22 = 87.10

PLANTA ATLANTA
X'
17.53
S2
92.1
N
23

NEWPORT
NEW
15.5
87.1
19

UNIDADES
TRABAJADORES
US$/HORA
US$/HORA

Paso 1: Plantear las hiptesis.

Ho:1 = 2
Ha:1 2
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z o t.
t = (X1-X2) (1-2)
(sp2/n1) + (sp2/n2)

Estimado mancomunado de la varianza comn a ambas poblaciones:


Sp2 = s12 (n1 - 1) + s22 (n2 - 1)
n1 + n2 2

Sp2 = 92.10 (23 - 1) + 87.10 (19 - 1)


23 + 19 2
Sp2 = 89.85
t = (17.53-15.5) (0)
(89.85/23) + (89.85/19)
t = 0.69
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z o t.
Si = 0.02 (con un nivel de confianza del 98%), g.l. = n1 + n2 2 = 23+19-2 = 40, el valor crtico
de t es 2.423.

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 244
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

245
Regla de decisin: No rechazar t si esta entre 2.423. Rechazar si t es menor que -2.423 o
mayor que 2.423.
La Ho se acepta porque la t de la estadstica de prueba est dentro del rango 2.423 de la
Regla de Decisin.
Paso 4: Interpretacin y conclusiones.
Parece que no hay diferencia en el salario promedio. Esta conclusin se confirma por el hecho
de que intervalo contena cero.
Pruebas de Hiptesis para dos medias con muestras pequeas con varianzas desiguales
Prueba de hiptesis con muestras pequeas cuando 22 22:
t = (X1-X2) (1-2)
(s21/n1) + (s22/n2)
Caso VII.
Un negocio vende dos tipos de amortiguadores de caucho para coches de bebs. Las pruebas
de desgaste para medir la durabilidad revelaron que 13 amortiguadores de tipo 1 duraron un
promedio de 11.3 semanas, con una desviacin estndar de 3.5 semanas; mientras que 10 del
tipo 2 duraron un promedio de 7.5 semanas, con una desviacin estndar de 2.7 semanas. El
tipo 1 es ms costoso para fabricar y el CEO (Director Ejecutivo) de Acme no desea utilizarlo
a menos que tenga un promedio de duracin de por lo menos ocho semanas ms que el tipo
2. El CEO tolerar una probabilidad de error de slo el 2%. No existe evidencia que sugiera
que las varianzas de la duracin de los dos productos sean iguales.
N1 = 13 amortiguadores

N2 = 10 amortiguadores

X1 = 11.3 semanas

X2 = 7.5 semanas

S1 = 3.5 semanas

S2 = 2.7 semanas

Paso 1: Plantear las hiptesis.


Ho:1 = 2
Ha:1 2
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z o t.
t = (X1-X2) (1-2)
(s21/n1) + (s22/n2)
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 245
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

246

t = (11.3-7.5) (0)
(3.5/13) + (2.7/10)
t = 2.94
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z o t.
Si = 0.02 (con un nivel de confianza del 98%)
Grados de libertad cuando las varianzas poblacionales non son iguales.
g.l. =

(s12/n1 + s22/n2)2______
(s12/n1) 2 / (n1- 1) + (s22/n2) 2 / (n2- 1)

g.l. =

(3.52/13 + 2.72/10)2______
(3.52/13) 2 / (13- 1) + (2.72/10) 2 / (10- 1)

g.l. = 20.99 = 20
el valor crtico de t es 2.528.
Regla de decisin: No rechazar t si esta entre 2.528. Rechazar si t es menor que -2.528 o
mayor que 2.528.
La Ho no se acepta porque la t de la estadstica de prueba es mayor que 2.528 de la Regla de
Decisin.
Paso 4: Interpretacin y conclusiones.
La evidencia sugiere que el tipo 1 de amortiguador de caucho para coche de beb presenta
mayor durabilidad.
Pruebas de Hiptesis para la diferencia entre dos proporciones
Z = (p1 p2) - (1 2)
Sp1-p2
Error Estndar de la diferencia entre dos proporciones mustrales:
Sp1-p2 = (p1(1-p1))/n1) + p2(1-p2))/n2)

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 246
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

247
Caso VIII.
Un minosta desea probar la hiptesis de que la proporcin de sus clientes masculinos,
quienes compran a crdito, es igual a la proporcin de las mujeres que utilizan el crdito. l
selecciona 100 clientes hombres y encuentra que 57 compraron a crdito mientras que 52 de
las 110 mujeres lo hicieron. Pruebe a un nivel del 1%.
Paso 1: Plantear las hiptesis.
Ho:1 = 2
Ha:1 2
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z o t.
p1 = 57/100 = 0.57 hombres
p2 = 52/110 = 0.473 mujeres
Z = (p1 p2) - (1 2)
Sp1-p2
Error Estndar de la diferencia entre dos proporciones mustrales:
Sp1-p2 = (p1(1-p1))/n1) + p2(1-p2))/n2)
Sp1-p2 = (0.57 * 0.43/100) + (0.473 *0.527/110)
Sp1-p2 = 0.069

Z = (0.57 0.473) 0
0.069
Z = 1.41
Paso 3: Determinar la regla de decisin con base en los valores crticos de Z o t.
Si = 0.01 (con un nivel de confianza del 99%), el valor crtico de Z es 2.58.
Regla de decisin: No rechazar Z si esta entre 2.58. Rechazar si Z es menor que -2.58 o
mayor que 2.58.
La Ho no se rechaza porque la Z de la estadstica est dentro del rango de 2.58 de la Regla
de Decisin.
Paso 4: Interpretacin y conclusiones.
El minorista no puede concluir a un nivel del 1% que las proporciones de hombres y mujeres
que compran a crdito difieren.
Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 247
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)

248

Modelos Estadsticos para la Toma de Decisiones | Ing. Rubn Daro Estrella, MBA Cavaliere 248
Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemtico (PUCMM), Telogo (UNEV) y Maestro (SALOME UREA)