Vous êtes sur la page 1sur 98

1

UNIVERSIDAD CENTROAMERICANA
FACULTAD DE CIENCIA, TECNOLOGA Y AMBIENTE
DEPERTAMENTO DE CIENCIAS BSICAS



ASIGNATURA ESTADSTICA





INGENIERA EN SISTEMAS Y TECNOLOGA DE LA INFORMACIN





Septiembre, 2013
Recopilado por
Clara Pastora Tllez



2
ndice de contenido
Objetivos . 4
Introduccin .. 4
1. Unidad I: Estadstica Descriptiva ... 4
Ramas de la estadstica.. 6
Conceptos . 7
Escalas de medicin 9
Actividad de Autoaprendizaje N 1 . 11
Organizacin de datos 14
Grficas estadsticas .. 17
Actividad de Autoaprendizaje N 2 19
Medidas de tendencia central .. 21
Media 21
Mediana.. 24
Moda . 25
Medidas de tendencia no central. 25
Cuartiles y Percentiles .. 26
Medidas de variacin .. 27
Varianza, Desviacin estndar .. 27
Coeficiente de variacin.. 26
Actividad de Autoaprendizaje N 3 29
2. Unidad II: Probabilidades .. 30
Enfoques de probabilidad y Conceptos . 30
Reglas de Probabilidad .. 32
Actividad de Autoaprendizaje N 4 . 36
Teorema de Bayes 42
Actividad de Auto aprendizaje N 5 43
3. Unidad III: Distribuciones de Probabilidad y Pruebas Estadsticas 45
Distribucin de probabilidad . 45
Actividad de Autoaprendizaje N 6 .. 48
Distribucin Binomial .. 49
Actividad de Autoaprendizaje N 7 51
Distribucin de Poisson. 51
Actividad de Autoaprendizaje N 8 54
Distribucin Normal .. 55
Actividad de Autoaprendizaje N 9 59
Distribucin muestral para la media 61
Teorema de Limite Central 64
Actividad de Autoaprendizaje N 10 .. 65
Estimacin por intervalo y tamao de muestra . 70
Actividad de Autoaprendizaje N 11 .. 73
Prueba de Hiptesis . 75
Actividad de Autoaprendizaje N 12 .. 85
Prueba de independencia... 86
Actividad de Autoaprendizaje N 13 .. 88



3
4. Unidad IV: Regresin y Correlacin Lineal Simple 90
Diagrama de Dispersin. 90
Regresin Lineal . 91
Estimacin de la ecuacin. ........................................... 92
Error estndar de estimacin . 93
Coeficiente de Correlacin y Determinacin .. 93
Intervalo de Confianza de la media 94
Inferencia acerca de los parmetros 95
Actividad de Autoaprendizaje N 14 96
Referencias . 98






































4
Objetivos
1. Apropiarse de la terminologa usada en el rea estadstica, con el fin de impulsar la
adquisicin de cultura estadstica por parte de los estudiantes.
2. Identificar maneras adecuadas para la presentacin de informacin y adquirir las
destrezas para construir tablas y grficos estadsticos.
3. Se pretende lograr un aprendizaje significativo con la construccin de objetos de
aprendizaje en cada una de las unidades, adems, del apoyo de herramientas de software
estadstico.
4. Se espera que el curso sea ameno y provechoso para todos (as), logrando potenciar al
estudiante en la aplicacin de la estadstica y fortaleciendo adems, otros valores como: la
honestidad, solidaridad y trabajo en grupo.


Introduccin
El presente material de estudio no pretende sustituir a ningn texto de Estadstica, por el
contrario es un esfuerzo que trata de resumir los temas que se requieren para cursar la
asignatura; los estudiante que deseen profundizar en el contenido del programa, deben realizar
las consultas necesarias para completar el conocimiento de esta disciplina.
El material cuenta con cuatro unidades donde se presenta una introduccin, el desarrollo
terico, ejercicios resueltos paso a paso, ejercicios propuestos y un formulario creado para
cada unidad. La temtica se resume en: Estadstica descriptiva, Probabilidades, Distribuciones
de Probabilidad y Prueba estadsticas y Regresin y Correlacin Lineal Simple.


UNIDAD I ESTADSTICA DESCRIPTIVA
En esta Unidad se har un pequeo recorrido por la historia de la estadstica, mencionando
algunos de los personajes que la impulsaron, recalcando sus progresos y aportes a travs del
tiempo.
El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en
pocas remotas. Se tiene informacin de hace ms 3000 aos antes de Cristo, donde las
antiguas civilizaciones, como la Egipcia, aplicaron continuamente censos que ayudaban a la
organizacin del estado y la construccin de las pirmides.
El antiguo testamento nos sugiere que Moiss orden un Censo a la poblacin Israelita
para identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano,
era comn la aplicacin de censos para la planificacin de impuestos y la prestacin del
servicio militar.
La primera persona que introdujo el trmino estadstica en Inglaterra fue Sir John
Sinclair (1754-1835) con su trabajo Statistical Account of Scotland (1791-1799)
trabajo compilado en 21 volmenes. El autor explica en su libro, que la palabra
estadstica la adopt gracias al estudio de investigaciones realizadas en Alemania, como
una palabra novedosa que llamara la atencin de los ingleses.
A comienzos del siglo XIX, la palabra estadstica adopta un significado ms generalizado
hacia la recoleccin y clasificacin de cualquier tipo de datos cuantitativos.
Herman Hollerith (1860-1929) fue un estadstico estadounidense quien desarroll
la primera mquina tabuladora basada en tarjetas perforadas y mecanismos elctrico-
mecnicos para el tratamiento rpido de millones de datos. Su mquina fue usada en el
censo de 1890 en Estados Unidos que redujo la tabulacin de los datos de 7 aos (censo


5
de 1880) a 2.5 aos. Cre la firma Computing Tabulating Recording Corporation (CTR),
que bajo la presidencia de Thomas J. Watson fue renombrada a International Business
Machines (IBM) en 1924.
1. Definicin
1.1 Estadstica es una disciplina que apoya el proceso de toma de decisiones en diversas
reas del conocimiento, adems, de entregar pautas para la presentacin adecuada de
informacin.
1.2 Estadstica es la ciencia que utilizando las matemticas y de modo particular el clcul o
para estudi ar l as l eyes de comportami ento de aquel l os fenmenos que no
estando sometidos a leyes rgidas dependen del azar y basndose en ella, se predicen resultados.
1.3 El famoso diccionario Ingls Word Reference define la estadstica como un rea de la
matemtica aplicada orientada a la recoleccin e interpretacin de datos cuantitativos
y al uso de la teora de la probabilidad para calcular los parmetros de una poblacin.

2. Estudio de la Estadstica
Existen dos razones por las cuales el campo de accin de la estadstica y la necesidad de un
estudio han crecido enormemente en las ltimas dcadas. Una razn es que el enfoque cada
vez ms cuantitativo que se emplea en todas las ciencias, as como en las empresas y en
otras actividades que afectan nuestras vidas. Esto incluye el uso de tcnicas matemticas
para la evaluacin de controles contra la contaminacin, la planeacin de inventarios, el
estudio de la nutricin, la longevidad, la evaluacin de tcnicas de enseanza, etc.
La otra razn es que la cantidad de informacin estadstica que se recolecta, procesa y
disemina al pblico, por un motivo o por otro ha crecido casi ms all de nuestro
entendimiento, y algo que todo mundo se pregunta es qu parte de ella es estadstica
pura y qu parte es impura.

3. Aplicaciones
3.1 Una compaa que fabrica equipos electrnicos complejos produce algunos equipos que
funcionan adecuadamente, pero tambin algunos que, por razones desconocidas, no
funcionan adecuadamente. a que se debe que algunos sean buenos y otros no?
3.2 El departamento de control de calidad de una compaa se encarga de vigilar la
produccin en forma continua, aplicando muestreo y otras tcnicas estadsticas
comunes.
3.3 El contralor y el departamento de contabilidad de una empresa se encargan de la
exactitud en los clculos financieros. Ya que resulta fsicamente imposible verificar cada
documento y determinar su exactitud, se realiza un muestreo de las facturas y se toman
decisiones en base a los resultados de la muestra.
3.4 El departamento de mercadotecnia de una empresa realizar pruebas con los
consumidores y proyectan las ganancias con base en los resultados de la muestra.
3.5 Los analistas de investigacin evalan muchos aspectos de una accin o valor antes de
hacer una recomendacin de compra o venta. Recopilan los datos de ventas anteriores de
la empresa y estiman las ganancias futuras.
3.6 El gobierno realiza un gran nmero de encuestas para determinar la condicin actual de
la economa y la prediccin de las tendencias econmicas futuras. Se elaboran ndices,


6
como el ndice de precios al consumidor con el objeto de evaluar la tendencia
inflacionaria.
3.7 Los consumidores utilizan los precios unitarios para decidir la cantidad o calidad del
producto a comprar.
3.8 Los resultados de sondeos de opinin pblica se presentan en los medios de comunicacin.
Estos abarcan muchos temas, como evaluacin del desempeo de las alcaldas, ministerios,
asamblea nacional, incluso al presidente, el impacto de las medidas econmicas, etc.
3.9 Dificultades que encuentran los estudiantes al momento de realizar lectura de textos, su
nivel de comprensin, etc.

4. Ramas de la estadstica
Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la
Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y tratamiento de
la informacin para su presentacin por medio de tablas y de representaciones grficas,
as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin
(la media y la desviacin estndar). Es un primer acercamiento a la informacin.




4.1


La investigacin cuya finalidad es: el anlisis o experimentacin de situaciones para el
descubrimiento de nuevos hechos, la revisin o establecimiento de teoras y las aplicaciones
prcticas de las mismas, se basa en los principios de Observacin y Razonamiento y
necesita en su carcter cientfico, el anlisis tcnico de datos para obtener de ellos
informacin confiable y oportuna. Este anlisis de datos requiere de la Estadstica como
una de sus principales herramientas, por lo que los investigadores de profesin y las
personas que de una y otra forma la realizan.
Cuando se realiza un estudio de investigacin, se pretende generalmente inferir o
generalizar resultados de una muestra a una poblacin. Se estudia en particular a un
reducido nmero de individuos a los que tenemos acceso con la idea de poder generalizar
los hallazgos a la poblacin de la cual esa muestra procede. Este proceso de inferencia se
efecta por medio de mtodos estadsticos basados en la probabilidad.



4.2





Estadstica Descriptiva
La estadstica descriptiva es una ciencia que analiza series de datos (por
ejemplo, edad de una poblacin, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) y trata de extraer conclusiones
sobre el comportamiento de estas variables.

Estadstica Inferencial
Basndose en los resultados obtenidos de una muestra induce o estima las
leyes reales del comportamiento de la poblacin de la que proviene dicha
muestra.



7
5. Conceptos bsicos.







Ej. 1 Poblacin (se simboliza por N)
1.1 Estudiantes de Ingeniera en Sistema de Nicaragua.
1.2 Trabajadores de una compaa industrial.
1.3 Produccin textil en una zona franca.
1.4 Clientes de un banco.






Ej. 2 Muestra (su smbolo es n)
2.1 Si se estudia el precio de la vivienda de una ciudad, lo normal ser no recoger
informacin sobre todas las viviendas de la ciudad (sera una labor muy compleja),
sino que se suele seleccionar un subgrupo (muestra) que se entienda que es
suficientemente representativo.

Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos
sealar:
1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
2. Como consecuencia del punto anterior ahorraremos costos.
3. Estudiar la totalidad de las personas con una caracterstica determinada en muchas
ocasiones puede ser una tarea inaccesible o imposible de realizar.
4. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y
mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y
plurales que si las tuvisemos que realizar a una poblacin.
5. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una
poblacin al indicar los criterios de inclusin y/o exclusin.



Poblacin
Son todos y cada uno de los elementos que se quieren analizar. Puede ser finita o infinita
(en realidad las poblaciones infinitas no existen, pero cuando se trata de un nmero
grande se supone como si lo fuera).


Muestra
Es un subconjunto de la poblacin o parte de la poblacin que se observa.
(Caracterstica de una poblacin es la propiedad que se estudia.)

Parmetro
Caracterstica numrica de una poblacin.

Estadstico
Caracterstica numrica de una muestra.



8





Ej. 3 Poblacin: Estudiantes de la UCA.
Variable: Edad, valor que puede asumir: 17, 20, 19, (La caracterstica se designa con
letras maysculas X, Y, Z,)

Las variables pueden ser de dos tipos:
1. Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo:
nacionalidad, color de la piel, sexo).
2. Variables cuantitativas o numricas: tienen valor numrico (edad, precio de un producto,
ingresos anuales).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
2.1 Discretas: Slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo, nmero
de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podr ser 3,45).
2.2 Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h, etc.

Ej. 4 Clasifique cada una de las siguientes variables en categrica o numricas (discreta o
continua).









Las variables tambin se pueden clasificar en:
1. Variables unidimensionales: slo recogen informacin sobre una caracterstica (por
ejemplo: edad de los alumnos de una clase).
2. Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin
(por ejemplo: edad y altura de los alumnos de una clase).
Variable
Numrica
Categrica
Discreta
Continua
Variable Tipo de variable
1 Nacionalidad.
2 Resistencia a la tensin.
3 Salario mensual (C$).
4 N de artculos defectuosos.
5 Temperatura (F).
Variable
Es una forma de expresar una caracterstica de un grupo de elementos de
estudio, como el peso de una persona, su estatura, el color de sus ojos,una
poblacin o de una muestra




9
3. Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por
ejemplo: edad, altura y peso de los alumnos de una clase).

Cuando se estudia el comportamiento de una variable hay que distinguir el siguiente concepto:







6. Etapas del anlisis estadstico.
Recogi da de datos.
Ordenacin de los mismos en tablas.
Resumen de la informacin recogida a travs de las medidas (Descriptiva).
Analizar los datos provenientes de una muestra para sacar conclusiones sobre la poblacin
de la que proviene la muestra (Inferencial).

7. Niveles o Escalas de medicin.
Medir en el campo de las ciencias exactas es comparar una magnitud con otra, tomada de
manera arbitraria como referencia, denominada patrn y expresar cuntas veces la
contiene. En el campo de las ciencias sociales medir es el proceso de vincular conceptos
abstractos con indicadores empricos. Al resultado de medir lo se le llama medida. La
medicin de las variables puede realizarse por medio de cuatro escalas de medicin: la
nominal, ordinal, de intervalo y de razn. Se utilizan para ayudar en la clasificacin de las
variables, el diseo de las preguntas para medir variables, e incluso indican el tipo de
anlisis estadstico apropiado para el tratamiento de los datos. Una caracterstica esencial
de la medicin es la dependencia que tiene de la posibilidad de variacin. La validez y la
confiabilidad de la medicin de una variable depende de las decisiones que se tomen para
operarla y lograr una adecuada comprensin del concepto evitando imprecisiones y
ambigedades, en caso contrario, la variable corre el riesgo inherente de ser invalidada
debido a que no produce informacin confiable.

7.1 Escala nominal.
En este nivel de medicin se establecen categoras distintivas que no implican un orden
especfico. Por ejemplo, si la unidad de anlisis es un grupo de personas, para clasificarlas
se puede establecer la categora sexo con dos niveles, masculino (M) y femenino (F), los
encuestados slo tienen que sealar su gnero, no se requiere de un orden real. As, se
pueden asignar nmeros a estas categoras para su identificacin: 1=M, 2=F o bien, se
pueden invertir los nmeros sin que afecte la medicin: 1=F y 2=M. En resumen en la escala
nominal se asignan nmeros a eventos con el propsito de identificarlos. Otros ejemplos:
religin, color de ojos, etc.

7.2 Escala ordinal.
Se establecen categoras con dos o ms niveles que implican un orden inherente entre s.
La escala de medicin ordinal es cuantitativa porque permite ordenar a los eventos en
funcin de la mayor o menor posesin de un atributo o caracterstica. Por ejemplo, en las
Individuo
Cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si
estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos
el precio de la vivienda, cada vivienda es un individuo.



10
instituciones escolares de nivel bsico suelen formar por estatura a los estudiantes, se
desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. Estas escalas
admiten la asignacin de nmeros en funcin de un orden prescrito. Las formas ms
comunes de variables ordinales son tems (reactivos) actitudinales estableciendo una serie
de niveles que expresan una actitud de acuerdo o desacuerdo con respecto a algn
referente. Por ejemplo, ante el reactivo: ENACAL debe privatizarse, el respondiente
puede marcar su respuesta de acuerdo a las siguientes alternativas:
Totalmente de acuerdo
De acuerdo
Indiferente
En desacuerdo
Totalmente en desacuerdo
Las anteriores alternativas de respuesta pueden codificarse con nmeros que van del uno al
cinco que sugieren un orden preestablecido pero no implican una distancia entre un nmero
y otro.

7.3 Escala de intervalos.
La medicin de intervalo posee las caractersticas de la medicin nominal y ordinal.
Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables
continuas pero carece de un punto cero absoluto. El ejemplo ms representativo de este
tipo de medicin es un termmetro, cuando registra cero grados centgrados de
temperatura indica el nivel de congelacin del agua y cuando registra 100 grados
centgrados indica el nivel de ebullicin, el punto cero es arbitrario no real, lo que significa
que en este punto no hay ausencia de temperatura.

7.4 Escala de Razn (Cociente).
Una escala de medicin de razn incluye las caractersticas de los tres anteriores niveles
de medicin (nominal, ordinal e intervalo). Determina la distancia exacta entre los
intervalos de una categora. Adicionalmente tiene un punto cero absoluto, es decir, en el
punto cero no existe la caracterstica o atributo que se mide. Las variables de ingreso,
edad, peso, estatura, nmero de hijos, etc. son ejemplos de este tipo de escala. El nivel de
medicin de razn se aplica tanto a variables continuas como discretas.
Ej. 5 Clasifique c/u de las siguientes variables en categricas o numricas, si es numrica
Determine si es discreta o continua. Adems proporcione el nivel de medicin.












Variable Tipo de variable Nivel de medicin
Nmero de mensajes de correo
electrnico enviados por un
planificador.

Costo efectivo de los libros de
texto de un estudiante para un
cuatrimestre.

Edad
Marca de computadora personal.
Nivel acadmico.


11
ACTIVIDAD DE AUTOAPRENDIZAJE N 1
1. Origen y Evolucin de la Estadstica.
Escriba un ensayo que trate del origen y evolucin de la estadstica.

2. Describa con sus palabras cada uno de los siguientes trminos, proporcionando adems tres
ejemplos diferentes a los vistos en clase.
a. Poblacin. b. Muestra. c. Dato
d. Variable. e. Atributo. f. Parmetro.
g. Estadstico.
3. Ilustracin.
Un estudiante de estadstica desea tener una idea acerca del valor (en unidades
monetarias) del automvil tpico que poseen los profesores de su universidad. Para esto se
aplica cada uno de los trminos bsicos que se han definido.
3.1 La poblacin es el conjunto de todos los vehculos de los profesores de la
universidad.
3.2 Una muestra es una porcin o parte de una poblacin. Por ejemplo el nmero de
automviles cuyos propietarios son los profesores del departamento de matemticas,
es una muestra.
3.3 La variable es el valor real de cada automvil.
3.4 Un dato es el valor de un vehculo en particular. Por ejemplo, el auto del profesor
Miranda esta valuado en 12 mil dlares.
3.5 Los datos son el conjunto de valores que corresponden a la muestra obtenida (8, 10,
12,miles de $)
3.6 El parmetro acerca del cual se busca informacin es el valor promedio en la
poblacin.
3.7 El estadstico que se encontrar es el valor promedio de la muestra

4. Un fabricante de equipos electrnicos desea conocer la proporcin de artculos
defectuosos. Se realiza un estudio en 5000 artculos y se encontr que 8% estn
defectuosos. Suponiendo que esos 5000 artculos son representativas para el fabricante,
conteste las siguientes preguntas.
a. Cul es la poblacin?
b. Cul es la muestra?
c. Identifique el parmetro de inters.
d. Identifique el estadstico e indique cuales su valor.
e. Se conoce el valor del parmetro.

5. Encuentre un artculo o un anuncio de peridico, que ejemplifique el empleo de la
estadstica.
a. Describa e identifique la poblacin de inters.
b. Describa e identifique una variable.
c. Determine e identifique un estadstico.




12
6. Usted estudia los movimientos de precios de un grupo selecto de acciones enlistadas
en la Bolsa de Valores de Nicaragua. Consult un diario local del da 12 de julio del
2012 y encontr.






a. Se consideran las 112 acciones una muestra o una poblacin? Explique.
b. Cul es el nivel de medicin? Explique.
c. Son las categoras mutuamente excluyentes? Explique.

7. Si dos estudiantes obtienen una calificacin de 90 en el mismo examen, qu
argumentos podran usar para demostrar que la variable (fenmeno de inters), la
calificacin en la prueba, es continua?

8. Indique si cada una de las siguientes variables es categrica o numrica. Si es
numrica determine si es discreta o continua. Adems proporcione el nivel de medicin.

N Variable Tipo de variable Nivel de medicin
1 Cotizacin de una accin en el
mercado de valores.

2 Cociente de inteligencia.

3 Tipos de accidentes que ocurren en
una fbrica.

4 Temperatura.

5 Estado civil.

6 Precio de un producto.

7

Nmero de mensajes de correo
electrnico enviados diariamente
por un planificador.


8
Costo efectivo de los libros de
texto de un estudiante para un
cuatrimestre.

9 Factura mensual en electricidad.

10 Categoras de los profesores
universitarios.

11 Nmero de pginas escritas en cada
trabajo.

12 Tiempo que se necesita para auditar
una cuenta en una empresa.

13 Especialidad acadmica.

14 Nmero de crditos registrados en
el II cuatrimestre.

15 Formas de pago en una compaa.

16 Color del telfono usado.

Movimiento accionario Nmero
Aumentaron 69
Disminuyeron 32
Sin cambio 11


13
17 Cantidad de dinero gastado en ropa
el mes pasado.

18 Tipo principal de transaccin usada
al comprar la ropa.


19
Nmero de seales de trnsito en
poblados con menos de 50000
habitantes.


20
Tiempo que se necesita para
contestar una llamada telefnica en
una oficina de informacin.

21 Lugar de residencia.

22 N de bits transmitidos.

23 Marca de una computadora
personal.

24 Satisfaccin de un producto.

25 Tiempo de reparacin de un
componente electrnico.

26 Capacidad de almacenamiento de un
disco duro.


9. En una facultad universitaria se ha repartido un cuestionario entre los estudiantes
para averiguar el grado de satisfaccin en diversas actividades y servicios. Por ejemplo,
por lo que se refiere al mtodo de matrcula para las clases del III cuatrimestre, se pide
a los estudiantes que pongan una cruz en una de las casillas siguientes:
Muy satisfecho
Moderadamente satisfecho
Neutral
Moderadamente insatisfecho
Muy insatisfecho
Es la respuesta de un estudiante a esta pregunta, numrica o categrica? Si es numrica,
es discreta o continua? Adems indique el nivel de medicin.

10. El gerente de una compaa ha formulado una serie de preguntas al responsable del
Departamento de Informtica acerca de los trabajadores. Identifique el tipo de
dato que se pide en cada pregunta.
a. Cuntos trabajadores tiene el Departamento de Informtica?
b. Nivel acadmico (secundaria, universitaria, tcnico, otros).
c. Cuntas veces al mes ha habido reclamo en el salario de los empleados?
d. Nmero de trabajadores ausentes al mes.
e. Salario de los trabajadores.

11. Suponga que el gerente de la divisin de servicios al cliente de Xenith est interesado
principalmente en determinar si los clientes que han comprado una computadora durante
los ltimos 12 meses quedaron satisfechos con el producto. Usando las tarjetas de garanta
entregadas despus de la compra, el gerente planea encuestar a 1425 de estos clientes.
a. Describa tanto la poblacin como la muestra de inters para el gerente.
b. Describa el tipo de dato que el gerente desea recolectar principalmente.


14
c. Desarrolle un primer borrador del cuestionario escribiendo una serie de siete
d. preguntas categricas y cinco numricas que piensa serian apropiadas para esta
encuesta.

8. Organizacin de datos.
Muchas veces uno se pregunta, para qu sirven las encuestas que a veces se hacen en la
calle?, Cmo saber si una estacin de radio se escucha ms que otra? , Cul candidato
puede ganar? La respuesta se comienza con la recaudacin de datos. Los datos son
informacin que se recoge, esto puede ser opinin de las personas sobre un tema, edad o
sexo de encuestados, dnde viven, cuntas personas viven en una casa, qu tipo de sangre
tiene un grupo de personas, etc. Hay datos que pueden ser de mucha utilidad a diferentes
profesionales en la toma de decisiones, para resolver problemas o para mostrar resultados
de investigaciones. Una vez que se haya recogido toda la informacin, se procede a crear
una base de datos, donde se registran todos los datos obtenidos. Algunas veces, si los
datos son muy complicados, se codifican, esto quiere decir que se le coloca una palabra
clave que identifica un ttulo muy largo. Cuando ya est elaborada la base de datos se
parece a una tabla. Es importante recordar que nunca se colocan las tablas y las grficas
juntos, porque en realidad dicen lo mismo, corrientemente se utiliza o una tabla y su
anlisis, o una grfica y su anlisis. Por ejemplo, supngase que se ha preguntado a un
conjunto de n personas: qu opinin tienen acerca de la instalacin de playas en la Ciudad
de Rivas o que ha hecho el Gobierno a partir del 2010? Las n respuestas se encuentran en
una escala que va de 1 a 5, donde 1 representa un total desacuerdo con la medida mientras
que 5 quiere significar un acuerdo total.

Una manera de obtener datos es a travs de la observacin directa. Un experimento
estadstico es una forma de observacin directa en la que se controlan algunos o todos los
factores que pueden influir en la variable que se estudia.








Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple (f) Acumulada (fa) Simple (fr) Acumulada (fra)
X1
f1 f1 fr1 = f1 / n fr1
X2
f2 f1 + f2 fr2 = f2 / n fr1 + fr2
... ... ... ... ...
Xn-1
fn-1 f1 + f2 +..+ fn-1 frn-1 = fn-1 / n fr1 + fr2 +..+frn-1
Xn
fn
fa = n
frn = fn / n fra = 1
Siendo X los distintos valores que puede tomar la variable.
Siendo f el nmero de veces que se repite cada valor.
Siendo fr el porcentaje que la repeticin de cada valor supone sobre el total
Distribucin de frecuencia
Es la representacin estructurada, en forma de tabla, de toda la informacin
que se ha recogido sobre la variable que se estudia.



15
Frecuencia absoluta es el nmero de veces que se repite un determinado valor.
Frecuencia relativa es el cociente entre la frecuencia absoluta y el nmero total de
observaciones, por tanto la frecuencia relativa est siempre entre cero y uno.
Frecuencia absoluta acumulada es decir se suman las frecuencias anteriores a un
valor dado, por tanto la acumulada al final coincide con el tamao de la muestra o la
poblacin (n N).
Frecuencia relativa acumulada se suman las frecuencias relativas anteriores a un
valor dado, al final la suma es 1.

Ej. 6 Se utiliza un contador Geiger electrnico para contar el nmero de emisiones
radiactivas en un periodo de 10 segundos, obteniendo las cuentas siguientes: 8, 12, 13,
15, 8, 12, 15, 23, 16, 12, 13, 16, 30, 23, 15. Presente esta informacin en una
distribucin de frecuencias (Comente los resultados)





















1. Distribucin de frecuencias agrupadas.
1.1 La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un nmero grande de valores o la variable es continua.
1.2 Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.
1.3 Rango, es la diferencia entre el lmite superior y el inferior. (R = X
M
- X
m
)
1.4 Intervalo de clase, conocido tambin como Amplitud o Ancho de clase,
Si se decide que el ancho de cada clase sea uniforme, deber calcularse por medio de
la expresin,


Emisiones
radiactivas.
N de emisiones
(f)

(fa)
% de emisiones
(fr)

(fra)
8 2 2 0,1333 0,1333
12 3 5 0,2000 0,3333
13 2 7 0,1333 0,4666
15 3 10 0,2000 0,6666
16 2 12 0,1333 0,8000
23 2 14 0,1333 0,9333
30 1 15 0,0666 1,0000
Tabla de frecuencias
Una distribucin de frecuencias es una tabla en la que se organizan los datos en
clases, es decir, en grupos de valores que describen una caracterstica de los datos
y muestra el nmero de observaciones del conjunto de datos que caen en cada una
de las clases.

n .
observado valor Mn observado valor Mx
c
log 322 3 1
) . . (
+

=



16
1.5 Marca de clase: La marca de clase es el punto medio de cada intervalo y es el
valor que representa a todo el intervalo para el clculo de algunos parmetros.
1.6 Lmites de clase: Cada clase est delimitada por el lmite inferior de la clase y el
lmite superior de la clase.

En todos los casos debe comprobarse que la diferencia entre el lmite superior e
inferior de cada clase sea igual al ancho de la clase menos una unidad de variacin.

2. Pasos para la elaboracin de tablas de distribucin de frecuencias.
2.1 Recopilacin de datos.
2.2 Clasificacin de los datos de menor a mayor (optativo).
2.3 Clculo del ancho de la clase.
2.4 Identificacin de los lmites de clase.
2.5 Conteo de los datos.

Ej. 7 Treinta solicitantes interesados en trabajar para un programa de asistencia social,
rindieron un examen diseado para medir su aptitud para trabajo social. Los resultados
fueron los siguientes. Prepare una distribucin de frecuencias.





Clasificacin ordenada.





Calculo del ancho de clase.





5 70014138 , 4
30 log 322 , 3 1
) 70 98 (
~ =
+

= c


Distribucin de frecuencias.

79 97 86 76 93 87 98 78 84 88
81 91 86 87 70 94 77 92 76 85
73 78 98 88 96 72 79 79 97 83
70 72 73 76 76 77 78 78 79 79
79 81 83 84 85 86 86 87 87 88
88 91 92 93 94 96 97 97 98 98
Calificacin N de
solicitantes (f)

(fa)
% de solicitantes
(fr)

(fra)
Marca
de clase

Limites reales
70 - 74 3 3 0,1000 0,1000 72 69,5 - 74,5
75 - 79 8 11 0,2666 0,3666 75 74,5 - 79,5
80 - 84 3 14 0,1000 0,4666 80 79,5 - 84,5
85 - 89 7 21 0,2333 0,7000 85 84,5 - 89,5
90 - 94 4 25 0,1333 0,8333 90 89,5 - 94,5
95 - 99 5 30 0,1666 1,0000 95 94,5 - 99,5
n .
observado valor Mn observado valor Mx
c
log 322 3 1
) . . (
+

=

u c L L
i S
+ =



17
Con los resultados obtenidos en la tabla, responda las siguientes preguntas:
a. Cuntos solicitantes obtuvieron calificacin entre 84,5 y 89,5?

b. Qu porcentaje de solicitantes obtuvo a lo sumo 89,5 como calificacin?


c. Cuntos solicitantes obtuvieron cuando mucho 94,5 puntos?

d. Cunto es la calificacin media representativa ubicada entre 74,5 y 79,5?

e. Cunto es la calificacin mxima del 83,33% de los solicitantes?

f. Qu porcentaje de solicitantes obtuvieron calificacin entre 94,5 y 99,5?



Si los datos se agrupan en categoras numricas, la tabla resultante se denomina distribucin
categrica o cualitativa. Este tipo de distribucin se ilustra por medio de la tabla siguiente
que pertenece a los planes de estudios superiores de un grupo de 548 estudiantes del ltimo
ao de secundaria.


Ej: 8
Planes de estudio superior. N de estudiantes del ltimo ao de
secundaria
Planea ir a la universidad. 240
Quiz vaya a la universidad. 146
Planea ir o quiz vaya a una escuela tcnica. 57
No ir a ninguna universidad. 105
Total 548



9. Representacin grfica.
Una grfica es la representacin de datos, generalmente numricos, mediante lneas,
superficies o smbolos, para ver la relacin que esos datos guardan entre s. Sirven para
analizar el comportamiento de un proceso, o un conjunto de elementos o signos que
permiten la interpretacin de un fenmeno.










18
9.1 Histograma.
Los histogramas no muestran frecuencias acumuladas, son preferibles para el tratamiento
de datos cuantitativos y la barra con mayor altura representa la mayor frecuencia. La
sumatoria de las alturas de las columnas equivale al 100% de los datos.




9.2 Polgono de frecuencias.


9.3 Ojiva.
La diferencia fundamental entre las ojivas y los polgonos de frecuencias es que en el eje
horizontal (x) en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor y para la ojiva menor que, la
mayor.










9.4 Grficas de barras.
Se emplea cuando la variable independiente es categrica.

Es un grfico de lneas que se usa
para presentar las frecuencias
absolutas de los valores de una
distribucin en el cual la altura del
punto medio asociado a un valor de
la variable es proporcional a la
frecuencia de dicho valor.

Una grfica similar al polgono de
frecuencias es la ojiva, pero sta se
obtiene al aplicar parcialmente la
misma tcnica a una distribucin
acumulativa y de igual manera que
stas, existen las ojivas mayores que
y las ojivas menores que.
Es una representacin grfica de una
variable en forma de barras, donde la
superficie de cada barra es
proporcional a la frecuencia de los
valores representados. En el eje
vertical se representan las f. y en el
eje horizontal los valores de las
variables (lmites reales de clase).

Cada barra slida, ya sea vertical u
horizontal representa un tipo de dato.
Cuando es necesario representar
divisiones de datos se utiliza un grfica
de barras subdivididas.


19
9.5 Grfica de lneas.
Son ideales para representar tendencias de ventas, importaciones y otra serie de valores
durante un cierto perodo.


9.6 Grfica circular.



ACTIVIDAD DE AUTOAPRENDIZAJE N 2

1. Los siguientes datos representan el tiempo (en horas) que dedican 50 estudiantes de una
universidad a actividades de horas libres, durante una semana comn de asistencia a clase.






a. Clasifique la variable involucrada.
b. Desarrolle la clasificacin ordenada.
c. Organice los datos en una tabla de distribucin de frecuencia.
d. Presente estos datos mediante: Un Histograma.
Un Polgono de frecuencia.
Una Ojiva y una Ojiva porcentual.

2. Los tiempos de reparacin (medidos en horas) de 40 instrumentos electrnicos se
muestran enseguida:





23 17 22 16 22 20 18 12 24 21
16 21 28 18 15 28 20 29 14 25
29 38 17 19 23 18 20 25 32 19
16 24 12 07 18 22 17 27 24 29
30 15 20 19 14 24 34 23 18 13
21 15 25 13 12 11 14 24 09 20
12 18 19 16 16 20 12 10 11 24
08 17 13 23 18 15 12 16 13 18
10 22 12 24 19 09 15 23 18 15
Esta ilustra mediante segmento
de lneas los cambios en
cantidades con respecto al
tiempo.
Los grficos circulares,
denominados tambin grficos de
pastel, se utilizan para mostrar
porcentajes y proporciones.


20
a. Clasifique la variable involucrada.
b. Desarrolle la clasificacin ordenada.
c. Organice los datos en una tabla de distribucin de frecuencia.
d. Presente estos datos mediante: Un Histograma.
Un Polgono de frecuencia.
Una Ojiva y una Ojiva porcentual.
e. Qu porcentaje de instrumentos electrnicos necesitan entre 13.5 y 16.5 horas
para ser reparados?
f. Cuntos instrumentos electrnicos necesitan a lo sumo 19.5 horas para ser
reparados?
g. Qu porcentaje de instrumentos electrnicos necesitan a lo sumo 22.5 horas para
ser reparados?

3. La prueba KSW de aptitud en ciencias de la computacin fue aplicada a 50 estudiantes,
obteniendo la siguiente distribucin de frecuencia de sus calificaciones o puntajes.

Puntaje de la
prueba KSW
N de
estudiantes

1 - 4 4
5 - 8 8
9 - 12 10
13 - 16 20
17 - 20 8
Total
a. Complete la tabla. Cul es el ancho de cada clase?
b. Cuntos estudiantes obtuvieron entre 11.5 y 15.5 puntos en la prueba KSW?
c. Que % de estudiantes obtuvieron entre 3.5 y 7.5 puntos en la prueba?
d. Cul es la puntuacin mxima del 84% de los estudiantes?
e. Que % de estudiantes obtuvo cuando mucho 11.5 puntos?

4. Los siguientes datos representan las acciones de mercado (en porcentaje) propiedad de un
fabricante de software de aplicaciones de negocios de Windows durante el ao 2012.







a. Construya una grfica de barras y uno de pastel.
b. Escriba un informe describiendo los datos anteriores y ofrezca sugerencias sobre
como Lotus podra incrementar su posicin de acciones del mercado.

5. La conservacin ambiental es un asunto nacional de principal importancia. Se ha dicho que
los pases industrializados tiraron 227,1 millones de toneladas de basura en un ao
reciente. Por lo general el desecho de basura se hace mediante rellenos sanitarios (87%),
Fabricante Acciones del mercado (%)
Aldus 5,5
Lotus 15,3
Microsoft 60,0
Software Publishing 12,7
Otros 6,5


21
incineracin (7%) y reciclamiento (5%). Suponga que la compaa consultora donde Ud.
trabaja proporciona la siguiente tabla que muestra el desglose de porcentajes de las
fuentes de desecho: Construya la grfica apropiada para representar estos datos.











6. Los siguientes datos representan las acciones de mercado (en porcentaje) propiedad de
fabricantes de telfonos celulares porttiles, transportables y mviles vendidos en el ao
2010. Presente los datos mediante una grfica de barras.








10. Medidas de posicin central.
Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos
analizando. Estas medidas permiten conocer diversas caractersticas de esta serie de
datos.
Las medidas de posicin son de dos tipos:
Medidas de posicin central: informan sobre los valores medios de la serie de datos.
Medidas de posicin no centrales: informan de como se distribuye el resto de los
valores de la serie.

Las principales medidas de posicin central son las siguientes:
Media ( x ): Es el valor medio ponderado de la serie de datos. Se pueden calcular
diversos tipos de media, siendo las ms utilizadas.
Media aritmtica: La suma de todos los datos se divide por el total de datos de la
muestra.

Su frmula es:




Fuente %
Papel 20
Basura de jardn 10
Desechos 26
Vidrio 6
Metales 9
Plstico 10
Madera 5
Otros 14
Fabricante Acciones del mercado (%)
Motorola 16
Sony Ericsson 20
Nokia 18
Samsung 25
Otros 21
n
x
x
i
=


22
Ej: 9 La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su
tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das. Determine el nmero medio de
personas que entraron a la tienda durante esos das.


478
10
700 520 ... 300 295
=
+ + + +
= =

n
x
x
i

En conjunto, el nmero de personas que entraron al almacn durante los
pasados 10 das es 478, ste es el nmero medio (o promedio) de personas que
visitaron la tienda por da.
Con su calculadora cientfica verifique esta respuesta.





Media geomtrica: Algunas veces manejamos cantidades que cambian a lo largo de un
periodo, entonces se necesita conocer una tasa promedio de cambio. En tal caso la
media aritmtica no es apropiada, porque no proporciona la respuesta correcta.

Usos principales de la media geomtrica.
Para pronosticar porcentajes, ndices y cifras relativas.


Ej: 10 Una fbrica de telas ha elevado el costo del algodn en un periodo que abarca los
ltimos 5 aos en los siguientes porcentajes. Cul es el aumento porcentual
promedio del costo del algodn en ese periodo?




% 59 , 9 592269869 , 9 52 , 81209 ) 1 , 13 )( 3 , 12 )( 5 , 10 )( 8 )( 6 (
5 5
~ = = = MG

Es decir el incremento porcentual promedio del costo del algodn fue de 9,59%
aproximadamente, durante ese periodo.

Para determinar el incremento porcentual promedio de ventas, exportaciones,
produccin u otras actividades econmicas o series econmicas de un periodo a otro.






2007 2008 2009 2010 2011
6% 8% 10,5% 12,3% 13,1%
n
n
x x x MG ...
2 1
=
1


1 = n
perodo del inicio al Valor
perodo del final al Valor
MG

(Entre a MODE , SD , digite los datos 295 M
+
, 300 M
+
, 700
M
+
, luego SHIFT 2 , 1 , = y obtendr el resultado)




23
Ej: 11 La produccin de una fbrica se increment de 25600 unidades en el 2001 a 132520 en
el 2012. Obtenga el incremento porcentual anual.


% 12 , 16 161215596 , 0 1 161215596 , 1 1 1765625 , 5 1
25600
132520
11
11
~ = = = = MG

El incremento porcentual anual de la fbrica fue de 16,12% aproximadamente durante
ese periodo.

Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media
geomtrica. Esta se suele utilizar en series de datos como tipos de inters anuales, inflacin,
etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores.
En todo caso, la media aritmtica es la medida de posicin central ms utilizada. Lo ms
positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no
se pierde ninguna informacin. Sin embargo, presenta el problema de que su valor (tanto en el
caso de la media aritmtica como geomtrica) se puede ver muy influido por valores extremos,
que se aparten en exceso del resto de la serie. Estos valores anmalos podran condicionar en
gran medida el valor de la media, perdiendo sta representatividad.

Media ponderada: Nos permite obtener un promedio que tiene en cuenta la
importancia de cada valor para el total global. Se denota por,




Donde w
i
: es el peso asignado a cada observacin,
x
i
: es el valor de cada observacin.

Ej: 12 En una agencia de viajes se han vendido 200 pasajes a los precios siguientes:

Precio de venta (cientos$) x
i
12 14 16
Nmero de pasajes. w
i
60 100 40

$ 8 , 13
200
2760
40 100 60
) 16 ( 40 ) 14 ( 100 ) 12 ( 60
de cientos
w
x w
x
i
i i
w
= =
+ +
+ +
= =


El precio promedio de venta de los 200 pasajes es de $1380

Media armnica: De una serie de n nmeros x
1
, x
2
, x
n
es la reciproca de la
media aritmtica de los datos, donde ninguno toma el valor cero. Este promedio se
utiliza para que los valores extremos no afecten al valor del promedio. Los valores
extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico.






=
i
i i
w
w
x w
x

=
i
x
n
H
1



24
Ej: 13 Calcular el rendimiento promedio para el caso de tres automviles que recorrieron
500 kilmetros y cada auto tuvo el rendimiento siguiente:


33434215 , 61
048912238 , 0
3
6 , 77
1
4 , 62
1
50
1
3
1
= =
+ +
= =

i
x
n
H

El resultado muestra que el rendimiento promedio de los autos es de 61,3 Km/galn.

Mediana (M
e
); Es el valor de la serie de datos que se sita justamente en el centro
de la muestra (un 50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influida por los valores extremos, pero en cambio no
utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por
el nmero de veces que se ha repetido).
Para su clculo los datos deben estar ordenados.



Ej: 14 La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su
tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das. Determine el nmero mediano de
personas que entraron a la tienda durante esos das.
Ordenar datos:
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
295 300 350 400 495 520 520 520 680 700
n = 10 (par)
Posicin:
5 , 5
2
1 10
X X M
e
= =
+

Se ubica entre la posicin 5 y 6.
508 5 , 507
2
520 495
5 , 5
~ =
+
= = X M
e

El nmero mediano de personas que visitan la tienda es de 508.
En este ejemplo, la mediana se sita exactamente entre el quinto y sexto dato de este grupo,
ya que entre estos dos valores se encuentra la divisin entre el 50% inferior y el 50% superior.



Auto A B C
Rendimiento (Km/galn) 50 62,4 77,6
Posicin:
2
1 +
=
n e
X M



25
Ej: 15 Los tiempos en minutos que necesitan varias empresas de seguro para revisar
solicitudes de servicios de cobertura mdica son: 230 50 180 63 120
Determine el tiempo mediano de servicio de cobertura de las empresas de seguro.
Ordenar datos:



n = 5 (impar)

Posicin:
3
2
1 5
X X M
e
= =
+


Se ubica entre la posicin 3. . X M
e
min 120
3
= =
El tiempo mediano de servicio para revisar las solicitudes de seguro mdico es de
120 min.


Moda (M
0
): Es el valor que ms se repite en la muestra.
Ej: 16 La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su
tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das. Determine el nmero modal de
personas que entraron a la tienda durante esos das.
295, 300, 520, 350, 400, 520, 495, 680, 520, 700
Observamos que el valor 520 se repite tres veces.
El nmero modal de personas que visitan la tienda es de M
0
= 520.

11. Medidas de posicin no central.
Las medidas de posicin no centrales permiten conocer otros puntos caractersticos de
la distribucin que no son los valores centrales. Entre otros indicadores, se suelen
utilizar una serie de valores que dividen la muestra en tramos iguales:
Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma
creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos
concentra el 25% de los resultados.
Se determinan mediante las posiciones:


Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los
resultados. Los deciles y percentiles se calculan de igual manera,
X
1
X
2
X
3
X
4
X
5
50 63 120 180 230
4
1 1
:
+ n
X Q

e
M Q :
2

4
) 1 ( 3 3
:
+ n
X Q



26
Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma
creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra
el 1% de los resultados. La posicin para determinar los percentiles es:


Ej: 17 Los siguientes datos se refieren a las ganancias por accin de 10 compaas de la
industria de las comunicaciones.

4,62 1,34 1,62 2,11 1,29 6,04 9,56 4,90 0,84 7,25

Cul es la ganancia mxima por accin del 25% de las compaas?
Ordenar los datos:
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
0,84 1,29 1,34 1,62 2,11 4,62 4,90 6,04 7,25 9,56

n = 10
Posicin:



Es decir el 25% de las compaas tienen como ganancia mxima 1,33 por accin.


17.1 Cul es la ganancia mxima por accin del 60% de las compaas?
Ordenar los datos:
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
0,84 1,29 1,34 1,62 2,11 4,62 4,90 6,04 7,25 9,56

Posicin:




Lo que nos muestra es, el 60% de las compaas tienen como ganancia mxima
4,79 por accin.

17.2 Cul es la ganancia mxima por accin del 75% de las compaas?




17.3 Cul es la ganancia mxima por accin del 90% de las compaas?


100
) 1 (
:
p
n
p
X P
+
6 , 6
100
60
) 1 10 (
60
: X X P =
+
4
1 1
:
+ n
X Q
75 , 2
4
1 10 1
: X X Q =
+
33 , 1
3275 , 1 ) 29 . 1 34 , 1 ( 75 , 0 29 , 1
1
1
~
= + =
Q
Q
79 , 4
788 , 4 ) 62 , 4 90 , 4 ( 6 , 0 62 , 4
60
60
~
= + =
P
P
100
) 1 (
:
p
n
p
X P
+



27
12. Medidas de variacin o dispersin.
Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms
o menos concentrados, o ms o menos dispersos.
Existen diversas medidas de dispersin, entre las ms utilizadas podemos destacar las
siguientes:
Rango: Mide la amplitud de los valores de la muestra y se calcula por diferencia entre
el valor ms elevado y el valor ms bajo.



Varianza: Mide la distancia existente entre los valores de la serie y la media. Se
calcula como la sumatoria de las diferencias al cuadrado entre cada valor y la media,
dividida por el tamao de la muestra menos uno.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms
concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.




Desviacin estndar (o tpica): Se calcula como raz cuadrada de la varianza.



Coeficiente de variacin: se calcula como cociente entre la desviacin tpica
(estndar) y la media. El inters del coeficiente de variacin es que al ser un
porcentaje permite comparar el nivel de dispersin de dos muestras. Esto no ocurre
con la desviacin tpica, ya que viene expresada en las mismas unidas que los datos de
la serie.
Por ejemplo, para comparar el nivel de dispersin de una serie de datos de la altura
de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede
utilizar las desviaciones tpicas (una se expresa en cm y la otra en kg). En cambio, sus
coeficientes de variacin son ambos porcentajes, por lo que s se pueden comparar.




Coeficiente de asimetra: Karl Pearson desarrollo una medida para calcular el sesgo de
una distribucin, llamado Coeficiente de Asimetra. El concepto de asimetra se
refiere, si la curva que forman los valores de la serie presenta la misma forma a
izquierda y derecha de un valor central (media aritmtica).

observado mnimo Valor observado mximo Valor R =
1
) (
2
2

n
x x
s
i

1
) (
2

=

n
x x
s
i

%) 100 (
x
s
CV =



28
Para medir el nivel de asimetra se utiliza la frmula que viene definida por:


Caractersticas.
Vara de 3.0 a + 3.0
Un valor cero indica una distribucin simtrica.
Si el extremo largo de la distribucin esta a la derecha, se dice que tiene sesgo
positivo.
Si el extremo largo de la distribucin esta a la izquierda, el sesgo es negativo.

Ej: 18 Tomando el Ej. 9.
La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su
tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das.
18.1 Determine e interprete la desviacin estndar.
Para calcularla debemos conocer la media.
478
10
700 520 ... 300 295
=
+ + + +
= =

n
x
x
i




Sustituimos en la frmula:
143 7157237 , 142 77778 , 20367
1 10
183310
1
) (
2
~ = =

=

n
x x
s
i

La cantidad promedio de personas que visitan la tienda es de 478, con una
dispersin de 143 personas aproximadamente, con respecto a la media.

Con su calculadora cientfica verifique esta respuesta.




x

) ( x x

2
) ( x x

295 295 478 = -183 (-183)
2
= 33489
300 300 478 = -178 (-178)
2
= 31684
520 520 478 = 42 (42)
2
= 1764
350 350 478 = -128 (-128)
2
= 16384
400 400 478 = -78 (-78)
2
= 6084
520 520 478 = 42 (42)
2
= 1764
495 495 478 = 17 (17)
2
= 289
680 680 478 = 202 (202)
2
= 40804
520 520 478 = 42 (42)
2
= 1764
700 700 478 = 222 (222)
2
= 49284
Total 0 183310
s
M x
CA
e
) ( 3
=

(Entre a MODE , SD , digite los datos 295 M+ , 300 M+,
700 M+ luego SHIFT 2 , 3 , = y obtendr el resultado)



29
18.2 Calcule e interprete el coeficiente de variacin.
Conocemos 7157237 , 142 478 = = s y x
Sustituimos en la frmula.
% 86 , 29 %) 100 ( 298368459 , 0 %) 100 (
478
7157237 , 142
%) 100 ( ~ = = =
x
s
CV

Es decir



18.3 Cul es el coeficiente de asimetra?
Sustituir en la frmula.
62 , 0 620113872 , 0
7157237 , 142
) 5 , 507 478 ( 3 ) ( 3
~ =

=
s
M x
CA
e

Este valor indica un grado menor de asimetra negativa, provocando que el nmero
promedio de personas que visitan la tienda sea menor que el nmero mediano.

ACTIVIDAD DE AUTOAPRENDIZAJE N 3

1. Un experto en computadoras, tratando de optimizar la operacin de un sistema, reuni
datos sobre el tiempo, en minutos, entre la solicitud de servicio de un proceso especial.





a. Determine el tiempo medio, mediano y modal de este conjunto de datos.
b. Calcule la desviacin estndar e interprete el resultado.
c. Determine el porcentaje de variacin de este conjunto de datos.
d. Calcule e interprete el coeficiente de asimetra.
e. Cual es el tiempo mximo del 70% de operaciones?
f. Cul es el tiempo mximo del 90% de operaciones?

2. Un fabricante emplea a varios especialistas para hacer reparaciones de urgencia en horas.
Por lo general, los especialistas deben viajar distancias cortas. Se tomo una muestra de 8
comprobantes de gastos de viaje de los tcnicos, con el propsito de estimar los gastos que
debern hacerse el prximo ao por este concepto. La informacin resultante fue la
siguiente.

a. Determine el gasto medio y mediano de los tcnicos.
b. Qu caractersticas en este conjunto de datos es la responsable de la diferencia
sustancial entre estas dos medidas (media y mediana)?
c. Determine la varianza y la desviacin estndar.
d. Cul es el porcentaje de variacin de estos datos?

2800 5913 3750 5520 5000
4900 3420 9530 8735 8900
4500 4900 5010 7012 5400
C$230 635 525 240 252 258 420 260


30
3. Se toma una muestra de seis resistores y se mide su resistencia (en ohm). Los resultados son
los siguientes:

Calcule:
a. La varianza y la desviacin estndar muestral.
b. Reste 35 a cada una de las mediciones de resistencia originales y calcule s
2
y s. Compare
sus resultados con los obtenidos en el inciso (a).
c. Reste 30 de cada valor y luego multiplique las diferencias por 10. Ahora calcule s
2
para
el nuevo conjunto de datos. Qu relacin existe entre esta s
2
y la de los datos
originales? Explique.

4. Considere el siguiente par de muestras:
Muestra 1:

Muestra 2:

a. Calcule el rango de ambas muestras. Es posible concluir que las dos muestras exhiben la
misma variabilidad?
b. Calcule la desviacin estndar de cada una de las muestras. Estas cantidades indican que
las dos muestras tienen la misma variabilidad?
c. Calcule el coeficiente de variacin de cada una de las muestra y diga cul de las muestras
presenta menor variabilidad relativa.


UNIDAD II: PROBABILIDADES
Introduccin.
Para la mayora de las personas, probabilidad es un trmino vago utilizado en el lenguaje
cotidiano para indicar la posibilidad de la ocurrencia de un evento futuro. Esta interpretacin
prctica del trmino puede considerarse aceptable, pero se pretende lograr una comprensin
ms precisa del contexto de su aplicacin, como se mide y de que manera se utiliza la
probabilidad para hacer inferencias. El concepto de probabilidad es necesario cuando se opera
con procesos fsicos, biolgicos y sociales que generan observaciones que no es factible
predecir con exactitud. Adems, la probabilidad y la estadstica se relacionan en una forma
muy curiosa. En esencia la probabilidad es el vehculo que le permite al estadstico usar la
informacin contenida en una muestra para hacer inferencias o para describir la poblacin de
la cual se ha obtenido la muestra.

1. Enfoques de Probabilidad.
Probabilidad clsica a priori.
En este caso la probabilidad de xito se basa en el conocimiento anterior al
involucrado.

45 38 47 41 35 43
10 9 8 7 8 6 10 6
10 6 10 6 8 10 8 6
resultados de total N
favorables resultados de N
xito de obabilidad


Pr

=



31
Ej: 1. La probabilidad de sacar una carta con figura negra de una baraja.
2. La probabilidad que la suma de las caras de dos dados sea siete.

Probabilidad clsica emprica.
Aunque la probabilidad se sigue definiendo como la proporcin entre el nmero de
resultados favorables y el nmero total de resultados, estos resultados se basan
en datos observados, no en el conocimiento anterior a un proceso.
Ej: 1. La probabilidad que un estudiante tenga un promedio inferior a 80 puntos.
2. La probabilidad que un individuo seleccionado aleatoriamente de una encuesta sobre la
satisfaccin de los empleados, este satisfecho con su trabajo.

Probabilidad subjetiva.
Se refiere a la probabilidad de ocurrencia asignada a un evento por un individuo
particular.
Ej: 1. La probabilidad que tenga xito un nuevo producto en el mercado.
2. La probabilidad que un conservador gane la prxima eleccin presidencial.
La asignacin de probabilidades a diversos eventos suele estar basada en la
experiencia previa, opinin personal y el anlisis de una situacin en particular. La
probabilidad subjetiva es de uso especial en la toma de decisiones en situaciones en las
cuales no se puede hacer determinaciones empricas de la probabilidad de diferentes
eventos.
2. Conceptos bsicos de probabilidad.
Experimento.
Es un proceso por medio del cual se obtiene una observacin (o una medicin). Su
smbolo es E .
Ej: 2.1 :
1
E Registrar la capacidad productiva de un obrero textil.
:
2
E Entrevistar a un votante para que nos diga su preferencia antes de una
eleccin.
:
3
E Registrar la puntuacin obtenida en una prueba de Estadstica.
Espacio muestra o muestral.
Es la coleccin de todos los eventos posibles. Su smbolo es . S
Ej: 2.2 Con referencia a :
1
E Suponga que la capacidad productiva del obrero se
encuentra entre 50 y 60 unidades diarias inclusive. Entonces { } 0 ...., , 51 , 50 = S


Evento (o Suceso).
Un evento simple es el que se puede describir con una caracterstica.
Se simboliza por ... , , C B A


32
Ej: 2.3 Para
2
E existen 3 eventos simples.
: A Votante simpatizante AC. : B Votante simpatizante PLC.
: C Votante simpatizante FSLN. C: Votante simpatizante PLI.

El complemento de un evento A, incluye todos los eventos que no son parte del
evento A. Su smbolo es A' .

Un evento conjunto es un evento que tiene dos o ms caractersticas.

Ej: 2.4 Para
3
E podemos determinar eventos conjuntos como,
S y F : Estudiante mujer y con alta puntuacin.
B y M : Estudiante varn y con baja calificacin.
3. Axiomas de Probabilidad.
Suponga que un espacio muestral S , esta asociado a un experimento. A cada evento A
definido en S ( ) S Ac , se le asigna un nmero ) (A P , llamado probabilidad de A, de tal
manera que cumpla lo siguiente.
1. 0 ) ( > A P 4. 1 ) ( = S P
2. 1 ) ( 0 s s A P 5. 0 ) ( = | P
3. ) ( 1 ) ( A P A P = '

3. Probabilidad Simple (marginal).
Significa la probabilidad de ocurrencia de un evento simple ). (A P


Ej: 3.1 La probabilidad que un estudiante obtenga una puntuacin alta en la asignatura de
Estadstica.
3.2 La probabilidad que un votante sea simpatizante liberal.
3.3 Suponga que una encuesta a 200 trabajadores de una industria, se desarrolla usando
un paquete de computacin para hacer una clasificacin cruzada de los eventos de
inters: la satisfaccin en el trabajo y el progreso en la organizacin, los resultados
son.
Satisfaccin
en el trabajo
Avance en la organizacin
Total Si No
Si 96 70 166
No 20 14 34
Total 116 84 200

Presente estos datos en un diagrama de Venn.







B
A 70


{ } 14 = ' ' B A { } 186 = B A
96
20



33
Definimos los sucesos involucrados.
: A Estar satisfecho en el trabajo.
: A' No estar satisfecho en el trabajo.
: B Haber avanzado en la organizacin.
: B' No haber avanzado en la organizacin.

3.3.1 Calcule la probabilidad que un empleado seleccionado aleatoriamente este
satisfecho con su trabajo.
empleados de total N
trabajo su con s satisfecho empleados de N
A P


) (

=


83 , 0
200
166
) ( = = A P

El resultado 0,83 nos indica la probabilidad que un empleado escogido al azar este
satisfecho con su trabajo.


3.3.2 Calcule la probabilidad que un empleado seleccionado al azar haya avanzado en la
organizacin.
s deempleado total N
n organizaci la en avanzado han que empleados de N
B P


) (

=


58 , 0
200
116
) ( = = B P

..


4 Probabilidad Conjunta.
Se refiere a fenmenos que contienen dos o ms eventos.

Ej: 4.1 Refirindose al ejemplo 3.3
4.1.1 Calcule la probabilidad que un empleado escogido al azar este satisfecho con su
trabajo y no haya avanzado en la organizacin.
empleados de total N
n organizaci la en avanzado han no y s satisfecho empleados de N
B y A P


) (

= '

35 , 0
200
70
) ( = = ' B y A P





4.1.2 Calcule la probabilidad que un empleado escogido al azar no este satisfecho con su
trabajo, ni haya progresado en la organizacin.
s deempleado total N
n organizaci la en avanzado han no y satifechos no empleados de N
B y A P


) (

= ' '

07 , 0
200
14
) ( = = ' ' B y A P




34
5. Regla de la Adicin.
Ya se ha desarrollado una forma para encontrar la probabilidad del evento A y la
probabilidad del evento A y B ) ( B A . Ahora examinaremos una regla para encontrar
la probabilidad del evento A o B (A ) B . Esta regla se llama unin, se refiere a la
ocurrencia, ya sea, del evento A, del evento B o de A y B. Se expresa,



Y se le llama regla general de la adicin.

Ej: 5.1 Refirindonos al ejemplo 3.3
5.1.1 Calcule la probabilidad que un empleado seleccionado al azar este satisfecho
con su trabajo o no haya avanzado en la organizacin.

90 , 0
200
180
200
70
200
84
200
166
) ( = = + = ' B A P





5.1.2 Calcule la probabilidad que un empleado escogido aleatoriamente no est satisfecho
con su trabajo o no haya avanzado en la organizacin.

52 , 0
200
104
200
14
200
84
200
34
) ( = = + = ' ' B A P





Siempre que la probabilidad conjunta no tenga resultado, los eventos involucrados
se consideran mutuamente excluyentes (es decir, si ambos eventos no pueden
ocurrir al mismo tiempo), en tal caso la regla de la adicin se reduce a.



Ej: 5.2 Un estudio de 200 tiendas de abarrotes revel los siguientes ingresos, despus
del pago de impuestos.






Cul es la probabilidad de que una tienda de abarrotes seleccionada al azar tenga un
ingreso entre 10 y 20 millones de C$ o un ingreso de ms de 20 millones de C$?

49 , 0
200
98
200
37
200
61
) ( = = + = C B P


Ingresos despus de los impuestos Sucesos N de empresas
Menos de 10 millones de C$ A 102
C$10 millones - C$20 millones B 61
Mas de C$20 millones C 37
Total
) ( ) ( ) ( ) ( ) ( B A P B P A P B o A P B A P + = =
) ( ) ( ) ( ) ( B P A P B o A P B A P + = =


35
6. Probabilidad Condicional.
La probabilidad condicional de un evento es la probabilidad del evento, dado el hecho de
que ya ocurrieron uno o ms eventos. Se denota de la siguiente manera:




Ej: 6.1 Refirindonos al ejemplo 3.3
6.1.1 Suponga que un empleado ha progresado en la organizacin. Cul es la probabilidad
que est satisfecho con el trabajo?
A: Empleado satisfecho con su trabajo.
B: Empleado ha progresado en la organizacin.







6.1.2 Si un empleado est satisfecho con su trabajo. Cul es la probabilidad que haya
avanzado en la organizacin?
5783 , 0
166
96
200
166
200
96
) (
) (
) / ( = = =

=
A P
A B P
A B P





7. Independencia estadstica.
El conocimiento previo de un evento no afecta la probabilidad de otro evento. Esta
caracterstica se llama independencia estadstica.



Ej: 7.1 Refirindonos al ejemplo 3.3
7.1.1 El evento estar satisfecho en el trabajo es independiente si el trabajador ha
progresado en la organizacin?
A: Empleado satisfecho con su trabajo.
B: Empleado ha progresado en la organizacin.

8276 , 0
116
96
200
116
200
96
) / ( = = = B A P



83 , 0
200
166
) ( = = A P

Puesto que 0,8276 = 0,83, indica que estar satisfecho en el trabajo y haber
progresado en la organizacin no son estadsticamente independiente.
) (
) (
) / (
B P
B A P
B A P

=
,
0 ) ( > B P

) ( ) / ( A P B A P =

8276 , 0
200
116
200
96
) (
) (
) / ( = =

=
B P
B A P
B A P


36
8. Regla de la Multiplicacin.
La frmula para la probabilidad condicional se puede manejar algebraicamente, con lo que
la probabilidad conjunta (A y B) se puede determinar la probabilidad condicional de un
evento.

Se le llama regla general de la Multiplicacin.

Ej: 8 De 20 cuentas que se tienen en un archivo, 5 tienen error de procedimiento en la
elaboracin de los saldos. Si un auditor elige al azar 2 de las 20 cuentas. Cul es
la probabilidad de que ninguna de las cuentas contenga error de procedimiento?
: C Cuenta contiene error de procedimiento.
: C' Cuenta no contiene error de procedimiento.
) / ( ) ( ) (
1 2 1 2 1
C C P C P C C P ' ' ' = ' '
5526 , 0
380
210
19
14
20
15
) (
2 1
= = |
.
|

\
|
|
.
|

\
|
= ' ' C C P




Regla de la Multiplicacin para eventos independientes.



Por lo tanto hay dos formas de determinar la independencia estadstica.
Los eventos A y B son estadsticamente independientes si y slo si,


Los evento A y B son estadsticamente independientes si y slo si,




ACTIVIDAD DE AUTOAPRENDIZAJE N 4

1. Presente una descripcin del espacio muestral para cada uno de los experimentos aleatorios.
a. Cada una de tres piezas maquinadas se clasifica como arriba o abajo de las
especificaciones.
b. Cada uno de cuatro bits transmitidos se clasifica como error o sin error.
c. En la inspeccin final de fuentes de poder electrnicas podran ocurrir tres tipos de
disconformidades: funcionales, secundarias y de acabado. Las fuentes de poder
defectuosas se clasifican adems segn sea el tipo de disconformidad.
d. En la fabricacin de cinta para grabacin digital, cada una de 24 pistas se clasifica de
acuerdo a si contiene o no uno o ms bits con error.
e. En un proceso de fabricacin pueden producirse algunas piezas que no son aceptables.
Cada una de tres partes se clasifica como aceptable o no aceptable.
f. En el pedido de una computadora puede especificarse memoria de 4, 8 12 megabytes y
capacidad de almacenamiento de disco duro de 200, 300 400 megabytes.
) / ( ) ( ) ( A B P A P B A P =

) ( ) ( ) ( B P A P B A P =
) ( ) / ( A P B A P =
) ( ) ( ) ( B P A P B A P =



37
2. El director general de una empresa expresar maana a los accionistas su consideracin
de que la compaa debe fusionarse con otra empresa. Ha recibido diez cartas acerca d
esa cuestin, y est interesado en el nmero de personas que estn de acuerdo con l.
a. Cul es el experimento?
b. Cules son algunos de los eventos posibles? Exprese dos posibles resultados.

3. Se ha desarrollado un nuevo juego de computadora. Su potencial de mercado lo van a
probar 80 jugadores veteranos de este equipo de diversin.
a. Cul es el experimento?
b. Cules son algunos de los eventos posibles? Exprese dos posibles resultados.
c. Suponga que 65 jugadores probaron el nuevo juego y afirmaron que les gust.
65 es una probabilidad?

4. Antes de efectuar una encuesta a nivel nacional se seleccionaron 50 personas para probar
el cuestionario. Una pregunta acerca de si debe o no legalizarse el aborto teraputico,
requiere una encuesta de s o no.
a. Cul es el experimento?
b. Cules son algunos de los eventos posibles? Exprese dos posibles resultados.

5. Una empresa adquiere una nueva mquina que debe instalarse y probarse antes de que
est lista para su uso. La empresa est segura de que no tardara ms de 7 das en
instalarla y probarla. Sea A el suceso se necesitaran ms de 4 das para que la mquina
est lista y B el suceso se necesitaran menos de 6 das para que la mquina est lista.
Describa lo siguiente:
a. El suceso que es el complemento del suceso A.
b. El suceso que es la interseccin de los sucesos A y B.
c. El suceso que es la unin de los sucesos A y B.
d. Son los sucesos A y B mutuamente excluyentes?

6. En el diagrama de Venn de la figura se muestran tres eventos. Copie la figura y sombree la
regin que corresponda a cada uno de los eventos siguientes.








a. A' d. ) ( ' C B
b. B A e. C B A ' ) (
c. C B A ) ( f. ) ( ' B A

B
A

C

C



38
7. Muestras de una pieza de aluminio forjado se clasifica con base en el acabado de la superficie
(en micro-pulgadas) y en las mediciones de la longitud. Los resultados de 100 piezas se
resumen a continuacin.
Acabado de la
superficie
Longitud
Total Excelente Bueno
Excelente 75 7
Bueno 10 8
Total
Sea A denote el evento que una muestra tiene un acabado de la superficie excelente y
sea B el evento que una muestra tiene una longitud excelente. Determine el
nmero de muestras en , B A ' B' y B A .

8. El anlisis de las flechas para un compresor se resumen por su cumplimiento con las
especificaciones.






a. Si se sabe que una flecha cumple con los requerimientos de redondez. Cul es la
probabilidad que cumpla con los requerimientos del acabado de la superficie?
b. Si se sabe que una flecha no cumple con los requerimientos de redondez. Cul es la
probabilidad que cumpla con los requerimientos del acabado de la superficie?

9. Se clasifican muestras de hule espuma de tres proveedores de acuerdo a si cumplen o no con
las especificaciones. Los resultados de 100 muestras se resumen a continuacin.







Sea que A denote el evento de una muestra del proveedor 1 y sea que B denote el
evento de una muestra cumpla con las especificaciones. Si se selecciona una muestra de
hule espuma al azar, determine las siguientes probabilidades.
a. ) (A P d. ) (B P
b. ) (A P ' e. ) ( B A P
c. ) ( B A P f. ) ( B A P '

10. Un lote de 100 chips semiconductores contiene 20 que estn defectuosos. Se seleccionan dos
chips del lote, al azar, sin reemplazo.
a. Cul es la probabilidad de que el primero que se seleccione este defectuoso?
El acabado de la
superficie cumple
La redondez cumple
Total Si No
Si 345 57
No 12 8
Total

Proveedor
Cumple
Total Si No
1 18 2
2 17 3
3 50 10
Total


39
b. Cul es la probabilidad de que el segundo que se seleccione este defectuoso, dado que el
primero estuvo defectuoso?
c. Cmo cambia la respuesta del inciso (b) si los chips seleccionados se reemplazaron antes
de la siguiente seleccin?

11. Durante un perodo determinado, aument el valor de mercado de las acciones comunes en
circulacin en una industria, que incluye solamente 12 acciones. Si un inversionista escoge dos
de esas acciones al azar. Cul es la probabilidad de que ambos hayan experimentado un
aumento en su valor de mercado durante ese perodo, si se sabe que 8 aumentaron su valor?
12. Se selecciona una muestra de tres calculadoras de una lista de fabricacin y cada una de ellas
se clasifica como defectuosa o aceptable. Sean A, B y C los eventos de la primera, la segunda
y la tercera calculadora esta defectuosa, respectivamente.
a. Describa el espacio muestral para este experimento
b. Describa cada uno de los eventos siguientes: A, B , B A , C B

13. De 600 empleados, 300 participan en un plan de reparto de utilidades de la compaa,
400 tienen una cobertura gastos mdicos y 200 empleados participan en ambos programas.
a. Describa cada uno de los sucesos involucrados.
b. Presente estos datos en una tabla de contingencia.
c. De un ejemplo de un evento simple.
d. De un ejemplo de un evento conjunto.
e. Cul es el complemento del suceso Empleado participa en cobertura de gastos mdicos?
f. Cul es la probabilidad de que un empleado elegido al azar:
f.1 Participe por lo menos en uno de los programas?
f.2 No participe en ninguno de los programas?
f.3 Participe en el plan de reparto de utilidades considerando que tiene
seguro de gastos mdicos?
f.4 Determine si los eventos empleado participa en el programa de
reparto de utilidades es independiente a tener cobertura de gastos
mdicos.

14. De 100 personas que solicitan empleo de operador de computadoras en una firma, 40 tenan
Experiencia profesional, 30 maestra y 20 tenan experiencia y maestria.
a. Describa cada uno de los sucesos involucrados.
b. Presente estos datos en una tabla de contingencia.
c. Cul es la probabilidad que un solicitante escogido aleatoriamente tenga experiencia o
maestra?
d. Tenga maestra dado que tiene alguna experiencia profesional.
e. Determine si la experiencia y poseer maestra son sucesos independientes.

15. A los 500 clientes de crdito de Credicom. S.A. estn categorizados segn el nmero de aos
que han tenido cuenta de crdito y por su promedio de saldo. De estos clientes 210 han tenido
saldos menores a $100, otros 260 han tenido cuenta de crdito cuando menos 5 aos, 80 han
tenido saldos mayores de $100 y cuentas de crdito por menos de 5 aos. Presente estos
datos en una tabla de contingencia.
Si se selecciona al azar un cliente.


40
a. Cul es la probabilidad que tenga un saldo de crdito mayor de $100?
b. Cul es la probabilidad que tenga un saldo de crdito menor de $100 o ha tenido cuenta
de crdito cuando menos 5 aos?
c. Cul es la probabilidad que tenga un saldo de crdito menor de $100 y ha tenido cuentas
de crdito por menos de 5 aos?
d. Suponga que un cliente ha tenido cuentas de crdito cuando menos 5 aos. Cul es la
probabilidad de que tenga un saldo inferior a $100?
e. Muestre si tener un saldo de crdito superior a $100 y poseer cuenta de crdito
cuando menos 5 aos, son estadsticamente independiente.
16. Un lote contiene 15 piezas fundidas de un proveedor local y 25 piezas fundidas de un
proveedor del estado contiguo. Se seleccionan dos piezas fundidas al azar, sin reemplazo del
lote de 40. Sea A: el evento de que la primera pieza fundida seleccionada es del proveedor
local y sea B: el evento de que la segunda pieza fundida seleccionada es del proveedor del
estado contiguo. Determine:
a. ) (A P c. ) / ( B A P
b. ) ( B A P d. ) ( B A P

17. Durante una semana determinada se estima que la probabilidad de que el precio de una accin
especfica aumente (A), permanezca sin cambio (C) o se reduzca (R) es de 0,35, 0,20 y 0,45
respectivamente.
a. Cmo son los sucesos A, C y R?
b. Cul es la probabilidad de que el precio de la accin aumente o permanezca sin cambio?
c. Cul es la probabilidad de que el precio de la accin cambie durante la semana?

18. La siguiente tabla de contingencia representa la clasificacin de 150 compaas muestreadas
de acuerdo con cuatro grupos industriales, y respecto a si su rendimiento sobre la inversin
est por encima o por debajo del rendimiento promedio.

Categora
Industrial
Rendimiento sobre el capital Total
Superior al promedio (S) Inferior al promedio (I)
A 20 40
B 10 10
C 20 10
D 25 15
Total

a. Construya una tabla de probabilidad conjunta en base a estos datos muestrales.
b. Determine las siguientes probabilidades:
P(A y S) P(I) P(C/I)
P(S) P(D) P(I/S)
P(B/S) P(B o I) P(D y S)

19. Si 8 , 0 ) ( 6 , 0 ) ( ; 4 , 0 ) / ( = = = B P y A P B A P Los eventos A y B son
independientes?


41
20. Se estima que la probabilidad de que aumenten las ventas de automviles en el siguiente mes
es de 0,40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de
0,50. Se estima que la probabilidad de que ambas industrias experimenten un aumento en
ventas es de 0,10. Cul es la probabilidad de que:
a. Hayan aumentado las ventas de automviles durante el mes, dado que existe
informacin de que han aumentado las ventas de refacciones.
b. Hayan aumentado las ventas de refacciones, dado que existe informacin de que
aumentaron las ventas de automviles durante ese mes.
21. La proporcin general de artculos defectuosos en un proceso continuo de produccin es 0,08.
Cul es la probabilidad de que:
a. Dos artculos elegidos al azar ninguno tenga defecto?
b. Dos artculos escogidos al azar tengan defecto?

22. La probabilidad de que haya escasez de cemento es 0,28 y la probabilidad de que no habr
escasez y que una obra de construccin se termine a tiempo es 0,64. Cul es la probabilidad
de que la obra se termine a tiempo dado que no habr escasez de cemento?

23. Un estudiante est tomando dos cursos, historia y matemticas. La probabilidad de que
apruebe el curso de historia es 0,60 y matemticas es 0,70. La probabilidad que apruebe
ambas es 0,50. Cul es la probabilidad que pase por lo menos una? Qu regla de
probabilidad aplic?

24. Las probabilidades de dos eventos A y B son 0,20 y 0,30, respectivamente. Los sucesos no
son mutuamente excluyentes. La probabilidad de que ambos A y B ocurran es 0,15 Cul es
la probabilidad de que sucedan A o bien B?

25. Cada vendedor de una empresa se califica como por debajo del promedio. Promedio o
Arriba del promedio, con respecto a su habilidad para las ventas. Adems, cada vendedor
tambin se califica con respecto a su posibilidad de promocin en: regular, buena o
excelente. En la tabla que sigue se presentan las clasificaciones de estos rasgos para 500
vendedores.






a. Cmo se llama esta tabla?
b. Cul es la probabilidad que un vendedor seleccionado al azar tenga habilidad de ventas
por encima del promedio y excelente posibilidad de promocin?

26. Suponga que P(A) = 0,40, P(B/A) = 0,30 Cul es la probabilidad conjunta de A y B?



Habilidades en ventas
Posibilidades de promocin
Total Regular Buena Excelente
Por debajo del promedio 16 12 22
Promedio 45 60 45
Arriba del promedio 93 72 135
Total


42
27. Un estudio de las opiniones de los diseadores en lo referente al color primario ms
conveniente para aplicar en oficinas ejecutivas indic:






a. Cul es el experimento?
b. Cul es un posible evento?
c. Cul es la probabilidad de seleccionar una respuesta especifica y descubrir que el
diseador prefiere blanco o verde?
d. Cul es la probabilidad de que un diseador no prefiera amarillo?

28. Una encuesta a ejecutivos de alto nivel revel que 45% leen con regularidad el diario La
Prensa, 35% El Nuevo Diario y 25% ambos diarios.
a. Qu porcentaje de ejecutivos no lee ninguno de los diarios?
b. Cmo se le llama a la probabilidad 0,25?
c. Los eventos son mutuamente excluyentes? Explique su respuesta.

9. Teorema de Bayes.
La probabilidad condicional toma en cuenta la informacin en cuanto a la ocurrencia de un
evento para predecir la probabilidad de otro evento. Este concepto se puede ampliar para
la revisin de las probabilidades basadas en nueva informacin y para determinar la
probabilidad de que un evento particular se debi a una causa especfica. El procedimiento
para la revisin de estas probabilidades se conoce como Teorema de Bayes y la
composicin de los eventos para resolver los problemas de la probabilidad se facilita
algunas veces al considerar el espacio muestral S como una unin de subconjuntos que son
mutuamente excluyentes.
Es decir,
k
B B B S = ....
2 1
con j i B B
j i
= = , | luego cualquier subconjunto A de S se
puede escribir como,
) .... (
2 1 k
B B B A A = Usando ley distributiva entre conjuntos,
) ( .... ) ( ) (
2 1 k
B A B A B A A = Observemos que,
) ( ... ) ( ) ( ) (
2 1 k
B A P B A P B A P A P + + + =
) / ( ) ( ... ) / ( ) ( ) / ( ) ( ) (
2 2 1 1 k k
B A P B P B A P B P B A P B P A P + + + =

=
=
k
i
i i
B A P B P A P
1
) / ( ) ( ) ( Se le llama probabilidad total.
Una probabilidad condicional se puede calcular como,



Color primario N de opiniones
Blanco 92
Amarillo 86
Violeta 70
Verde 14
Total

=
=
k
i
i i
i i
i
B A P B P
B A P B P
A B P
1
) / ( ) (
) / ( ) (
) / (



43
9.1 rbol de decisin, diagrama de rbol o arborigrama.
Una forma alternativa de ver la descomposicin de las probabilidades es, a travs del
de un arborigrama.

Ej: 9.11 El gerente de marketing de una firma fabricante de juguetes planea evaluar la
introduccin de un nuevo juguete al mercado. En el pasado 40% de los juguetes
introducidos por esta firma han tenido xito y 60% no lo han tenido. Antes de
lanzar el juguete al mercado, se lleva a cabo una investigacin y se elabora un
informe, favorable o desfavorable. En el pasado 80% de los juguetes con xito
recibieron informes favorables y 30% de los juguetes sin xito tambin recibieron
informes favorables. El gerente de marketing desea conocer la probabilidad de que el
nuevo juguete tenga xito si recibe un informe favorable. Sean,
: S Produccin de juguetes de esa firma.
:
1
B Juguete con xito en el mercado. :
2
B Juguete sin xito en el mercado.
: A Informe favorable. : A' Informa desfavorable.

0,8 A (0,4) (0,8) = 0,32

1
B
0,4 0,2 A' (0,4) (0,2) = 0,08
S
0,3 A (0,6) (0,3) = 0,18
0,6
2
B
0,7 A' (0,6) (0,7) = 0,42

Probabilidades Probabilidades Probabilidades
a priori. condicionales. conjuntas.

) / ( ) ( ) / ( ) (
) / ( ) (
) / (
2 2 1 1
1 1
1
B A P B P B A P B P
B A P B P
A B P
+
=



64 , 0
50 , 0
32 , 0
18 , 0 32 , 0
32 , 0
) 3 , 0 )( 6 , 0 ( ) 8 , 0 )( 4 , 0 (
) 8 , 0 )( 4 , 0 (
) / (
1
= =
+
=
+
= A B P





ACTIVIDAD DE AUTOAPRENDIZAJE N 5

1. El software para detectar fraudes con tarjetas telefnicas personales rastrea el nmero de
reas donde se originan las llamadas cada da. Se ha encontrado que 1% de los usuarios
legtimos hacen llamadas de dos o ms reas en un solo das. Sin embargo, 30% de los
usuarios fraudulentos hacen llamadas de dos o ms reas en un solo da. La proporcin de
usuarios fraudulentos es 0,01%.
a. Describa cada uno de los sucesos involucrados.
b. Presente esta informacin en un diagrama de rbol.


44
c. Si el mismo usuario hace llamadas de dos o ms reas en un solo da. Cul es la
probabilidad de que el usuario sea fraudulento?

2. En una fbrica de zapatos, se sabe por experiencia que la probabilidad es 0.82 de que un
trabajador que ha asistido a un programa de capacitacin de la fbrica cumplir con la cuota
de produccin y que la probabilidad correspondiente es 0.53 para un trabajador que no
asisti al programa de capacitacin. Si el 60% de los trabajadores asisten al programa de
capacitacin de la fbrica.
a. Describa cada uno de los sucesos involucrados.
b. Presente esta informacin en un diagrama de rbol.
c. Suponga que el trabajador cumpli con la cuota de produccin. Cul es la probabilidad de
que haya asistido al curso?

3. Suponga que 2% de los rollos de tela de algodn y 3% de los rollos de tela de nylon
contienen defectos. De los rollos usados por un fabricante, 70% son de algodn y 30% son de
nylon.
a. Describa cada uno de los sucesos involucrados.
b. Presente estos datos en un diagrama de rbol.
c. Cul es la probabilidad que uno de los rollos de tela de nylon usados por el fabricante
seleccionado al azar contenga defectos?

4. Los clientes acostumbran evaluar en forma preliminar el diseo de los productos. En el
pasado, 95% de los productos de gran xito recibieron crticas favorables, 60% de los
productos con xito moderado recibieron crticas favorables y 10% de los productos sin
mucho xito tambin recibieron crticas favorables. Adems 40% de los productos han sido
de gran xito, 35% de xito moderado y 25% han sido productos sin mucho xito.
a. Describa cada uno de los sucesos involucrados.
b. Presente esta informacin en un diagrama de rbol.
c. Si un diseo nuevo obtiene una crtica favorable. Cul es la probabilidad que sea un
producto de gran xito?
d. Cul es la probabilidad que sea un producto de gran xito, si no consigue una crtica
favorable?

5. El dueo de una tienda de discos divide a los clientes que entran a su tienda en clientes
en edad escolar, clientes en edad universitaria y clientes mayores y observa que el 30,
50 y 20 por ciento de todos los clientes, respectivamente, pertenecen a estas
categoras. Tambin observa que compran discos el 20 por ciento de los clientes en
edad escolar, el 60 por ciento de los clientes en edad universitaria y el 80 por ciento
de los clientes mayores.
a. Describa cada uno de los sucesos involucrados.
b. Presente esta informacin en un diagrama de rbol.
c. Si un cliente seleccionado aleatoriamente compra un disco. Cul es la probabilidad
que est en edad escolar?





45
6. El departamento de crdito de una casa comercial, inform que 30% de sus ventas son en
efectivo, 30% se pagan con cheque en el momento de la adquisicin y 40% se pagan con
tarjetas de crdito. Se tiene que 29% de las compras en efectivo, 90% en cheques y 60% de
las compras con tarjeta de crdito son por ms de $100.
a. Describa cada uno de los sucesos involucrados.
b. Presente esta informacin en un diagrama de rbol.
c. Alba Marn acaba de comprar un vestido nuevo que cuesta $150. Cul es la
probabilidad de que haya pagado en efectivo?

7. Tres mquinas M
1
, M
2
, M
3
producen respectivamente 50%, 30%, 20% del total de artculos
De una fbrica. Las mquinas producen artculos defectuosos en un porcentaje de 7%, 6%,
4% respectivamente. Al colocar la produccin de las tres mquinas en fila y escoger un
artculo.
a. Describa cada uno de los sucesos involucrados.
b. Presente esta informacin en un diagrama de rbol.
c. Si el artculo escogido es defectuoso. Cul es la probabilidad que haya sido
producido en cualesquiera de las tres mquinas? Tome como decisin el elemento mayor
probabilidad de producir artculos defectuosos.

8. En cierta Empresa el 6% de los empleados varones y el 4% de los empleados mujeres tienen
salarios mayores de C$ 12000. Adems el 60% de los empleados son hombres.
a. Describa cada uno de los sucesos involucrados.
b. Presente esta informacin en un diagrama de rbol.
c. Se despide a un empleado al azar que gana ms de C$12000.
c.1 Cul es la probabilidad que sea varn?
c.2. Cul es la probabilidad que sea mujer?

9. Un comerciante de parte para automviles tiene 4 empleados K, L, M y N, que cometen
errores al llenar un pedido una vez en cien, cuatro veces en cien, dos veces en cien y seis
veces en cien respectivamente. De todos los pedidos llenados, K, L, M y N llenan
respectivamente el 20, 40, 30 y 10%.
a. Presente esta informacin en un diagrama de rbol que muestre todas las probabilidades.
b. Si se encuentra un error en un pedido. Cul es la probabilidad que fue llenado por K, L, M
o N.



UNIDAD III: DISTRIBUCIONES DE PROBABILIDAD Y PRUEBAS
ESTADSTICAS.
Introduccin.
La preparacin de un proyecto de investigacin es una tarea compleja, ya que se han de tener
en cuenta multitud de aspectos para que el documento final contemple todos los apartados que
cualquier estructura estndar considera y para que todos los investigadores sepan con qu y
cmo deben proceder en todas las etapas de ejecucin del estudio planteado. Uno de los
dilemas que se presenta cuando se inicia la elaboracin del proyecto es decidir sobre los


46
individuos o elementos que se incluirn en el estudio: qu caractersticas tendrn criterios de
inclusin y exclusin, a cuntos individuos se estudiar tamao de la muestra y cmo se
elegirn para que entren a formar parte del estudio tcnica de muestreo. Estudiar a toda la
poblacin, que sera la manera ms exacta de conocer lo que se pretende estudiar, es casi
imposible en la prctica. Entre los motivos que lo impiden se encuentran la falta de tiempo, la
escasez de recursos humanos y econmicos, la dificultad para acceder a todos los sujetos, etc.,
por lo que se estudia slo a una parte de ellos, para, posteriormente, generalizar o inferir
los resultados obtenidos a toda la poblacin. Por tanto, cuando se habla de sujetos de estudio,
se ha de diferenciar claramente entre poblacin, muestra e individuo.


1. Distribucin de probabilidad.
Una distribucin de probabilidad indica toda la gama de valores que pueden representarse
como resultado de un experimento. Es decir, describe la probabilidad de que un evento
se realice en el futuro y constituye una herramienta fundamental para la prospectiva,
puesto que se puede disear un escenario de acontecimientos futuros considerando las
tendencias actuales de diversos fenmenos naturales. Recordemos inicialmente que
existen las variables aleatorias, siendo aquellas que se asocian a la ocurrencia de un
fenmeno aleatorio. Cuando una de estas variables aleatorias toma diversos valores, la
probabilidad asociada a cada uno de tales valores puede ser organizada como una
distribucin de probabilidad. Las distribuciones de probabilidad pueden representarse a
travs de una tabla, una grfica o una frmula, en cuyo caso tal regla de correspondencia
se le denomina funcin de probabilidad. Toda distribucin de probabilidad es generada por
una variable aleatoria x, y puede ser de dos tipos:

2. Variable aleatoria discreta (x).
Porque solo puede tomar valores enteros y un nmero finito de ellos.

Ej: 2.1 xVariable que nos define el nmero de alumnos aprobados en la asignatura
de Estadstica en un grupo de 40 estudiantes (1, 2 ,3 los 40). Consideraremos
primero las distribuciones de probabilidad para variables discretas. Las propiedades de
las distribuciones de variables discretas son dos, y que posteriormente, al hablar de las
distribuciones de variables continuas, se repetirn de manera muy similar:
0 P(X = x) 1.
P(X = x) = 1, o que es lo mismo: la suma de todas las probabilidades de los
eventos posibles de una variable aleatoria es igual a la unidad.

Hay que hacer notar que estas propiedades se enuncian suponiendo que conocemos el
valor de la probabilidad, pero en la realidad esto no ocurre, es decir que no sabemos la
probabilidad y lo que se hace es trabajar con estimaciones. Precisamente esto nos lleva
a modelos tericos que estiman los resultados, los principales son los que a continuacin
se presentan.






47
3. Valor esperado de una variable aleatoria (v.a.)
Para tener una medida del punto central de una distribucin de probabilidad, introducimos
el concepto de esperanza de una variable aleatoria, el valor esperado es la medida
correspondiente del punto central de una variable aleatoria.
Su frmula es:



4. Varianza y Desviacin Estndar de una v.a.
En la unidad I observamos que la varianza muestral es una medida til de la dispersin de
un conjunto de observaciones numricas. Y es el promedio de los cuadrados de las
diferencias entre las observaciones y la media. Nos basamos en esta misma idea para medir
la dispersin de la distribucin de probabilidad de una v.a. La varianza de una v.a. es el
promedio ponderado de los cuadrados de sus diferencias posibles con respecto a la media.
Su frmula es:



Y la desviacin estndar est dada:


Ej: 4.1 Un contratista est interesado en saber cul es el costo total de un proyecto
para el que pretende presentar una oferta. Estima que los materiales costarn
$25000 y su trabajo $900 al da. Si el proyecto tarda en realizarse X das, el costo
laboral total ser 900X $ y el costo total del proyecto (en $) ser
x x C 900 25000 ) ( + = El contratista estima unas probabilidades subjetivas de la
duracin probable del proyecto.




4.1.1 Determine la media, la varianza y la desviacin estndar de la duracin X del
proyecto.

= = ) ( ) ( x xP x E
das x E 9 , 11 ) 1 , 0 ( 14 ) 2 , 0 ( 13 ) 3 , 0 ( 12 ) 3 , 0 ( 11 ) 1 , 0 ( 10 ) ( = + + + + =

Este valor indica que sobre un gran nmero de das, el contratista espera que la
duracin promedio de la obra sea de 11,9 das.

= = ) ( ) ( ) (
2 2
x P x x V o
29 , 1 ) 1 , 0 ( ) 9 , 11 14 (
) 2 , 0 ( ) 9 , 11 13 ( ) 3 , 0 ( ) 9 , 11 12 ( ) 3 , 0 ( ) 9 , 11 11 ( ) 1 , 0 ( ) 9 , 11 10 (
2
2 2 2 2 2
=
+ + + + = o

. 1 , 1 135781669 , 1 29 , 1 da ~ = = o


Duracin X (das) 10 11 12 13 14
Probabilidad 0,1 0,3 0,3 0,2 0,1

= = ) ( ) ( x xP x E

= = ) ( ) ( ) (
2 2
x P x x V o

= ) ( ) (
2
x P x o



48
ACTIVIDAD DE AUTOAPRENDIZAJE N 6

1. El nmero de computadoras vendidas al da en una tienda viene definida por la
siguiente distribucin de probabilidad:




a. En promedio cuntas computadoras vende al da la tienda?
b. Cul es la desviacin estndar de esta distribucin?
c. Grafique esta funcin de probabilidad.
d. Cul es la probabilidad que la tienda venda a lo sumo 3 computadoras en un da?

2. Las muestras de cierta materia prima se clasifican de acuerdo con su contenido de
humedad e impurezas, redondeado este al porcentaje ms cercano. A continuacin se
presentan los resultados obtenidos con 80 muestras.





a. Determine la media y la varianza del contenido de humedad de esas muestras.
b. Calcule la media y la varianza del contenido de impurezas de estas muestras.

3. Una pastelera ofrece bocadillos con decoracin especial para cumpleaos, bodas y otras
ocasiones. En la tabla que sigue se proporciona el nmero total de bocadillos vendidos al da y
las probabilidades correspondientes. Calcule la media, la varianza y la desviacin estndar para
el nmero de bocadillos vendidos por da.




4. Una compaa inmobiliaria tiene un gran nmero de apartamentos disponibles cada mes para
rentar. Un inters de la administracin es el # de apartamentos vacantes mensualmente. Un
estudio reciente revel el porcentaje del tiempo que est vacante un nmero dado de
apartamentos. Calcule la media y la desviacin estndar del nmero de unidades desocupadas.





5. El gerente de personal de una empresa est estudiando el nmero de accidentes en el trabajo
durante un periodo de un mes. Elabor la distribucin probabilstica que se muestra enseguida.
Calcule e interprete la media, la varianza y la desviacin estndar del nmero de accidentes en
un mes.
N de accidentes 0 1 2 3 4
Probabilidad 0,4 0,2 0,2 0,1 0,1

X 0 1 2 3 4 5 6
P(X) 0,05 0,10 0,20 0,20 0,20 0,15 0,10
Impurezas Contenido de humedad.
3% 4%
1% 5 14
2% 57 4
N de bocadillos vendidos 12 13 14 15
Probabilidad 0,25 0,40 0,25 0,10
N de vacantes 0 1 2 3 4
Probabilidad 0,40 0,30 0,20 0,08 0,02


49
5. Distribucion Binomial.
Consideremos los llamados ensayos de Bernoulli, stos son aquellos experimentos cuyo
resultado es uno de dos posibles y mutuamente excluyentes. Es decir aquel modelo que
sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: xito
(acierto) o fracaso:
Cuando es acierto la variable toma el valor 1
Cuando es fracaso la variable toma el valor 0

Ej: 5.1 Los siguientes son ensayos Bernoulli.
El saldo de una cuenta por cobrar esta correcta o incorrecta.
Un tornillo, puede estar defectuoso o no defectuoso.
El sexo de un beb al nacer: nio o nia.
La respuesta correcta o incorrecta en un examen.

Si consideramos una serie de ensayos Bernoulli que tiene como caractersticas:
La probabilidad de xito permanece constante, ensayo tras ensayo; y
Los ensayos son independientes entre s.
La distribucin binomial se aplica cuando se realizan un nmero "n" de veces el experimento de
Bernoulli, siendo cada ensayo independiente del anterior. La variable puede tomar valores
entre 0 y n
Entonces se tiene lo que se denomina experimento binomial, donde el nmero de ensayos se
denota con n, la probabilidad de xito con p y la de fracaso con q. Hay que notar que las
probabilidades de xito y de fracaso estn relacionadas de la siguiente manera: p + q = 1.

Ej: 5.2 Consideremos un examen con tres preguntas de opcin mltiple, con cuatro pciones,
y que ser contestado al azar.

Al examinar los registros de facturacin mensual de una editora con ventas por internet, el
auditor tom una muestra de 8 de las facturas no pagadas. La cantidad adeudada a la compaa
es: $ 260 340 300 320 300 280 240 220

La deuda promedio es:
a. 305 b. 282,5 c. 300 d. 290,5

La mediana es:
a. 280 b. 290 c. 320 d. 240

La varianza es:
a. 1650 b. 1560 c. 1565 d. 1625

Con esto contamos con un experimento binomial, ya que la probabilidad de xito
permanece constante en las tres preguntas (p =) y las respuestas de una a otra pregunta son
independientes entre s. Se cuenta con una cantidad n = 3 de ensayos y q = 1 - p =
3
/
4
.
Hay que decir que n y p son los llamados parmetros de la distribucin. Tenemos ahora la
variable aleatoria X que representar el nmero de respuestas correctas, siendo sus posibles
valores: 0, 1, 2, y 3.


50
En general, si se tienen n ensayos de Bernoulli con probabilidad de xito p y de fracaso q,
entonces la distribucin de probabilidad que la modela es la distribucin de probabilidad
binomial y su regla de correspondencia es:

para x = 0, 1,2,, n.

La media y la desviacin estndar de la distribucin binomial con parmetros n y p es:


Nota:
La eleccin de xito o fracaso es subjetiva y queda a opcin de la persona que resuelve el
problema, pero teniendo cuidado de plantear correctamente lo que se pide.

Ej: 5.3 Suponga que Susana Fermn es agente de seguros y contacta a 5 personas y cree
que la probabilidad de vender un seguro a cada una es de 0,4.

5.3.1 Halle la probabilidad de que no venda seguro.
Es decir, ) 0 ( = X P
X: # de seguros a vender.
n = 5
p = 0,4 q = 0,6
Sustituyendo en la frmula.
) (
x n x
x n
q p C x X P

= =
0,07776 0,07776) )( 1 )( 1 ( ) 6 , 0 ( ) 4 , 0 ( ) 0 (
0 5 0
0 5
= = = =

C X P

Es decir, hay un 7,8 % de probabilidad aproximadamente, de que Susana Fermn no
venda seguro.


5.3.2 Cul es la probabilidad que venda a lo mximo un seguro?
En forma simblica P(X 1)
Sustituyendo en la frmula.
(0,6) (0,4) C ) 6 , 0 ( ) 4 , 0 ( ) 1 ( ) 0 ( ) 1 (
1 - 5 1
1 5
0 5 0
0 5
+ = = + = = s

C X P X P X P

33696 . 0 2592 , 0 07776 , 0 ) 1 ( = + = s X P

Lo que indica que hay una probabilidad de 0,337 de que venda cuando mucho un
seguro.


5.3.3 Halle la probabilidad de que venda entre dos y cuatro seguros (inclusive).





5.3.4 Cul es la probabilidad que venda por lo menos un seguro?

) (
x n x
x n
q p C x X P

= =

npq np x E = = = o , ) (



51
ACTIVIDAD DE AUTOAPRENDIZAJE N 7

1. Un director de produccin sabe que el 5% de los componentes producidos en un
determinado proceso de produccin tiene algn defecto. Se examinan seis de estos
componentes, cuyas caractersticas pueden suponerse que son independientes entre s.
a. Cul es la probabilidad que ningn componente tenga este defecto?
b. Cul es la probabilidad que uno de estos componentes tenga un defecto?
c. Cul es la probabilidad que al menos dos de estos componentes tenga un defecto?

2. Una mquina de cierta marca est produciendo 10% de piezas defectuosas. El ingeniero de
control de calidad ha estado verificando la produccin por medio de muestreo casi continuo
desde que empez la condicin anormal. Cul es la probabilidad que en una muestra de 10
piezas:
a. Exactamente 5 estn defectuosas?
b. 5 o ms estn defectuosas?
c. A lo sumo una esta defectuosa?

3. Un inspector encargado del control de calidad de los camiones de juguete producidos por una
fbrica, ha observado que cierto defecto en las llantas se presenta en el 5% de los vehculos.
En cada uno se colocan seis llantas. Cul es la probabilidad de que en un conjunto de seis
llantas seleccionadas aleatoriamente no se presente el defecto?

4. Un circuito electrnico contiene 10 circuitos integrados. La probabilidad de que cualquier
circuito integrado este defectuoso es 0.05, y los circuitos integrados son independientes.
El artculo trabaja slo si no contiene circuitos defectuosos. Cul es la probabilidad que el
artculo trabaje?

5. En un proceso de produccin se examinan lotes de 50 resortes helicoidales para
determinar si cumplen con los requerimientos del cliente. El nmero promedio de resortes
helicoidales que no cumplen con los requerimientos es de 5 por lote. Suponga que el nmero
de resortes que no cumplen con los requerimientos en un lote, denotado por X, es una v.a.
binomial.
a. Que valor tiene n y p?
b. Calcule P(X 2) y P(X 49)

6. Las observaciones durante un largo perodo muestran que un vendedor determinado puede
concluir una venta en una sola entrevista con una probabilidad de 0,30 Suponga que el
vendedor entrevista a 6 prospectos (o compradores prospectivos).
a. Cul es la probabilidad que exactamente dos prospectos compren el producto?
b. Cul es la probabilidad de que todos los prospectos compren el producto?
c. Cul es la probabilidad que al menos dos prospectos compren el producto?

6. Distribucin de Poisson.
La distribucin de Poisson es tambin un caso particular de probabilidad de variable
aleatoria discreta, el nombre se debe a Simen Denis Poisson (1781-1840), un francs que
la desarroll a partir de los estudios que realiz durante la ltima etapa de su vida, como


52
una forma lmite de la distribucin binomial que surge cuando se observa un evento raro
despus de un nmero grande de repeticiones. En general, la distribucin de Poisson se
puede utilizar como una aproximacin de la binomial, si el nmero de pruebas n es grande,
pero la probabilidad de xito p es pequea; una regla es que la aproximacin Poisson-
Binomial es buena si n 20 y p 0,05 y muy buena si n 100 y p 0,01. La distribucin
de Poisson tambin surge cuando un evento o suceso raro ocurre aleatoriamente en el
espacio o el tiempo. La variable asociada es el nmero de ocurrencias del evento en un
intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores
enteros de 0 en adelante (0, 1, 2, ...). As, el nmero de llamadas que recibe un servicio de
atencin a urgencias durante 1 hora, el nmero de clulas anormales en una superficie
histolgica o el nmero de glbulos blancos en un milmetro cbico de sangre son ejemplos
de variables que siguen una distribucin de Poisson.

Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad de rea o
tiempo.

Ej: 6.1 # de clientes que llegan a una caja de un supermercado en la hora pico.
# de defectos de una tela por m
2
.
# de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc.
# de bacterias por cm
2
de cultivo.
# de llamadas telefnicas a un conmutador por hora, minuto, etc.
# de llegadas de embarcaciones a un puerto por da, mes, etc.

Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo o rea, la
frmula a utilizar sera:



Donde,
) ( x X P = Es la probabilidad de que ocurran x xitos, cuando el nmero promedio
de ocurrencia de ellos es t
t : Media o promedio de xitos por unidad de tiempo o rea.
e = 2,718 (Base de logaritmo neperiano o natural)
X : Variable que nos denota el nmero de xitos que se desea que ocurran.

Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por unidad de
tiempo o rea es totalmente al azar y que cada intervalo de tiempo es independiente de otro,
as como cada rea es independiente de otra rea. Para que una variable siga una distribucin
de Poisson deben cumplirse varias condiciones:
En un intervalo muy pequeo (por ej. un milisegundo) la probabilidad de que ocurra un
evento es proporcional al tamao del intervalo.
La probabilidad de que ocurran dos o ms eventos en un intervalo muy pequeo es tan
reducida que, a efectos prcticos, se puede considerar nula.
El nmero de ocurrencias en un intervalo pequeo no depende de lo que ocurra en cualquier
otro intervalo pequeo que no se solape con aqul.

t t X E x
x
t e
x X P
x t

) ( ... , 1 , 0
!
) (
) (
2
o

= = = = =




53
El parmetro de la distribucin, es, t

(lambda), representa el nmero promedio de
eventos esperados por unidad de tiempo o de espacio, por lo que tambin se suele hablar de
lambda como la tasa de ocurrencia del fenmeno que se observa.
La distribucin de Poisson tiene iguales la media y la varianza. Si la variacin de los casos
observados en una poblacin excede a la variacin esperada por la Poisson, se est ante la
presencia de un problema conocido como sobredispersin y, en tal caso, la distribucin
binomial negativa es ms adecuada.

Ej: 6.2 El nmero de fallas de un instrumento de prueba debido a las partculas
contaminantes de un producto, tiene una media de 0,02 fallas por hora.

6.2.1 Cul es la probabilidad que el instrumento no falle en una jornada de 8 horas?

8 , 0,02 horas t = =

Determinar P(X = 0)


0,16 0,02(8) = = t Calculamos
Sustituimos en la frmula:

!
) (
) (
x
t e
x X P
x t


= =


9 0,85214378
! 0
) 16 , 0 (
) 0 (
0 16 ., 0
= = =

e
X P

Es decir la probabilidad es de 0,8521 de que no falle el instrumento en una jornada
de 8 horas.


6.2.2 Cul es la probabilidad que se presente al menos una falla en un periodo de 24
horas?
Es decir P(X 1), donde horas t 24 0,02 = =



48 0 ) 24 ( 02 0 , , t Calculamos = =
;
) 0 ( 1 ) 1 ( 1 ) 1 ( = = < = > X P X P X P
Sustituimos en la frmula:

!
) (
) (
x
t e
x X P
x t


= =



3812 , 0 381216608 , 0 618783391 , 0 1
! 0
) 48 , 0 (
1 ) 1 (
0 48 , 0
~ = = = >

e
X P

Por consiguiente la probabilidad que se presente al menos una falla en un periodo de
24 horas es de 0,3812 .


6.2.3 Cul es la probabilidad que se presente a lo sumo una falla en un periodo de 12
horas?
Es decir P(X 1), donde horas t 12 0,02 = =



24 0 ) 12 ( 02 0 , , t Calculamos = =
;
) 1 ( ) 0 ( ) 1 ( = + = = s X P X P X P


54
Sustituimos en la frmula:
!
) (
) (
x
t e
x X P
x t


= =

9754 , 0 975418547 , 0 188790686 , 0 786627861 , 0
! 1
) 24 , 0 (
! 0
) 24 , 0 (
) 1 (
1 24 , 0 0 24 , 0
~ = + = + = s

e e
X P



ACTIVIDAD DE AUTOAPRENDIZAJE N 8

1. Una persona pasa todas las maanas a la misma hora por un crucero donde el semforo
est en verde el 20% de las veces. Suponga que cada maana representa un ensayo
independiente.
a. En cinco maanas consecutivas, Cul es la probabilidad que el semforo este en verde
exactamente un da?
b. En 20 maanas, Cul es la probabilidad que el semforo este en verde exactamente cuatro
das?
c. En 20 maanas, Cul es la probabilidad que el semforo este en verde ms de cuatro das?

2. Se supone que el nmero de defectos en los rollos de tela de cierta industria textil es una v.a.
de Poisson con una media de 0.10 defectos por metro cuadrado.
a. Cul es la probabilidad de tener dos defectos en un metro cuadrado de tela?
b. Cul es la probabilidad de tener un defecto en 10 metros cuadrados de tela?
c. Cul es la probabilidad de que no haya defectos en 20 metros cuadrados de tela?
d. Cul es la probabilidad que existan al menos dos defectos en 10 metros cuadrados de
tela?

3. El nmero de mensajes que se envan por computadora a un boletn electrnico tiene una
media de cinco mensajes por hora.
a. Cul es la probabilidad que el boletn reciba cinco mensajes en una hora?
b. Cul es la probabilidad que el boletn reciba 10 mensajes en una hora y media?
c. Cul es la probabilidad que el boletn reciba menos de dos mensajes en media hora?
d. Cul es la probabilidad que el boletn reciba por lo menos tres mensajes en una hora?

4. Un profesor recibe, por trmino medio, 4,2 llamadas telefnicas de los estudiantes el da
antes de realizarse alguna prueba sistemtica. S las llamadas siguen una distribucin de
Poisson. Cul es la probabilidad que:
a. Reciba al menos tres llamadas ese da?
b. El profesor no reciba llamadas ese da?
c. Reciba a lo sumo tres llamadas ese da?

5. Un estudio de las filas en las cajas registradoras de salida en un supermercado revel que
durante un cierto periodo en la hora ms concurrida, el nmero de clientes en espera era en
promedio cuatro. Cul es la probabilidad que durante ese periodo:
a. No haya cliente esperando?
b. Cuatro o menos clientes estn en espera?


55
c. A lo sumo un cliente este en espera?
d. Por lo menos un cliente este en espera?

6. Un banco en promedio recibe 6 cheques sin fondos por da. Cul es la probabilidad de que
reciba cuatro cheques sin fondo en un da dado?


7. Variable aleatoria Continua.
Una variable aleatoria continua es aquella que puede asumir un nmero infinito de valores
dentro de un determinado rango.
Los conceptos y las ideas sobre las variables aleatorias discretas tambin se
aplican a las variables aleatorias continuas. Muchos indicadores econmicos y empresariales
como las ventas, la inversin, el consumo, los costos y los ingresos pueden representarse
por medio de variables aleatorias continuas. Adems, las medidas del tiempo, la distancia,
la temperatura y el peso encajan en esta categora.

8. Distribucin Normal.
Es el modelo de distribucin ms utilizado en la prctica, ya que multitud de fenmenos se
comportan segn una distribucin normal.
La distribucin normal es, sin duda, la distribucin de probabilidad ms importante del
Clculo de probabilidades y de la Estadstica. Fue descubierta por De Moivre (1773), como
aproximacin de la distribucin binomial. Esta distribucin se caracteriza porque los
valores se distribuyen formando una campana de Gauss, en torno a un valor central que
coincide con el valor medio de la distribucin. La curva de la distribucin normal puede ser
modelada utilizando la funcin de densidad,


Un 50% de los valores estn a la derecha de este valor central y otro 50% a la izquierda.
Esta distribucin viene definida por dos parmetros:
:
es el valor medio de la distribucin y es precisamente donde se sita el centro
de la curva (de la campana de Gauss).
:
2
o es la varianza e indica si los valores estn ms o menos alejados del valor central:
si la varianza es baja los valores estn prximos a la media; si es alta, entonces
los valores estn muy dispersos.

Cuando la media de la distribucin es 0 y la varianza es 1 se denomina "normal
tipificada o estandarizada", y su ventaja reside en que hay tablas donde se recoge la
probabilidad acumulada para cada punto de la curva de esta distribucin. Adems, para
transformarla en una normal tipificada se crea una nueva variable (Z) que ser igual a la


56
anterior (X) menos su media y dividida por su desviacin tpica (que es la raz cuadrada de la
varianza)




Toda distribucin normal se puede transformar en una normal tipificada: La distribucin
normal tipificada tiene la ventaja, como ya hemos indicado, de que las probabilidades para cada
valor de la curva se encuentran recogidas en una tabla.

Propiedades de la curva de distribucin normal.
Los valores de la curva son positivos.
La curva es simtrica con respecto al valor de la media. La curva tiene un valor mximo en
el valor de la media.
La curva tiene puntos de inflexin en aquellos valores de X para los cuales a la media se le
suma o se le resta una desviacin estndar.
La curva, en sus extremos izquierdo y derecho, tiende a acercarse infinitamente al valor
cero, es decir, el eje de las abscisas es asntota horizontal.
El rea bajo la curva es la unidad.


Manejo de la tabla
La tabl a nos da la probabi l i dad P(Z z) siendo z la variable tipificada.




1. P(a Z b) = Z(b) - Z(a)

2. P(Z a) = 1 P(Z < a) = 1 - Z(a)

3. P(Z a) = Z(a)


o
o

z x
x
Z + =

= ,

Bsqueda en la tabla el valor Z
En la primera columna buscamos el valor de las unidades y las dcimas. En la primera fila el
valor de las centsimas. Su interseccin nos da la probabilidad buscada.


57
Ej. 8.1 Un cliente tiene una cartera de inversin cuyo valor medio es de 78 mil dlares y
desviacin estndar de 36 mil dlares. Se le ha pedido que calcule:
8.1.1 La probabilidad que el valor de la cartera sea inferior a 132000 $.
X: Valor de la cartera de inversin (en miles de $)
$ 36 $ 78 mil y mil = = o
Frmula para estandarizar:
o

=
x
Z

( ) 0,9332 ) 50 , 1 ( 1,50
36
78 132
) 132 ( = = < = |
.
|

\
|
< = < Z Z P Z P X P

Es decir el 93,32% del valor de la cartera de inversin es inferior a $132000.


8.1.2 La probabilidad que el valor de la cartera de inversin sea por lo menos de 96000 $.
X: Valor de la cartera de inversin (en miles de $)
$ 36 $ 78 mil y mil = = o
Frmula para estandarizar:
o

=
x
Z


( )
0,3085 ) 50 , 0 ( 1 ) 50 , 0 ( 1
0,50
36
78 96
) 96 X (
= = < =
> = |
.
|

\
|
> = >
Z Z P
Z P Z P P

Este resultado muestra que el 30,85% del valor de la cartera de inversin es por
lo menos de $ 96000.


8.1.3 La probabilidad que el valor de la cartera de inversin sea cuando mucho 25000
dlares.
X: Valor de la cartera de inversin (en miles de $)
$ 36 $ 78 mil y mil = = o
Frmula para estandarizar:
o

=
x
Z


( )
0,0708 ) 47 , 1 (
-1,47
36
78 25
) 25 X (
= =
s = |
.
|

\
|
s = s
Z
Z P Z P P

Lo que indica que el 7,08% del valor de la cartera de inversin es cuanto mucho
de 25 mil dlares.




58
8.1.4 La probabilidad que el valor de la cartera sea superior a $72000.
X: Valor de la cartera de inversin (en miles de $)
$ 36 $ 78 mil y mil = = o
Frmula para estandarizar:
o

=
x
Z


( )
5675 , 0 4335 , 0 1 ) 17 , 0 ( 1
) 17 , 0 ( 1 17 , 0
36
78 72
) 72 (
= = =
< = > = |
.
|

\
|
> = >
Z
Z P Z P Z P X P

El 56,75% del valor de la cartera de inversin es superior a $72000.


8.1.5 La probabilidad que el valor de la cartera de inversin este entre 80 y 90 mil dlares.
X: Valor de la cartera de inversin (en miles de $)
$ 36 $ 78 mil y mil = = o
Frmula para estandarizar:
o

=
x
Z

( )
1054 , 0 5239 , 0 6293 , 0 ) 06 , 0 ( ) 33 , 0 (
33 , 0 06 , 0
36
78 90

36
78 80
) 92 80 (
= = =
< < = |
.
|

\
|
< <

= < <
Z Z
Z P Z P X P

Lo que indica que esta probabilidad de ocurrencia es apenas de un 0,1054, que la cartera de
inversin se ubique entre esos valores.

8.1.6 La probabilidad que el valor de la cartera de inversin este entre 20 mil y 29 mil
dlares.
X: Valor de la cartera de inversin (en miles de $)
$ 36 $ 78 mil y mil = = o
Frmula para estandarizar:
o

=
x
Z

( )
0,0332 0869 , 0 0537 , 0 ) 61 , 1 ( ) 36 , 1 (
1,36 - 61 , 1
36
78 29

36
78 20
) 29 20 (
= = =
< < =
|
.
|

\
|
< <

= < <
Z Z
Z P
Z P X P

El resultado muestra que la probabilidad de ocurrencia es de un 3,32% de que la cartera
de inversin se encuentre entre esos valores.

8.1.7 La probabilidad que el valor de la cartera se encuentre entre 65 mil y 172 mil dolares.
X: Valor de la cartera de inversin (en miles de $)
$ 36 $ 78 mil y mil = = o


59
Frmula para estandarizar:
o

=
x
Z

( )
0,6361 3594 , 0 9955 , 0 ) 36 , 0 ( ) 61 , 2 (
2,61 36 , 0
36
78 172

36
78 65
) 172 65 (
= = =
< < = |
.
|

\
|
< <

= < <
Z Z
Z P Z P X P

Este resultado nos muestra que 0,6361 es la probabilidad que la cartera de inversin
se encuentre entre 65 y 172 mil dlares.


Nos encontramos con el caso inverso a los anteriores, conocemos el valor de la probabilidad y
se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la tabla el valor que ms
se aproxime a ste.

Ej: 8.2 Suponga que la cantidad de tiempo que lleva a la superintendencia de contribuciones enviar
reembolsos se distribuye normal con una media de 12 semanas y una varianza de 9.

8.2.1 Cuntas semanas tendr que esperar el 95% de los contribuyentes distribuidos
simtricamente para obtener el reembolso?
= 12 ,
2
= 9 = 3
) (
2 1
z Z z P < < Por la simetra 95% divida en dos partes iguales.
96 , 1 975 , 0 )
2 2
= = s z z P(Z 96 , 1
1
= z
Sustituyendo en
o z x + =

. 7 12 , 7 ) 3 )( 96 , 1 ( 12
1 1
semanas x semanas x ~ = + =

. 18 88 , 17 ) 3 )( 96 , 1 ( 12
1 2
semanas x semanas x ~ = + =
El contribuyente que solicite reembolso tendr que esperar entre 7 y 18 semanas, con
estas caractersticas.

8.2.2 Cunto tiempo tienen que esperar el 90% de los contribuyentes?
1,28 90 , 0 ) (
1 1
= = s z z Z P
Sustituyendo en o z x + =
. 16 84 , 15 ) 3 )( 28 , 1 ( 12
1 1
semanas x semanas x ~ = + =
Es decir que el 90% de los contribuyentes que soliciten reembolso tendr que esperar
aprximamente 16 semanas.

Ej. 8.3 Se aplica un test de cultura general y se observa que las puntuaciones obtenidas
siguen una distribucin normal con media 65 y desviacin estndar 18. Se desea
clasificar a los examinados en tres grupos (de baja cultura general, de cultura general
aceptable y de excelente cultura general) de modo que hay en el primero un 20% de la
poblacin, un 65% en el segundo y un 15% en el tercero. Cul ha de ser la puntuacin
que marca el paso de un grupo a otro?


60


8.3.1 Baja cultura general.
X: Puntuacin en el examen.
18 65 = = o y
Para calcular la variable X usamos la frmul a estandari zada ( ti pi fi cada)

o

=
x
Z o z x + =
20 , 0 ) (
1
= s z Z P

Este valor lo ubicamos en el cuerpo de la tabla. 84 , 0
1
= z
Sustituyendo en o z x + =
50 88 , 49 ) 18 )( 84 , 0 ( 65
1 1
~ = + = x x
Hasta 50 puntos para cultura baja.


8.3.2 Cultura aceptable.
04 , 1 85 , 0 ) (
2 2
= = < z z Z P
Sustituyendo en o z x + =
84 72 , 83 ) 18 )( 04 , 1 ( 65
2 2
~ = + = x x
De 51 a 84 para cultura general aceptable.


8.2.3 Excelente cultura.
A partir de 85 puntos.



ACTIVIDAD DE AUTOAPRENDIZAJE N 9

1. Peridicamente se suspende el servicio de una computadora para darle mantenimiento, instalar
nuevo equipo, etc. El tiempo que permanece inactiva una computadora en particular, est
distribuida normalmente con media igual a 1,5 horas y desviacin estndar de 0,4 horas. Cul
es el porcentaje de perodo de inactividad,
a. Entre 1 y 2 horas?
b. Menos de 1 hora?
c. A lo sumo 1,8 horas?
d. Cunto es el tiempo de inactividad del 75 % de las computadoras?
e. Cunto es el tiempo de inactividad del 25% de las computadoras?




61
2. Una compaa de transporte premia con un bono especial a aquellos empleados que venden
300 o ms boletos durante una jornada de 8 horas. El nmero de boletos vendidos por
empleado en dicha jornada est distribuido de manera aproximadamente normal,
con = 270 y = 16. Cul es la probabilidad que un vendedor seleccionado
aleatoriamente no reciba el premio?

3. La distribucin de los salarios anuales de 10000 trabajadores de una empresa es normal y
tiene una media de C$ 110 y varianza de C$ 64 (en miles). Cuntos trabajadores tienen
salarios:
a. Iguales o inferiores a C$ 110?
b. Entre C$ 88 y C$ 115?
c. Entre que valores se encuentra simtricamente distribuidos el 95% de los salarios
anuales de esos trabajadores? Y del 90%?
d. Cunto es el salario mximo del 95% de los trabajadores? Y del 80%?

4. El 80% de los integrantes de un grupo de personas tienen menos de 30 aos. Sabiendo
que la edad media del grupo es de 24 aos, calcule su desviacin tpica.

5. El tiempo de espera en cierto banco est distribuido en forma normal, aproximadamente, con
media y desviacin estndar iguales a 3,7 y 1,4 minutos, respectivamente. Encuentre la
probabilidad de que un cliente seleccionado aleatoriamente tenga que esperar:
a. Menos de 2 minutos.
b. Entre 3 y 3,5 minutos.
c. Por lo menos 2,3 minutos?
d. Cunto tiempo tiene que esperar el 90 % de los clientes?
e. Cunto tiempo tiene que esperar el 10 % de los clientes?

6. Se sabe que la cantidad de dinero que gastan los estudiantes en libros de texto en un ao
en una universidad sigue una distribucin normal que tiene una media de $380 y una
desviacin estndar de $50. Cul es la probabilidad que un estudiante elegido al azar:
a. gaste menos de $360 en libros de texto en un ao?
b. gaste ms de $400 en libros de texto en un ao?
c. gaste entre $300 y $400 en libros de texto en un ao?
d. gaste entre $250 y $280 en libros de texto en un ao?
e. Quiero hallar un intervalo de gastos en libros de texto que incluya el 80% de todos los
estudiantes de esa universidad.


9. Distribucin muestral de la media.
9.1 Distribucin muestral para la media de tamao n, con reemplazo.
una poblacin constituida por un nmero N de elementos, cuya media aritmtica es
y donde la desviacin tpica viene dada , pueden formarse N
2
muestras posibles. Para
cada una de estas muestras es posible una MEDIA MUESTRAL, que denotaremos con
el smbolo En una distribucin muestral de las medias, la VARIABLE ALEATORIA
MEDIA MUESTRAL sigue una ley normal descrita como N (, /n).

i
x


62
Resumen de frmulas para la distribucin de muestreo para la media.

Extraccin
Con reemplazo Sin reemplazo


Poblacin


Infinita





Finita (N)



Ej: 9 Dado los elementos de la poblacin {1, 3, 5}, encuentre todas las medias
muestrales posibles de tamao 2, con reemplazo. Las medias aritmticas reflejadas,
seran: Medias muestrales de todas las muestras posibles de tamao 2, con reemplazo.



A partir de la variable estadstica original de la poblacin se puede construir una nueva
variable estadstica , que tendra como valores las medias de las muestras tomadas de la
poblacin. La media aritmtica de esta DISTRIBUCIN MUESTRAL DE LAS MEDIAS se
denota por , y su desviacin tpica por .

PARMETROS DE LA DISTRIBUCIN MUESTRAL DE LAS MEDIAS DE TAMAO 2
Distribucin de muestreo para la media de todas la muestras de tamao dos.

Media muestral Frecuencia Probabilidad
1 1 1/9
2 2 2/9
3 3 3/9
4 2 2/9
5 1 1/9
Total = 9 = 1

Grfica de distribucin de muestreo de tamao 2.










Establecida una distribucin muestral de las medias de tamao 2, su ESPERANZA
MATEMTICA adopta el valor siguiente:

Muestra 1 , 1 1 , 3 1, 5 3 , 1 3 , 3 3 , 5 5 , 1 5 , 3 5 , 5
Media 1 2 3 2 3 4 3 4 5
1 2 3 4 5
X
0.11
0.22
0.33
p
r
o
b
a
b
i
l
i
d
a
d

x
o
=
x
=
x
=
x
n
x
o
o =
n
x
o
o =
n
x
o
o =
1

=
N
n N
n
x
o
o
=
x
i
x
) ( ) ( x E x E
x
= = =
i
x


63
Siendo la media aritmtica de la poblacin, la media aritmtica de cada muestra , la
media aritmtica de todas las medias , la esperanza matemtica de la variable
aleatoria X (para la poblacin) y la esperanza matemtica de la variable aleatoria (para
la distribucin muestral de las medias).
Por su parte, los valores de la varianza y la desviacin tpica de esta distribucin muestral de
tamao 2 son:

donde es la desviacin tpica de la poblacin, la desviacin tpica de la distribucin
muestral, la varianza de la variable x (poblacin) y la varianza de la variable
(distribucin muestral de las medias)
Basado en el ejemplo 9, obtenemos:
Media muestral Media Poblacional




Desviacin estndar muestral Desviacin estndar poblacional













Anlisis de la distribucin de muestreo para la media:
Se tiene que la media muestral y la poblacional son iguales a 3
La desviacin estndar poblacional es 1,6399 y la muestral es 1.1547. Es decir, que la
desviacin muestral es menor a la poblacional.
Las medias mustrales varan entre 1 y 5, mientras que los datos originales de la poblacin
van de 1, 3, y 5.
Se tiene que la distribucin de muestreo de los valores de las medias tiende a una
distribucin Normal.

NOTA: La diferencia de la DESVIACIN ESTNDAR describe la variabilidad de los valores
de una variable, en cambio el ERROR ESTNDAR describe la precisin del estadstico.
Adems, se cumple que .





x

i
x
) (x E
) (x E
2
, ) ( , ) (
2
o
o o o = = =
x x
x V x V
) (x V ) (x V
x
3
9
27
9
5 ... 2 3 2 1
) ( = =
+ + + + +
= = x E
x
3
3
9
3
5 3 1
= =
+ +
=
3
) 3 5 ( ) 3 3 ( ) 3 1 (
2 2 2
2
+ +
= o
666666667 , 2
3
8
2
= = o
63993162 , 1 = o
x
o o >
154700538 , 1 =
x
o
9
) 3 5 ( ... ) 3 3 ( ) 3 2 ( ) 3 1 (
2 2 2 2
+ + + +
=
x
o
333333333 , 1
9
12
= =
x
o
8 1515470053 , 1 =
x
o
=
x
2
632993162 , 1
= =
n
x
o
o
x
o
o
666666667 , 2 = o


64
9.2 Distribucin muestral de las medias de tamao n, sin reemplazo.
Dada una poblacin constituida por un nmero n de elementos, cuya media aritmtica es y
donde la desviacin tpica viene dada , pueden formarse
N
C
n
, se lee N combinaciones de n
para encontrar todas las muestras posibles.

Ej: 10 Auxilindonos del ejemplo 9. Dado los elementos de la poblacin {1, 3, 5}, encuentre
todas las medias muestrales posibles de tamao 2, sin reemplazo.
N = 3 ; n = 2, entonces,
3
C
2
= 3, se refiere al nmero total de muestras posibles y
sera;
Medias muestrales de todas las muestras de tamao 2 sin reemplazo.




Distribucin muestral para la media de todas la muestras de tamao 2 sin reemplazo.
Medias muestral Frecuencia Probabilidad
2 1 1/3
3 1 1/3
4 1 1/3
Total = 3 = 1

Anlisis de la distribucin de muestreo para la media:
Se tiene que la media muestral y la poblacional son iguales a 3.
La desviacin estndar poblacional es 1,632993162 y la muestral se calcula de la siguiente
manera;



Es decir, que la desviacin muestral es menor a la poblacional.
Las medias mustrales varan entre 2 y 4, mientras que los datos originales de la poblacin
van de 1, 3 y 5.
Se tiene que la distribucin de muestreo de los valores de las medias tiende a una
distribucin Normal.

10. Teorema de Lmite Central.
El Teorema del Lmite Central consiste en un conjunto de resultados acerca del
comportamiento de las distribuciones muestrales, en l se afirma, bajo ciertas hiptesis,
que la distribucin de las medias de un nmero muy grande de muestras se aproxima a una
distribucin normal. El trmino Central, debido a Poly (1920), describe el rol que cumple
este teorema en la teora de la probabilidad. Grandes matemticos colaboraron para
desarrollar el teorema del lmite central, sin embargo Laplace ocupa un lugar fundamental:
a pesar de que nunca enunci formalmente este resultado, ni lo demostr rigurosamente, a
l le debemos este importante descubrimiento. "Para una poblacin con una media y una
varianza
2
, la distribucin de las medias de todas las muestras posibles de tamao n
generadas de la poblacin estarn distribuidas de forma aproximadamente normal
asumiendo que el tamao de la muestra es suficientemente grande."

Muestra 1, 3 1 , 5 3 , 5
Media

2 3 4
816496581 , 0
1 3
2 3
2
632993162 . 1
1
=

=
N
n N
n
x
o
o
i
x


65
Con relacin al teorema del lmite central debemos enfatizar en:
Si el tamao de la muestra n, es suficientemente grande (n > 30) la distribucin muestral
de las medias ser aproximadamente normal. No importa si la poblacin es normal, sesgada
o uniforme, si la muestra es grande el teorema se aplicar.
La media de la poblacin y la media de todas las posibles muestras son iguales. Si la
poblacin es grande y un gran nmero de muestras son seleccionadas de esa poblacin
entonces la media de las medias muestrales se aproximar a la media poblacional.
La desviacin estndar de la distribucin muestral de las medias, a la que llamaremos error
estndar, es determinado por:












ACTIVIDAD DE AUTOAPRENDIZAJE N 10

1. Una empresa industrial tiene 5 trabajadores de produccin (considerados como la
poblacin) La retribucin (salario en horas) de cada empleado se presenta en seguida.








a. Cul es la media de la poblacin?
b. Cul es la distribucin muestral de medias para una muestra de tamao 2, sin
remplazo?
c. Cul es la media de la distribucin muestral y el error estndar de estimacin?

2. Hay cuatro representantes de ventas en Mid-Motors Ford. A continuacin se enlistan los
cuatro representantes y el nmero de automviles que vendieron la semana pasada.







Trabajador Salario ($)
Nelson 8
Mara 9
Kevin 6
Sofa 10
Marcelo 5
Representante
de ventas
Autos
vendidos
Ileana 6
Luis 4
Ramiro 10
Csar 8
1

=
N
n N
n
x
o
o


66
a. Cuntas muestras diferentes de tamao dos son posibles, con reemplazo?
b. Enliste todas las muestras posibles de tamao dos y calcule la media de cada muestra.
c. Compare la media de las medias muestrales con la de la poblacin.
d. Calcule o y
x
o .

11. Estimaciones.
11.1 Estimacin puntual.
Estimar un parmetro es proponer un valor para el mismo a partir de la muestra; un
estimador del porcentaje poblacional sera la proporcin de dispositivos electrnicos
que presentan falla a este tipo de estimacin se le llama estimacin puntual. Es
bastante probable que el valor que se obtiene no sea realmente el valor del parmetro
en la poblacin.
Parmetro Estimador
Media ()
Desviacin Estndar () S
Proporcin (P) p

Ej: 11 Suponga que un ingeniero se interesa en probar el sesgamiento de un medidor
de pH. Se renen datos de una sustancia neutra (pH =7,0), se toma una muestra de las
mediciones y los resultados son:
7,07 7,00 7,10 6,97 6,98 7,08 7,08 7,04

11.1 Determine e interprete y S.




11.2 Cul es la proporcin de mediciones con pH superior a 7,0?





11.2 Estimacin por intervalos.
Una mejor alternativa es la estimacin por intervalos; se da con ella un rango de valores
que contendr el valor del parmetro con una cierta confianza o seguridad, que
habitualmente es del 95%. La afirmacin hecha mediante un intervalo de confianza,
es preferible a la hecha por estimacin puntual, ya que permite cuantificar la magnitud
del error asociado a la estimacin. Un concepto importante al realizar estimaciones es el
error estndar, que est relacionado con la calidad de la estimacin. Se ha
estudiado una muestra de 100 neonatos que tienen una media de peso de 3200 g y una
desviacin estndar de 80; si se estudia otra muestra de 100 se puede encontrar una
media de 3400 y una desviacin estndar de 97; en otra muestra se pueden encontrar
valores de 3100 y 92, respectivamente, etc., y as se podran estudiar muestras
diferentes hallando valores similares pero no iguales.
x
x


67
El error estndar mide la variabilidad entre las diferentes medias de las muestras; es
decir, mide la dispersin imaginaria que presentaran las distintas medias obtenidas en las
muestras estudiadas.
Se utilizarn frmulas diferentes segn se pretenda calcular el error estndar de una
media o el error estndar de una proporcin.

11.2.1 Intervalo de confianza para una media.
De una poblacin de media y desviacin estndar o tpica () se pueden tomar
muestras de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se
puede demostrar que la media de todas las medias muestrales coincide con la media
poblacional:
Pero adems, si el tamao de las muestras es lo suficientemente grande, la distribucin
de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con
media y una desviacin tpica dada por la siguiente expresin:



Esto se representa como sigue: Si estandarizamos:

En una distribucin Z ~ N (0, 1) puede calcularse fcilmente un intervalo dentro del cual caiga
un determinado porcentaje de las observaciones, esto es sencillo hallar z
1
y z
2
tales que P[z
1

z z
2
] = 1 - , donde (1 - )100% es el porcentaje deseado.

Se desea obtener una expresin tal que
En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se
encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza
determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A
este valor se le llamar 1 (debido a que es el error que se cometer, un trmino opuesto).
Para ello se necesita calcular el punto o, mejor dicho, su versin estandarizada o,
<<valor crtico>> junto con su "opuesto en la distribucin" Estos puntos delimitan la
probabilidad para el intervalo, como se muestra en la siguiente imagen:


Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que: As:

Haciendo operaciones es posible despejar para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:
2
o
X
2
o
Z
2
o
X

2 2

o o
z z =

n
x
o
o =

x
x


68
Obsrvese que el intervalo de confianza viene dado por la media muestral ( ) el producto
del valor crtico por el error estndar .

Si se conoce N debe verificar la fraccin muestral
|
.
|

\
|
N
n
, luego aplique




Si se conoce y n es grande (habitualmente se toma n 30). Aproximaciones para el valor
los niveles de confianza estndar son 1,96 para 1 = 95% y 2,575 para 1 = 99%.

En la siguiente tabla se detallan algunos niveles de confianza ms comunes:
Nivel de confianza (1 )
Z
/2

90% 0,10 1,645
95% 0,05 1,96
99% 0,01 2,575

NOTA: Para un nivel de confianza del 90%, el valor se ubica en el cuerpo de la tabla y se
encuentra un valor aproximado o exacto del percentil de la distribucin Normal. Luego,
2
o
Z
= 1.645.
Si no se conoce y n es grande (n 30) donde s es la
desviacin tpica de una muestra.

Ej: 12 Se encuentra que la concentracin promedio de zinc que se extrae del agua a
partir de una muestra aleatoria en 36 sitios diferentes es de 2,6 gr por mililitro.
Encuentre e interprete un intervalo de confianza de 95% para la concentracin
media de zinc. Suponga que la desviacin estndar es 0,3.


Uso de la
~ Normal

Sustituyendo en la frmula
) (
2
x
z x o
o
e
la informacin brindada,
Obtenemos:

36
0,3
1,96 2,6
|
|
.
|

\
|
|
.
|

\
|
e
( ) 0,098 2,6 e
gr , , 698 2 502 2 < <
Es decir si se extraen muestras repetidas de tamao 36 del agua, se esperara que
aproximadamente el 95% de las veces la media estara contenida entre
gr , , 698 2 502 2 < < y el 5% restante estar fuera de dicho intervalo.



n
o
96 , 1
025 , 0
2
05 , 0 % 95 1
3 , 0 6 , 2
2
=
= = =
= =
o
o
o o
o
z
gr x
2
o
z
2
o
z
x
. 05 . 0
1
l FCF se omite e
N
n
si
N
n N
n
FCF
x
<

=

o
o



69
Si no se conoce y n es pequea (habitualmente se toma n < 30)





Ej: 13 El contenido de 7 envases similares de cido sulfrico son: 10,8 11,2 11,4
10,8 11,0 11,2 10,6 litros. Encuentre e interprete un intervalo de confianza
del 95% para la media de todos los envases, si se supone una distribucin
aproximadamente normal.

Usar calculadora

Buscar en la ~ t de Student.


Sustituimos en la frmula:



|
|
.
|

\
|
|
.
|

\
|
e
7
2 0,28284271
2,45 11

( ) 261916017 , 0 11 e

litros 26 , 11 74 , 10 < <

Es decir si se extraen muestras repetidas de tamao 7 de los envases conteniendo
cido sulfrico, se esperara que aproximadamente el 95% de las veces la media
estara contenida litros 26 , 11 74 , 10 < < y el 5% restante estar fuera de dicho
intervalo.

11.2.2 Tamao de muestra para estimar .
Con frecuencia deseamos saber que tan grande necesita ser una muestra para asegurar
que el error al estimar sea menor que una cantidad especfica e, esto significa que
deseamos conocer n de modo que . Al resolver esta ecuacin se obtiene la
siguiente frmula para n.



Procedimiento para calcular n.










gl n con
N
n N
n
s
s donde s t x
x x
n
1
1
) (
1 ,
2

= e

o


45 , 2
6 1 7 1
025 , 0
2
05 , 0 % 95 1
282842712 , 0
11
6 , 025 , 0
=
= = =
= = =
=
=
t
n gl
s
litros x
o
o o
e
n
z
2
=
|
.
|

\
|
o
o
2
2
|
|
.
|

\
|
=
e
z
n
o
o

+
= >
= <

(
(

=
0
0
0
0
2
2
0
05 . 0
05 . 0
. 2
1
n N
Nn
n
n n
N
n
Si
e
z
n .
o
o

) (
1 ,
2
x
n
s t x

e
o



70
Ej: 14 Qu tan grande se requiere una muestra del Ejemplo 7.2, si queremos tener 95%
de confianza que nuestra estimacin de difiere por ms o menos 0.05.
Uso de la
~ Normal


Como no se conoce N, sustituimos en la frmula,



Con estas caractersticas se deben muestrear 139 sitios para el estudio.

Cuando se resuelve para el tamao de muestra, todos los valores fraccionarios se
redondean al siguiente nmero entero.


11.2.3 Intervalo de confianza para una proporcin.
El intervalo de confianza para estimar una proporcin P, conocida una proporcin
muestral p de una muestra de tamao n, a un nivel de confianza del (1- )100% es:




En la demostracin de estas frmulas est involucrado el Teorema Central de Lmite como una
aproximacin de una binomial por una normal.l

Ej: 15 Un fabricante de reproductores iPod utiliza un conjunto de pruebas para evaluar la
funcin elctrica de su producto. Todos los reproductores deben pasar las pruebas
antes de venderse. Una muestra de 500 reproductores tiene como resultado 15 que
fallan en una o ms pruebas. Encuentre e interprete un intervalo de confianza de 90%
para la proporcin de los reproductores iPod de la poblacin que pasan todas las
pruebas.




Uso de la
~ Normal


Sustituyendo en la frmula:
n
x
p y
n
p p
donde z p P
p
=

= e
) 1 (
) (
p
2
o o
o

|
|
.
|

\
|
|
|
.
|

\
|
e
500
) 03 , 0 ( 97 , 0
645 , 1 97 , 0 P

( ) 7628892) 1,645(0,00 0,97 e P


( )
2976 , 138
05 , 0
3 , 0 96 , 1
2
2
2
= |
.
|

\
|
=
|
|
.
|

\
|
=
e
z
n
o
o
3 , 0 05 , 0
96 , 1
025 , 0
2
05 , 0 % 95 1
2
= =
=
= = =
o
o
o o
o
e
z
n = 139
= 139
n
x
p y
n
p p
donde z p P
p
=

= e
) 1 (
) (
p
2
o o
o

645 , 1
05 . 0
2
10 , 0 90 , 0 1
97 , 0
500
485

485 15 500
. iPod # :
2
=
= = =
= =
= =
o
o
o o
z
p
fallan no fallan x n
pruebas ms o una en fallan que res reproducto de x


71
( ) 012549528 , 0 97 , 0 e P ) 982549528 , 0 ; 957450471 , 0 ( e P

Si se extraen muestras repetidas de tamao 500 de los reproductores iPod, se espera
que aproximadamente el 90% de las veces la proporcin de reproductores de la
poblacin que pasan todas las pruebas est contenida entre el 95,75% y el 98,25% y el
10% restante se ubica fuera de ese intervalo.

11.2.4 Tamao de muestra para estimar p.
Determinemos que tan grande se requiere que sea una muestra para asegurar que el
error al estimar P sea menor que una cantidad e, esto significa que debemos

elegir n de modo que: . Al resolver esta ecuacin para n, obtenemos:




Procedimiento para calcular n.








NOTA: Si la proporcin de la poblacin no se conoce o bien no se cuenta con un valor estimado
de ste, se debe usar el valor de 0,5

Ej: 16 Se lleva a cabo un estudio para estimar el porcentaje de ciudadanos de una
comunidad que estn a favor de tener agua fluorada. Qu tan grande se requiere
que sea la muestra, si se desea tener una confianza de 95% y que nuestra
estimacin este dentro del 1% del porcentaje real?
Uso de la
~ Normal



No se conoce N, sustituimos en la frmula


La muestra debe ser de 9604 ciudadanos para llevar a cabo el estudio.






e
n
p p
z =
) 1 (
2
o
2
2
0
) 1 (
2
e
p p z
n

=
o

+
= >
= <

=
) 1 (
05 . 0
05 . 0
. 2
) 1 (
1
0
0
0
0
2
2
2
0
n N
Nn
n
n n
N
n
Si
e
p p z
n .
o

5 , 0
01 , 0
96 , 1
025 , 0
2
05 , 0 % 95 1
2
=
=
=
= = =
p
e
z
o
o
o o
9604
) 01 , 0 (
) 5 , 0 )( 5 , 0 ( ) 96 , 1 (
) 1 (
2
2
2
2
0
2
= =

=
e
p p z
n
o
9604 = n



72
ACTIVIDAD DE AUTOAPRENDIZAJE N 11

1. La asociacin de exalumnos de una universidad quiere estimar los salarios mensuales
promedios de los graduados en 2010. Una muestra aleatoria de 100 personas revel un
salario promedio de $850 con una desviacin estndar de $145. Establezca e
interprete una estimacin por intervalo con una confiabilidad del 90%, del salario
promedio mensual de los graduados en 2010.

2. Un fabricante produce anillos para los pistones de un motor de automvil. Se sabe que el
dimetro del anillo est distribuido aproximadamente normal, y que tiene una desviacin
estndar de 0.1 mm. Una muestra aleatoria de 45 anillos tiene un dimetro promedio de
74.6 mm. Construya e interprete un intervalo de confianza del 95% para el dimetro
promedio del anillo.

3. Se sabe que la duracin, en horas, de un foco de 75 watts tiene una distribucin
aproximadamente normal, con una desviacin estndar de 25 horas. Se toma una muestra
aleatoria de 40 focos, la cual resulta tener una duracin promedio de 1014 horas.
Construya e interprete un intervalo de confianza del 99% para la duracin promedio.

4. En el ejercicio # 3, Suponga que se desea una confianza del 95% en que el error en la
estimacin de la duracin sea de 5 horas. Qu tamao de muestra se necesita?

5. Un ingeniero analiza la resistencia a la compresin del concreto. La resistencia est
distribuida aproximadamente normal, con varianza
2 2
) ( 1000 psi = o . Al tomar una
muestra aleatoria de 36 especmenes, se tiene que psi x 3250 = . Construya e interprete
un intervalo de confianza del 95% para la resistencia a la compresin promedio.

6. Suponga que en el ejercicio # 5, se desea estimar la resistencia a la compresin con un
error menor de 15 psi para un nivel de confianza de 99% Qu tamao de muestra debe
emplearse para este fin?

7. En los resultados del censo de poblacin y vivienda 2005, acerca de la cantidad total de
viviendas que conforman el distrito IV en Managua es de 29, 920 y haciendo un supuesto
de que el 60% de las familias de ese distrito tiene casa propia con un margen de error del
4% y nivel de confianza del 90%. Cul es el tamao de muestra para la proporcin de
personas que tienen casa propia?

8. El gerente de control de calidad de una fbrica de lmparas elctricas desea estimar la
duracin promedio de un embarque de lmparas (focos). Los resultados indican que la
desviacin estndar del proceso es de 100 horas y el gerente desea estimar la duracin
promedio con aproximacin de 20 horas del promedio real con una confiabilidad del 95%.
Qu tamao de muestra se necesita?

9. Se va a vender un nuevo cereal para desayuno y se pone a prueba de mercado durante un mes
en las tiendas de una cadena de autoservicio, se desea estimar la suma promedio de venta


73
con aproximacin de $100 con un 95% de confianza y se supone que la desviacin estndar
es de $200. Qu tamao de muestra se necesita?

10. Un grupo de estudio quera estimar la facturacin mensual promedio por luz elctrica en el
mes de julio en casas unifamiliares en una ciudad. Con base en estudios efectuados en otras
ciudades, se supone que la desviacin estndar es de $20. El grupo quiere estimar la
facturacin promedio de julio con aproximacin de $5 del promedio real con un 95% de
confianza. Qu tamao de muestra se necesita?

11. El gerente de una sucursal bancaria en una ciudad quiere determinar la proporcin de su
cuenta habiente a los cuales se les paga el sueldo por semana, por experiencia previa en otras
reas se sabe que slo el 30% prefieren este sistema, si el gerente quiere tener 95% de
confianza de que esta en lo correcto con aproximacin de 0.05 de la proporcin de sus
clientes a quienes se les paga por semana. Qu tamao de muestra se necesita?

12. Se desea hacer una encuesta para determinar la proporcin de familias que carecen de
medios econmicos para atender los problemas de salud. Existe la impresin de que esta
proporcin est prxima a 0,35. Se requiere de una confianza del 95% con un error de
estimacin de 0,05. De qu tamao debe tomarse la muestra?

13. Determine el tamao de muestra que se requiere para estimar la proporcin verdadera de
los estudiantes de una universidad que tienen ojos azules, si se desea que la estimacin
tenga un error mximo de 0,02 y una confianza del 95%. Suponga que la poblacin
estudiantil es de 4350.

14. Se desea realizar una encuesta entre la poblacin juvenil de una determinada localidad
para determinar la proporcin de jvenes que estaran a favor de una nueva zona de ocio. El
nmero de jvenes de dicha poblacin es N = 2000. Determinar el tamao de muestra
necesario para estimar la proporcin de estudiantes que estn a favor con un error de
estimacin de 0,05 y un nivel de confianza del 95%.

15. En un proceso qumico se fabrica cierto polmero. Normalmente, se hacen mediciones de
viscosidad despus de cada corrida, y la experiencia acumulada indica que la variabilidad
en el proceso es muy estable. Las siguientes son 15 mediciones de viscosidad por corrida:
724 718 776 760 745 759 795 756
742 740 761 749 739 747 742
Encuentre e interprete un intervalo de confianza del 95% para la viscosidad media
del polmetro.

16. Una mquina produce las varillas de metal usadas en el sistema de suspensin de un
automvil. Se toma una muestra aleatoria de 12 varillas y se mide el dimetro (mm). Los
datos obtenidos aparecen abajo. Suponga que el dimetro de la varilla tiene una
distribucin normal. Construya e interprete un intervalo de confianza del 95% para el
dimetro promedio de la varilla.
8.24 8.23 8.20 8.21 8.20 8.28
8.23 8.25 8.19 8.25 8.26 8.23


74
17. Una lnea de autobuses piensa establecer una ruta desde un suburbio hasta el centro de la
ciudad. Se selecciona una muestra aleatoria de 50 posibles usuarios y 18 indicaron que
utilizaran esa ruta de autobuses. Establezca e interprete una estimacin del intervalo con
95% de confianza de la proporcin real de usuarios para esta nueva ruta de autobuses.

18. Un ingeniero hace pruebas con resistencia a la compresin del concreto. Para ello examina
12 especmenes y obtiene los siguientes datos.
2212 2237 2249 2204 2225 2301
2281 2263 2318 2255 2275 2295
Construya e interprete un intervalo de confianza del 99% para la resistencia promedio.

19. Un artculo publicado en Nuclear Ingineering Internacional describe varias caractersticas
de las varillas de combustibles utilizadas en un reactor propiedad de una empresa noruega
de electricidad. Las mediciones notificadas sobre el porcentaje de enriquecimiento de 12
varillas son las siguientes.
2.94 2.75 2.75 2.81 2.90 2.90
2.82 2.95 3.00 2.95 3.00 3.05
Encuentre e interprete un intervalo de confianza del 95% para el porcentaje promedio
de enriquecimiento.

20. Los ingresos del impuesto sobre ventas en una comunidad particular se recaudan cada
trimestre. Los siguientes datos representan los ingresos (en miles de dlares) cobrados
durante el primer trimestre de una muestra de nueve establecimientos de menudeo de la
comunidad: 16, 18, 11, 17, 13, 10, 22, 15, 16
a. Establezca e interprete una estimacin por intervalo con un 99% de confianza, de los
ingresos trimestrales del impuesto sobre ventas en los establecimientos de menudeo.
b. Si hay un total de 300 establecimientos de menudeo en esa comunidad, estime e
interprete un intervalo con un 95% de confianza de los ingresos trimestrales del
impuesto sobre ventas en los establecimientos de menudeo.

21. Un artculo publicado en el Journal of Composite Materials describe el efecto de la
prdida de lminas sobre la frecuencia natural, de vigas formadas por varias lminas. Se
sujetaron cinco vigas con prdida de laminas a varias cargas, y las frecuencias resultantes
fueron las siguientes (en Hz)
230.66 233.05 232.58 229.48 232.58
Encuentre e interprete un intervalo de confianza del 95% para la frecuencia natural.

22. Se realiz una investigacin de mercadotecnia para estimar la proporcin de amas de casa que
pueden reconocer la marca de un producto de limpieza con base en la forma y color del
recipiente. De las 1400 amas de casa consultadas, 420 fueron capaces de identificar la marca
del producto. Use un grado de confianza del 95% para determinar e interpretar en que
intervalo se encuentra la proporcin poblacional.

23. Un estudio muestral de 256 compaas industriales, determin que el 23% haban sealado a
sus empleados como la decada econmica a principios de 2008 afectara la organizacin.
Determine un intervalo de confianza de 95% para la proporcin de todas las compaas que


75
explicaran a sus empleados los efectos de la decada. Suponiendo que hay un total de 2000
compaas.

24. El nmero de autos vendidos en Casa Pellas durante el primer semestre del 2012 fue de
800 automviles de diversas marcas, en una muestra de 400 automviles se observ que de
estos 47 eran de color Rojo.
a. Estime la proporcin de compradores que prefirieron automvil color Rojo.
b. Establezca el intervalo de confianza del 90% para la proporcin de compradores que
prefirieron el color Rojo e interprete los resultados.

25. Un auditor de una dependencia gubernamental de proteccin al consumidor quiere
determinar la proporcin de reclamos sobre plizas de enfermedades que paga la compaa
de seguros en un plazo de dos meses de haber recibido el reclamo. Se selecciona una
muestra de 200 reclamos y se determina que 80 fueron pagadas en un plazo de dos meses
despus de recibidos. Establezca e interprete una estimacin del intervalo con 99% de
confianza de la proporcin real de reclamos pagadas dentro de ese plazo de dos meses.

12. Prueba de hiptesis.
La estadstica inferencial es el proceso de usar la informacin de una muestra para
describir el estado de una poblacin. Sin embargo es frecuente que usemos la informacin
de una muestra para probar un reclamo o conjetura sobre la poblacin. El reclamo o
conjetura se refiere a una hiptesis. El proceso que corrobora si la informacin de una
muestra sostiene o refuta el reclamo se llama prueba de hiptesis.

Hiptesis: Afirmacin acerca de los parmetros de la poblacin.

Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) de un parmetro
poblacional, despus de recolectar una muestra aleatoria, se compara la estadstica muestral (
), con el parmetro hipottico, de una supuesta media poblacional (). Luego se Rechaza o No
se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico slo si el
resultado muestral resulta muy poco probable cuando la hiptesis es cierta. En el anlisis
estadstico se hace una aseveracin, es decir, se plantea una hiptesis, despus se hacen las
pruebas para verificar la aseveracin o para determinar que no es verdadera. Por tanto, la
prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora de
probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable.

Se realiza mediante un procedimiento sistemtico de cinco paso:

Siguiendo este procedimiento sistemtico, al llegar al paso cinco se puede o no rechazar la


76
hiptesis, pero debemos de tener cuidado con esta determinacin. Analizaremos cada paso en
detalle.

Objetivo de la prueba de hiptesis.
El propsito de la prueba de hiptesis no es cuestionar el valor calculado del estadstico
(muestral), sino hacer un juicio con respecto a la diferencia entre el estadstico de muestra y
un valor planteado del parmetro.

Procedimiento sistemtico para una prueba de hiptesis de una muestra.
PASO 1: Plantear la hiptesis nula H
0
y la hiptesis alternativa H
1
.
Cualquier investigacin estadstica implica la existencia de hiptesis o afirmaciones acerca de
las poblaciones que se estudian. La hiptesis nula (Ho) se refiere siempre a un valor
especificado del parmetro de poblacin, no a una estadstica de muestra. La letra H significa
hiptesis y el subndice cero no hay diferencia. Por lo general hay un "no" en la hiptesis nula
que indica que "no hay cambio" Podemos rechazar o no Ho, adems la hiptesis nula (H
0
) es una
afirmacin que no se rechaza a menos que los datos muestrales proporcionen evidencia
convincente de que es falsa. El planteamiento de la hiptesis nula siempre contiene un signo de
igualdad con respecto al valor especificado del parmetro.
La hiptesis alternativa (H
1
) es cualquier hiptesis que difiera de la hiptesis nula. Es una
afirmacin que no se rechaza si los datos muestrales proporcionan evidencia suficiente de que
la hiptesis nula es falsa. Se le conoce tambin como la hiptesis de investigacin. El
planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad con respecto al
valor especificado del parmetro. Si queremos decidir entre dos hiptesis que afectan a un
cierto parmetro de la poblacin, a partir de la informacin de la muestra usaremos el
contraste de hiptesis, cuando optemos por una de estas dos hiptesis, hemos de conocer una
medida del error cometido, es decir, cuantas veces de cada cien nos equivocamos.

En resumen: Veremos cmo se escribiran las hiptesis que queremos contrastar:
H
0
se llama hiptesis nula y es lo contrario de lo que sospechamos que va a ocurrir (suele
llevar los signos igual, mayor o igual o menor o igual)

H
1
se llama hiptesis alternativa y es lo que sospechamos que va a ser cierto (suele llevar
los signos distinto, mayor o menor)

Los contrastes de hiptesis pueden ser de dos tipos:
Bilateral: En la hiptesis alternativa aparece el signo distinto.
Ej: 17 H
0
: = 200
H
1
: 200


Unilateral: En la hiptesis alternativa aparece el signo > o el signo <.
Ej: 18
H
0
: 200 H
0
: 200
H
1
: < 200 H
1
: > 200




o/2
o/2
o/2


77
PASO 2: Seleccionar el nivel de significancia.
Nivel de significancia: Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le
denota mediante la letra griega (), tambin es denominada como nivel de riesgo, este trmino
es ms adecuado ya que se corre el riesgo de rechazar la hiptesis nula, cuando en realidad es
verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin
indicar la probabilidad de rechazar, es decir, est fuera de rea de No rechazo. El nivel de
confianza (1 - ), indica la probabilidad de No rechazar la hiptesis planteada, cuando es
verdadera en la poblacin. La distribucin de muestreo de la estadstica de prueba se divide en
dos regiones, una regin de rechazo (conocida como regin crtica) y una regin de no rechazo.
Si la estadstica de prueba cae dentro de la regin de No rechazo, no se puede rechazar la
hiptesis nula. La regin de rechazo puede considerarse como el conjunto de valores de la
estadstica de prueba que no tienen posibilidad de presentarse si la hiptesis nula es
verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hiptesis
nula es falsa. El valor crtico separa la regin de rechazo con la de no rechazo.

Tipos de errores.
Cualquiera sea la decisin tomada a partir de una prueba de hiptesis, ya sea de No rechazo de
Ho, puede incurrirse en error.
Un error tipo I se presenta si la hiptesis nula Ho es rechazada cuando es verdadera y
deba No rechazarse. La probabilidad de cometer un error tipo I se denomina con la letra
alfa ().
Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula No se
rechaza cuando de hecho es falsa y deba ser rechazada.

En cualquiera de los dos casos se comete un error al tomar una decisin equivocada. En la
siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.


Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los
errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y
se tiene que poner una limitacin al error de mayor importancia. La nica forma de reducir
ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta , depende
de la diferencia entre los valores supuesto y real del parmetro de la poblacin. Como es ms
fcil encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el
correspondiente parmetro de poblacin es grande, la probabilidad de cometer un error de
tipo II, probablemente sea pequea.


78
De los dos, el ms importante es alfa que llamaremos nivel de significacin y nos informa de la
probabilidad que tenemos de estar equivocados si aceptamos la hiptesis alternativa.
Debido a que los dos errores anteriores a la vez son imposibles de controlar, vamos a fijarnos
solamente en el nivel de significacin, este es el que nos interesa ya que la hiptesis alternativa
que estamos interesados en probar y no queremos aceptarla si en realidad no es cierta, es
decir, si aceptamos la hiptesis alternativa queremos equivocarnos con un margen de error muy
pequeo. El nivel de significacin lo marcamos nosotros. Si es grande es ms fcil No rechazar
la hiptesis alternativa cuando en realidad es falsa. El valor del nivel de significacin suele ser
un 5%, lo que significa que 5 de cada 100 veces No rechazamos la hiptesis alternativa cuando
la verdadera es la nula. El estudio y las conclusiones que obtengamos para una poblacin
cualquiera, se habrn apoyado exclusivamente en el anlisis de una parte de sta. De la
probabilidad con la que estemos dispuestos a asumir estos errores, depender, por ejemplo, el
tamao de la muestra requerida. Las contrastaciones se apoyan en que los datos de partida
siguen una distribucin normal, existe una relacin inversa entre la magnitud de los errores
y : conforme aumenta, disminuye. Esto obliga a establecer con cuidado el valor de para
las pruebas estadsticas. Lo ideal sera establecer y . En la prctica se establece el nivel y
para disminuir el error se incrementa el nmero de observaciones en la muestra, pues as se
acortan los limites de confianza respecto a la hiptesis planteada. La meta de las pruebas
estadsticas es rechazar la hiptesis planteada. En otras palabras, es deseable aumentar
cuando sta es verdadera, o sea, incrementar lo que se llama poder de la prueba (1- ). La
aceptacin de la hiptesis planteada debe interpretarse como que la informacin aleatoria de
la muestra disponible no permite detectar la falsedad de esta hiptesis.

PASO 3: Clculo del estadstico de prueba.
Valor determinado a partir de la informacin muestral, que se utiliza para determinar si se
rechaza la hiptesis nula, existen muchos estadsticos de prueba para nuestro caso
utilizaremos los estadsticos z o t. La eleccin de uno de estos depende de la cantidad de
muestras que se toman, si las muestras son iguales a 30 o ms se utiliza el estadstico z, en
caso contrario se utiliza el estadstico t.
En las pruebas de hiptesis para la media (), cuando se conoce la desviacin estndar ()
poblacional, o cuando el valor de la muestra es grande (30 o ms), el valor del estadstico de
prueba es z y se determina a partir de:



El valor del estadstico z, para muestra grande y desviacin estndar poblacional desconocida
se determina por la ecuacin:



En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor del estadstico t.



n
x
z
o

=

n
s
x
z

=

libertad de grados n con
n
s
x
t 1

=




79
Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma utilizada
cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada
caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin
particular. En tal caso el estadstico de prueba es.




PASO 4: Formular la regla de decisin.
Se establecen las condiciones especficas en la que se rechaza la hiptesis nula y las
condiciones en que No se rechaza la hiptesis nula. La regin de rechazo define la ubicacin de
todos los valores que son tan grandes o tan pequeos, que la probabilidad de que se presenten
bajo la suposicin de que la hiptesis nula es verdadera, es muy remota.

Valor critico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que No se rechaza.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar en
unidades de desviacin. Una regin de rechazo de 0.025 en cada cola de la distribucin
normal, da por resultado un rea de .475 entre la media hipottica y el valor crtico. Si se
busca est rea en la distribucin normal, se encuentra que los valores crticos que dividen
las regiones de rechazo y no rechazo son + 1,96 y 1,96

PASO 5: Tomar una decisin.
En este ltimo paso de la prueba de hiptesis, el estadstico de prueba se compara con el valor
crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en una
prueba de hiptesis slo se puede tomar una de dos decisiones: Rechazar o No rechazar la
hiptesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula
cuando no debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la
hiptesis nula No se rechace cuando debera haberse Rechazado (error tipo II)

Valor p:
Es un planteamiento alternativo para la toma de una decisin de prueba de hiptesis.
Es la probabilidad de obtener una estadstica de prueba igual o ms exacta que el resultado
obtenido a partir de los datos de la muestra dado que la hiptesis nula, Ho, es realmente
verdadera.
A menudo el Valor p se conoce como nivel de significacin observado, que es el mnimo nivel al
cual Ho puede ser rechazado para un conjunto de datos.
El procedimiento compara el Valor p con el nivel de significacin .




) 1 (
o o
o
p np
np x
z

=

Si el Valor p Ho se Rechaza

Si el Valor p > Ho no se
Rechaza


80
Ej 19 Establezca las hiptesis nula y alterna.
19.1 En promedio, los estudiantes de una universidad viven a no ms de 15 Km de la
misma.



19.2 El consumo promedio de un nuevo modelo de auto es de 52Km/galn.




19.3 Ms del 65% de los empleados de un colegio aportan a Fondos Sociales.



19.4 Al menos un 60% de la poblacin adulta de una comunidad votar en las prximas
elecciones municipales.




19.5 Se reclama que al menos el 60% de las compras realizadas en cierta tienda por
departamentos son artculos especiales.




19.6 Una nueva marca de computadora dura en promedio ms de 10 aos.





19.7 Se observa que el 20% de los graduados de cierto colegio privado solicitan
admisin a escuelas de medicina.




19.8 El balance promedio de una cuenta de cheques en el First State Bank es de al
menos $150




. 15 :
. 15 :
1
0
Km H
Km H
>
s

65 , 0 :
65 , 0 :
1
0
>
s
p H
p H


81
Ej: 20 Determine si la prueba es de cola derecha, izquierda o ambas, con el nivel de
significancia = 0,05 encuentre el valor critico y dibuje la regin de rechazo.

20.1 Uso de la ~ Normal



20.2





20.3





20.4





Ej: 21 Determine el valor crtico con las caractersticas indicadas.

21.1

Si o = 0,01 = z


21.2






21.3





645 , 1
05 , 0
=
=
o
o
z
o
z = 2,33
Para o = 0,01 y n = 40
11 :
11 :
1
0
>
s

H
H
645 , 1 =
o
z
8 , 5 :
8 , 5 :
1
0
<
>

H
H
110 :
110 :
1
0
=
=

H
H
3 , 0 :
3 , 0 :
1
0
<
>
p H
p H
o/2 o/2
Para o = 0,05 y n = 16
Para o = 0,01 y n = 10 o


82
21.4





Ej: 22 Un fabricante de cierta marca de cereal de arroz afirma que el contenido
promedio de grasa saturada no excede de 1,5 gramos, con una desviacin estndar de
0,3 gramos. Se toma una muestra de 40 bolsas de cereal y se encuentra que el
contenido medio de grasa saturada es de 1,6 gramos. Pruebe la afirmacin del
fabricante con un nivel de significacin de 0,05. Determine el Valor p.

o
= 1,5 gramos. = 0,3 gramos
n = 40 bolsas = 1,6 gramos = 0,05

1. Formulacin de las Hiptesis.
(El contenido promedio de grasa saturada no excede de 1,5 gr. en la marca de cereal)

(El contenido promedio de grasa saturada es superior a 1,5 gr. en la marca de cereal)

2. Nivel de Significacin.

= 0,05

3. Calcular el Estadstico de Prueba.






4. Regla de Decisin.
Observe que este valor se ubica en la Regin de Rechazo, es decir,
Por lo tanto Ho se Rechaza.


5. Toma de Decisin.
Existe suficiente evidencia a un nivel de significacin de 0,05 que el contenido
promedio de grasa saturada en la marca de cereal de arroz es superior a 1,5 gramos.


Valor p.







x
. 5 , 1 :
. 5 , 1 :
1
0
gr H
gr H
>
s

645 , 1 =
o
z
11 , 2
108185107 , 2
40
3 , 0
5 , 1 6 , 1
~
=

=
Cal
z
n
x
z
o

11 , 2 =
Cal
z
o
z z
Cal
>
11 , 2 =
Cal
z
chaza se Ho p Como
p
z p z P p
Re 05 , 0 0174 , 0
0174 , 0 4826 , 0 5 , 0
) 11 , 2 ( 5 , 0 ) 11 , 2 (
= s =
= =
= > =
o
o/2

o/2
o/2

o/2
Para o = 0,05 y n = 36


83
Ej: 23 En el departamento de personal de una compaa de telecomunicaciones se quiere
estimar los gastos familiares en odontologa de sus empleados. Para determinar la
factibilidad de proporcionarles un plan de seguro dental, el gerente del departamento
toma una muestra de 10 empleados y obtuvo la siguiente informacin de los gastos (en
dlares) durante el ao anterior.
110 362 246 85 510 208 173 425 179 316
Con un nivel de significacin de 0,01 Existe evidencia que le permita al gerente de
personal llegar a la conclusin de que los gastos dentales familiares de los empleados
sean diferente de $320? Determine el Valor p.
n = 10 empleados = 0,01
o
= $320
Con la calculadora
determine:

1. Formulacin de las Hiptesis.
(Los gastos dentales familiares de los empleados son de $320)
(Los gastos dentales familiares de los empleados son diferentes de $320)

2. Nivel de Significacin.
= 0,01
gl = n - 1 = 10 1 = 9


3. Calcular el Estadstico de Prueba.





4. Regla de Decisin.
Observe que este valor se ubica en la Regin de No Rechazo, es decir,
. Por lo tanto Ho No se Rechaza.

5. Toma de Decisin.
No Existe suficiente evidencia a un nivel de significacin de 0,01 que el gasto promedio
durante el ao pasado en odontologa sea diferente a $320.


Valor p.


El valor calculado de la estadstica de prueba es . En la tabla de la distribucin t
de Student observamos que debido a la simetra, slo se muestran los valores crticos del
extremo superior. Pero si omitimos el signo con el propsito de usar la tabla, notamos que el
V.C. para un rea de extremo superior de 0,25 y 9 gl. es 0,7029 y para un rea de extremo
superior de 0,10 es 1,380; como se ubica entre estos dos valores y podemos
establecer que el Valor p para esta prueba est entre 0,25 y 0,10 cada uno de estos valores
8045789 , 138 $
4 , 261 $
=
=
s
x
320 $ :
320 $ :
1
0
=
=

H
H
005 , 0
2
=
o
34 , 1
335038601 , 1
10
8045789 , 138
320 4 , 261
~
=

=
Cal
t
n
s
x
t

34 , 1 =
Cal
t
25 , 3 34 , 1 25 , 3 < = <
Cal
t
25 , 3
) 9 , (
2
= o t
25 , 3
) 9 , (
2
=
o
t 25 , 3
) 9 , (
2
=
o
t
34 , 1 =
Cal
t
34 , 1 =
Cal
t
34 , 1 =
Cal
t


84
son mayores ( > ) que el nivel escogido de significacin. Por lo tanto, la hiptesis nula,
Ho, No se Rechaza.


Ej: 24 El director de personal de una compaa de seguros est interesado en reducir
la tasa de movimientos de los oficinistas encargados en procesar datos durante su
primer ao de empleo. Registros anteriores indican que 25% del total de las nuevas
contrataciones de esta rea ya no se encuentran en la compaa al final del primer ao.
Se estn aplicando programas de entrenamiento extensivos a una muestra de 150
nuevos oficinistas encargados del procesamiento de datos. Al final de un periodo de un
ao, de los 150 individuos, 30 ya no se encuentran en la compaa. Al nivel de
significancia de 0,01 Existe evidencia de que la proporcin de oficinistas encargados
del procesamiento de datos que estuvieron en el nuevo programa de entrenamiento y
que ya no trabajan para la compaa es menor de 0,25? Calcule el Valor p.
p
o
= 25%. n = 150 oficinistas x = 30 = 0,01

1. Formulacin de las Hiptesis.
(La proporcin de oficinistas encargados del procesamiento de datos y que ya no
trabajan para la compaa es por lo menos del 25%)
(La proporcin de oficinistas encargados del procesamiento de datos y que ya no
trabajan para la compaa es inferior al 25%)

2. Nivel de Significacin.


= 0,01

3. Calcular el Estadstico de Prueba.




4. Regla de Decisin.
Observe que este valor se ubica en la Regin de No Rechazo, es decir,
Por lo tanto Ho No se Rechaza.

5. Toma de Decisin.
No existe suficiente evidencia a un nivel de significacin de 0,01 que la proporcin de
oficinistas encargados del procesamiento de datos y que ya no trabajan para la
compaa sea inferior al 25%.

Valor p.





% 25 :
25 :
1
0
<
>
p H
% p H
33 , 2 =
o
z
41 , 1
414213562 , 1
125 , 28
5 , 7
) 25 , 0 1 )( 25 , 0 ( 150
) 25 , 0 ( 150 30
) 1 (
=
=

=
Cal
o o
o
z
p np
np x
z
41 , 1 =
Cal
z
41 , 1 33 , 2 = < =
Cal
z z
o
41 , 1 =
Cal
z
chaza No se Ho p Como
p
z p z P p
Re 01 , 0 0793 , 0
0793 , 0 4207 , 0 5 , 0
) 41 , 1 ( 5 , 0 ) 41 , 1 (
= > =
= =
= s =
o
01 , 0 = o


85
ACTIVIDAD DE AUTOAPRENDIZAJE N 12

1. Se requiere que la tensin de ruptura de un hilo utilizado en la fabricacin de material de
tapicera sea al menos de 100 psi. La experiencia ha indicado que la desviacin estndar de
la tensin de ruptura es 6 psi. Se prueba una muestra aleatoria de 36 especmenes, y la
tensin de ruptura promedio observada es de 98 psi. Pruebe la hiptesis a un nivel de
significacin de 0.05. Determine el valor p.

2. Se sabe que el dimetro de los agujeros para una montura de cable tiene una desviacin
estndar de 0.01 in. Se obtiene una m.a. de 40 monturas, donde el dimetro promedio
resulta ser 1.5045 in. Pruebe la hiptesis que el dimetro promedio verdadero del agujero
es de 1.50 in, usando una significancia de 0.05. Cul es el valor de p en esta prueba?

3. El Gerente de produccin de una Compaa manufacturera estima que la edad media de sus
empleados es 22.8 aos. El tesorero de la firma necesita una cifra de la edad media de los
empleados ms exacta, a fin de estimar el costo de una prestacin por antigedad que se
considera para los empleados. El tesorero toma una muestra aleatoria de 70 trabajadores y
observa que la edad media de los empleados muestreados es de 26.2 aos con una desviacin
estndar de 4.6 aos. Con un nivel de significacin del 1%. Qu puede concluir acerca de la
exactitud de la estimacin del Gerente de produccin?

4. La produccin diaria de una planta industrial qumica registrada durante 50 das, tiene una
media muestral de 871 toneladas y una desviacin estndar de 21 toneladas. Pruebe la
hiptesis de que el promedio de la produccin diaria del producto qumico es de 880 toneladas
por da, contra la alternativa de que es mayor o menor que 880 toneladas por da, usando una
significacin del 5%.

5. Una muestra aleatoria de 6 observaciones de una poblacin normal, gener los siguientes
datos: 3.7 6.4 8.1 8.8 4.9 5.0 Proporcionan los datos suficiente evidencia que seale
que < 7, a un nivel del 5%.

6. Tina Dennis es la jefa de contabilidad de Meck Industries (MI). Ella cree que los
problemas de flujo de efectivo en MI se deben a la cobranza lenta de cuentas pendientes.
Estima que ms de 60% de las cuentas estn en atraso ms de tres meses. Una muestra de
200 cuentas seal que 140 tenan ms de tres meses de antigedad. Al nivel de
significacin de 0.01. se puede concluir que ms de 60% de las cuentas estn en atraso
por ms de tres meses?

7. Experiencias en la Wills Travel Agency indica que 44% de las personas desean que esa
agencia planee unas vacaciones para viajar a Europa. Durante la temporada ms reciente,
una muestra de 1000 fue seleccionada al azar de los archivos y se encontr que 480
queran ir a Europa de vacaciones. Ha sido un cambio significativo hacia arriba en el
porcentaje de personas que desean ir a Europa? Pruebe a un nivel del 5%.



86
8. Se analiza una marca particular de margarina diettica para determinar el nivel de cido
graso poliinsaturado (en porcentaje). Se toma una muestra de seis paquetes y se obtienen
los siguientes datos: 16.8 17.2 17.4 16.9 16.5 17.1
Pruebe la hiptesis 0 . 17 :
0
= H contra 0 . 17 :
1
= H Utilice 05 . 0 = o Cules son
sus conclusiones? Cul es el valor de p en esta prueba?

9. Un ingeniero que trabaja para un fabricante de llantas investiga la duracin promedio de un
compuesto nuevo de caucho. Para ello, construye 16 llantas y las prueba en una carretera
hasta alcanzar el fin de la vida til de estas. Los datos, en Km., obtenidos son los
siguientes:
60623 59784 60545 69947 59836 60221
60257 60135 59554 60311 60000 60220
60252 50040 59997 60523
Al ingeniero le gustara demostrar que la vida til promedio de la nueva llanta excede los
60 mil km. Proponga y pruebe hiptesis apropiadas. Obtenga una conclusin con 05 . 0 = o
Determine el valor p.

10. Se efecta una prueba de impacto Izod sobre 20 muestras de tubera PVC. El estndar
ASTM para este material requiere que la resistencia al impacto Izod sea mayor que 1.0 ft-
lbs/in. El promedio y la desviacin estndar muestrales son 25 . 1 = x y 25 . 0 = s
respectivamente. Realice la prueba a un nivel de significacin de 0.01. Obtenga
conclusiones. Determine el valor p.


13. Prueba de Independencia.
La estadstica desempea una funcin importante en muchos problemas en los que se
obtiene informacin a travs del conteo o la enumeracin y no por medio de la medicin. En
tal caso la prueba que se aplica se llama prueba de independencia de una tabla de
contingencia. Es decir, las clasificaciones entre dos caracteres (A y B) de los mismos
individuos en estudio, en la cual las r filas representan los niveles de caracter A y las
c columnas los niveles de caracter B.

El procedimiento para el desarrollo de una prueba es similar al abordado anteriormente, las
hiptesis se planteara de la siguiente manera:
H
0
:

La categora A y la categora B son independientes (es decir, No hay relacin
entre ellas).
H
1
: La categora A y la categora B son dependientes (Hay relacin entre ellas).



El estadstico de prueba es, con (r - 1)(c - 1) gl.



Donde,
0
f representa las frecuencias observadas y
e
f las frecuencias esperadas.

2
_

=

=
k
i
e
e
f
f f
1
2
0 2
) (
_



87
Las
e
f se obtienen multiplicando el total de la fila a la cual pertenece por el total de la
columna al que pertenece dividiendo entre el gran total de la tabla.





La regla de decisin es Rechazar Ho si, en caso contrario No existe
suficiente evidencia para rechazar Ho


Ej: 25 En un experimento para estudiar la dependencia de la hipertensin con el hbito
de fumar, se tomaron los siguientes datos de 180 individuos.

Padece de
hipertensin?
Tipo de fumador
Total No fumador Fumador moderado Fumador
empedernido
Si 21 [33,35] 35 [29,48] 31 [24,17] 87
No 48 [35,65] 26 [31,52] 19 [25,83] 93
Total 69 61 50 180

Pruebe la hiptesis que la presencia o ausencia de hipertensin es independiente a los
hbitos de fumar. Use un nivel de significancia de 0,01. Determine el Valor p

1. Formulacin de las Hiptesis.
Ho: No existe relacin entre la presencia o ausencia de hipertensin y los hbitos de
fumar.
H
1
: Existe relacin entre la presencia o ausencia de hipertensin y los hbitos de
fumar.

2. Nivel de Significacin.


3. Calcular el Estadstico de Prueba.






... 59 , 14
85 , 25
) 83 , 25 19 (
.....
48 , 24
) 48 , 24 35 (
35 , 33
) 35 , 33 21 ( ) (
2 2 2
1
2
0 2
=

+ +

=
k
i
e
e
f
f f
_



n
columnas filas
f
e

=
) )( (

2 2
Tab Cal
_ _ >

21 , 9
2 ) 1 3 )( 1 2 (
01 , 0
2
2 , 01 , 0
=
= =
=
_
o
gl
35 , 33
180
) 69 )( 87 (
11
= =
e
f 48 , 29
180
) 61 )( 87 (
12
= =
e
f 17 , 24
180
) 50 )( 87 (
13
= =
e
f
65 , 35
180
) 69 )( 93 (
21
= =
e
f 52 , 31
180
) 61 )( 93 (
22
= =
e
f 83 , 25
180
) 50 )( 93 (
23
= =
e
f


88
4. Regla de decisin.
Como
2
Cal
_ se ubica en la regin de Rechazo, por consiguiente Ho se rechaza. Es decir,
2 2
Tab Cal
_ _ > (14,59 > 9,21)


5. Toma de decisin.
Existe suficiente evidencia al nivel de significacin de 0,01 que nos muestre que hay
relacin entre la presencia o ausencia de hipertensin y los hbitos de fumar.

Valor p.
. 2 ) 59 , 14 (
2
gl con P > _
. Re 01 , 0 005 , 0 chaza se Ho p = s = o





ACTIVIDAD DE AUTOAPRENDIZAJE N 13

1. Se efecta un estudio sobre las fallas de un componente electrnico. Existen cuatro tipos
de fallas posibles y dos posiciones de montaje para el dispositivo. Se toman los datos
siguientes:
Posicin de
montaje
Tipo de falla
Total
A B C D
1 22 46 18 9
2 4 17 6 12
Total

Puede concluir que el tipo de falla es independiente de la posicin de montaje. Use

05 . 0 = o Determine el valor p.

2. Se realiza un anlisis de datos sobre el tipo de accidente, para determinar la distribucin
del nmero de accidentes automovilsticos segn el tamao del auto. Los datos para 346
accidentes son los siguientes,

Tipo de
accidente
Tamao del auto
Total
Pequeo Mediano Grande
Mortal 67 26 16
No mortal 128 63 46
Total

Indican los datos que el tipo de accidentes depende del tamao del automvil? = 0.10









89
3. Se entrevist a un grupo de 306 personas para determinar su opinin respecto a un tema
especfico de poltica exterior. Al mismo tiempo, se registr su afiliacin poltica. Los
datos son los siguientes:

De acuerdo con
la poltica
En desacuerdo con
la poltica
No opinaron Total
Partido de gobierno 114 53 17
Oposicin 87 27 8
Total

Presentan los datos suficiente evidencia que indique que hay relacin entre la afiliacin
poltica y la opinin expresada. Use un nivel de 0.05.

4. De un grupo de estudiantes se toman al mismo tiempo las calificaciones que estos obtienen
en un curso de Estadstica y en otro de Clculo. Los resultados son los siguientes:

Calificaciones
de estadstica
Calificaciones de Clculo
Total
A B C D
A 25 6 17 13
B 17 16 15 6
C 18 4 18 10
D 10 8 11 20
Total

Existe alguna relacin entre las calificaciones de los cursos de estadstica y Clculo?
05 . 0 = o Determine el valor p.

5. La directiva de una compaa est interesada en determinar si existe una asociacin entre
el tiempo de cambio de turno de sus empleados y el nivel de estrs relacionado con
problemas observados en el trabajo. En un estudio de 116 trabajadores de lnea de
ensamblaje se revel lo siguiente.


Tiempo de cambio
Estrs
Total Alto Moderado Bajo
Menos de 15 min. 9 5 18
15 a 45 min. 17 8 28
Ms de 15 min. 18 6 7
Total

A un nivel de significancia de 0,01 Existe evidencia de que haya alguna relacin entre el
tiempo de cambio de turno y el estrs?









90
UNIDAD IV: REGRESIN Y CORRELACIN LINEAL SIMPLE
Introduccin.
En la prctica es frecuente que se requiera resolver problemas que implican conjuntos de
variables de las cuales se sabe que tienen alguna relacin inherente entre s. Podra ser de
inters desarrollar un mtodo de pronstico, es decir, un procedimiento de entrada a partir de
informacin experimental.

1. Diagrama de dispersin.
Diagrama que refleja la relacin entre dos variables.
Si X y Y denotan las dos variables, entonces un diagrama de dispersin muestra la
localizacin de los puntos (x, y) en un sistema de coordenadas rectangulares.

Definicin de las variables.
Variable dependiente (Y) Variable que se va a predecir o estimar.
Variable independiente (X) Variable que proporciona la base para el clculo.

Ej: 1 Se dispone de una muestra de observaciones formadas por pares de variables: (x
1
, y
1
),
(x
2
, y
2
), .., (x
n
, y
n
) A travs de esta muestra, se desea estudiar la relacin existente
entre las variables X e Y. Es posible representar estas observaciones mediante un
grfico de dispersin, como el siguiente:


Ej: 2 El gerente de una tienda de artculos informticos est considerando contratar a una
compaa de publicidad para estimular el negocio. Para lo cual investig el campo de la
publicidad y recolect los siguientes datos de la Cantidad de ganancia (Y) que logra la
compaa y la Cantidad gastada en publicidad (X). Los datos se muestran a
continuacin.

Cantidad en
publicidad
(cientos de $)

3.6

4.8

9.7

12.6

10.8

18.2

10.0

16.6
Ganancia
(en cientos de $)
12.2 14.4 22.6 28.4 27.6 40.2 25.8 34.5

Presente estos datos en un diagrama de dispersin.







91
2. Regresin Lineal.
En primer lugar debemos realizar un grfico de dispersin como el del Ej. 2 y estudiar
visualmente si la relacin entre nuestra variable dependiente (Ganancia) y nuestra variable
independiente (Cantidad en publicidad) puede considerarse lineal. Por convenio, se coloca
la variable dependiente en el eje Y de las ordenadas y la variable independiente en el eje X
de las abscisas. Si no observamos un comportamiento lineal, debemos transformar la
variable dependiente o incluso replantearnos el tipo de anlisis, ya que es posible que la
relacin entre ambas variables en caso de existir, pueda no ser lineal. En nuestro ejemplo
2, si parece cumplirse una relacin lineal entre la Ganancia y la Cantidad en publicidad.



El objetivo de la regresin lineal simple es encontrar la mejor recta de ajuste entre todas
las posibles, dentro de la nube de puntos. La mejor recta de ajuste ser aquella que
minimice las distancias verticales entre cada punto y la recta, calculndose normalmente
por el mtodo de mnimos cuadrados. De este modo conseguiremos una
ecuacin para la recta de regresin de Y (variable dependiente) en funcin de X (variable
independiente) de la forma bX a Y + =

En nuestro ejemplo, el problema radica en


estimar a (constante de la recta) y b (pendiente de la recta) de modo que podamos
construir la ecuacin o recta de regresin que minimice esas distancias.



Estimacin de la ecuacin de regresin muestral.
Consiste en determinar los valores de "a" y "b " a partir de la muestra. El mtodo de
estimacin es el de Mnimos Cuadrados, mediante el cual se obtiene:




Luego, la ecuacin de regresin muestral estimada es: bX a Y + =

,
que se interpreta:
a es una constante y es el valor estimado de la variable Y cuando la variable X = 0 ,
b es el coeficiente de regresin. Indica el nmero de unidades en que vara Y cuando se
produce un cambio, en una unidad, en X (pendiente de la recta de regresin). Un valor negativo
de b sera interpretado como la magnitud del decremento en Y por cada unidad de aumento en
X.

) ( publicidad en Cantidad b a Ganancia + =



( )( )
( )

=
2
2
i i
i i i i
X X n
Y X Y X n
b
y X b Y a =


92
Ej: 3 En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
determinar los coeficientes de regresin del ejemplo 2.
Realice los clculos necesarios o (use la calculadora Mode REG Lin)

X Y XY X
2
Y
2
3,6 12,2
4,8 14,4
9,7 22,6
12,.6 28,4
10,8 27,6
18,2 40,2
10,0 25,8
16,6 34,5
x = 86,3 y = 205,7 xy = 2550,52 x
2
= 1112,29 y
2
= 5907,21

Sustituyendo en las frmulas correspondientes,












Por lo tanto la ecuacin ajustada de regresin es:


El coeficiente estimado de regresin b se calcul en 1.83, lo que indica que por cada
incremento de una unidad en la Cantidad de publicidad (es decir por cada cien $), en
promedio la Ganancia del negocio aumenta en 1.83 cientos de dlares es decir en $183
aproximadamente. El valor de a se interpretara como el valor obtenido, en promedio,
para la Ganancia, cuando la Cantidad en publicidad es cero.

Estimacin de un valor esperado de Y para un valor de X.
Se utiliza la ecuacin de regresin para estimar o predecir valores de Y, dado algn valor de X.

Ej: 4 Cunto se espera que sea la Ganancia del negocio (en promedio), si se invirtieron
20.5 (cientos de $) en publicidad?
Sustituyendo el valor de inters en la ecuacin:

(cientos de $) Es decir la Ganancia esperada
en el negocio es de $4350,5
( )( )
( )
( ) ( )( )
( ) ( )
2 2
2
3 , 86 29 , 1112 8
7 , 205 3 , 86 52 , 2550 8

=


i i
i i i i
X X n
Y X Y X n
b
828343547 , 1
63 , 1450
25 , 2652
69 , 7447 32 , 8898
91 , 17751 16 , 20404
= =

= b
83 , 1 ~ b
|
.
|

\
|
= =
8
3 , 86
828343547 , 1
8
7 , 205
X b Y a
989243984 , 5 72325602 , 19 7125 , 25 = = a
99 , 5 ~ a
X Y 83 , 1 99 , 5

+ =
X Y 83 , 1 99 , 5

+ =
505 , 43 ) 5 , 20 ( 83 , 1 99 , 5

= + = Y


93
1. Error estndar de la estimacin.
Representa una medida de la variacin en torno a la recta ajustada de regresin y se mide
en unidades de la variable dependiente.
Frmula.




Ej: 5 Calcule e interprete el error estndar de estimacin del Ejemplo 2.




Es decir si la Ganancia esperada en el negocio fue de $4350.5 cuando se invirtieron
$2050 con un error estndar de $141,14 aproximadamente.

2. Coeficiente de Correlacin.
Es la herramienta estadstica que podemos usar para describir el grado en el que una
variable esta linealmente relacionada con otra. Al trabajar con dos variables cuantitativas
podemos estudiar la relacin que existe entre ellas mediante la correlacin y la regresin.
Aunque los clculos de ambas tcnicas pueden ser similares en algunos aspectos e incluso
dar resultados parecidos, no deben confundirse. En la correlacin tan solo medimos la
direccin y la fuerza de la asociacin de una variable frente a la otra, pero nunca una
relacin de causalidad. Slo cuando tenemos una variable que es causa o depende de otra,
podremos realizar una regresin. En esta unidad estudiaremos el coeficiente de correlacin
ms utilizado, como es el Coeficiente de Pearson. Abordamos un ejemplo de regresin lineal
simple y cmo se interpretan sus resultados.
El coeficiente de correlacin de Pearson (r) puede tomar valores entre -1 y +1, de modo
que un valor de r positivo nos indica que al aumentar el valor de una variable tambin
aumenta el valor de la otra (Figura 1A), y por el contrario, r ser negativo si al aumentar
el valor de una variable disminuye la otra (Figura 1B). La correlacin ser perfecta si r = 1,
en este caso los puntos formarn todos una recta. Es importante a priori determinar qu
valor de r vamos a considerar como relevante, puesto que una correlacin tan baja como r
= 0,07 sera significativa con un tamao muestral de unas 1000 personas. Adems es una
medida adimensional por lo que no posee unidades.

A

B


6
) 52 , 2550 ( 828343547 , 1 ) 7 , 205 ( 989243984 , 5 21 , 5907
=
YX
S
41396183 , 1 999288057 , 1
6
6154 . 995728347 , 11
= = =
YX
S
$) ( 41396 , 1 de cientos S
YX
~
2
2


=

n
Y X b Y a Y
S
i i i i
YX



94
Frmula:



Ej: 6 Determine e interprete el Coeficiente de Correlacin del Ejemplo 2.
Sustituimos en la frmula, los clculos correspondientes.

( )( )
( ) ( )
( )( )
( ) ( )
(

=
(
(

(
(


8
7 , 205
21 , 5907
8
3 , 86
29 , 1112
8
7 , 205 3 , 86
52 , 2550

2 2 2
2
2
2
n
Y
Y
n
X
X
n
Y X
Y X
r
i
i
i
i
i i
i i


| || |
990249517 , 0
7956693 , 334
53125 , 331
1402 , 112088
53125 , 331
14875 , 618 32875 , 181
98875 , 2218 52 , 2550
= = =

= r


La cercana a +1 implica una asociacin fuerte entre la Ganancia (en cientos de $) y la
Cantidad en publicidad (en cientos de $) del negocio.

El clculo del coeficiente de correlacin de Pearson dio como resultado 0,9902,
indicando que la asociacin es positiva y por tanto valores altos en la Ganancia se
corresponden a su vez con valores altos en la Cantidad en publicidad. Sin embargo slo
con la correlacin no tendramos la suficiente informacin si quisiramos hacer
predicciones de los valores de la Ganancia en funcin de la Cantidad en publicidad del
negocio.

Coeficiente de Determinacin ) (
2
r y No Determinacin ) - (1
2
r
Mide la proporcin de variacin que se explica con la variable independiente en el modelo.
En este ejemplo
9806 , 0 980594107 , 0 ) 990249517 , 0 (
2 2
~ = = r

Significa que el 98.06% de la variacin en la Ganancia (en cientos de $) del
negocio se explica por la variabilidad en la Cantidad en publicidad (en cientos de $).
Slo el 1.94% de la variacin en la Ganancia se puede explicar por otros factores
ajenos a la Cantidad en publicidad tales como

3. Estimacin del Intervalo de Confianza de la media de Y ( ) para un valor de X.
Un examen de la ecuacin indica que el ancho del intervalo de confianza depende de varios
factores. Para un nivel dado de confianza, el aumento en la variacin alrededor de la recta
de regresin, medida con el error estndar de la estimacin, da por resultado un intervalo
ms ancho. Pero, como sera de esperar, el tamao aumentado de la muestra reduce el
ancho del intervalo. As, mismo, el ancho del intervalo vara tambin con diferentes valores
YX

( )( )
( ) ( )
(
(

(
(


n
Y
Y
n
X
X
n
Y X
Y X
r
i
i
i
i
i i
i i
2
2
2
2




95
de X. Cuando se predice Y para los valores de X cercanos a , el intervalo es mucho ms
estrecho que para las predicciones de valores de X ms distantes de la media.






Ej: 7 Encuentre una estimacin de intervalo con 95% de confianza, para la ganancia
promedio si se tuvo una inversin de $800 en publicidad.

Calculamos primero el valor de


Con la tabla de la distribucin t de Student determinamos.



Sustituimos en la formula, los valores encontrados anteriormente.











Por lo tanto se estima que la ganancia promedio estar entre $1956 y $2170
aproximadamente, si se invirtieron $800 en publicidad, con una confianza de 95%.


4. Inferencia acerca de los parmetros de Regresin y Correlacin.
Se puede determinar si existe o no relacin significativa entre las variables X y Y al probar
si
1
| (la pendiente real) es o no igual a cero.







$) ( 8

de cientos X para Y
i
=
54 , 20 ) 8 ( 83 , 1 99 , 5

= + =
i
Y
2,45 t
6 2 8 2
025 , 0
2
05 , 0 95 , 0 1

0,025;6
=

= = =
= = =
n gl
o
o o
( )
( )

+

n
X
X
X X
n
S t Y
i
i
i
YX
n
i 2
2
2
2 ,
2
1

o

( )
( )

+

n
X
X
X X
n
S t Y
i
i
i
YX
n
i 2
2
2
2 ,
2
1

o
( )
( )
( )
07 , 1 63 , 20 069430734 , 1 63 , 20
32875 , 181
77015625 , 7
8
1
13 , 1 45 , 2 63 , 20
8
3 , 86
29 , 1112
) 7875 , 10 8 (
8
1
13 . 1 . 45 , 2 63 , 20
2
2
=
+ =
(
(
(
(

+
| | | | 21,70 , 19,56 1,07 63 , 20 e e
YX YX

Mtodo 1: Para la Pendiente

1
|

Estadstico de prueba
1
1
b
S
b
t =
donde
( )
2
2
1
n
X
X
S
S
i
i
YX
b


=




96









Ej: 8 Con un nivel de significacin de 0,05. Hay relacin lineal entre las variables en
estudio? (Aplique los tres mtodos)






ACTIVIDAD DE AUTOAPRENDIZAJE N 14

1. El gerente de marketing de una cadena de tiendas de autoservicio quiere determinar
efecto del espacio en las estanteras, sobre las ventas de alimentos para animales
domsticos. Se seleccion una muestra aleatoria de 9 tiendas de igual tamao cuyos
resultados se muestran en seguida.

Espacio en estantera (pies
2
) 5 6 8 4 9 8 10 12 15
Ventas semanales (miles de $) 1.6 2.2 1.4 1.9 2.4 2.8 2.6 3.1 4.5

a. Identifique las variables.
b. Presente estos datos en un diagrama de dispersin.
c. En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
estimar los coeficientes de regresin e interprtelos.
d. Prediga las ventas semanales (en miles de $) de alimentos para animales domsticos
para una tienda con 7 pies
2
de estantera para esos alimentos.
e. Calcule e interprete el coeficiente de correlacin, determinacin y no determinacin.
f. Calcule e interprete el error estndar de la estimacin.
g. Encuentre una estimacin de intervalo con 95% de confianza en las ventas semanales
promedio de una tienda que tiene 8 pies
2
de estantera.
h. Con un nivel de significacin de 0,05. Hay una relacin lineal entre el espacio en
estantera y las ventas?

Mtodo 2: Estimacin del intervalo de confianza para:

1 2 ,
2
1 b
n
S t b

o


Mtodo 3: Para la Correlacin
Estadstico de prueba

2
1
2

=
n
r
r
t




97
2. El gerente de personal de una empresa considera que puede haber una relacin entre el
ausentismo y la edad, y desea usar la edad de un empleado para predecir el nmero de das
de ausencia durante un ao calendario. Para lo cual seleccion una muestra aleatoria de 10
empleados, con los resultados que se muestran a continuacin.

Edad 27 61 37 23 46 29 36 64 40 50
Das ausentes 15 6 10 18 9 14 11 5 8 9

a. Identifique las variables.
b. Presente estos datos en un diagrama de dispersin.
c. En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
estimar los coeficientes de regresin e interprtelos.
d. Cuntos das en promedio predecira usted que va a estar ausente un empleado de 45
aos de edad?
e. Calcule e interprete el coeficiente de correlacin, determinacin y no determinacin.
f. Calcule e interprete el error estndar de la estimacin.
g. Encuentre una estimacin de intervalo con 95% de confianza del promedio de das de
ausencia de un empleado de 40 aos de edad.
h. Con un nivel de significacin de 0,05. Hay una relacin lineal entre la edad y el
ausentismo?

3. El contralor de una cadena de tiendas de departamentos quiere predecir el saldo de las
cuentas al final del perodo de facturacin con base en el nmero de transacciones
efectuadas durante el perodo de facturacin. Se seleccion una muestra aleatoria de 12
cuentas, con los resultados dados a continuacin.

N de transacciones 1 2 3 4 5 6 5 7 8 9 11 12
Saldo de la cuenta ($) 15 36 40 69 78 84 75 100 175 120 150 198

a. Identifique las variables.
b. Presente estos datos en un diagrama de dispersin.
c. En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
estimar los coeficientes de regresin e interprtelos.
d. Prediga el saldo de la cuenta, para una cuenta que ha tenido 5 transacciones en el
ltimo periodo de facturacin.
e. Calcule e interprete el coeficiente de correlacin, determinacin y no determinacin.
f. Calcule e interprete el error estndar de la estimacin.
g. Encuentre una estimacin de intervalo con 95% de confianza del saldo promedio de una
cuenta en la cual hubo cinco transacciones en el ltimo periodo de facturacin.
h. Con un nivel de significacin de 0,05. Hay una relacin lineal entre el numero de
transacciones y el saldo de la cuenta?





98
4. Una mujer desea abrir una pequea tienda de ropa. Antes de seleccionar un local, le
gustara poder pronosticar la utilidad (en dlares) que se puede esperar que logre la tienda
por pies cuadrado de exhibicin y venta. Ella recolecta la siguiente informacin de otros
propietarios de tiendas comparables.

Tamao de la tienda (cientos de pies
2
) 35 22 27 16 28 12 40 32
Utilidad (miles de $) 20 15 17 9 16 7 22 23

a. Identifique las variables.
b. Presente estos datos en un diagrama de dispersin.
c. En el supuesto de una regresin lineal, utilice el mtodo de mnimos cuadrados para
encontrar e interprete los coeficientes de regresin a y b . Cul es la ecuacin de
regresin estimada?
d. Dibuje en el diagrama de dispersin la ecuacin de la recta estimada.
e. Calcule e interprete el coeficiente de correlacin, determinacin y no determinacin.
f. Qu utilidad espera percibir de una tienda de tamao 1500 pies
2
?
g. Qu porcentaje de la variacin total en las utilidades se atribuye a diferencias en el
tamao variable de las tiendas?
h. Calcule e interprete el error estndar de la estimacin.
i. Encuentre una estimacin de intervalo con 95% de confianza para la utilidad promedio
si se tiene una tienda de 1500 pies
2
.
j. Con un nivel de significacin de 0,05. Hay una relacin lineal entre el tamao de la
tienda y la utilidad?


Referencias.
Walpole, Ronald E., Myers, Raymond H., y Myers, Sharon L. (1998).
Probabilidad y estadstica para Ingenieros. (6. ed.). Mxico: PrenticeHall.
Johnson, R. (1988). Estadstica Elemental. (4. ed.). Mxico: Iberoamrica.

Mason, R., y Lind, D. (1998). Estadstica para Administracin y
Economa. (8. ed.). Mxico: Alfaomega.

Newbold, P., Carlson, W., y Thorne, B. (2008). Estadstica para
Administracin y Economa. (6. ed.). Madrid: Pearson Educacin.

Conde, Carlos. (2010). Estadstica Descriptiva. Recuperado el 24 de junio de 2012 de
http://www.es.crribd.ci/descriptiva/.pdf.

Navarro, Alfredo. (2010). Probabilidades. Recuperado el 2 de julio de 2012 de
http://www.profesorenlinea.cl/matematica/probabilidades.htm

Arroyo Cervantes, G. (2008). Inferencia Estadstica. Recuperado el 12 de agosto de
2012 de http://es.scribd.com/doc/43058695/PRUEBA-DE-HIPOTESIS.

Becerra Espinoza, J.M. (2009). Regresin y Correlacin Lineal simple. Recuperado
el 18 de agosto de 2012, de http://www.eumed.net/cursecon/medir/index.htm