Vous êtes sur la page 1sur 96

Indice

Estadstica Descriptiva

1. Introducci
on
1.1. Estadstica Descriptiva e Inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Conceptos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3. Etapas de una Investigacion Estadstica . . . . . . . . . . . . . . . . . . . . . . . . .

4
4
4
5

2. Muestreo
2.1. Conceptos basicos . . . . .
2.2. El Muestreo . . . . . . . .
2.3. Muestreo Aleatorio Simple
2.4. Muestreo Estratificado . .

.
.
.
.

6
6
6
6
7

variables
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8
8
8
8

3. Clasificaci
on de
3.1. Nominales .
3.2. Ordinales .
3.3. Intervalares

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

4. Organizaci
on de la Informaci
on

5. Medidas de Tendencia Central y Dispersi


on
5.1. Medidas de Tendencia Central . . . . . . . . . .
5.2. Medidas de Tendencia Central y Dispersion para
5.2.1. Datos no agrupados . . . . . . . . . . . .
5.2.2. Datos agrupados . . . . . . . . . . . . .
6. Estadsitica Bivariada
6.1. Frecuencia Absoluta y Frecuencia Relativa . .
6.2. Tablas de Contingencia . . . . . . . . . . . . .
6.3. Distribuciones Marginales . . . . . . . . . . .
6.4. Distribuciones Condicionales . . . . . . . . . .
6.5. Independencia . . . . . . . . . . . . . . . . . .
6.6. Asociacion, Dependencia o Correlacion . . . .
6.6.1. Indicadores de Asociacion: Covarianza
6.6.2. Indicadores de Asociacion: Correlacion
6.7. Ajuste de Curvas . . . . . . . . . . . . . . . .
6.7.1. Regresion Lineal Simple . . . . . . . .
6.7.2. Ajuste Exponencial . . . . . . . . . . .
6.7.3. Ajuste Polinomial . . . . . . . . . . . .
6.7.4. Otros Ajustes . . . . . . . . . . . . . .

II

Probabilidades

.
.
.
.
.
.
.
.
.
.
.
.
.

. . . . . . . . . . .
el Nivel Intervalar
. . . . . . . . . . .
. . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

12
12
12
12
13

.
.
.
.
.
.
.
.
.
.
.
.
.

15
15
15
15
16
17
17
17
18
20
20
21
21
21

22
1

7. Introducci
on
8. Modelo de Probabilidad
8.1. Espacio Muestral . . . . . . . .
8.2. Eventos . . . . . . . . . . . . .
8.3. Medida de Probabilidad . . . .
8.4. Espacios Probabilsticos Finitos

22

.
.
.
.

26
26
26
28
30

9. Probabilidad Condicionada e Independencia


9.1. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2. Probabilidad Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32
32
35
35

10.Variables Aleatorias
10.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . .
10.2. Variables Aleatorias Discretas . . . . . . . . . . . . . . .
10.3. Variables Aleatorias Continuas . . . . . . . . . . . . . . .
10.4. Localizacion y dispersion de una variable aleatoria . . . .
10.5. Casos especiales de distribuciones probabilidad . . . . . .
10.5.1. Distribucion Bernoulli . . . . . . . . . . . . . . .
10.5.2. Distribucion Binomial . . . . . . . . . . . . . . .
10.5.3. Distribucion Geometrica . . . . . . . . . . . . . .
10.5.4. Distribucion Binomial Negativa . . . . . . . . . .
10.5.5. Distribucion Poisson . . . . . . . . . . . . . . . .
10.5.6. Distribucion Uniforme . . . . . . . . . . . . . . .
10.5.7. Distribucion Exponencial . . . . . . . . . . . . . .
10.5.8. Distribucion Normal . . . . . . . . . . . . . . . .
10.6. Funciones de Variables Aleatorias . . . . . . . . . . . . .
10.6.1. Momentos y funciones generadoras de momentos .
10.6.2. Transformacion de variables . . . . . . . . . . . .
10.7. Aproximacion de distribuciones . . . . . . . . . . . . . .
10.7.1. Aproximacion Poisson a la distribucion Binomial
10.7.2. Aproximacion Normal a la distribucion Binomial .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

38
38
40
41
42
44
44
44
45
45
46
46
47
47
53
53
54
58
58
58

.
.
.
.

59
59
61
63
66

.
.
.
.

.
.
.
.

.
.
.
.

11.Vectores Aleatorios
11.1. Distribucion Conjunta . . . . . . . .
11.2. Distribuciones Conjuntas Especiales .
11.3. Distribucion Marginal y Condicional
11.4. Esperanza y Varianza Condicional . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

12.Nociones de Convergencia

69

III

71

Inferencia Estadistica

13.Introducci
on

71
2

14.Estimaci
on Puntual
14.1. Metodo de Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.2. Metodo de Maxima Verosimilitud . . . . . . . . . . . . . . . . . . . . . . . . . . . .

73
73
74

15.Insesgamiento y eficiencia

76

16.Pruebas de Hip
otesis
16.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . .
16.2. Prueba de Hipotesis para la media . . . . . . . . . . . . .
16.3. Prueba de Hipotesis para la proporcion . . . . . . . . . .
16.4. Prueba de Hipotesis para la varianza . . . . . . . . . . .
16.5. Prueba de Hipotesis para la diferencia de medias . . . . .
16.5.1. Varianzas conocidas. . . . . . . . . . . . . . . . .
2
16.5.2. Varianzas desconocidas pero iguales.X
= Y2 =
16.5.3. Varianzas desconocidas y distintas. . . . . . . . .
16.6. Prueba de Hipotesis para la diferencia de proporciones .
16.7. Prueba de Hipotesis para la comparacion de varianzas . .

.
.
.
.
.
.
.
.
.
.

79
79
81
82
82
83
83
84
84
85
85

.
.
.
.
.

88
88
89
89
90
92

17.Estimaci
on Intervalar
17.1. Intervalo de Confianza
17.2. Intervalo de Confianza
17.3. Intervalo de Confianza
17.4. Intervalo de Confianza
17.5. Intervalo de Confianza

para
para
para
para
para

la media . . . . . . . . . . .
una proporcion . . . . . . .
la varianza . . . . . . . . . .
la diferencia de medias . . .
la comparacion de varianzas

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

Parte I

Estadstica Descriptiva
1.

Introducci
on

Por estadstica entendemos los metodos cientficos por medio de los cuales podemos recolectar,
organizar, resumir, presentar y analizar los datos numericos relativos a un conjunto de individuos u
observaciones y que nos permiten extraer conclusiones validas y efectuar decisiones logicas basadas
en dichos analisis. Utilizamos la estadstica para aquellos casos en los que tenemos una gran cantidad de observaciones y cuya aparicion se rigen solo por las leyes del azar o aleatorias.

1.1.

Estadstica Descriptiva e Inferencial

La estadstica puede subdividirse en dos amplias ramas: la estadstica inductiva o inferencial y


la estadstica deductiva o descriptiva.
Estadstica Inductiva o Inferencial
Entendemos por estadstica inductiva si a partir de una m.a., suficientemente representativa del
universo, podemos inferir (inducir) conclusiones estadsticamente validas para todo el universo. Esto obliga a plantear simultaneamente las condiciones bajo las cuales dichas conclusiones son validas.
Estadstica Descriptiva o Deductiva
Entendemos por estadstica descriptiva si al analizar una m.a., solo se pueden obtener conclusiones validas para la muestra, sin que se puedan o se requieran generalizar sus resultados para todo
el universo.

1.2.

Conceptos B
asicos

Universo: Es el conjunto de todos los datos u observaciones de un suceso. El universo se designa usualmente con la letra U. El universo puede ser finito, infinito contable e infinito no contable
(dependiendo del tipo de universo es el tipo de analisis del problema).
Poblaci
on: Elementos del universo que tienen una caracterstica com
un y es la que tratamos
de estudiar.
Muestra Aleatoria (m.a.): Es un subconjunto de la poblacion, donde sus elementos son
escogidos al azar (no existe relacion en la eleccion de los elementos).

1.3.

Etapas de una Investigaci


on Estadstica

A
un cuando los tipos de problemas a los cuales puede aplicarse la estadstica matematica son
bastante heterogeneos, en muchos casos los pasos de una investigacion estadstica son similares.
a) Formulaci
on del problema. Para investigar con exito un problema dado, primero tenemos
que crear conceptos precisos, formular preguntas claras e imponer limitaciones adecuadas al
problema, tomando en cuenta el tiempo y dinero disponible y la habilidad de los investigadores.
Algunos conceptos tales como: Artculo defectuoso, servicio satisfactorio a la clientela, observaciones demograficas, grados de pureza de un mineral, tipo de trafico, etc., pueden variar de
caso en caso, y en cada situacion especfica, necesitamos coincidir en definiciones apropiadas
para los terminos que se incluyen.
b) Dise
no del experimento. Es deseable obtener un maximo de informacion empleando un
mnimo de costo y tiempo. Esto implica determinar el tama
no de la muestra o la cantidad y
tipo de datos.
c) Experimentaci
on o colecci
on de datos. En toda investigacion esta etapa es la que consume

mas tiempo. Esta debe aplicarse con reglas estrictas y con pautas preestablecidas.
d) Tabulaci
on y descripci
on de los resultados. Los datos experimentales se ilustran en
diagramas, graficos, pictogramas, etc. Obteniendose ademas, medidas descriptivas que representen el proceso efectuado.
e) Inferencia estadstica y formulaci
on de la respuesta. Al aplicar el metodo estadstico
seleccionado en la etapa b), podemos inferir conclusiones obtenidas de la muestra acerca de
la poblacion respectiva.

2.
2.1.

Muestreo
Conceptos b
asicos

Marco Muestral: El Marco Muestral es el conjunto de unidades del cual se seleccionara una
muestra.
Unidades de Muestreo: Las unidades del Marco Muestral se llaman Unidades de Muestreo.
Es importante notar que toda unidad de la poblacion debe estar asociada a una y solo una unidad del
Marco Muestral. Esto nos permitira dise
nar mecanismos de seleccion de la muestra de tal forma que
toda unidad de la poblacion se encontrara en, al menos, una de las posibles muestras seleccionadas
y en el caso del Muesteo Probabilstico nos permitira inducir una probabilidad de seleccion a cada
elemento de la poblacion.

2.2.

El Muestreo

El Muestreo es la disciplina que trata con el conjunto de metodos, tecnicas y procedimientos


para tomar u obtener una particular muestra a efectos de realizar inferencias inductivas a partir de
la misma. Existen dos grandes categoras de muestreo: el Muestreo Probabilstico y el Muestreo No
Probabilstico.
En el Muestreo No Probabilstico, pueden existir unidades de la poblacion que no pueden ser
seleccionadas en ninguna de las muestras posibles, o bien, aunque exista una probabilidad de seleccion positiva para cada una de estas unidades de la Poblacion, esta probabilidad es desconocida.
Un ejemplo de este tipo de Muestreo No Probabilstico es el Muestreo por Cuotas, muy utilizado
en los estudios de mercadeo y en algunas encuestas de opinion.
Con el Muestreo No Probabilstico, en general, las observaciones para una muestra particular
se obtienen mas rapidamente y a menor costo que en el Muestreo Probabilstico. Por otra parte,
los errores ajenos al muestreo (errores en las operaciones de recoleccion y procesamiento de
la informacion), son mas faciles de controlar cuando se utiliza Muestreo Probabilstico. En todo
caso, solo con el Muestreo Probabilstico es posible obtener indicadores de confiabilidad del error
inferencial de cada estimacion obtenida a traves de la muestra.

2.3.

Muestreo Aleatorio Simple

Es un dise
no muestral bastante utilizado cuando se cuenta con una lista o directorio para usar
como Marco Muestral. Se distinguen dos casos de m.a.s.: Muestreo sin Reemplazo y Muestreo con
Reemplazo. De las N unidades de la poblacion se selecciona al azar (igual probabilidad para cada

unidad) una unidad. Esta


se separa (sin reposicion) y de las N-1 restantes unidades de la poblacion
se selecciona, tambien al azar, una segunda unidad. De las N-2 unidades restantes se vuelve a
seleccionar al azar una tercera unidad y as sucesivamente hasta completar las n unidades de la
muestra.

2.4.

Muestreo Estratificado

El Muestreo Estratificado se presenta cuando la Poblacion se encuentra particionada en L grupos y en todos y cada uno de estos grupos se aplica en forma independiente un dise
no muestral, no
necesariamente igual en todos ellos. En tal caso, los grupos de la particion se llaman Estratos y la
particion de dice que es una Estratificacion.
La Estratificacion puede tener su origen en los propios objetivos del Estudio o en la intencion de
contar con Estratos homogeneos que pueden hacer mas eficiente el Dise
no Muestral.
Ejemplos de Estratificaciones en funcion de los objetivos del estudio son, por ejemplo, las divisiones poltico administrativas (los Estratos pueden ser Regiones, Provincias, Departamentos o
Distritos, etc.) en una Encuesta Nacional, Ramas de Actividad Economica en una Encuesta Industrial; P
ublico y Privado en una Encuesta sobre Educacion, etc.
Ejemplos de Estratos creados para obtener una mayor homogeneidad en cada uno de ellos son:
Empresas Grandes, Medianas, Peque
nas y Micro, en una Encuesta Industrial: Manzanas con hogares de ingresos mayoritariamente altos, medios y bajos, etc.

3.

Clasificaci
on de variables

Hay que hacer notar que toda variable puede clasificarse en uno de los niveles de medicion, los
que se daran en orden creciente en cuanto a la riqueza de los datos.

3.1.

Nominales

La variable induce en la poblacion una subdivision y los datos s e pueden clasificar en clases,
donde cada clase esta completamente definida y diferenciada de las demas.
La recopilacion se reduce a contar el n
umero de individuos de la muestra que pertenecen a cada
clase.

3.2.

Ordinales

En este nivel la variable de clasificacion tiene un orden implcito (admite grados de calidad u
ordenamiento) entre grupos o clases, esto significa que existe una relacion de orden entre las clases.
No es posible cuantificar la diferencia entre los individuos pertenecientes a una misma clase.

3.3.

Intervalares

La informacion obtenida en este caso es de tipo cuantitativo o numerico y es posible agruparla


en intervalos. En este nivel se considera no solo la informacion perteneciente al orden, sino ademas,
el tama
no relativo de los intervalos a que pertenece cada uno de los individuos. En este nivel es
posible cuantificar la diferencia de dos individuos pertenecientes al mismo intervalo y tambien a
intervalos distintos. En esta escala esta involucrado el concepto de unidad de distancia y la distancia
entre dos medidas puede ser expresada en funcion de esta unidad.

4.

Organizaci
on de la Informaci
on

Una coleccion de datos tomados de un suceso (sometido a estudio) nada nos dice si no lo ordenamos convenientemente para extraer as la informacion que se desea.
Los conceptos mas usuales se detallan a continuacion:
a.- El n
umero de clases o intervalos
Es una subdivision del rango en varios grupos o intervalos (se designa por la letra k),
N
umero de clases = 1 + 3.3log(n)
donde n es el n
umero total de datos. Como el n
umero de clases debe ser un n
umero entero,
este se aproxima al entero superior, identificandolo con la letra k.
b.- Intervalo o Clase
Una subdivision del rango en componentes (de acuerdo a la magnitud, atributos, etc.) se
llaman clases, categoras, intervalos o celdas. Se designan por la letra C con un subndice que
indica la clase a que pertenecen, por ejemplo C1 , C2 , . . . , Ck .
c.- Ancho del Intervalo
El ancho de la clase es la diferencia entre el lmite superior e inferior de la clase. Se designa
por la letra . En general, el ancho de cada clase puede o no ser del mismo tama
no. En el caso
de que todos sean iguales el valor de se define como:
R+1
k
donde R = Dato mayor en la muestra - dato menor de la muestra
El valor de I se aproxima al entero superior (cuando los datos son enteros).
I=

d.- Marca de la Clase


La marca de clase es el punto medio de la clase o intervalo. Se designa por las letras M Ci (el
subndice indica la clase a la que le corresponde).
e.- Frecuencia Absoluta
El n
umero de datos que pertenecen a una clase se llama frecuencia absoluta de la clase. Se
designa por la letra n con un subndice (que indica la clase a que pertenece) por ejemplo:
n1 , n2 , . . . , nk .
Nota:
La suma de todas las frecuencias absolutas debe ser igual al n
umero total de datos n.
f.- Frecuencia Relativa
A la proporcion de datos que pertenecen a una clase con respecto al total se llama frecuencia
relativa. Se designa por la letra f con un subndice (que indica la clase a que pertenece). Por
ejemplo: f1 , f2 , . . . , fk .
Notas:
9

i. La suma de todas las frecuencias relativas debe ser igual a 1.


ii. Frecuencia relativa = frecuencia absoluta/n
umero total de datos =

ni
n

g.- Frecuencia Absoluta Acumulada


El n
umero de datos que estan desde la primera clase hasta la clase i-esima, se llama frecuencia
absoluta acumulada de la clase i-esima. Se designa por la letra N con un subndice (que indica
la clase a que pertenece) por ejemplo: N1 , N2 , . . . , Nk .
Nota:
N1 = n1
N2 = n1 + n2 = N1 + n2
..
.
Ni = n1 + n2 + . . . + ni = Ni1 + ni

i = 1, 2, . . . , k.

y debe verificarse que Nk = n (n


umero total de datos)
h.- Frecuencia Relativa Acumulada
El n
umero de datos que estan desde la primera clase hasta la clase i-esima con respecto al
total de datos, se llama frecuencia relativa acumulada de la clase i-esima. Se designa por la
letra F con un subndice (que indica la clase a que pertenece) por ejemplo: F1 , F2 , . . . , Fk .
Nota:
F1 = f1 = Nn1
F 2 = f1 + f2 = F 1 + f2 =
..
.

N2
n

Fi = f1 + f2 + . . . + fi = Fi1 + fi =

Ni
n

i = 1, 2, . . . , k.

y debe verificarse que Fk = 1 (n


umero total de datos).
Ejemplo 4.1 Las notas obtenidas en un certamen, en escala 1 a 7 fueron:
3, 5, 6, 3, 4, 4, 7, 2, 1, 2, 3, 3, 4, 4, 6, 2, 7, 5, 3, 4, 4, 1, 2, 2, 3, 5, 4, 6, 5, 5.
Lo que se puede tabular como:
Clase
C1
C2
C3
C4
C5
C6
C7

Nota
1
2
3
4
5
6
7
Suma

ni
2
5
6
7
5
3
2
30

fi
Ni
0.067 2
0.167 7
0.200 13
0.233 20
0.167 25
0.100 28
0.067 30
1

10

Fi
0.067
0.233
0.233
0.667
0.833
0.933
1

Ejercicios 1 En una empresa se considera la siguiente muestra correspondiente a la resistencia de


50 lotes de algodon medidas en libras necesarias hasta romper una madeja.
74
105
79
101
110

87 99
110 99
105 96
96 97
94 101

88
94
93
103
97

90
104
93
108
106

101 91
97 90
90 91
90 102
86 88

83 97
88 89
102 94
91 76
97 107

94
90
106
109
107

1. Encuentre el n
umero de clases y el rango de la muestra
2. Determine la amplitud de la clase
3. Construya un cuadro resumen indicando intervalos, marca de clase, frecuencias absoluta, relativa, absoluta acumulada y relativa acumulada.
4. Grafique las frecuencias absolutas. Comente.

11

5.

Medidas de Tendencia Central y Dispersi


on

5.1.

Medidas de Tendencia Central

La idea es resumir los datos en un solo valor; un valor que represente a todo un conjunto
de datos, este tiene que ser un n
umero o una clase hacia el cual tienen tendencia a concentrarse
mayoritariamente el conjunto de datos, usualmente este se ubica en las clases mas o menos centrales,
o sea, que es un valor central o de posicion central a cuyo alrededor se distribuyen todos los datos
del conjunto, de all el nombre de Medidas de Tendencia Central (M.T.C.). Las mas comunes son
la mediana, moda, media o promedio, media geometrica, etc.
Estas y otras medidas nos sirven para resumir la informacion presentada en cuadros y poder
relacionar y comparar entre s, de una manera sencilla, un conjunto de distribuciones de frecuencias.
Una vez determinadas las Medidas de Tendencia Central de una distribucion, nos interesa determinar como se reparten (dispersan, desvan) los datos a uno y otro lado de la medida central. 0
sea, es necesario cuantificar la representatividad de la medida de tendencia para poder caracterizar
la distribucion. Si la dispersion es peque
na indica gran uniformidad y la informacion tiende a concentrarse en torno a la medida central, por el contrario, una gran dispersion indica que los datos
estan alejados de ella.
Las medidas de dispersion mas usuales son: desviacion media, desviacion tpica o estandar,
rango, rango semi-intercuartlico, rango percentil, etc.

5.2.

Medidas de Tendencia Central y Dispersi


on para el Nivel Intervalar

5.2.1.

Datos no agrupados

En este nivel la medida central mas representativa es la media o promedio. Un promedio es un


valor, que es tpico o representativo de un conjunto de datos. Como tales valores tienden a situarse
en el centro del conjunto de los datos ordenados seg
un su magnitud, los promedios se conocen
tambien como medidas de centralizacion.
a. Media
La media aritmetica o media de un conjunto de n n
umeros X1 , X2 , . . . , Xn se denota por X
y se define como
n
1X
X=
Xi
n i=1
b. Moda
La moda cruda de una serie de n
umeros es aquel que se presenta con la mayor frecuencia, es
decir, es el valor mas com
un.
Una distribucion que tiene una sola moda se llama unimodal (caso mas usual). Es posible
encontrar variables bimodales, trimodales, etc.

12

Propiedades de la Moda:
- Puede no existir y cuando existe no es necesariamente u
nica.
- No se ve afectada por valores extremos.
c. Mediana
Es el valor de la variable que ocupa la posicion central , en un conjunto de datos ordenados.
Si el n
umero de observaciones es impar, es la observacion central de los valores, una vez que
estos han sido ordenados en orden creciente o decreciente. Si el n
umero de las observaciones
es par, se calcula como el promedio de las dos observaciones centrales.
Propiedades de la Mediana:
- La mediana en un conjunto de datos es u
nica
- No es sensible a la presencia de datos extremos
- En un conjunto de datos, la mitad de ellos son iguales o menores que la mediana, y la otra
mitad, iguales o mayores que la mediana.
d. Percentiles
El percentil q es un valor de la variable tal que el q % de los datos es menor que el y, por lo
tanto, el (1-q) % es mayor. Son una medida de posicion que no reflejan la tendencia central.
Si X1 , X2 , . . . , Xn es una secuencia ordenada de datos, el percentil q se encuentra en la posicion
q(n + 1)
100
e. Varianza
Es una constante que representa una medida de dispersion media de una variable aleatoria X
, respecto a su valor medio. Puede interpretarse como medida de variabilidad de la variable.
Se define la varianza de una serie de observaciones X1 , . . . , Xn como
n

1X
(Xi X)2
s =
n i=1
2

o equivalentemente
n

1X 2
2
s =
Xi X
n i=1
2

5.2.2.

Datos agrupados

a. Media
Si los datos estan ordenados en una tabla (datos agrupados) en las que se conocen las respectivas marcas de clase M Ci , y ellas se presentan con frecuencias absolutas ni , la media
aritmetica es:
k
1X
X=
ni M C i
n i=1

13

b. Moda
La moda puede obtenerse mediante el n
umero dado por:
1
M oda = lmo +
I
1 + 2
donde:
mo = clase modal (clase con mayor frecuencia absoluta)
lmo = lmite inferior del intervalo de la clase modal
1 = nmo - n
mo
2 = nmo - n+
mo
nmo = es la frecuencia de la clase modal
n+
mo = es la frecuencia de la clase posterior a la clase modal
n
mo = es la frecuencia de la clase anterior a la clase modal
I = ancho del intervalo de la clase modal.
c. Mediana
Para datos agrupados, el n
umero mediana viene dada por:
Me = lMe +

n
2

NM
e
I
nM e

donde:
lMe = lmite inferior del intervalo de la clase mediana
n = n
umero total de datos
NMe = frecuencia absoluta acumulada hasta la clase anterior a la clase mediana
nMe = es la frecuencia de la clase mediana
I = ancho del intervalo de la clase mediana.
d. Percentiles
Para datos agrupados, nos referimos a la clase en el cual se encuentra al menos el q % de los
datos, digamos Ci , por lo que
Pq = li +

n q/100 Ni1
I
ni

donde:
li = lmite inferior de la clase a la cual pertenece el percentil q
I = ancho del intervalo Ci .
e. Varianza
La desviacion estandar o tpica de datos contenidos para datos agrupados con sus respectivas
frecuencias absolutas ni , y las marcas de clase M Ci , se representa por:
k

1X
s =
ni (M Ci X)2
n i=1
2

o equivalentemente
k

1X
2
s =
ni M Ci2 X
n i=1
2

14

6.

Estadsitica Bivariada

Ahora, supongamos que queremos estudiar el comportamiento de la variable de clasificacion


bidimensional (X, Y ), asociada a dos variables de clasificacion unidimensionales X e Y , respectivamente, en una muestra de tama
no n de la poblacion. Entonces dividimos la muestra en r clases Ai ,
seg
un la variable X, y en s clases Bj , seg
un Y .
Llamamos nij al n
umero de elementos de la muestra que pertenecen simultaneamente a la clase
Ai y la clase Bj . Podemos luego considerar una clase o modalidad Ai Bj formada por elementos de
la muestra que pertenecen simultaneamente a Ai y a Bj . Se observa que hay r s modalidades Ai Bj .

6.1.

Frecuencia Absoluta y Frecuencia Relativa

Definiciones de interes:
nij : frecuencia absoluta del n
umero de elementos pertenecientes a Ai Bj
fij : frecuencia relativa del n
umero de elementos en Ai Bj con respecto al total n, donde
nij
fij =
,
i = 1, . . . , r;
j = 1, . . . , s
n

6.2.

Tablas de Contingencia

Cuadro de doble entrada donde se puede resumir la informacion acerca de las frecuencias, ya
sean absolutas o relativas, como se muestra a continuacion:

X A1
A2
..
.
Ar

6.3.

Y
B1
n11
n21
..
.

B2
n12
n22
..
.

...
...
...
..
.

Bs
n1s
n2s
..
.

n1+
n2+
..
.

nr1
n+1

nr2
n+2

...
...

nrs
n+s

nr+
n

Distribuciones Marginales

ni+ : es el n
umero de elementos de la muestra que pertenecen a la clase Ai , sin importar la clase
Bj a la que esten asociados (suma de los valores de la fila i-esima de la tabla de contingencia de
frecuencias)
s
X
ni+ =
nij ,
i = 1, . . . , r
j=1

n+j : es el n
umero de elementos de la muestra que pertenecen a la clase Bj seg
un Y, sin importar
la clase Ai a la que esten asociados (suma de los valores de la columna j-esima de la tabla de
contin-gencia de frecuencias)
n+j =

r
X

j = 1, . . . , s

nij ,

i=1

15

fi+ : frecuencia relativa de las clases Ai sin importar las clases Bj .


fi+ =

ni+
,
n

i = 1, . . . , r

f+j : frecuencia relativa de las clases Bj sin importar las clases Ai .


f+j =

6.4.

n+j
,
n

j = 1, . . . , s

Distribuciones Condicionales

La distribucion condicional consiste en estudiar las frecuencias asociadas a las clases de una
variable cuando nos restringimos a los elementos de una clase dada seg
un la otra variable, esto es,
estudiar el comportamiento de una variable dado un valor fijo de la otra. Para calcular la proporcion
de individuos muestrales que seg
un Y caen en B, conociendo que seg
un X ya pertenecan a A, se
debe evaluar:
nB/A
fB/A =
n
donde fB/A es la frecuencia relativa condicional del subconjunto B de Y dado que X pertenece
al subconjunto A.
La distribucion de X condicionada a Y se define como
fi/j =

fi/j
nij
=
f+j
n+j

i = 1, . . . , r

y
r
X

fi/j = 1

i=1

La distribucion de Y condicionada a X se define como


fj/i =

fj/i
nij
=
fi+
ni+

j = 1, . . . , s

y
s
X

fj/i = 1

j=1

Ejemplo 6.1 Sea X la edad e Y la categora correspondiente al puesto de trabajo. Dada la siguiente
tabla de contingencia, calcular la distribucion condicional de Y, dado que X es 25-30 y 35-45.
X\Y
15-20
20-25
25-30
30-35
35-40
n+j

I
20
15
10
5
5
55

II
20
12
15
20
10
77
16

III ni+
5
45
8
35
10 35
25 50
30 45
78 210

6.5.

Independencia

Dada una informacion en una Tabla de Contingencia, se dice que las variables X e Y son
independientes, s y solo s, la frecuencia relativa conjunta es igual al producto de las frecuencias
relativas marginales.
fij = fi+ f+j
i = 1, . . . , r j = 1, . . . , s
Si las variables X e Y no son independientes entre s, se dice que existe una asociacion entre
ellas. De modo que el conocimiento de una de las variables presente alguna informacion respecto de
la otra. Nuestro objetivo es medir de alguna forma esta relacion existente y poder ademas describir
de que forma (lineal, exponencial, potencial, etc.) estan relacionadas.

6.6.

Asociaci
on, Dependencia o Correlaci
on

En estadstica Descriptiva se dice que dos variables cuantitativas estan asociadas, son dependientes, o estan correlacionadas si cuando se aumentan los valores de una variable, los valores
de la otra tienden a:
i) o bien a aumentar (y se dice que la asociacion dependencia es directa o que la correlacion es
positiva)
ii) o bien a disminuir (y se dice que la asociacion o dependencia es inversa o que la correlacion
es negativa)
Cuando no se presenta esta tendencia se dice que las variables no estan asociadas o no son dependientes o no estan correlacionadas.
La asociacion, correlacion o dependencia en Estadstica Descriptiva, no implica relacion causaefecto. En otras palabras, si cuando una variable aumenta la otra tiende a aumentar (o a disminuir)
no es posible afirmar que esta u
ltima aumenta (o disminuye) PORQUE la primera variable aumenta.
6.6.1.

Indicadores de Asociaci
on: Covarianza

La covarianza entre dos variables, X e Y esta dada por:


cov(X, Y ) =

n
X
(xi x)(yi y)

i=1

o equvalentemente
n

1X
cov(X, Y ) =
xi yi xy
n i=1
La covarianza es una medida de asociacion lineal, pero tiene la desventaja que su interpretacion
depende de las unidades de medicion.
Si cov(X,Y)> 0, la asociacion o correlacion es directa o positiva.
Si cov(X,Y)< 0, la asociacion o correlacion es inversa o negativa.
Si cov(X,Y) 0, no hay asociacion o correlacion lineal.
17

6.6.2.

Indicadores de Asociaci
on: Correlaci
on

La correlacion lineal entre dos variables se define como


n
X

(xi x)(yi y)

i=1

corr(X, Y ) = v
u n
n
X
uX
t (xi x)2
(yi y)2
i=1

i=1

Si corr(X, Y ) = 1, la correlacion es la maxima correlacion positiva o directa.


Si corr(X, Y ) = 1, la correlacion es la maxima correlacion negativa o inversa.
Si corr(X, Y ) 0, no existe correlacion o dependencia.
Una formula alternativa para calcular X,Y es
corr(X, Y ) =

sXY
sX sY

donde sX y sY son las desviaciones estandar de X e Y , respectivamente, y donde sXY es la covarianza


entre X e Y .
Otra formula alternativa es
 X  X 
X
xi y i
xi
yi /n
(X, Y ) = s
 X 2 sX
 X 2
X
x2i
xi /n
yi2
yi /n
Si bien no existe una regla general para decir si una correlacion es alta media o baja, en este
curso podemos adoptar el siguiente criterio:

18

Ejemplo 6.2 .
1. Consideremos los siguientes datos, donde X indica la temperatura media diaria en grados
Farenheit e Y , el consumo diario correspondiente de gas natural en pies c
ubicos.
X,F
Y,f t3

50
2.5

45
5.0

40
6.2

38
7.4

32
8.3

40
4.7

55
1.8

Realice un diagrama de dispersion y calcule el coeficiente de correlacion X,Y , si ademas cuenta


con las siguientes medidas de resumen:
X
X
X
X
X
xi = 300;
yi = 35,9;
x2i = 13,218;
yi2 = 218,67;
xi yi = 1431,8
2. Considere los siguientes datos donde X, representa el n
umero de sucursales que 10 bancos diferentes tienen en un area metropolitana, e Y es la correspondiente cuota del total de dep
ositos
mantenidos por los bancos.
X 198
Y 22.7

186
16.6

116
15.9

89
12.5

120
10.2

109 28
6.8 6.8

a) Construya un diagrama de dispersion entre X e Y.


b) Calcule covarianza y correlacion.

19

58
4.0

34
2.7

31
2.8

6.7.

Ajuste de Curvas

En el problema de ajuste a curvas se desea que dado un par de variables (X, Y ) encontrar una
curva que se ajuste de la mejor manera a los datos. La curva esta definida en forma parametrica, y se
deben encontrar los valores de sus parametros para hacer que alguna medida de error se minimice.
6.7.1.

Regresi
on Lineal Simple

Con la regresion lineal simple se pretende ir mas alla de ver la asociacion entre dos variables.
En concreto se quiere:
(i) Investigar la naturaleza de la asociacion.
(ii) Construir un modelo que describa la relacion entre ambas variables.
(iii) Predecir
Supongamos que un diagrama de dispersion de los datos de los puntos (xi , yi ) indica una relacion
lineal entre las variables X eY o, alternativamente, que el coeficiente de correlacion es cercano a 1
o -1. Entonces el siguiente paso es encontrar la recta L que en lag
unsentido ajuste los datos.
En general, el modelo de regresion lineal simple lo podemos plantear como la recta :
yi = a + bxi ,

i = 1, . . . , n.

(1)

donde
yi : es la variable respuesta o dependiente para el individuo i;
xi : es la variable esplicativa o independiente para el individuo i, i = 1, . . ., n.
a: representa el intercepto con el eje Y, y se interpreta como el valor que toma y cuando x =0.
b: representa la pendiente de la recta, y se interpreta como la cantidad que aumenta(disminuye) y
cuando x aumenta(disminuye) en una unidad.
La pendiente y el intercepto pueden calcularse de la siguiente manera:
b=

cov(X, Y )
rsy
=
sx
s2X

a = y b
x

Ejemplo 6.3 Considere los datos de los ejemplo 6.2 y 6.3, y encuentre la recta que se ajusta a los
datos.
Algunas veces el diagrama de puntos no indica una relacion lineal entre las variables X e Y pero
se podra observar alguna otra curva tpica y bien conocida Y = f (X) que puede aproximar los datos;
se le llama curva de aproximacion. Algunas de esas curvas tpicas son las siguientes analizamos la
relacion entres X e Y y determinamos que esta no se ajusta auna recta podemos analizar, entre
otros, los dos siguientes casos:

20

6.7.2.

Ajuste Exponencial

Si entre log(y) y x observamos una relacion lineal, usaremos la curva exponencial:


yi = aebxi ,

i = 1, . . . , n.

Este ajuste se puede reducir a una regresion lineal de la siguiente forma


log(yi ) = a0 + b0 xi ,

i = 1, . . . , n.

donde
a0 =log(a)
b0 =b
6.7.3.

Ajuste Polinomial

En este caso lo que hacemos es ajustar la relacion entre x e y a traves de un polinomio de grado
p:
yi = 0 + 1 xi + 2 x2i + 3 x3i , . . . , p xpi

i = 1, . . . , n.

Al incluir potencias de X logramos mayor flexibilidad en el modelo.


Si p=1, estamos en el caso de regresion lineal.
Si p=2, la regresion se llama cuadratica.
6.7.4.

Otros Ajustes

Hip
erbola
Si entre 1/y y x observamos un relacion lineal usaremos la hiperbola:
y=

1
a + bx

1
= a + bx
y

Curva Geom
etrica
Si entre log(y) y log(x) observamos una relacion lineal usaremos la curva potencial:
y = axb

o log(y) = log(a) + b log(x)

21

Parte II

Probabilidades
7.

Introducci
on

Uno de los problemas que deberemos considerar e intentar evaluar, es el elemento de aleatoriedad
que se asocia a la ocurrencia de ciertos eventos cuando se lleva a cabo un experimento. En muchos
casos debe tenerse la capacidad de resolver un problema de probabilidad mediante el conteo del
n
umero de casos posibles sin realmente anotar cada uno de ellos.
Teorema 7.1 Si una operacion puede realizarse de n1 formas, y si por cada una de estas una
segunda operacion puede llevarse a cabo de n2 formas, entonces las dos operaciones pueden realizarse
juntas de n1 n2 formas.
Ejemplo 7.1 Cuantos son los resultados posibles cuando se lanza un dado dos veces?
Teorema 7.2 (Principio Multiplicativo) Si una operacion puede realizarse de n1 formas, y si
por cada una de estas puede efectuarse una segunda en n2 formas, y para cada una de las dos
primeras se puede efectuar una tercera de n3 formas, y as sucesivamente, entonces la secuencia de
k operaciones pueden realizarse de n1 n2 . . . nk formas.
Ejemplo 7.2 Cuantos men
us que consisten de sopa, postre y bebida existen si se puede seleccionar
entre 4 sopas diferentes, 5 clases de postres y 4 bebidas?
Ejemplo 7.3 Cuantos n
umeros pares de tres dgitos pueden formarse con los dgitos 1, 2, 5, 6 y
9?
Con frecuencia interesa un conjunto que contiene como elmentos todos los posibles ordenes o
arreglos de un grupo de objetos. Por ejemplo, se puede desear conocer cuantos arreglos diferentes
son posibles para sentar a 6 personas alrededor de una mesa, o bien, cuantas formas diferentes
exiten de tomar 5 ramos de un total de 8.
Definici
on 7.1 Una permutaci
on es un arreglo de todos, o parte de, un conjunto de objetos.
Considerense las tres letras a, b y c. Las permutaciones posibles son abc, acb, bca, cab, bac y
cba. Se puede ver que hay 6 distintos arreglos. Con el principio multiplicativo se pueded llegar a
que la respuesta es 6 sin escribir todas las posibles combinaciones. Hay n1 = 3 posibilidades para la
primera posicion, despues n2 = 2 para la segunda y unicamente n3 = 1 posibilidades para la u
ltima,
lo que da un total de n1 n2 n3 = 3 2 1 = 6 permutaciones.
En general, se pueden acomodar n objetos distintos en n (n 1) (n 2) . . . (3) (2) (1)
formas. Este producto se representa por el smbolo n!, que se lee n factorial. Por definicion, 1! =
1 y 0! = 1.
Teorema 7.3 El n
umero de permutaciones de n distintos objetos es n!
22

El n
umero de permutaciones de las cuatro letras a, b, c y d sera de 4! = 24. Considerese ahora
el n
umero posible de ellas al tomar las cuatro letras, pero de dos a la vez. Seran ab, ad, ac, ba, ca,
bc, cb, bd, db, cd, dc. De una nueva cuenta con el Teorema 7.1, se tiene dos posiciones para llenar
con laa n1 = 4 posibilidades para la primera y, por lo tanto, n2 = 3 posibilidades para la segunda,
para un total de n1 n2 = 4 3 = 12 permutaciones. En general, n objetos distintos, si se toman r a
la vez, pueden acomodarse en n (n 1) (n2) (n r + 1) formas.
Teorema 7.4 El n
umero de permutaciones de n objetos distintos tomando r a la vez, es:
n Pr

n!
(n r)!

Ejemplo 7.4 De cuantas maneras se puede programar 3 ayudantas en 3 distintos horarios, si los
alumnos tienen 5 modulos disponibles?
Las permutaciones que se dan al acomodar objetos en un crculo se llaman permutaciones
circulares. Dos de estas no se consideran diferentes a menos que a los objetos correspondientes en
los dos arreglos les preceda o les siga un objeto diferente al avanzar en el sentido de las manecillas
del reloj. Por ejemplo, si 4 personas juegan a las cartas, no se tiene una nueva permutacion si todas
se mueven una posicion en esa direccion. Al considerar a una en un lugar fijo y acomodar a las otras
tre en 3! formas diferentes, se encuentra que hay 6 acomodos dsitintos para el juego de cartas.
Teorema 7.5 El n
umero de permutaciones de n objetos distintos agregados en un crculo es (n-1)!
Hasta ahora se han considerado permutaciones de objetos diferentes. Esto es, todos los objetos
eran distintos o totalmente distinguibles. Si consideramos la palabra OSO, entonces las 6 permutaciones de las letras de esta palabra son O1 SO2 , O1 O2 S, SO1 O2 , O2 SO1 , O2 O1 S, SO2 O1 , por lo que
u
nicamente tres son distintas. Por lo tanto, con tres letras, siendo dos iguales, se tienen 3!/2! = 3
diferentes permutaciones.
Teorema 7.6 El n
umero de permutaciones diferentes de n objetos de los cuales n1 son de un tipo,
n2 son de un tipo, . . ., nk de un k- esimo tipo, es:
n!
n1 !n2 ! nk !
Ejemplo 7.5 De cuantas formas diferentes pueden acomodarse 3 ampolletas rojas, 4 amarillas y
2 azules en un panel con 9 espacio para 9 luces?
Con frecuencia interesa el n
umero de formas en que se pueden repartir n objetos en r subconjuntos llamados celdas. La particion se logra si la interseccion de cada par posible de r subconjuntos
es el conjunto vaco y si la union de todos los subconjuntos da como resultado el conjunto original.
No importa el orden de los objetos dentro de una celda.
Teorema 7.7 El n
umero de formas de partir un conjunto de n objetos en r celdas con n1 elementos
en la primera celda, n2 elementos en la segunda, y as sucesivamente, es:


n
n!
=
n1 n2 nr
n1 !n2 ! nr !
donde n1 + n2 + + nr = n
23

Ejemplo 7.6 De cuantas formas distintas pueden 7 cientficos acomodarse en un laboratorio para
tres personas y dos laboratorios para dos personas?
En muchos problemas interesa el n
umero de formas posibles de seleccionar r objetos de un
total de n sin importar el orden. Estas selecciones se llaman combinaciones. Una combinacion es
realmente una particion en dos celdas, una de las cuales contiene los r objetos que se seleccionaron
y la otra, los (n r) objetos restantes.
Teorema 7.8 El n
umero de combinacioines de n objetos distintos, tomando r a la vez es
 
n
n!
=
r
r!(n r)!
Ejemplo 7.7 Encuentre el n
umero de comites que pueden formarse con 4 qumicos y 3 fsicos y
que comprendan 2 qumicos y 1 fsico.
Ejercicios 2 .
1. A los participantes de una convencion se les ofrecen 6 recorridos por da para visitar lugares
de interes durante los 3 das de duracion del evento. De cuantas formas puede una persona
acomodarse para hacer alguno de ellos?
2. En un estudio medico, los pacientes se clasifican en 8 formas diferentes de acuerdo con su
tipo de sangre, AB + , AB , A+ , A , B + , B , O+ , u O , y su presion sangunea (baja, alta o
normal). Encuentre el n
umero de formas posibles para clasificar un paciente.
3. Si un experimento consiste en lanzar un dado y despues seleccionar aleatoriamente una letra
del alfabeto, cuales son los posibles resultados?
4. Un estudiante de primer a
no debe tomar un curso de Ciencia, uno de Humanidades y otro de
Matematicas. Si puede escoger entre cualquiera de 6 cursos de Ciencia, 4 de Humanidades y
4 de Matematicas, de cuantas formas puede acomodar su horario?
5. Si una prueba de seleccion m
ultiple consta de 5 preguntas, cada una con 4 alternativas, de las
cuales una es al correcta,
a) de cuantas formas diferentes puede un estudiante escoger una respuesta para cada pregunta?
b) de cuantas maneras puede un estudiante escoger una alternativa para cada pregunta y
tener todas las respuestas incorrectas?
6. Un constructor desea edificar 9 casas, cada una con diferente dise
no. De cuantas formas
puede colocar estas casas si 6 terrenos estan en un lado de la calle y 3 estan en el opuesto?
7.

a) Cuantos n
umeros de tres dgitos pueden formarse con los dgitos 0, 1, 2, 3, 4, 5 y 6, si
cada uno puede utilizarse solo una vez?
b) Cuantos de estos n
umeros son impares?
c) Cuantos son mayores a 330?
24

8. De cuantas formas puedens sentarse en una lnea 4 ni


nos y 5 ni
nas, si deben colocarse
alternadamente?
9. Cuatro matrimonios compraron 8 lugares para un concierto. De cuantas formas diferentes
puedens sentarse
a) sin restricciones?
b) si se sientan por parejas?
c) si todos los hombres se sientasn juntos a las derecha de todas las mujeres?
10. En cuantas formas pueden plantarse en crculo 5 arboles diferentes?
11. Cuantas permutaciones distintas pueden hacerse con las letras de la palabra infinito?
12. De cuantas formas pueden plantarse, a lo largo de la lnea divisoria de una propiedad, 3
robles, 4 pinos y 2 arces, si uno no distingue entre los arboles de la misma clase?
13. Un colegio participa en 12 partidos de f
utbol en una temporada. De cuantas maneras puede
el equipo terminar la temporada con 7 victorias, 3 derrotas y 2 empates?
14. Nueve personas salen de viaje para esquiar en 3 vehculos cuyas capacidades son 2, 4 y 5
pasajeros, respectivamente. De cuantas formas es posible transportar a las 9 personas hasta
el albergue con todos los vehculos?
15. Hay 12 maneras de la cuales un artculo manufacturado puede tener un peque
no defecto y 10
maneras en las cuales puede tener un defecto mayor. De cuantas maneras puede ocurrir un
defecto menor y uno mayor? 2 defectos mayores y 2 menores?
16. Una clase se compone de 6 alumnos. Hallar el n
umero n de muestras ordenadas de tama
no 4:
a) con reemplazamiento,
b) sin reemplazamiento.
17. Una clase se compone de 9 ni
nos y 3 ni
nas. Hallar el n
umero de posibilidades que tiene un
profesor de elegir un comite de 4 alumnos
a) sin restricciones,
b) tiene que haber dos ni
nos y dos ni
nas,
c) tiene que haber exactamente una ni
na,
d) tiene que haber al menos una ni
na.
18. Los equipos A y B juegan en un campeonato de f
utbol, donde el equipo que primero gane
cuatro juegos gana el campeonato. Hallar el n
umero n de posibilidades que se pueden dar en
el campeonato sabiendo que A gana el primer juego y que el equipo que gane el segundo juego
tambien gana el cuarto. Enumerar las n posibilidades que se pueden dar.

25

8.

Modelo de Probabilidad

En el estudio de la estadstica interesa, basicamente, la presentacion e interpretacion de resultados aleatorios que se dan en un estudio planeado o en una investigacion cientfica. Por ejemplo,
es posible registrar el n
umero de accidentes que ocurren mensualmente en una determinada interseccion de calles, con el proposito de justificar la instalcion de un semaforo; clasificar los artculos
que salen de una lnea de ensamble como defectuosos o no defectuosos; o bien, tener interes en
conocer el volumen de gas que se libera durante una reaccion qumica cuando la concentracion de
un acido vara. De aqu que se manejen datos experimentales, que representan conteos o mediciones,
o tal vez datos categoricos que puedan clasificarse de acuerdo con alg
un criterio.
Necesitamos entonces una forma matematica para cuantificar la incertidumbre.
Utilizaremos la palabra experimento, E, para describir cualquier proceso que genere un conjunto de datos. Un ejemplo muy simple de un experimento consiste en el lanzamiento de una moneda
la aire. En este caso solo existen dos resultados posibles: cara o sello. Otro experimento podra
ser el lanzamiento de un proyectil y la observacion de su velocidad en un perodo de tiempo. Las
opiniones de los votantes respecto de un candidato a alcalde tambien pueden considerarse como
observaciones de un experimento. Aqu interesan particularmente las observaciones que se obtienen
en la repeticion de un experimento. En la mayor parte de los casos los resultados dependeran del
azar y, por lo tanto, no pueden pronosticarse con certidumbre. Si un qumico realiza varias veces
un analisis bajo las mismas condiciones y obtiene diferentes mediciones, ello indica la existencia
de un elemento de aleatoriedad en el procedimiento experimental. Incluso cuando una moneda se
lanza al azar repetidamente, no es posible garantizar que en un lanzamiento dado se obtendra como resultado una cara. No obstante, s se conoce el conjunto completo de posibilidades para cada
lanzamiento.

8.1.

Espacio Muestral

Definici
on 8.1 Al conjunto de todos los resultados posibles de un experimento estadstico se le
llama espacio muestral y se representa por la letra S.
A cada resultado en un espacio muestral se le llama elemento del espacio muestral o simplemente punto muestral.
Ejemplo 8.1 Determine el espacio muestral del siguiente experimento: se lanza una moneda y si
sale cara, se lanza un dado; si sale sello, se vuelve a lanzar.

8.2.

Eventos

Definici
on 8.2 Un evento A, respecto a un espacio muestral S, asociado a un experimento E,es
un subconjunto de resultados posibles.
Es claro que S en s mismo es un evento y tambien lo es el conjunto vaco. Cualquier resultado
individual tambien puede considerarse como un evento.

26

Definici
on 8.3 El complemento de un evento A con respecto a S es el conjunto de todos los
elementos de S que no estan en A, es decir, es el suceso que se da si A no ocurre. Denotamos el

complemento de A por el smbolo Ac , tambien escrito A.


Definici
on 8.4 La intersecci
on de dos eventos A y B, AB, es el evento que contiene a todos
los elementos comunes a A y a B, es decir, es el evento que ocurre si A y B ocurren.
Definici
on 8.5 Dos eventos A y B son mutuamente excluyentes o disjuntos si AB = , esto
es, si A y B no tienen elemento comunes.
Definici
on 8.6 La uni
on de los dos eventos A y B, AB es el evento que contiene a todos los
elementos que pertenecen a A, o a B o a ambos.
Ejemplo 8.2 Sea el experimento
E: lanzar un dado y observar el n
umero que sale,
y sean los eventos:
A: sale un n
umero par,
B: sale un n
umero impar,
C: sale un n
umero primo.
Determinar el espacio muestral y los elementos de los siguientes conjuntos:
a) A C
b) B C
c) C c
Definici
on 8.7 Sea A la clase de eventos (aleatorios) de S. A es un -
algebra de subconjuntos
de S (no vaco) si:
i) S A
ii) A A Ac A
iii) A1 , A2 , . . . A

i=1

Ai A

Nota: (S,A) se llama espacio medible.


Ejercicios 3 Demuestre las siguientes propiedades:
i) A
T
S
ii) A1 , A2 , . . . , An A ni=1 Ai A, ni=1 Ai A
T
iii) A1 , A2 , . . . A
i=1 Ai A

27

8.3.

Medida de Probabilidad

Finalmente, dado un - algebra A de eventos de S, para concretar nuestro modelo debemos


introducir una medida de probabilidad sobre (S,A).
Definici
on 8.8 Una medida de probabilidad P sobre (S,A) es una funcion
P : A [0, 1]
tal que cumple con los siguientes tres axiomas de Kolmogorov:
A1 P(A) > 0

AA

A2 P(S) = 1
A3 Si A1 , A2 , . . . A son disjuntos dos a dos, entonces
P

 X
Ai =
P (Ai )

i=1

i=1

(S, A, P)se llama modelo de probabilidad.


Lema 1 Sea (S, A, P) un modelo de probabilidad. Entonces valen las siguientes propiedades:
a) P() = 0
b) Si A1 , . . . , An A son disjuntos dos a dos, entonces
P

n
[

Ai =

i=1

n
X

P (Ai )

i=1

Propiedades de P
Dado un modelo de probabilidad (S, A, P) se desprende de A1, A2 y A3 que:
P1) P(Ac ) = 1 P(A)
P2) A B P(A) P(B)
P3) P(A B) = P(A) + P(B) P(A B)
S
P
P4) P(
A
)

i
i=1
i=1 P(Ai )
P5)

(i) Si An es una secuencia creciente de eventos, tal que


A=

[
i=1

entonces
28

Ai = lm An

P(A) = lm P(An )
(P es continua por abajo)
(ii) Si An es una secuencia decreciente de eventos, tal que
A=

Ai = lm An

i=1

entonces
P(A) = lm P(An )
(P es continua por arriba)
Ejercicios 4 .
1. Un espacio muestral S se compone de cuatro elementos, es decir, S = {a1 , a2 , a3 , a4 }. Bajo
cuales de las siguientes funciones S llega a ser un espacio probabilstico?
a)
P(a1 ) = 1/2

P(a2 ) = 1/3

P(a3 ) = 1/4

P(a4 ) = 1/5

P(a1 ) = 1/2

P(a2 ) = 1/4

P(a3 ) = 1/4

P(a4 ) = 1/2

P(a1 ) = 1/2

P(a2 ) = 1/4

P(a3 ) = 1/8

P(a4 ) = 1/8

P(a1 ) = 1/2

P(a2 ) = 1/4

b)
c)
d)
P(a3 ) = 1/4

P(a4 ) = 0

2. Sean tres sucesos A, B y C. Encuentre expresiones para los siguientes sucesos en lenguaje de
conjuntos.
a) Solo ocurre A.
b) Ocurren tanto B como C, pero no as A.
c) Los tres sucesos ocurren.
d) Ninguno de los tres sucesos ocurre.
e) A lo mas dos de ellos ocurren.
f) Al menos dos de los sucesos ocurren.
g) Al menos uno de los sucesos ocurre.
h) Exactamente dos de ellos ocurren.

29

8.4.

Espacios Probabilsticos Finitos

Consideremos un espacio muestral S y la clase A de todos los sucesos. S se convierte en un


espacio probabilstico asignando probabilidades a los sucesos de A de tal forma que satisfaga los
axiomas de probabilidad.
Espacios finitos equiprobables
Supongamos que S es un espacio muestral finito con n elementos y supongamos que las caractersticas fsicas del experimento sugieren que a varios de los resultados se les asignen probabilidaes iguales.
Entonces S se convierte en un espacio probabilstico, llamado espacio finito equiprobable, si a cada punto se le asigna probabilidad 1/n y si a cada suceso A que contiene r puntos, probabilidad r/n.
Por lo tanto,
P(A) =

n(A)
n(S)

Teorema 8.1 Sea S un espacio muestral finito, y para cualquier A S sea


P(A) =

n(A)
n(S)

Entonces P cumple los axiomas A1, A2 y A3.


Ejemplo 8.3 Supongamos que se elige aleatoriamente a un estudiante entre 80, de los cuales 30
estudian matematicas, 20 qumica y 10, ambas. Hallar la probabilidad p de uqe un estudiante est
a estudiando matematicas o qumica.
Sea S un espacio muestral finito, digamos S ={a1 , a2 , . . . , an } un espacio probabilstico finito, o
modelo probabilstico finito, se obtiene asinando a cada punto ai de S un n
umero real pi llamado
probabilidad de ai , que cumple con las siguientes propiedades:
a) cada pi es no negativo, pi 0
Pn
b)
i=1 pi = 1
Ejercicios 5 .
1. Tres caballos estan en una carrera: A tiene el doble de posibilidades de ganar que B, y este,
el doble de C. Hallar sus respectivas probabilidades de ganar.
2. Supongamos que A y B son sucesos con
P(A) = 0,6;

P(B) = 0,3

Hallar la probabilidad de
a) A no ocurra.
b) B no ocurra.
c) A o B ocurran
30

P(A B) = 0,2

d) Ni A ni B ocurran
3. Una caja contiene dos calcetines blancos y dos azules. Se sacan dos aleatoriamente. Hallar la
probabilidad p de que sean del mismo color.
4. Un naipe ingles consta de 52 cartas agrupadas en cuatro pintas (corazon, pique, trebol y
diamante) y 13 n
umeros (As, 2, . . ., 9, 10, J, Q K). Se elige consecutivamente al azar y
sin reemplazo cinco cartas de este naipe. Calcule las probabilidades de los siguientes eventos
o sucesos:
a) Las primeras tres cartas son diamantes y las dos u
ltimas son pique.
b) Hay exactamente cuatro cartas del mismo n
umero.
c) Hay tres cartas de un mismo n
uumero y dos de otro.

31

9.

Probabilidad Condicionada e Independencia

9.1.

Probabilidad Condicional

Definici
on 9.1 Supongamos que A, B son sucesos de un espacio muestral S. La probabilidad
condicional que A ocurra dado que B ha ocurrido, P(A | B) se define y denota como
P(A | B) =

P(A B)
,
P(B)

P(B) > 0

y
P(A | B) = 0,

si P(B) = 0.

P(A | B) mide en cierto modo la probabilidad relativa de A con respecto al espacio reducido de
B.
Ejemplo 9.1 Hallar P(B | A) si:
1. A es un subconjunto de B.
2. A y B son mutuamente excluyentes. (Asumimos que P(A) > 0)
Teorema 9.1 Supongamos que S es un espacio equiprobable, y que A y B son sucesos. Entonces
P(A | B) =

n(A B)
n(B)

es una medida de probabilidad


Ejemplo 9.2 Se tiran un par de dados y se define
A: salga 2 en al menos uno de los dados
B: la suma es 6.
Encontrar P(A | B) y P(A)
Teorema 9.2 (Multiplicacion para la probabilidad condicional)
P(A B) = P(B | A)P(A)

Corolario 1 P(A B C) = P(C | A B) P(B | A) P(A)

Ejemplo 9.3 Un lote contiene 12 objetos de los cuales 4 son defectuosos. Se sacan tres objetos al
azar del lote, uno detras de otro. Hallar la probabilidad de los tres no sean defectuosos.

32

Definici
on 9.2 Los sucesos A y B son independientes si P(A B) = P(A)P(B), de cualquier
otra forma seran dependientes.
Esta definicion nos lleva a concluir que A y B son sucesos independientes si
P(A | B) = P(A) y

P(B | A) = P(B)

Nota:
1.- Se dice que A1 , A2 , . . . , An A son dos a dos independientes ssi
P(Ai Aj ) = P(Ai ) P(Aj )

i<j

2.- Independencia dos a dos no implica independencia completa.


3.- La complementacion de uno o mas eventos no destruye la independencia.
4.- Sea C A un evento tal que P(C) > 0. Entonces A y B son condicionalmente independientes
dado C,
AB | C P(A B | C) = P(A | C) P(B | C)
5.- Observemos que los eventos disjuntos no son independientes a menos que uno de ellos tenga
probabilidad cero. Es decir, supongamos A B = y A y B son independientes. Entonces
P(A)P(B) = P(A B) = 0
y por lo tanto
P(A) = 0 o P(B) = 0
Ejemplo 9.4 .
1. Consideremos los siguientes sucesos para una familia con ni
nos:
A = {ni
nos de ambos sexos}

B= {al menos un ni
no}

a) Demostrar que A y B son sucesos independientes si la familia tiene tres hijos.


b) Demostrar que A y B son dependientes si la familia tiene solo dos hijos.
2. Consideremos un espacio equiprobable S = {a, b, c, d}, de ah cada suceso elemental tiene la
misma probabilidad p = 1/4. Consideremos los sucesos
A = {a, d}

B={b, d}

C={c, d}

a) Demostrar que A, B, C son independientes dos a dos.


b) Demostrar que A, B, C no son independientes.
3. Demostrar que si A y B son sucesos independientes, entonces A{ y B { son sucesos independientes.
33

4. Un equipo de f
utbol gana (G) con probabilidad 0.6, pierde (P) con una probabilidad 0.3 y
empata (E) con probabilidad de 0.1. El equipo juega tres partidos en el fin de semana.
a) Determinar los elementos del suceso A, que el equipo gane al menos dos partidos y que
no pierda, hallar P(A)
b) Determinar los elementos del suceso B, que el equipo gane, pierda y empate en alg
un
orden; hallar P(B)
5. Urna de Polya
Una urna contiene a fichas azules y r fichas rojas. El experimento consiste en:
(i) Extraer una ficha y observar su color.
(ii) Devolver la ficha con t fichas adicionales del mismo color.
(iii) Seguir iterando
Para tres ectracciones defina:
Ai : la i-esima ficha es azul,
Calcule P(A1 A2 A3 )

34

i= 1, 2, 3.

9.2.

Probabilidad Total

Definici
on 9.3 Una familia de eventos B1 , . . . , Bn A se llama partici
on de S si:
k
[

Ai = S

Ai Aj =

i 6= j.

i=1

Teorema 9.3 Supongamos que los sucesos A1 , A2 , . . . , Ak forman una particion de S. Entonces
para cualquier evento B se tiene que
P(B) =

k
X

P(B | Ai )P(Ai )

i=1

9.3.

Teorema de Bayes

Teorema 9.4 Bajo las mismas condiciones del teorema anterior se tiene que
P(B | Ai )P(Ai )
P(Ai | B) = Pk
j=1 P(Aj )P(B | Aj )
Ejercicios 6 .
1. El director de personal de una empresa que emplea vendedores a tiempo parcial ensaya una
prueba de aptitudes para las ventas con cientos de aspirantes. Como la prueba es nueva, los
resultados no se utilizan para dar el empleo. El 40 % de los aspirantes muestra gran aptitud
seg
un la prueba, y el 12 % de los contratados muestra gran aptitud y alcanza buenas cuotas
de ventas. La experiencia de la empresa indica que el 30 % del personal de ventas consigue
buenos niveles en las ventas.
a) Encuentre P(A), P(AB) y P(A/B)
b) Son A y B eventos independientes?
c) Es u
til la prueba para predecir buenos niveles en las ventas? Que tanto?
d) Cual es la probabilidad de que no ocurran ni A ni B?
2. Una compa
na encuentra que el 46 % de sus jovenes directores esta casado con un(a) profesional, el 37 % esta casado, pero no con un(a) profesional y el 17 % son solteros.
La compa
na considera que el 40 % de los directores casados con profesionales rehusaran ser
transferidos a otra oficina, al igual que el 10 % de los solteros y el 15 % de los que no est
an
casados con profesionales.
a) Defina los cuatro eventos de interes. Cual es la probabilidad de que un director sea
casado? y de que sea soltero?
b) Si a un director seleccionado al azar se le propone ser transferido, cual es la probabilidad
de que rechace la oferta?
c) Si un profesional rechaza ser trasladado, cual es la probabilidad de que sea soltero?
35

d) A que profesional usted no le ofrecera traslado, ya que cree que es muy probable que
rechace la oferta?
3. Supongamos que tenemos las tres cajas siguientes:
La caja A tiene 3 fichas rojas y 5 blancas.
La caja B tiene 2 rojas y una blanca.
La caja C tiene 2 rojas y 3 blancas.
Se escoge una caja al azar, y una ficha de dicha caja. Si la ficha es roja, hallar la probabilidad
de que sea de la caja A.
4. En una ciudad el 40 % de la gente se considera conservadora (C), el 35 % liberales (L), y el
25 % independientes (I). Durante las elecciones votaron el 45 % de los conservadores, el 45 %
de los liberales y el 60 % de los independientes tambien. Si se elige un votante al azar, hallar
la probabilidad de que el votante sea conservador, liberal e independiente.
5. En una universidad, el 4 % de los chicos y el 1 % de las chicas tienen una altura superior a
180 cm. El 60 % de los alumnos son chicas. Supongamos que escogemos al azar un alumno
que mide mas de 180 cm. Hallar la probabilidad de que el alumno sea chica.
6. El gerente de una empresa regional dispone de dos autos; uno proporcionado por la empresa y
el otro de su propiedad. La probabilidad que utilice su auto es 2/5 y la probabilidad que utilice
el auto de la empresa es 3/5. Ademas se sabe que le gerente llega a tiempo a las reuniones
de la empresa con probabilidad 1/5 y que, si utiliza el auto de la empresa, la probabilidad de
llegar a tiempo a esas reuniones es 1/4.
Cual es la probabilidad que llegue a tiempo a una reunion, dado que utilizo su propio auto?
Dado que el gerente llego a tiempo a la reunion, cual es la probabilidad que haya utilizado el
auto de la empresa?
7. Suponga que se ha elaborado un nuevo tipo de examen para detectar si una persona padece de
un determinado tipo de cancer. Si una persona que padece de este tipo de cancer se somete al
examen, la probabilidad de observar una reaccion positiva es 0.95. En cambio, la probabilidad
de observar reaccion positiva en una persona sana es 0.07. Se sabe ademas que el tipo especfico
de cancer en cuestion afecta a solo 1 de cada 100.000 personas. Si una persona seleccionada
al azar reacciona positivamente al examen, cual es la probabilidad de que esta persona tenga
el cancer en cuestion?
8. En la empresa Coca-Cola el llenado de las botellas con bebida es realizado automaticamente
por una maquina que funciona a distintas velocidades. La probabilidad de que el llenado sea
incorrecto es de 0.001 cuando el proceso se realiza a baja velocidad. Cuando el proceso de
llenado se realiza a alta velocidad, la probabilidad de llenado incorrecto es de 0.01. Suponga
que el 25 % de las botellas son llenadas cuando el proceso se realiza a alta velocidad, mientras
que el resto de botellas son llenadas a una baja velocidad.
a) Cual es la probabilidad de encontrar una botella con un volumen incorrecto en su interior?
36

b) Cual es la probabilidad de encontrar una botella llena con un volumen incorrecto y que
haya sido llenada cuando el proceso se realiza a baja velocidad?
c) Cual es la probabilidad de que el proceso de llenado de las botellas haya sido a baja
velocidad, si se sabe que la botella esta efectivamente con un volumen incorrecto?
d) Si se encuentra una botella llenada con un volumen incorrecto, Cual es la probabilidad
de que haya sido llenada cuando el proceso se realiza a alta velocidad?

37

10.
10.1.

Variables Aleatorias
Introducci
on

Informalmente una variable aleatoria puede definirse como una funcion numerica sobre , el
espacio muestral:
X:R
X es una funcion tal que asigna a cada un n
umero.
Nota: Usualmente, el recorrido de X, Rec(X), es un subconjunto de R.
Ejemplo 10.1 Sea = {CC, CS, SC, SS} y sea la variable aleatoria definida por
X() = n
umero de caras,
Cual es el recorrido de la variable aleatoria X?
Formalmente:
Definici
on 10.1 Dado un modelo de probabilidad (, A, P), diremos que una funcion
X:R
es una variable aleatoria ssi
{ : X() x} A, x R
X es una variable aleatoria en (, A, P) ssi { : X() x} es un evento (aleatorio) en
A, x R
uscula , la variable
Notacion: Si el valor de la variable aleatoria se denota por una letra min
se denota por la letra may
uscula correspondiente. Normalmente se utilizan las u
ltimas letras del
alfabeto.
El suceso el valor x de X pertenece al conjunto Bse denota por X B. Cuando B = {x} se
simplifica la notacion a {X = x}.
Definici
on 10.2 Dada una variable aleatoria X definida en (, A, P), la distribuci
on de probabilidad inducida por X en R se define, para un evento B R como:
PX (B) = P(X 1 (B))
donde X 1 (B) = { : X() B} es un evento en .
Conocer la distribucion de probabilidad para un subconjunto B implica que podemos PX para
cualquier B R (medible).
En general, cada B R medible puede generarse a partir de uniones y/o intersecciones de
intervalos de la forma [an , bn ]. La coleccion de estos intervalos de la forma (a, b] genera una algebra en R, llamada -
algebra de Borel y denotada por B. Los elementos de B se llaman
Borelianos y son subconjuntos medibles de R.
38

Proposici
on 1 PX es una medida de probabilidad en (R, B) (R, B, PX ) es una medida de
probabilidad (inducida por la variable aleatoria X).
Definici
on 10.3 La funcion definida por
FX (x) = PX ((, x])
= P(X x), x R
se llama funci
on de distribuci
on acumulada, f.d.a, de la variable aleatoria X.
Propiedades
Sea FX (x), x R, la funcion distribucion de X,
P1)
lm FX (x) = 0 y

(0 FX (x) 1

lm FX (x) = 1

x)

P2) Si x1 < x2 , entonces FX (x1 ) FX (x2 )


(FX es no decreciente en R)
P3)
lm FX (x) = FX (x0 )

xx0

(FX es continua por la derecha)

39

x0 R

10.2.

Variables Aleatorias Discretas

FX (x), x R, es discreta ssi la variable aleatoria X es discreta, es decir, X asume valores en


un subconjunto contable de R.
X() {x1 , x2 , . . .}

En tal caso, FX (x), x R, puede representarse como:


X
FX (x) =
P(X = t),

x S,

tx

donde
P(X = x),

x R, se llama funci
on de probabilidad.

Sigue de la definicion de P(X = x), x R, que:


i)
P(X = x) 0

xR

ii)
X

P(X = x) = 1

xR

iii)
PX (B) = P(X B) =

P(X = x)

xB

Ejemplo 10.2
Un dado no equilibrado asigna a la cara con el n
umero x probabilidades dadas por
p(x) = c 0, 7x 0, 36x , x = 1, . . . , 6
1. Calcule el valor de c.
2. Haga una tabla con los valores de la funcion de distribucion F.
3. Utilice la tabla para calcular la probabilidad que
(i) El n
umero este entre 2 y 4.
(ii) El n
umero sea mayor que 2.
Ejemplo 10.3 Un embarque de 8 computadores similares se enva a un distribuidor contiene 3 aparatos defectuosos. Si una escuela realiza una compra aleatoria de 2 de estos computadores, enceuntre
la distribucion de probabilidad y la f.d.a del n
umero de computadores defectuosos.
Ejemplo 10.4 Si 50 % de los automoviles extranjeros que vende una agencia esta equipado para
trabajar con diesel, encuentre una formula para la distribucion de probabilidad del n
umero de modelos
diesel entre los proximos 4 automoviles que venda esta agencia. Determine la f.d.a de la variable
de interes.
40

10.3.

Variables Aleatorias Continuas

FX (x), x R es continua ssi existe una funcion no negativa fX (x), x R, tal que:
Z x
fX (t)dt,
xR
FX (x) =

dFX (x)
dx
donde fX (x) se denomina funci
on de densidad de la variable aleatoria X.
fX (x) =

Note que:
i)
fX (x) 0
ii)
Z

fX (x) dx = 1

iii)
Z
PX (B) = P(X B) =

fX (x)dx
B

Si B es un intervalo, por ejemplo, B = (a, b), entonces se tiene lo siguiente:


PX (B) = P(a < X < b)
= P(a < X < b)
= P(a < X b) pues P(X = b) = 0,
= FX (b) FX (a)
Z b
Z a
Z
=
fX (x) dx
fX (x) dx =
fX (x) dx

Ejemplo 10.5 Suponga que el error de la temperatura de reaccion, en C, para un experimento


controlado de laboratorio es una variable aleatoria continua X, que tiene funcion de densidad de
probabilidad:
 x2
, -1 < x < 2
3
fX (x) =
0, e.o.c.
a) Verifique la condicion (ii).
b) Encuentre P(0 < X 1)
Definici
on 10.4 La distribuci
on acumulada FX (x) de una variable aleatoria continua X con
densidad fX es:
Z x
FX (x) = P(X x) =
fX (t) dt x R

Ejemplo 10.6 Para la funcion de densidad del ejemplo anterior, encuentre FX y utilcela para
calcular P(0 < X 1)

41

10.4.

Localizaci
on y dispersi
on de una variable aleatoria

Definici
on 10.5 La esperanza de una variable aleatoria X se define como:

X

xi fx (xi ),
X discreta

i=1
E(X) =
Z

xfX (x)dx, X continua

Notacion: X = E(X)
Propiedades
1.- La esperanza matematica es un operador lineal, esto es, si E(X) esta bien definida, entonces
E(aX + b) = aE(X) + b
2.- Si X e Y son variables aleatorias, entonces
E(X + Y ) = E(X) + E(Y )
3.- Si X e Y son variables aleatorias con esperanzas bien definidas y tales que
X() Y ()
entonces E(X) E(Y )
Definici
on 10.6 La mediana de una variable aleatoria X es alg
un n
umero m tal que:
P(X m) 1/2 y

P(X m) = 1/2

Notas:
i) Si X tiene distribucion simetrica y E(X) < , entonces E(X) es una mediana para X.
ii) Si X tiene distribucion asimetrica, la mediana de X puede ser una mejor medida de localizacion.
Dos distribuciones pueden tener la misma localizacion y ser completamente diferentes, por lo
que hay que considerar una medida de dispersion de la variable, la mas com
un, es la varianza.
Definici
on 10.7 La varianza de una variable aleatoria X se define como
V (X) = E[(X E(X))2 ]

X

(xi E(X))2 P(X = xi )

V (X) =
Zi=1

(x E(X))2 fX (x)dx

Notacion:

2
X

= V (X)

42

Propiedades
1.- V (X) = E(X 2 ) (E(X)2 )
2.- V (X) 0, V (X) = 0 X = c
3.- V (aX + b) = a2 V (X)
4.- Si X e Y son variables aleatorias, entonces
V(X + Y ) = V(X) + V(Y ) 2 Cov(X, Y )
Solo en el caso en que X e Y son variables aleatorias independientes, entonces
V(X + Y ) = V(X) + V(Y )
Ejemplo 10.7 Sea X la variable aleatoria que cuenta el n
umero de caras en tres lanzamientos de
una moneda honesta. Determine el recorrido, la funcion de distribucion, valor esperado y varianza
de X.
Ejemplo 10.8 Sea A un evento en (, A, P), con P(A) = p, con 0 p 1. Usted paga $1 se A
ocurre y $0 si A{ ocurre.
Sea X la ganancia obtenida en un ensayo de este experimento. Determine esperanza y varianza de
X.

43

10.5.

Casos especiales de distribuciones probabilidad

10.5.1.

Distribuci
on Bernoulli

Consideremos un experimento con solo dos resultados posibles, uno que se llame exito (E) y
otro, fracaso (F). Los resultados sucesivos e independientes de tal experimento se llaman pruebas
o experimentos Bernoulli.
En realidad, cualquier experiemnto puede ser usado para definir un ensayo Bernoulli simplemente
denotando alg
un evento de interes, A, como exito y su complemento, A{ , como fracaso.
Notaci
on: X Bernoulli(p) y su funcion de probabilidad esta dada por
P(X = x) = px (1 p)1x ,

x = 0, 1

donde
E(X) = p
V (X) = p(1 p)
10.5.2.

Distribuci
on Binomial

Un experimento que consiste de n ensayos Bernoulli independientes, cada uno con probabilidad
de exito p, se llama un experimento Binomial con n ensayos y parametro p.
Al decir ensayos independientessignifica que los ensayos son eventos indeoendientes esto es, lo
que ocurra en un ensayo no tiene efecto en el resultado observado para cualquier otro ensayo.
Definici
on 10.8 Sea X el n
umero total de exitos observados en un experimento Binomial con n
ensayos y parametro p. Entonces X se llama variable aletoria Binomial con parametros n y p
y se denota
X Bin(n, p)
y su funcion de probabilidad esta dada por
 
n x
P(X = x) =
p (1 p)nx ,
x

x = 0, 1, . . . , n

Teorema 10.1 La esperanza y varianza de la distribucion Binomial estan dadas por:


E(X) = n p
V (X) = n p (1 p)
Ejemplo 10.9 Se sabe que el n
umero de pacientes graves en una urgencia es una variable aleatoria
Binomial con una media de 12 pacientes graves y una varianza de 3. Determine la probabilidad que
en un da haya a lo menos 2 pacientes en estado grave.

44

10.5.3.

Distribuci
on Geom
etrica

Definici
on 10.9 Si se realizan repetidos experimentos Bernoulli independientes con probabilidad de
exito p, entonces la distribucion de la variable aleatoria X, el n
umero de experimentos necesarios
hasta encontrar el primer exito sigue una distribuci
on geom
etrica de parametro p y se denota
por:
X Geo(p)
con funcion de probabilidad dada por
P(X = x) = (1 p)x1 p,

x = 1, 2, 3, . . .

Teorema 10.2 La esperanza y varianza de la distribucion geometrica estan dadas por:


1
p
1p
V (X) =
p2
E(X) =

Ejemplo 10.10 Cacule la probabilidad de que deba lanzar un dado por lo menos 6 veces hasta
obtener un 5.
10.5.4.

Distribuci
on Binomial Negativa

Definici
on 10.10 Consideremos ensayos Bernoulli independientes con probabilidad de exito p en
cada ensayo. Si X es el n
umero de ensayos necesarios para observar el r-esimo exito, entonces X
se llama variable aleatoria Binomial negativa con parametros r, y p su funcion de probabilidad
est
a dada por


x1 r
P(X = x) =
p (1 p)xr ,
x {r, r + 1, . . .}
r1
y se denota por
X BinN eg(r, p)
Teorema 10.3 La esperanza y varianza de la distribucion Binomial Negativa estan dadas por:
r
p
r(1 p)
V (X) =
p2
E(X) =

Ejemplo 10.11 Cacule la probabilidad de que deba lanzar un dado por lo menos 6 veces hasta
obtener 5 tres veces.

45

10.5.5.

Distribuci
on Poisson

Definici
on 10.11 Una variable aleatoria X que cuenta el n
umero de eventos que ocurren en un
perodo de tiempo tiene distribuci
on Poisson de parametro > 0, y su funcion de probabilidad
est
a dada por
e x
P(X = x) =
, x = 0, 1, . . .
x!
y se denota por
X P oisson()
Teorema 10.4 La esperanza y varianza de la distribucion Poisson estan dadas por:
E(X) =
V (X) =
Ejemplo 10.12 Se sabe que los pacientes llegan de acuerdo a una distribucion Poisson con = 3
pacientes/minuto. Cuando llegan mas de 4 pacientes por minuto la secretaria se ve sobrepasada y
el servivio de atencion es calificado como deficiente. Cual es la probabilidad de que el sistema sea
calificado como no deficiente?
10.5.6.

Distribuci
on Uniforme

Definici
on 10.12 Una variable aleatoria X tiene distribuci
on uniforme si su densidad se distribuye por igual entre dos valores cualquiera a y b. Su funcion de densidad esta dada por
 1
, a < x < b,
ba
fX (x) =
0,
e.o.c.
Notacion: X U(a, b)
Teorema 10.5 La esperanza y varianza de la distribucion Uniforme estan dadas por:
a+b
2
(b a)2
V (X) =
12
E(X) =

Ejemplo 10.13 En los das del verano, X, el tiempo de retraso de un tren del Metro, se puede
modelar como distribuida uniformemente entre 0 y 20 minutos.
1. Calcule la probabilidad de que el tren llegue por lo menos con 8 minutos de retraso.
2. Calcule la desviacion estandar del tiempo de retraso del tren.

46

10.5.7.

Distribuci
on Exponencial

Definici
on 10.13 Suponga que los eventos suceden aleatoriamente a lo largo del tiempo, con un
tiempo esperado entre eventos . Sea X, la variable aleatoria que cuenta el tiempo para el siguiente
evento, entonces X tiene distribuci
on exponencial y su funcion densidad esta dada por
 1 x/
e
, x > 0,

fX (x) =
0,
e.o.c.
donde > 0 y se denota por
X exp()
Teorema 10.6 La esperanza y varianza de la distribucion Exponencial estan dadas por:
E(X) =
V (X) = 2
Ejemplo 10.14
En un centro rural para la atencion de emergencias el tiempo entre llegadas sigue una distribuci
on
exponencial con un tiempo media de llegadas de 1.25 horas. Encuentre la probabilidad de que el
tiempo entre llegadas sea mayor a 1 hora. Encuentre la probabilidad de que el tiempo entre llegadas
sea mayor a 2 horas.
10.5.8.

Distribuci
on Normal

Definici
on 10.14 La variable aleatoria X tiene distribuci
on normal con media y varianza 2
si su funcion de densidad esta dada por
fX (x) =

1
2 2

(x)2
2 2

< x <

Notacion: X N(, 2 )
Definici
on 10.15 Si Z es una variable aleatoria normal con media 0 y varianza 1, entonces Z se
llama variable aleatoria normal est
andar.
Cualquier variable aleatoria normal X se puede transformar en una variable aleatoria normal
estandarizada Z, sustrayendo el valor esperado y dividiendo el resultado por .
Ejemplo 10.15 Considere la distribucion normal estandar con media = 0 y desviacion = 1.
1. Cual es la probabilidad que z sea mayor que 2,6?
2. Cual es la probabilidad que z sea menor que 1,3?
3. Cual es la probabilidad que z este entre -1.7 y 3.1?
4. Cual es el valor de z que corta el 15 % menor de la distribucion?

47

Ejercicios 7 .
1. Clasifique las siguientes variables como discretas o continuas.
X : el n
umero de accidentes de automovil por a
no en la ciudad de Santiago.
Y : el tiempo que toma jugar 18 hoyos de golf.
M : la cantidad de leche producida anualmente por una vaca en particular.
N : el n
umero de huevos que pone mensualmente una gallina.
P : el n
umero de permisos para la construccion de edificios que otorga mensualmente una
municipalidad.
Q : la cantidad de kilos de manzanas que exporta una empresa.
2. Sea X = n
umero de sustancias nocivas en un material de trabajo escogido al azar.
x
p(x)
p(x)
p(x)

0
0.3
0.4
0.4

1
0.2
0.1
0.2

2
0.1
0.1
-0.3

3
0.05
0.1
0.5

4
0.05
0.3
0.2

a) Cual de las siguientes tres funciones de probabilidad es una funcion de probabilidad


legitima para X, Por que no se permiten las otras 2?
b) Para la funcion de probabilidad legitima de la parte anterior. Calcule P(2 X 4),
P(X 2) y P(X 6= 0)
c) Escriba la funcion de probabilidad acumulada.
d) Si p(x) = c (5 x) para x = 0, 1, 2, 3. Cual es el valor de c?
3. Una firma de inversiones ofrece a sus clientes bonos municipales que vencen despues de diferente n
umero de a
nos. Dada la distribucion acumulada de T , el n
umero de a
nos para el
vencimiento de un bono seleccionado aleatoriamente es

0, t < 1,

41 , 1 x < 3
1
, 3x<5
FT (t) =
2

, 5x<7

4
1, t 7.
Encuentre
a) P(T = 5)
b) P(T > 5)
c) P(1,4 < T < 6)

48

4. Ciertos temes son producidos por una maquina, cada item es clasificado como de primera o
segunda calidad; los temes de segunda calidad representan al 5 % de la produccion total. Si se
inspeccionan temes hasta que se encuentra el quinto de segunda calidad,
a) Determine la variable aleatoria y su funcion de probabilidad.
b) Cual es el n
umero esperado de temes que se deben inspeccionar para detectar el quinto
de segunda calidad?
c) Cual es la probabilidad de que se tengan que inspeccionar 7 artculos?
5. Se sabe que el 60 % de estudiantes de la Universidad son fumadores. En una muestra aleatoria
de 12 alumnos,
a) Cual es la probabilidad que haya exactamente dos fumadores?
b) Cual es la probabilidad que sean fumadores solo los dos primeros alumnos entrevistados?
c) Cual es el n
umero esperado de fumadores?
6. Ocasionalmente aplicaciones de laser se usan para destruir celulas cancergenas. El exito de
una aplicacion se eval
ua con un examen histologico. Suponga que una aplicacion es exitosa
con probabilidad p. En caso cuya gravedad lo amerita, aplicaciones se repiten hasta contrar
tres examenes que indiquen exito.
a) Calcule la probabilidad de que un paciente dado requiera seis aplicaciones
b) Calcule la probabilidad que un paciente dado requiera menos de seis aplicaciones
7. Suponga que se realizan n lanzamientos independientes de una moneda sesgada, con probabilidad de cara , 0 < < 1.
a) Determine la probabilidad de obtener exactamente n 1 caras, dado que se obtienen a lo
menos dos caras en total.
b) Determine la probabilidad de obtener exactamente n 1 caras, dado que se obtiene cara
en cada uno de los primeros n 2 lanzamientos.
8. Usted recibe correos electronicos durante una jornada que se define como el perodo de tiempo
que va desde las 8 de la ma
nana a las 20 horas. Solo en este perodo ustede puede leer sus
correos. Suponga que los correos se reciben de acuerdo a un proceso de Poisson a un tasa (o
razon) de 0,2 mensajes por hora.
a) Usted lee sus correos cada hora durante una jornada. Cual es la probabilidad de que en
una hora dada no encuentre mensajes nuevos? Y cual es la probabilidad de encontrar a
lo mas un mensaje nuevo en esa hora?
b) Suponga que debido a un viaje usted no ha ledo su correo durante toda una jornada.
Cual es la probabilidad de que haya recibido exactamente 2 mensajes?
c) Dado que en la u
ltima jornada usted ha recibido 7 correos en total, calcule la probabilidad
de que entre las 8 y 10 de la ma
nana usted haya recibido exactamente 3 mensajes?
Verifique que esta probabilidad es igual a P(X = 3) cuando X Binomial(n, p), e
identifique los parametros.
49

9. Un peaje cobra $2000 por cada autob


us de pasajeros y $3500 por otros vehculos particulares.
Supongamos que durante las horas diurnas, el 60 % de todos los vehculos son autobuses de
pasajeros.
a) Si 25 vehculos cruzan el peaje durante un perodo particular diurno, cual es el ingreso
esperado en el peaje?; cual es la varianza del ingreso del peaje?
b) Suponga que los vehculos de pasajeros llevan un promedio de 15 pasajeros y los particulares un promedio de 3 pasajeros. Cual es la probabilidad de que un vehculo que se
detiene en el peaje lleve cuatro pasajeros?
c) Un vehculo es detenido en el peaje y lleva tres pasajeros, cual es la probabilidad de que
sea de tipo particular?
10. Una fabrica de motores cerrara si tiene mas de dos fallas en un da durante los proximos 15
dias. La probabilidad de que alguno de estos tenga fallas en cada intento es de 0,03 y cada da
se producen 10 motores.
a) Cual es la probabilidad de que la fabrica cierre?
b) Cual es la probabilidad de que la fabrica no cierre?
c) Cual es la probabilidad de que ocurran 2 o mas fallas todos los das?
d) Cuantos das tendra que haber fallas para que la probabilidad de cierre sea de 0,5?
11. Si el 90 % de todos los solicitantes para cierto tipo de hipoteca no llenan correctamente el
formato de solicitud en la primera remision, Cual es la probabilidad de que entre 15 de estos
solicitantes seleccionados al azar:
a) Por lo menos 12 no la llenen a la primera remision.
b) Entre 10 y 13 inclusive no la llenen a la primera remision.
c) A lo sumo 2 llenen correctamente sus formatos en la primera remision.
12. Una compa
na de seguros esta considerando incluir la cobertura de una enfermedad extra
na en
el campo de seguros medicos. La probabilidad de que un individuo seleccionado aleatoriamente
tenga esta enfermedad es 0,001 y se incluyen 3000 individuos en el grupo asegurado. Se pide
determinar:
a) Cual es el n
umero esperado de personas del grupo que padecen dicha enfermedad?
b) Cual es la probabilidad de que ninguna persona del grupo de 3000 padezca la enfermedad?
13. Una variable aleatoria continua X que puede tomar valores entre x=2 y x=5 tiene una funci
on
de densidad
2(1 + x)
fX (x) =
27
Calcule
a) P(X < 4)
b) P(3 < X < 4)
50

14. Considere la funcion de densidad



k x, 0 < x < 1
fX (x) =
0,
e.o.c.
a) Encuentre el valor de k.
b) Encuentre FX (x) y utlcela para calcular
P(0,3 < X < 0,6)
15. Un individuo dispara dardos sobre un blanco circular de radio r > 0. Suponga que la probabilidad de que el dardo caiga en un circulo concentrico (centrado en el origen) es proporcional al
area de dicho crculo. Sea X la distancia desde la posicion en que el dardo impacta el tablero
y su centro.
a) Obtenga la funcion de distribucion acumulada, funcion de densidad y valor esperado de
X.
b) Calcule la probabilidad de que el dardo aterrice a una distancia (j 1)r/4 y jr/4 del
origen j = 1, 2, 3, 4.
c) Si se sabe que el dardo aterrizo a una distancia inferior a r/2 del centro Cual es la
probabilidad de que haya cado a una distancia menor que d, con 0 < d < r/2?
16. Una maquina que marca n
umeros telefonicos al azar selecciona aleatoriamente cuatro dgitos
entre 0000 y 9999 (incluido ambos). Trate a la variable Y, el n
umero seleccionado, como
si fuese continua (aun cuando hay solo hay 10000 posibilidades discretas) y uniformemente
distribuida.
a) Encuentre P(0300 < Y < 1300)
b) P(Y > 5555)
c) Encuentre la varianza de Y
17. En una central nuclear ocurren aleatoriamente a lo largo del tiempo eventos poco comunes
(problemas menores de operacion). El tiempo medio entre dos eventos es 40 das.
a) Cual es la probabilidad de que el tiempo para el siguiente evento poco com
un se encuentre entre 20 y 60 das?
b) Cual es la probabilidad de que pasen mas de 60 das sin probemas?
c) Encuentre la desviacion estandar del tiempo para el siguiente evento poco com
un.
d) Un analisis de los archivos de la central nuclear muestra que los eventos poco comunes suceden con mayor frecuencia los fines de semana, que hipotesis subyacente a las
respuestas de las preguntas anteriores se pone en duda?
18. Sea Z una variable aleatoria normal estandarizada. Calcule:
a) P(0 Z 1,96)
51

b) P(Z > 1,96)


c) P(1,96 Z 1,96)
d) P(0 Z 1,96)
19. Los ingresos anuales de los profesores de la universidad siguen una distribucion normal con
media 18600 dolares y una desviacion estandar de 27000 dolares. Encuentre la probabilidad
de que un profesor seleccionado al azar tenga
a) un ingreso anual inferior a 15000 dolares.
b) un ingreso mayor a 21000 dolares.
c) un ingreso mayor a 25000 y de a lo mas 30000 dolares.
20. La presion de aire de un neumatico seleccionado al azar, instalado en un automovil nuevo,
esta normalmente distribuida con valor medio 31 lb / pulg y desviacion estandar de 0,2 lb /
pulg
a) Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, exceda
de 30.5 lb/ pulg?
b) Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, se
encuentre entre 30.5 y 31.5 lb/ pulg?
c) Suponga que un neumatico se considera con presion baja si esta debajo de 30.4 lb/ pulg .
Cual es la probabilidad de que al menos uno de los cuatro neumaticos de un autom
ovil
se encuentre con presion baja?
21. La dureza Rockwell de un metal se determina al golpear con un punto acerado (herramienta) la
superficie del metal y despues medir la profundidad de penetracion del punto. Suponga que la
dureza Rockwell de cierta aleacion esta normalmente distribuida con media de 70 y desviaci
on
estandar de 3.
a) Si un especimen es aceptable solo si su dureza esta entre 67 y 75, Cual es la probabilidad
que un especimen seleccionado al azar tenga una dureza aceptable?
b) Si la escala aceptable de dureza es (70 c; 70 + c) Para que valores de c tendran el 95 %
de los especimenes una dureza considerada aceptable?
c) Cual es la probabilidad de que a lo sumo ocho de diez especimenes, seleccionados independientemente, tengan una dureza menor a 73, 84?
22. Suponga que los niveles de colesterol para los adultos entre 20 y 74 a
nos de edad tienen media
= 211mg/dl y desviacion estandar = 46mg/dl. Se asume que por debajo de 200 mg/dl
los niveles son normales, entre 200 y 240 mg/dl el nivel es normal-alto y mas de 240 es alto.
a) Cual es la probabilidad de estar en cualquiera de las tres categoras?
b) Si se eligen 10 adultos al azar, cual es la probabilidad que a lo mas tres de ellos tengan
colesterol alto?

52

10.6.

Funciones de Variables Aleatorias

Definici
on 10.16 Sea X una variable aleatoria y sea g una funcion con dominio en S y valores en
R. El valor esperado de g(X) esta dado por

X

g(xi )P(X = xi ), X discreta

E(g(X)) =
Zi=1

g(x)f (x)dx,
X continua

10.6.1.

Momentos y funciones generadoras de momentos

Definici
on 10.17 Dada una variable aleatoria X se definen:
(i)

X

xki fx (xi ),
X discreta

k
E(X ) =
Zi=1

xk fX (x)dx, X continua

como el k-esimo momento (no centrado) de X.


(ii)

X

(xi )k fx (xi ),
X

k
i=1
E((X ) ) =
Z

(x )k fX (x)dx, X

discreta
continua

como el k-esimo momento centrado de X.


Definici
on 10.18 La funci
on generadora de momentos (f.g.m.) de una variable aleatoria X
se define como

X

etxi fx (xi ),

MX (t) =
Zi=1

etx fX (x)dx,

con t R.
Ejemplo 10.16 Determine su funcion generadora de momentos para las siguientes distribuciones:
a) X Bin(n, p)
b) X N(0, 1)
Teorema 10.7 Sea X una variable aleatoria con funcion generadora de momentos MX (t). Entonces

dk MX (t)
k
E(X ) =
dtk t=0
53

Ejemplo 10.17 Utilizando las respectivas f.g.m calcule la media de X si


a) X Bin(n, p)
b) X N(0, 1)
Teorema 10.8 (Teorema de Unicidad)
Sean X e Y dos avriables aleatorias con funciones generadoras de momentos MX (t) y MY (t), respectivamente. Si MX (t) = MY (t) para todos los valores de t, entonces X e Y tienen la misma
distribucion de probabilidad.
Teorema 10.9 Si Y = cX + d, entonces MY (t) = etd MX (t)
Ejemplo 10.18 Sea X una variable aleatoria con distribucion normal estandar. Determine la
f.g.m. de Y = + X.
10.6.2.

Transformaci
on de variables

Frecuentemente, en estadstica, se presenta la necesidad de deducir la distribucion de probabilidad de una funcion de una o mas variables aleatorias. Por ejemplo supongamos que X es una variable
aleatoria discreta con distribucion de probabilidad f (x) y supongamos ademas que Y = g(X) define una transformacion uno a uno entre los valores de X e Y . Se desea encontrar la distribucion
de probabilidad de Y . Es importante resaltar el hecho que la transformacion uno a uno implica
que cada valor de x esta relacionado con un, y solo un valor de y = g(x) y que cada valor de y
esta relacionado con un, y solo un valor de x = g 1 (y).
Teorema 10.10 Sea X una variable aleatoria discreta con distribucion de probabilidad f(x). Si
Y = g(X) define una transformacion uno a unn entre los valores de X e Y de tal forma que la
ecuacion y = g(x) pueda resolverse u
nicamente para x en terminos de y. Entonces la distribuci
on
de probabilidad de Y es
fY (y) = fX (g 1 (y))
Ejemplo 10.19 Sea X una variable aleatoria geometrica con distribucion de probabilidad
 x1
3 1
,
x = 1, 2, . . .
fX (x) =
4 4
a) Encuentre al distribucion de la variable aleatoria de Y = X 2
b) Encuentre la distribucion para la variable aleatoria Z = 4 5X
Teorema 10.11 Suponga que X es una variable aleatoria continua con distribucion de probabilidad
f (x). Sea Y = g(X), con g una funcion uno a uno entre los valores de X e Y . Entonces la
distribucion de probabilidad de Y esta dada por
fY (y) = fX (g 1 (y))|J|
donde J = (g 1 (y))0 y recibe el nombre de Jacobiano de la tranformacion.
54

Ejemplo 10.20 .
a) Sea X una variable aleatoria continua con funcion densidad
fX (x) =

x
,
12

1<x<5

Encuentre la distribucion de probabilidad de la variable aleatoria Y = 2X 3.


b) Sea X una variable aleatoria con densidad Beta(a,b), es decir,
fX (x) =

(a + b) a1
x (1 x)b1 ,
(a)(b)

0 < x < 1.

Determinar la distribucion de Y = 1 - X.
Teorema 10.12 Sea X una variable aleatoria continua con funcion densidad fX (x). Si Y = g(X)
es una transfromacion entre los valores de X e Y que no es uno a uno, es decir, para cada y R
existen k inversas, xi = gi1 (y), i = 1, . . . , k, entonces la distribucion de probabilidad de Y es
fY (y) =

k
X

fX (gi1 (y))|Ji |

i=1

donde
|Ji | =

d 1
g (y) i = 1, . . . , k.
dy i

Ejemplo 10.21 . Sea X una variable aleatoria con densidad


1
fX (x) = e|x| ,
2

< x < .

Determinar la distribucion de Y = |X|.

Ejercicios 8 .
1. Si X U (0, 1), encontrar al funcion densidad de Y = eX
R: fY (t) = 1t 1 < t < e.
2. Si Y U (0, 5), cual es la probabilidad de que las races de la ecuacion 4x2 + 4xY + Y + 2 = 0
sean ambas reales?
R: 35
3. Un entero positivo I es seleccionado con P(I = n) = 21n para n = 1, 2, . . . Si el entero es n, se
lanza la moneda al aire y la probabilidad de obtener una cara es en . Cual es la probabilidad
que al lanzar la moneda obtengamos cara?
R: 2e11
55

4. Se dice que X tiene distribucio Weibull si



x1 exp(x ), x > 0;
fX (x) =
0,
e.o.c.
Se asume que > 0 y > 0. Determine E(X). Cual es la distribucion de Y = X ?
5. Encuentre la funcion generadora de momentos de una variable aleatoria X U (a, b). Use
este resultado para calcular E(X) y V (X).
6. Sea X un variable aleatoria que sigue cada una de las siguientes distribuciones:
a) Bin(n,p)
b) Poisson()
c) Geom(p)
d) U(m,n), m < n.
Para cada distribucion calcule
a) E(X)
b) E(X(X-1))
c) E(X 2 )
d) V(X)
e) E(z X ), donde z es un n
umero real.
7. A traves de experimentos estadsticos se determino que la duracion de un cierto tipo de llamada
telefonica satisface la relacion P(T > t) = aet + (1 - a)et , t 0, donde 0 a 1,
, > 0. Hallar la media y la varianza de T.
8. Suponga que X tiene funcion densidad
g(x) = cecx ,
a) Encuentre la distribucion de

x 0.

X
1+X

b) Encuentre la distribucionde X + c
9. Suponiendo que X tienen la siguiente funcion de densidad
f (x) = e(xa) ,

x a.

a) Encuentre MX (t).
b) Calcular E(X) y V(X).
10. Sea X una variable aleatoria que satisface
2

P(X > t) = et
56

t > 0.

a) Calcule P(1 < X < 2)


b) Encuentre la funcion densidad de probabilidad de X.
c) Calcule E(X 2 )
d) Calcule el percentil 90 de la distribucion de X.
e) Encuentre la funcion distribucion acumulada de

1
X

11. Sea X una variable aleatoria con funcion densidad dada por
fX (x) =

|x|
,
16

si |x| < 4.

a) Determine E(X).
b) Encuentre la funcion de distribucion acumulada de Y = |X|.
c) Determine E(Y).
12. Suponga que el n
umero de horas X que funcionara una maquina antes de fallar es una variable aleatoria con distribucion Normal de parametros = 720 y 2 = 482 .
Suponga que en el momento en que la maquina comienza a funcionar Ud. debe decidir cuando
el inspector regresara a revisarla. Si el vuelve antes de que la maquina falle, se ocasiona un
costo de a dolares por haber desperdiciado una inspeccion. Si vuelve despues de que la m
aquina
haya fallado, se ocasiona un costo de b dolares por el no funcionamiento de la maquina.
a) Determine una expresion para el costo esperado, considerando que el tiempo hasta que el
inspector vuelve a inspeccionar la maquina es de t horas.
b) Suponga que el inspector decide volver en un tiempo de t = 816 hrs. Calcule la probabilidad de que el inspector llegue tarde a la inspeccion, es decir, la maquina ya ha dejado
de funcionar.
c) Se observa este proceso durante 15 perodos. Determine la probabilidad de que el inspector
llegue tarde mas de 12 veces.

57

10.7.

Aproximaci
on de distribuciones

Sea una variable aleatoria X Bin(n, p), por ejemplo, suponga que recoge la opinion de una
muestra de 1000 electores para saber su sentir en pro del fortalecimiento del gobierno de la ciudad.
Cual es la probabilidad de encontrar 460 o menos electores a favor del fortalecimiento si suponemos
que el 50 % de la poblacion esta a favor de el?
En este caso, sea X el n
umero de electores en pro del fortalecimiento, con X Bin(1000, 1/2),
entonces para calcular la probabilidad pedida P(X 460) debemos sumar 461 terminos, lo que no
parece una tarea facil.
En este tipo de situaciones, donde el n
umero de ensayos es demasiado grande ( 20), aproximaremos nuestra distribucion de probabilidad a otro distribucion, dependiendo del valor de p, la
probabilidad de exito.
10.7.1.

Aproximaci
on Poisson a la distribuci
on Binomial

Se sugiere aproximar a la distribucion Poisson una distribucion binomial para valores de n muy
grandes y de p muy peque
na. La regla es aproximar si p < 0,05 y n 20. Si n 100 la aproximacion es buena siempre y cuando np > 10.
En ambos casos = np y en vez de utilizar X Bin(n, p) usamos X P (np).
Ejemplo 10.22 Se sabe que el 5 % de los libros encuadernados en cierto taller tienen encuadernaciones defectuosas. Determine la probabilidad de que 2 de 100 libros encuadernados en ese taller,
tengan encuadernaciones defectuosas, usando,
a) la formula de la distribucion Binomial,
b) la aproximacion de Poisson a la distribucion Binomial.
10.7.2.

Aproximaci
on Normal a la distribuci
on Binomial

Se sugiere aproximar la distribucion Normal a una distribucion binomial cuando n es muy


grande y los valores de p son cercanos a 0.5.
En tal caso, = np y 2 = np(1 p). Esta aproximacion debera utilizarse solo si np 5 y
n(1 p) 5.
Ejemplo 10.23 Se considera un sindicato laboral en el cual el 40 % miembros esta a favor de la
huelga. Si se seleccionan 15 miembros de manera aleatoria, cual es la probabilidad de que 10 apoyen
un paro? Calcule dicha probabilidad utilizando las distribuciones Binomial y Normal por separado
y compare.
Ejercicios 9 El 45 % de todos los empleados del centro de capacitacion gerencial tiene ttulos universitarios. Cual es la probabilidad de que de los 150 empleados seleccionados aleatoriamente, 72
tengan un ttulo univeristario?

58

11.

Vectores Aleatorios

Definici
on 11.1 X = (X1 , X2 , . . . , Xn ) es un vector aleatorio definido en (, A, P) ssi X1 , X2 , . . . , Xn
son variables aleatorias definidas en el mismo modelo (, A, P).

11.1.

Distribuci
on Conjunta

Definici
on 11.2 La funcion definida por
FX1 ,X2 ,...,Xn (x1 , x2 , . . . , xn ) = P(X1 = x1 , X2 = x2 , . . . , Xn = xn ),

xR

se llama funci
on distribuci
on conjunta de X1 , X2 , . . . , Xn
Definici
on 11.3 Sea X = (X1 , X2 , . . . , Xn ) un vector aleatorio en (, A, P). Diremos que:
a) X = (X1 , X2 , . . . , Xn ) es discreto ssi
Rec(X)= Rec(X1 , X2 , . . . , Xn )
es un subconjunto contable (finito o no) de Rn .
En tal caso, la distribucion de probabilidad puede representarse mediante
\

n
P(X1 = x1 , X2 = x2 , . . . , Xn = xn ) = P
{Xi = xi }
i=1

As,
(i) P(X = x) 0
x Rn
P
(ii)
P(X = xi ) = 1
b) X = (X1 , X2 , . . . , Xn ) es continuo ssi existe una funcion
fX1 ...Xn : Rn R
no negativa tal que
Z

x1

xn

FX1 ...Xn (x1 , . . . , xn ) =

fX1 ...Xn (t1 , . . . , tn )dtn dt1 ,

xR

En tal caso
fX1 ...Xn (x1 , . . . , xn ) =

n
FX ...X (x1 , . . . , xn )
x1 xn 1 n

Ejemplo 11.1 Sean X e Y variables aleatorias con funcion distribucion conjunta dada por

(1 ex )(1 ey ), x >0, y > 0;
FXY (x, y) =
0,
e.o.c.
Determine fXY .
59

Definici
on 11.4 La distribuci
on de probabilidad de X = (X1 , X2 , . . . , Xn ) se define como:
PX (B) = P(X B)

B Bn

As, PX (B), B B n , es una medida de probabilidad.


(PX , B n , Rn ) es una medida de probabilidad.
Proposici
on 2

B Bn
X

P(X = x), X

xB
Z
PX (B) = P(X B) =

fX (x)dx, X

discreta
continua

xB

Teorema 11.1 Sea X un vector aleatorio continuo n- dimensional con densidad fX (x). Sea g =
(g1 , g2 , . . . , gn ) una funcion. Considere el vector aleatorio Y = g(X). Esto significa que se considera
la transformacion
y1 = g1 (x1 , . . . , xn )
y2 = g2 (x1 , . . . , xn )
..
.
yn = gn (x1 , . . . , xn )

Finalamente supongase que g y g 1 son continuas y dieferenciables. Entonces la densidad de Y es


fY (y) = |J|fX (g 1 (y), g21 (y), . . . , gn1 (y)) y Rn
Ejemplo 11.2 Sean X e Y dos variables aleatorias continuas con distribucion de probabilidad
conjunta

4xy, 0 < x < 1, 0 < y < 1;
f (x, y) =
0,
e.o.c.
Encuentre la densidad conjunta de W = X 2 y Z = XY .

60

11.2.

Distribuciones Conjuntas Especiales

Algunas distribuciones multivariadas conocidas se enuncian a continuacion:


Suponga que realiza N experimentos inpedendientes, en cada uno de los cuales puede obtener
uno de los k resultados posibles, cada uno con probabilidad p1 , p2 , . . . , pk , respectivamente, y desea
contar cuantas repeticiones de cada resultado obtuvo.
Definici
on 11.5 Las variables aleatorias X1 , X2 , . . . , Xk tienen una distribuci
on multinomial
si y solo si su distribucion de probabilidad conjunta esta dada por


n
P(X1 = x1 , Xk = xk , . . . , Xk = xk , ) =
px1 px2 . . . pxkk
n1 n2 nk 1 2
donde

r
X

nj = n

j=1

k
X

pi = 1

i=1

Lo que se denota como


(X1 , . . . , Xk ) M ult(n, p1 , p2 , . . . , pk )
Ejemplo 11.3 Suponga que los errores de cierto procedimiento de medicion tienen distribuci
on
normal de media 0 y desviacion estandar 2, en milmetros. Suponga que se toman 10 mediciones
independientes. Calcule la probabilidad que: por lo menos 9 mediciones tengan errores menores a
los 2 milmetros y que no mas de una medicion tenga error mayor a los 3 milmetros.

Considere un conjunto de N elementos, de los cuales M1 son de la P


primera clases, M2 de la
segunda clase, y as sucesivamente, hasta Mk de la k-esima clase, donde
Mi = N .
Definici
on 11.6 Las variables aleatorias X1 , . . . , Xk tienen una distribucion hipergeom
etrica
multivariada si y solo si su distribucion de probabilidad conjunta esta dada por


M1
k
... M
x1
xk

P(X1 = x1 , . . . , Xk = xk ) =
M
n

donde

k
X

xi = n,

i=1

k
X

Mi = N

i=1

Ejemplo 11.4 En un panel de presuntos jurados participan 6 hombres casados, tres hombres solteros, siete mujeres casadas y cuatro mujeres solteras. Si la seleccion es al azar, cual es la probabilidad
de que el jurado consita de 4 hombres casados, un soltero, cinco mujeres casadas y dos solteras?

61

Entre las distribuciones multivariadas continuas, la distribucion normal multivariada es de especial importancia, ya que es una generalizacion de la distribucion normal en una variable.
Definici
on 11.7 El vector aleatorio (X, Y ) tiene una distribucion normal bivariada si y s
olo si
su funcion densidad conjunta esta dada por

2 
2




1
x 1
y 2
x 1
y 2
1
p
f (x, y) =
+
2
exp
2(1 2 )
1
2
1
2
21 2 1 2
para x R, y R, 1 , 2 > 0, y 1 < < 1.

Teorema 11.2 Si dos variables aleatorias tienen una distribucion normal bivariada, son inpedendientes si y solo si = 0.

62

11.3.

Distribuci
on Marginal y Condicional

Dada la distribucion de probabilidad conjunta f (x, y) de las variables aleatorias X e Y , la


distribucion de probabilidad f (x) de X se obtiene al sumar f (x, y) sobre todos los valores de Y .
De la misma forma, la distribucion de probabilidad f (y) se obtiene al sumar f (x, y) sobre todos
los valores de X. Cuando X e Y son variables aleatorias continuas, las sumas se reemplazan por
integrales.
Definici
on 11.8 Las distribuciones marginales de X e Y estan dadas por
X
X
pX (x) =
fXY (x, y)
y
pY (y) =
fXY (x, y)
y

para el caso discreto y


Z

Z
fXY (x, y)dy

fX (x) =

fY (y) =

fXY (x, y)dx


x

para el caso continuo.


Definici
on 11.9 Sean X e Y dos variables aleatorias discretas o continuas. La distribuci
on condicional de la variable aleatoria Y, dado que X=x, esta dada por:
fY |X (y) =

fXY (x, y)
,
fX (y)

fX (x) > 0

Ejemplo 11.5 Suponga que la fraccion X de atletas hombres y la fraccion Y de atletas mujeres que
terminan la carrera del maraton puede describirse por la funcion densidad conjunta
fXY (x, y) = 8xy,

0 x 1, 0 y x.

Encuentre fX , fY y fY |X y determine la probabilidad de que menos de 1/8 de las mujeres que se


inscribieron para un maraton en particular la finalicen, si se sabe que exactamente 1/2 de los atletas
hombres terminaron la carrera.
Definici
on 11.10 Sean X e Y dos variables aleatorias, discretas o continuas, con distribuci
on
de probabilidad conjunta fXY y distribuciones marginales fX y fY , respectivamente. Las variables
aleatorias X e Y se dice que son independientes estadsticamente, ssi
fXY (x, y) = fX (x)fY (y),

63

x, y R

Ejercicios 10 .
1. Usted tiene una urna con r fichas rojas y n fichas negras, con r 2 y n 2. Usted extrae
2 fichas al azar, sucesivamente y sin reemplazo. Para cada i {1, 2}, defina: Xi = 1, si la
i-esima bolita extraida es roja, y Xi = 0, si no.
a) Determine la funcion de probabilidad conjunta del vector (X1 , X2 ).
b) Determine las distribuciones marginales de X1 y X2 .
c) Obtenga la funcion de distribucion acumulada FX1 X2 (x1 , x2 ) con (x1 , x2 R2 )
2. Sean X1 , X2 variables aleatorias con distribucion exponencial de parametro 1 y 2 respectivamente. Suponga ademas que los eventos del tipo (X1 < c1 ) y (X2 < c2 ) son independientes
entre s para cualquier c1 , c2 R+ , de lo que se desprende que los eventos del tipo (X1 > c1 )
y (X2 > c2 ) tambien lo son. Considere las siguientes variables aleatorias
Z = max{X1 , X2 } y

W = mn{X1 , X2 }.

a) Exprese FZ (z) en funcion de FX1 (z) y FX2 (z).


b) Calcule fZ (z).
c) Demuestre que W sigue una distribucion exponencial e identifique su parametro.
3. Sea (X, Y ) un vector aleatorio con funcion de densidad conjunta
fX,Y (x, y) = cxy,

0 x 1; 0 y 1

a) Calcule P(X t, Y t) para cualquier t (0,1).


b) Calcule P(X + Y 1).
4. Sean X e Y variables aleatorias con funcion de densidad de probabilidad conjunta

3x, 0 < y < x < 1;
fX,Y (x, y) =
0, e.o.c.
a) Calcule fX , fY
b) Encuentre FX,Y (x, y) para 0 < y < x < 1.
c) Calcule P(Y > x/2)
5. Suponga que X e Y son variables aleatorias con densidad conjunta dada por:
fX,Y (x, y) = 120x(y x)(1 y)

0xy1,

y 0 en otro caso.
a) Verifique que Y tiene distribucion Beta(, ) e indique el valor exacto de y
b) Muestre que para todo 0 < t < 1, P (X t Y ) = 3t2 2t3 .
64

6. Suponga que X e Y son variables aleatorias con densidad conjunta dada por:
0 x 1,

fX,Y (x, y) = 2x;

0y1

a) Calcule P(X + Y t) para 0 t 2.


Indicacion: Analice separadamente los casos 0 t 1 y 1 < t 2.
b) Obtenga la funcion de densidad de la variable aleatoria Z = X + Y.
c) Demuestre que sen(X) y {ln(Y )}2 son independientes.
7. Sean X e Y variables aleatorias independientes con distribucion Normal(0, 2 ). Encuentre las
funciones de densidad margina de U = X 2 + Y 2 y V = X
y vea que estas son independientes.
Y
8. Sea X e Y variables aleatorias independientes con funciones densidades marginales
fX (x) = xex ,

x>0

fY (y) = ey

Sean
Z = X + Y,

W =

y>0

X
X +Y

a) Determine las respectivas densidades marginales de Z y W .


b) Son Z y W variables aleatorias independientes?
c) Obtenga la funcion generadora de momentos de Z, MZ (t).
9. Sea (X, Y ) un vector bivariado discreto con funcion de probabilidad conjunta,
pX,Y (x, y) =

cy
,
x+1

1 x 3;

1yx

Calcule pX (x) en funcion de la constante c y determnela.


10. Sea (X, Y ) un vector aleatorio con funcion de densidad conjunta
fX,Y (x, y) = c|y|ex ,

0 x ; x y x

a) Encuentre la densidad marginal de X en termino de la constante c. Demuestre que c =


1/2.
b) Encuentre la densidad marginal de Y y obtenga E(Y ).
c) Encuentre la densidad condicional de Y dado X = 1.

65

11.4.

Esperanza y Varianza Condicional

Definici
on 11.11 Dado un vector aleatorio (X,Y) la esperanza condicional de Y dado X=x se
define como
X

y P(Y = y|X = x), X discreta

Zy
E(Y |X = x) =

y fY |X (y)dy,
X continua

Mas generalmente, si g : R R
X

g(y)P(Y = y|X = x), X discreta

Zy
E(g(Y )|X = x) =

g(y)fY |X (y)dy,
X continua

Proposici
on 3 Si E(|Y |) <
E[E(Y | X)] = E(Y )
Ejemplo 11.6 Sea Y |X = x U (0, 1 x) y fX (x) = 2(1 x), si 0 < x < 1. Determine E(Y ).
Propiedades:
i) E(c|X = x) = c
ii) E(Y1 + Y2 |X = x) = E(Y1 |X = x) + E(Y2 |X = x)
iii) E(cY |X = x) = c E(Y |X = x)
iv) E(g(X, Y )|X = x) = E(g(x, Y ))
En particular,
E(g1 (X)g2 (Y )|X = x) = g1 (x)E(g2 (Y )|X = x)
v) E(g(Y )|X = x) = E(g(Y )) X es independiente de Y.
Definici
on 11.12 La varianza condicional de Y dado X=x se define como
V(Y |X = x) = E[(Y E(Y |X = x))2 |X = x]
X

(y E(Y |X = x))2 P(Y = y|X = x), X discreta

Zy
=

(y E(Y |X = x))2 fY |X (y)dy,


X continua

Teorema 11.3 Suponga que E(Y 2 ) <


V(Y ) = E(V(Y |X)) + V(E(Y |X))
66

Ejemplo 11.7 Sean X e Y variables aleatorias continuas tales que X U(0, 1) e Y |X = x


U(x, x + 1).
Calcule:
a) E(Y |X = x) y V(Y |X = x).
b) E(Y ) y V(Y ).
c) La densidad condicional de X dado Y = y.
d) E(X|Y = y) y E(Y |X = x).
e) Considere las funciones de variables aleatorias h(Y ) = E(X|Y ) y k(X) = E(Y |X). Calcule la
funcion de densidad de h(Y ) y la funcion de densidad de k(X).
Ejercicios 11 .
1. Sean X e Y variables aleatorias independientes con X P oisson(1 ), Y P oisson(2 ).
a) Muestre que Z = X + Y sigue una distribucion Poisson. Determine el parametro de esta
distribucion.
b) Encuentre la funcion distribucion del vector (X,Z).
2. Sea X una variable aleatoria positiva con media y varianza . Condicional en el valor
observado x de X se generan variables aleatorias Y1 , Y2 , . . . , Yn independientes e identicamente
distribuidas P oisson(cx).
a) Calcule E(Y1 ) y V(Y2 )
P
Yi . Calcule E(Tn ) y V(Tn ).
b) Sea Tn = n1
3. Sean S y T variables aleatorias independientes con densidades marginales
1
fS (s) = s2 es ,
2

s>0

fT (t9 = 2t,

0 < t < 1.

a) Sea X=ST. Encuentre la densidad de probabilidad conjunta de X y S.


b) Calcule E(X|T = t) y obtenga E(X).
4. Sean N, X1 , X2 , . . . variables aleatorias independientes donde N P oisson() y Xi U (0, ),
i = 1, 2, . . .
Sea
N
X
T =
Xi
i=1

a) Encuentre E(T ) y V(T ).


b) Sea Z = max{X1 , . . . , Xn }. Encuentre E(Z).

67

5. Sean (X1 , Y1 ), (X2 , Y2 ), . . . vectores aleatorios tales iid donde X1 sigue una distribucion U(0,1)
y la densidad condicional de Y1 dado X=x es
fY1 |X1 (y) =

1 y/x
ye
,
x2

Sea
T =

n
X

y>0

Yk

k=1

a) Calcule E(T )
b) Calcule V( Tn )
6. Sean X e Y variables aleatorias tales que Y |X = x Bin(x, p) y X P oisson(). Determine
la distribucion de Y y calcule su esperanza.

68

12.

Nociones de Convergencia

El objetivo de esta seccion es estudiar el comportamiento de una secuencia de variables aleatorias,


{Z1 , Z2 , . . . , Zn }, cuando n .
Definici
on 12.1 Sea {Zn , n 1} una secuencia de variables aleatorias en (, A, P) y sea R
una constante.
Diremos que Zn converge en probabilidad para ssi
> 0,

P(|Zn | ) 0,

cuando

Notacion: Zn
P

Ademas, note que Zn

(Zn ) 0

Definici
on 12.2 Sea {Zn , n 1} una secuencia de variables aleatorias definidas en (, A, P) y
sea Z otra variable aleatoria, cuya distribucion no depende de n, la cual no necesita estar definida
sobre el mismo espacio de probabilidad donde se encuentran definidas las Zn s.
Diremos que Zn converge en distribuci
on para Z ssi
FZn (z) = P(Zn z) P(Z z) = FZ (z)
cuando n , z donde FZ es continua.
D

Notacion: Zn Z

o FZn FZ

Las definiciones anteriores motivan el siguiente teorema:


Teorema 12.1 (del Lmite Central)
Sean X1 , X2 , . . . , Xn una secuencia de variables aleatorias independientes con media y varianza
2 < . Entonces,
Xn D
N (0, 1)
n

donde
n
X
Xi
Xn =
n
i=1
Aplicacion:
Para n suficientemente grande
X n N (, 2 /n)

69

Ejercicios 12 .
1. La distribucion de las perdidas mensuales de una empresa en unidades monetarias (u.m.) es
aproximadamente normal, con una media de = 3500 y una varianza de 2 = 184900.
a) Cual es al probabilidad de que las perdidas mensuales sean inferiores a 2500 u.m.?
b) Que valor separa el 5 % inferior de la distribucion de las perdidas mensuales?
c) Describa la distribucion de medias muestrales de tama
no 5 tomadas de esta poblaci
on.
d) Que valor separa el 5 % inferior de la distribucion muestral de tama
no 5?
e) Dada una muestra de las perdidas de 5 meses, cual es la probabilidad de que las perdidas
mensuales sean inferiores a 2500 u.m.?
f) Cual es al probabilidad de que solo uno de los cinco meses se tenga una perdida menor
a 2500 u.m.?
2. Entre los adultos, la distribucion de niveles de alb
umina en el fluido cerebroespinal es aproximadamente simetrica con media = 29,5mg/100ml y una varianza 2 = 85,56mg/100ml.
Suponga que usted elige muestras repetidas de tama
no 20 de esta poblacion y calcula la media
de cada muestra.
a) Si usted seleccionara una gran cantidad de muestras aleatorias de tama
no 20, Cual sera
la media de las medias muestrales?
b) Como se compara la desviacion estandar de las medias muestrales con al desviaci
on
estandar de los niveles de alb
umina mismos?
c) Si usted toma todas las diferentes medias muestrales y las utiliza para construir un histograma, Cual sera la forma de su distribucion?
d) Que proporcion de las medias muestrales de tama
no 20 son mayores de 33 mg/100ml?
e) Que proporcion de las medias son menores que 28 mg/100ml?
f) Que proporcion de las medias se localizan entre 29 y 31 mg/100ml?
3. Para la poblacion de hombres adultos, la distribucion de pesos es aproximadamente normal,
con media = 172,2 libras y una desviacion estandar de = 29,8 libras. Suponga que elige
una sola muestra aleatoria de tama
no 25 y encuentra que el peso medio de los hombres de la
muestra es = 190 libras. Cuan probable es este resultado? Que concluira usted?

70

Parte III

Inferencia Estadistica
13.

Introducci
on

La teora de la inferencia estadstica consiste en aquellos metodos por los que se realizan inferencias o generalizaciones acerca de una poblacion. La tendencia actual es la distincion entre el
metodo clasico de estimacion de un parametro en la poblacion, por medio del cual las inferencias se
basan de manera estricta en informacion que se obtiene de una muestra aleatoria seleccionada de la
poblacion, y el metodo bayesiano, que utiliza el conocimiento subjetivo previo sobre la distribucion
de probabilidad de los parametros desconocidos junto con la informacion que proporcionan los datos
de la muestra. En este curso desarrollaremos los metodos clasicos para estimar los parametros de
la poblacion desconocidos como la media, proporcion y varianza mediante el calculo de estadsticas
de muestras aleatorias.
La inferencia estadstica se puede dividir en doa areas principales: estimacion y pruebas de
hipotesis. La estimacion de un parametro poblacional puede ser puntual, es decir, por alg
un
metodo deteminamos una formula en funcion de los datos para calcular el valor de este en la muestra, o intervalar, donde ademas de calcular el valor del parametro en la muestra establecemos un
grado de precision de nuestra estimacion. Con las pruebas de hipotesis lo que queremos es llegar a
la decision correcta acerca de una hipotesis preestablecida, con alguna medicion de la precision de
nuestra decision.
Algunos conceptos de interes se definen a continuacion.
Definici
on 13.1 Las variables aleatorias X1 , . . . , Xn corresponden a una muestra aleatoria de
tama
na n de una poblacion con funcion densidad f (x) si
X1 , . . . , Xn son mutuamente independientes
X1 , . . . , Xn tienen funcion densidad marginal f (x)
las variables X1 , . . . , Xn se denominan independientes e identicamente distribuidas, iid, y escribimos
iid
Xi f (x),
i = 1, . . . , n.
Definici
on 13.2 Sean X1 , . . . , Xn una muestra aleatoria de tama
no n de una poblacion, y sea
T (x1 , . . . , xn ) una funcion real o vectorial- valorada. Entonces, la variable (vector) aleatoria(o)
Y = T(X1 , . . . , Xn )
se denomina estadstico.
P
Definici
on 13.3 Sea Z1 , . . . , Zk un muestra aleatoria de la distribucion N (0, 1). Sea Y = ki=1 Zi2 .
Entonces Y tiene distribucion chi-cuadrado de Pearson con k grados de libertad y se denota
por
k
X
Y =
Zi2 2k
i=1

71

Teorema 13.1 La esperanza y varianza de una distribucion 2 estan dadas por


E(Y ) = k
V(Y ) = 2k
Definici
on 13.4 Sea Z0 , Z1 , . . . , Zk una muestra aleatoria de la distribucion N (0, 1) y sea Y =
P
k
2
.
Z
i=1 i Entonces
Z0
X=p
Y /k
tiene distribucion t-Student con n grados de libertad y se denota por
X tn
Teorema 13.2 Si X1 , . . . , Xn es una muestra aleatoria de X N (, 2 ) entonces:
a)
n

X=

1X
Xi
n i=1

1 X
s =
(Xi X)2
n 1 i=1
2

son independientes.
b)
(n 1)s2
2n1
2

Definici
on 13.5 Sean X, Y dos variables aleatorias independientes que tienen distribucion 2 con
n y m grados de libertad, respectivamente, es decir,
X 2n e Y 2m
Entonces la variable aleatoria
Z=

X/n
Y /m

se tiene distribucion F con n y m grados de libertad y se denota por


Z Fn,m

72

14.

Estimaci
on Puntual

Definici
on 14.1 Un estimador puntual corresponde a cualquier funcion de la muestra
g(X1 , X2 , . . . , Xn )

14.1.

M
etodo de Momentos

Definici
on 14.2 Sea X1 , X2 , . . . , Xn una muestra aleatoria de una variable X, proveniente de una
poblacion con funcion de densidad f , con
= (1 , 2 , . . . , k )
El estimador de momentos e de corresponde a la solucion del sistema de ecuaciones
n

E(X 1 ) =

1X 1
X
n i=1 i
n

1X 2
E(X ) =
X
n i=1 i
2

.
= ..
n

E(X k ) =

1X k
X
n i=1 i

Debiendose plantear tantas ecuaciones como parametros se desea estimar.


iid

Ejercicios 13 Si X1 , X2 , . . . , Xn f , encuentre los estimadores de momentos si f es


1. U (, 2)
2. N (, 2 )

73

14.2.

M
etodo de M
axima Verosimilitud

Definici
on 14.3 Sea X1 , . . . , Xn una muestra aleatoria proveniente de una poblacion con funci
on
densidad f . Se define la funci
on de verosimilitud como la funcion densidad conjunta del vector
X1 , . . . , Xn y esta dada por
n
Y
L(, x) =
f (xi )
i=1
iid

Ejercicios 14 Si X1 , X2 , . . . , Xn f , encuentre una expresion simplificada para la funci


on de
verosimilitud si f es
1. exp()
2. (, ), con conocido.
3. Bin(n, p) con n conocido.
4. P oisson()
Definici
on 14.4 Un estimador m
aximo verosmil, EMV, de , basado en una muestra X
corresponde a
b
(X)
el cual se obtiene al resolver

log(L(, x)) = 0
j

j = 1, . . . , k

iid

Ejercicios 15 Si X1 , X2 , . . . , Xn f , encuentre los estimadores de maxima verosimilitud si f es


1. exp()
2. (, ), con conocido.
3. Bin(n, p) con n conocido.
4. P oisson()
Definici
on 14.5 Consideremos una familia de distribuciones con parametro para una variable aleatoria X y con funcion de verosimilitud asociada L(, x). Se dice que la log- verosimiltud
de X pertenece a una familia exponencial ssi existen funciones 1 , . . . , k y t1 , . . . , tk R,
tales que
k
X
log L(, x) = log h(x) + log c() +
j ()tj (x)
j=1

con h y c funciones positivas definidas en R

74

Ejemplo 14.1 Sea la variable aleatoria X con funcion densidad



(1 )x1 , x = 1, 2, . . . , (0,1);
f (x) =
0,
e.o.c.
Determine si f(x) pertenece a la familia exponencial.
Ejemplo 14.2 Sea X1 , . . . , Xn una muestra aleatoria de X cuya densidad es


1
1
2
f (x) =
exp 2 (x )
2
2 2
con x R, = (, 2 ), < < , 2 > 0, desconocidos. Determine si esta distribucion pertenece
a la familia exponencial.

75

15.

Insesgamiento y eficiencia

Definici
on 15.1 Un estimador puntual b de es insesgado si
b =
E()

Si b no es insesgado , se denomina sesgo de b a


b = E()
b
b()
Por lo tanto, un estimador es insesgado si su distribucion tiene como valor esperado al parametro
que se desea estimar.
iid

Ejercicios 16 Si X1 , X2 , . . . , Xn f , determine si los estimadores de momentos y maxima verosimilitud son insesgados para f
1. exp()
2. (, ), con conocido.
3. Bin(n, p) con n conocido.
4. P oisson()
Definici
on 15.2 El error cuadr
atico medio de un estimador b de corresponde a
b = E(b )2
ECM()
b + (b())
b 2
= V()
iid
b
Ejemplo 15.1 Sea X1 , . . . , Xn exp() y consideremos b = 1/x. Calcule el ECM().

Definici
on 15.3 Se define la matriz de informaci
on de Fisher como

2

I() = E
logL(, x)

Lema 2 Sea la funcion f tal que



 Z



d

E
logL(, x) =
logf (x) f (x) dx,
d


entonces,
2
 2


E
logL(, x) = E
logL(, x)

2


76

Teorema 15.1 Cramer - Rao.


Sea X1 , . . . , Xn una muestra con funcion densidad f que satisface la conmutatividad entre el operador integral y diferencial y sea g(X) = g(X1 , . . . , Xn ) un estimador donde E(g(X)) es diferenciable
como funcion de . Entonces
d
( d
E(g(X))2
V(g(X))
2

E
log L(, x)
Observacion: La cantidad

d
E(g(X))2
( d

log

L(, x)

2

se llama cota de Cram


er-Rao y todo estimador que alcance esta cota sera llamado eficiente.
Es claro que si g(X) es un estimador insesgado para entonces se cumple que
1

V(g(X))
E

log

2
L(, x)

es decir, la cota de Cramer- Rao es igual a I()1 .


Definici
on 15.4 Un estimador g(X) de se dice eficiente si
I()1
=1
b
V()
b
Teorema 15.2 Si b es el EMV de , entonces para cualquier funcion g(), el EMV de g() es g()

Ejercicios 17 .
iid

1. Si X1 , X2 , . . . , Xn f , encuntre los estimadores de momentos si f es


a) exp()
b) (, )
c) U (0, )
d) U (, )
2. Sea X1 , . . . , Xn una muestra aleatorio con funcion densidad
fX (x) =

x x/
e
2

x > 0,

>0

a) Determine el estimador de momentos y el EMV de .


b) Determine si b es insesgado, calcule su varianza y comparela con la cota de CramerRao. Es este estimador eficiente?
77

iid
b si b = x.
3. Sea X1 , . . . , Xn N (, 2 ). Calcule el ECM()

4. Suponga que el tiempo de duracion X de un cierto componente electronico posee distribuci


on
Rayleigh de parametro , con funcion densidad dada por
2
2
fX (x) = xex / ,

x>0 >0

Para realizar la inferencia acerca de se considera una muestra aleatoria X = (X1 , . . . , Xn )


que representa los tiempos de duracion de n de esos componentes.
a) Determine la funcion de verosimilitud.
b) Determine el estimador de maxima verosimilitud b de .
c) Determine si el EMV es insesgado.
b
d) Calcule el ECM().
iid

5. Sea X1 , . . . , Xn N (, 2 ) y consideremos los estimadores para 2


n

s21

1 X
(Xi X)2
=
n 1 i=1

Determine el ECM de ambos estimadores.

78

s22 =

n1 2
s
n 1

16.
16.1.

Pruebas de Hip
otesis
Introducci
on

A menudo los datos muestrales sugieren que algo relevante esta sucediendo en la poblacion o
proceso subyacente. Como suponemos que los datos provienen de una muestra aleatorio y por lo
mismo, estan sujetos a cierto grado de variacion aleatoria, la pregunta es si el resultado o el efecto
aparente en la muestra es una indicacion de que algo esta sucediendo en la pobalcion (o proceso)
subyacente o si el resultado observado es posiblemente una casualidad, producto de la variacion
aleatoria.
Por esta razon es que postulamos una conjetura (o varias) que nos permita estimar si los resultados aparentes en una muestra indican que en realidad algo esta pasando. De manera formal, la
conjetura puede postular en forma de hipotesis estadstica.
Definici
on 16.1 Una hip
otesis estadstica es una aseveracion o conjetura con respecto a una
o m
as poblaciones.
En nuestro caso en particular, una hipotesis es una afirmacion sobre un parametro poblacional.
La verdad o falsedad de una hipotesis estadstica nunca se sabe con albosuta certeza a menos
que examinemos toda la poblacion. Esto, por supuesto, sera poco practico en la mayora de las
situaciones. En su lugar, tomamos una muestra aleatoria de la poblacion de interes y utilizamos
los datos contenidos en esta muestra para proporcionar evidencia que apoye o no la hipotesis. La
evidencia de la muestra que es inconsistente con la hipotesis que se establece conduce al rechazo de
esta, mientras que la evidencia que la apoya conduce a su aceptacion.
La estructura de la prueba de hipotesis se formulara con el uso del termino hipotesis nula (H0 ),
hipotesis que deseamos probar como verdadera. En caso contrario, es decir, si la rechazamos, estamos aceptando como verdadera la hipotesis alternativa (H1 ), que en general escribimos como
H0 : 0

vs

H1 : {0

Definici
on 16.2 Una prueba de hip
otesis es una regla de decision que especifca para que valores
de la muestra la decision es aceptar H0 como verdadera y para que valores de la muestra la decisi
on
es aceptar H1 como verdadera.
Para verificar si H0 es verdadera debemos resumir la informacion de los datos en un estadstico de prueba. Dicho estadstico se calcula para ver si la informacion que entregan los datos es
razonablemente compatible con la hipotesis nula.
Para decidir a favor de la hipotesis nula debemos establecer una regi
on de aceptaci
on, la cual
identificara los valores del estadstico de prueba que son relativamente probables dada la hipotesis
nula y los valores que no lo son. En que valor del estadstico de la prueba comenzamos a decir que
los datos apoyan a a la hipotesis alternativa? Para contestar esta pregunta se requiere conocer la
distribucion muestral del estadstico de prueba. Los valores del estadstico de prueba que son sumamente improbables bajo la hipotesis nula forman una regi
on de rechazo para la prueba estadstica.

79

Cuando realizamos una prueba, podemos tomar dos decisiones. Por tanto, podemos cometer dos
tipos de error:
Error de tipo I: rechazar la hipotesis nula, H0 dado que esta es verdadera.
Error de tipo II: no rechazar la hipotesis nula H0 , dado que la hipotesis alternativa H1 es correcta.
Las consecuencias de estos tipos de error son diferentes y generalmente intentaremos minimizar el
error de tipo I.
Ejemplo 16.1 Determine los errores de tipo I y II.
1. H0 : el acusado es culpable
H1 : el acusado es inocente
2. H0 : el paciente esta enfermo
H1 : el paciente esta sano
La prueba adecuada sera aquella que minimizara la probabilidad de cometer los dos tipos de
error simultaneamente, lo cual, con estadstica clasica, es imposible.
En consecuencia, se trata de minimizar la probabilidad de cometer Error tipo II, sujeto a que
la probabilidad de cometer Error tipo I no exceda un valor predeterminado . Este u
ltimo error es
tambien llamado nivel de significancia.
Algunas propiedades importantes respecto de estos errores son:
Los errores de tipo I y tipo II estan relacionados. Una disminucion en la probabilidad de uno
por lo general tiene como resultado un aumento en la probabilidad del otro.
El tama
no de la region de rechazo, y por tanto la probabilidad de cometer error tipo I, siempre
se puede reducir al ajustar el o los valores crticos.
Un aumento en el tama
no muestral n reducira y (error tipo II) de forma simultanea.
Si la hipotesis nula es falsa, es un maximo cuando el valor real de un parametro se aproxima
al valor hipotetico . Entre mas grande sea la distancia entre el valor real y el valor hipotetico,
sera menor .
Definici
on 16.3 La potencia de una prueba es la probabilidad de rechazar H0 dado que una
alternativa especfica es verdadera, y se puede calcular como 1 .
Diferentes tipos de pruebas se comparan al contrastar propiedades de potencia.
A pesar de estar fijo, la probabilidad de cometer error de tipo I puede ser calculada y recibe el
nombre de valor-p.

80

Definici
on 16.4 El valor-p de una prueba de hipotesis es el menor valor de para el cual rechazamos la hipotesis nula.
Calculado este valor, la regla sera rechazar la hipotesis nula si valor p < .
En este curso estudiaremos pruebas de hipotesis para tres parametros poblacionales: media,
varianza y proporcion.

16.2.

Prueba de Hip
otesis para la media

Sea X1 , . . . , Xn una muestra aleatoria de una distribucion con media y varianza 2 > 0.
Considere las hipotesis generales
H0 : 0

vs

H1 : {0

Es decir, queremos probar alg


un valor o rango de valores para la media, cuando la varianza es
conocida. La estadstica de prueba apropiada se basa en la variable X, que por TCL sabemos
distribuye N (, 2 /n) y que si estandarizamos obtenemos
Z=

X
N (0, 1)
/ n

Entonces distinguiremos tres casos:


Hipotesis Nula
= 0
0
0

Hipotesis Alternativa
6= 0
> 0
< 0

donde
z0 =

Rechazo H0 si
|z0 | z1/2
z0 z1
z0 z1

x 0

/ n

Ejemplo 16.2 Una muestra aleatoria de 100 muertes registradas en un servicio el a


no pasado
muestra una vida promedio de 71.8 a
nos. Suponga una desviacion estandar poblacional de 8.9 a
nos.
esto parece indicar que la vida media hoy en da es mayor a 70 a
nos? Utilice un nivel de significancia de 5 %.
Sea X1 , . . . , Xn una muestra aleatoria de una distribucion con media , desconocida y varianza
s2 > 0, esto quiere decir que la varianza es estimada en la muestra. Considere las hipotesis generales
H0 : 0

vs

H1 : {0

Es decir, queremos probar alg


un valor o rango de valores para la media, cuando la varianza es
desconocida, por lo que la reemplazamos por s2 , el estimador insesgado de la varianza. La estadstica
de prueba apropiada se basa en la variable X, que por TCL sabemos distribuye N (, 2 /n) y ademas
n1 2
s 2 , con las que podemos construir el estadstico
2
Z=

X
t(n 1)
s/ n

Entonces distinguiremos tres casos:


81

Hipotesis Nula
= 0
0
0

Hipotesis Alternativa
6= 0
> 0
< 0

donde
t0 =

Rechazo H0 si
|t0 | t1/2
t0 t1
t0 t1

x 0

s/ n

Ejemplo 16.3 Se afirma que una aspiradora gasta en promedio 46 kilowatt-hora al a


no. Se toma
una muestra aleatoria de 12 hogares indica que las aspiradoras gastan un promedio de 42 kilowatthora al a
no con una desviacion estandar de 11.9 kilowatt-hora, esto sugiere que las aspiradoras
gastan, en promedio, menos de 46 kilowatt-hora anualmente con 5 % de significancia?

16.3.

Prueba de Hip
otesis para la proporci
on

Es de interes probar la hipotesis que la proporcion de exitos de un experimento binomial es


igual a un valor especfico o esta en un rango de valores. Sea X la variable aleatoria que cuenta el
n
umero de exitos y sea pb = X/n la estimacion del parametro p. Entonces, para n grande, podemos
establecer que
pb p
x np
=q
N (0, 1)
Z=p
p(1p)
np(1 p)
n

Entonces distinguiremos tres casos:


Hipotesis Nula
p = p0
p p0
p p0
donde

Hipotesis Alternativa
p 6= p0
p > p0
p < p0

Rechazo H0 si
|z0 | z1/2
z0 z1
z0 z1

pb p0
z0 = p
p0 (1 p0 )/n

Ejemplo 16.4 Un medicamento que se prescribe actualmente se considera efectivo en un 60 %.


Resultados experimentales con un nuevo farmaco se asministar a una muestra aleatoria de 100
personas, de las cuales 70 se aliviaron. Esta es evidencia suficiente para concluir que el nuevo
medicamento es superior al que se receta actualmente? Use = 5 %

16.4.

Prueba de Hip
otesis para la varianza

Sean X1 , . . . , Xn una muestra de una variable aleatoria con distribucion N (, 2 ), ambos parametros desconocidos. Sabemos que si s2 es el estimador insesgado de 2 , es decir,
1 X
s2 =
(xi x)2
n1
entonces

(n 1)s2
2(n1)
2

82

Entonces, si es de interes probar que la varianza poblacional esta en un intervalo dado, distinguiremos tres casos:
Hipotesis Nula
2 = 02
2 02
2 02

Hipotesis Alternativa
Rechazo H0 si
2
2
2
6= 0
Q0 n1,1/2 o Q0 2n1,/2
2
2
Q0 2n1,1
> 0
2 < 02
Q0 2n1,

donde
Q0 =

(n 1)s2
02

Ejemplo 16.5 Se tienen los pesos de 10 paquetes de semillas de pasto distribuidas por cierta compa
na, de la cuales se obtuvo x = 46,12 y s2 = 0,286. La empresa desea saber si los pesos registrados
presentan evidencia para asegurar que la varianza poblacional es mayor a 0.2, con un nivel de
significancia de 5 %.

16.5.

Prueba de Hip
otesis para la diferencia de medias

Si tenemos dos muestras de tama


no n y m de poblaciones independientes, X e Y, con medias
X y Y , estas pueden ser comparadas usando la diferencia 1 2 , cuyo estimador es x y. La
distribucion de esta diferencia dependera de la informacion respecto de la relacion entre las varianzas
2
poblacionales X
y Y2 , de los cuales podemos identificar tres casos.
16.5.1.

Varianzas conocidas.

El estadstico de prueba es
(X Y ) d
q
N (0, 1)
2
2
X
Y
+ m
n
Las hipotesis a contrastar son:
Hipotesis
X Y
X Y
X Y
donde

Nula
=d
d
d

Hipotesis Alternativa
X Y 6= d
X Y > d
X Y < d

Rechazo H0 si
|z0 | z1/2
z0 z1
z0 z1

(x y) d
Z0 = q 2
X
2
+ mY
n

Ejemplo 16.6 Una muestra aleatoria de tama


no n1 = 25, que se toma de una poblacion normal
con una desviacion estandar 1 = 5,2, tiene una media x1 = 81. Una segunda muestra aleatoria
de tama
no n2 = 36, que se toma de una poblacion normal diferente con una desviacion est
andar
= 3,4, tiene una media x2 = 76. Pruebe la hipotesis de las medias son iguales con un nivel de
significancia del 5 %.

83

16.5.2.

2
Varianzas desconocidas pero iguales.X
= Y2 =

Si las varianzas desconocidas, debemos estimarlas, incorporando el hecho que sean iguales. En2
tonces, dados s2X y s2Y , los estimadores insesgados de X
y Y2 , respectivamente, definimos
s2p =

(n 1)s2X + (m 1)s2Y
n+m2

El estadstico de prueba es
(X Y ) d
q
t
sp n1 + m1
con = n + m 2.
Las hipotesis a contrastar son:
Hipotesis
X Y
X Y
X Y

Nula
=d
d
d

Hipotesis Alternativa
X Y 6= d
X Y > d
X Y < d

donde
T0 =

Rechazo H0 si
T0 t,1/2
T0 t,1
T0 t,1

(x y) d
q
sp n1 + m1

Ejemplo 16.7 Una compa


na armadora de automoviles grande trata de decidir si compra llantas
de la marca A o de la B para sus nuevos modelos. Se lleva a cabo un experimento, para ayudar a
llegar a una decision, en el que se usan 12 llantas de cada marca. Las llantas se utilizan hasta que
se acaban. Los resultados son
Marca A :x1 = 37900km
Marca B :x2 = 39800km

s1 = 5100km
s2 = 5900km

Pruebe la hipotesis que no hay diferencias entre las dos marcas de llantas con un nivel de significancia del 5 %, suponiendo que las varianzas poblacionales son iguales.
16.5.3.

Varianzas desconocidas y distintas.

Si las varianzas desconocidas y distintas, el estimador de la varianza de X Y es


s2p =

s2X s2Y
+
n
m

El estadstico de prueba es
(X Y ) d
t
sp
con
=

s2X
n
(s2X /n)2
n1

s2Y
m

(s2 /m)2
( Ym1

Las hipotesis a contrastar son:


84

2


Hipotesis
X Y
X Y
X Y

Nula
=d
d
d

Hipotesis Alternativa
X Y 6= d
X Y > d
X Y < d

donde
T0 =

Rechazo H0 si
|T0 | t,1/2
T0 t,1
T0 t,1

(x y) d
t
sp

Ejemplo 16.8 Para el ejemplo anterior, realice la prueba para la hipotesis que las llantas de la
marca A son mejores que las de B, suponiendo que las varianzas poblacionales son distintas.

16.6.

Prueba de Hip
otesis para la diferencia de proporciones

Si tenemos dos muestras independientes X1 , . . . , Xn y Y1 , . . . , Ym de poblaciones Bernoulli de


parametros p1 y p2 , respectivamente, estas pueden ser comparadas usando la diferencia p1 p2
utilizando que
(p p2 ) d
q 1
N (0, 1)
p1 (1p1 )
p2 (1p2 )
+
n
m
Las hipotesis a contrastar son:
Hipotesis Nula
p1 p2 = d
p1 p2 d
p1 p2 d

Hipotesis Alternativa
p1 p2 6= d
p1 p2 > d
p1 p2 < d

donde
z0 = q

Rechazo H0 si
|z0 | z1/2
z0 z1
z0 z1

(b
p1 pb2 ) d
pb1 (1b
p1 )
n

pb2 (1b
p2 )
m

Ejemplo 16.9 En un estudio para estimar la proporcion de residentes de cierta ciudad y sus suburbios que estan a favor de la construccion de una planta de energa nuclear, se encuentra que 63
de 100 residentes urbanos estan a favor de la construccion mientras que solo 59 de 125 residentes
suburbanos la favorecen. Hay una diferencia significativa entre las proporcion de residentes urbanos
y suburbanos que favorecen la construccion de la planta nuclear? Use = 0,05.

16.7.

Prueba de Hip
otesis para la comparaci
on de varianzas

2
Sean X1 , . . . , Xn una muestra aleatoria de la distribucion N (X , X
), independiente de Y1 , . . . , Ym
2
una muestra aleatoria de una distribucion N (Y , Y ), con todos los parametros son desconocidos.
2
Las varianzas poblacionales pueden ser comparadas usando el cuociente X
/Y2 cuyo estimador es
2
2
sX /sY . Entonces
2
X
k Fn1,m1
Y2

Entonces, si es de interes probar que las varianzas poblacionales estan en una razon dada es
85

Hipotesis Nula
2
X
= k1
2
Y

2
X
2
Y
2
X
2
Y

1
k
1
k

Hipotesis Alternativa
Rechazo H0 si
2
X
1
F0 Fn1,n2,1/2 o F0 Fn1,n2,/2
6= k
2
Y

2
X
2
Y
2
X
2
Y

>
<

1
k
1
k

F0 Fn1,n2,1
F0 Fn1,n2,

donde
F0 =

s2X
k
s2Y

Ejemplo 16.10 Para el ejemplo 16.9, determine si las varianzas son iguales o distintas con 2.5 %
de confianza.
Ejercicios 18 .
1. Un profesor ha registrado las calificaciones de sus alumnos durante varios semestres, siendo
la media de aquellas igual a 72. Su grupo actual de 36 estudiantes parece tener una aptitud
promedio superior, por lo que el profesor desea mostrar que de acuerdo con su media el grupo
actual es mejor que los anteriores. Constituye el promedio del grupo x = 75,2 suficiente
evidencia para respaldar la afirmacion del profesor?. Utilizar = 0,05 y = 12.
2. Una determinada compa
na que produce una parte maquinada para un motor, afirma que
tiene una varianza de diametro no mayor que 0.0002 pulgadas. Una muestra aleatoria de
10 de dichas partes dio una varianza de muestra s2 = 0,0003. Si se supone que las medidas
del diametro se distribuyen en forma normal, Hay evidencia para refutar lo que afirma el
proveedor?. Usar = 0,05.
3. Se supone que en una localidad de Santiago, el 90 % de los productores cultivan maz. De
110 productores de la zona que se encuestaron, 95 cultivan maz. Esta este resultado en
conformidad con el valor supuesto? Use = 0,05.
4. Para estimar el rendimiento de parcelas plantadas con papa de una cierta variedad, se cosecharon 8 de ellas, obteniendose la siguiente informacion expresada en kg/parcela:
4.5

5.3

5.4

4.9

5.3

5.7

6.2

4.8

Se puede asegurar, con = 0,05 que esta variedad de papas tiene un rendimiento promedio
de 5.25 kg?
5. Se llevo a cabo un estudio para comparar el tiempo que toma a los hombres y mujeres efectuar
determinada maniobra en una lnea de ensamble. Se utilizaron muestras independientes de 50
hombres y 50 mujeres en un experimento en el cual se tomaba a cada persona el tiempo para
hacer tareas identicas. Los resultados fueron los siguientes:
Datos
x
Hombres 42
Mujeres 28
86

2
18
14

Presentaron estos datos la evidencia suficiente como para decir que hay una diferencia entre
los verdaderos tiempos de terminacion para hombres y mujeres, a un nivel de significancia del
5 %?
6. El dise
nador de una troqueladora nueva de lamina afirma que su maquina puede trabajar con
determinado producto con mas rapidez que la maquina que esta en uso. Se hicieron nueve
ensayos independientes troquelando el mismo artculo en cada maquina y se obtuvieron los
siguientes resultados de tiempos(en segundos) de terminacion:
Maquina normal
x1 = 35.22
(n1 1)s21 =195.5

Maquina nueva
x2 = 31.56
(n2 1)s22 =160.22

El nivel de significancia del 5 %, puede respaldar la afirmacion del dise


nador?. Asuma que
las varianzas poblacionales son desconocidas, pero iguales.
7. Muchos estudiantes se han quejado de que la maquina vendedora de refrescos A despacha
menos bebidas que la maquina B. Los siguientes son los datos de las muestras:
Maquina A n1 = 10 x1 =5.38
Maquina B n1 = 12 x2 =5.92

s21 =1.59
s22 =0.83

Con = 0,05, Respalda la evidencia la hipotesis de que la cantidad media despachada por la
maquina A es menor que la despachada por la maquina B?
8. Un vendedor de una nueva marca de radio comunicadores afirma que el n
umero de aparatos
defectuosos en sus lotes de produccion sera no mayor que el de un competidor. Se toman
muestras aleatorias de ambos productos para contrastar esta aseveracion.
Producto
Vendedor
Competidos

N defectuosos
8
2

N revisados
100
100

Puede rechazarse la afirmacion del vendedor al nivel de significacion 0.05?

87

17.

Estimaci
on Intervalar

Ademas de las estimaciones puntuales de un parametro, hay estimaciones por intervalos que
estipulan, con un cierto grado de confianza, que el parametro se encuentra entre dos valores del
estadstico estimado. Supongamos una variable aleatoria poblacional X que tiene media cuyo
valor es desconocido. De una muestra aleatoria de taman
no n, el valor x de la media muestral X
se puede usar para estimar al 95 % de confianza como sigue:
Definido E, el margen de error y la significancia , tal que
P( E x + E) = 1
lo que es equivalente a la ecuacion
P(x E x + E) = 1
Entonces (x E, x + E) se llama intervalo de confianza del 100(1 ) % para .
Formalmente:
Definici
on 17.1 Un estimador intervalar para un parametro , dados los valores x = (x1 , . . . , xn )
de una variable aleatoria X, es cualquier par de funciones L(x1 , . . . , xn ) y U (x1 , . . . , xn ) que satisface
L(x) U (x) para todo x. El intervalo aleatorio [L(X), U(X)] se denomina un estimador intervalar.
Definici
on 17.2 Para un parametro cualquiera , se define un conjunto de confianza 1
como un conjunto C(x) tal que
P( C(X)) = 1
Definici
on 17.3 Una variable aleatoria Q(X, ) corresponde a un pivote si su distribuci
on no
depende de ning
un parametro. Es decir, la distribucion de Q(X, ) es la misma, para todo .
Ejemplo 17.1 Encuentre una cantidad pivotal si X1 , . . . , Xn son una muestra aleatoria N (, 2 )
y a partir de esta construya un conjunto o intervalo de confianza para la media poblacional.

17.1.

Intervalo de Confianza para la media


iid

Sea X1 , . . . , Xn N (, 2 ). Un intervalo de confianza para la media poblacional cuando la


varianza poblacional es conocida es
xE

donde E = z1/2 / n.
Ejemplo 17.2 Una aerolnea necesita estimar el n
umero medio de pasajeros en un vuelo de reciente apertura. Para ello, toma una muestra de 40 das y encuentra una media muestral de 112.0
pasajeros y una desvaicion estandar de 25. Encuentre un intervalo de confianza al 95 % para la
media poblacional.

88

iid

Sea X1 , . . . , Xn N (, 2 ). Un intervalo de confianza para la media poblacional cuando la


varianza poblacional es desconocida es
xE

donde E = t(n1,1/2) s/ n.
Ejemplo 17.3 En una aerolnea se resgistran los tiempos de espera promedio de atencion en mes
on
de 14 das, obteniendo los siguientes resultados:
4.3

5.2

2.1

6.2

5.8

4.7

3.8

9.3

5.0

4.1

6.0

8.7

0.5

4.9

Encuentre un intervalo de confianza al 95 % para el tiempo de espera medio.

17.2.

Intervalo de Confianza para una proporci


on

Sea Y Bin(n, p). Por teorema del lmite central sabemos que
pb (E(b
p), V(b
p))
Se puede mostrar que E(b
p) = p y V(b
p) =

p(1p)
.
n

As, el intervalo de confianza al (1 )100 % para una proporcion esta dado por
pb E
donde E = z1/2

pb(1b
p)
.
n

Ejemplo 17.4 En un colegio de Ense


nanza Media hay matriculados 800 alumnos. A una muestra
seleccionada aleatoriamente de un 15 % de ellos, se les pregunto si utilizaban la cafetera del colegio.
Contestaron negativamente un total de 24 alumnos.
a) Estime el porcentaje de alumnos que utilizan la cafetera del colegio.
b) Determine, con una confianza del 99 %, el error maximo cometido con dicha estimacion.

17.3.

Intervalo de Confianza para la varianza

Sea X1 , . . . , Xn una muestra aleatoria de una poblacion normal con media y varianza 2 . Un
intervalo de confianza para la varianza poblacional 2 esta dado por


(n 1)s2 (n 1)s2
,
2(n1,1/2) 2n1,/2
donde s2 =

1
n1

Pn

i=1 (Xi

X)2 .

89

Ejemplo 17.5 Un vendedor de muebles de madera para armar (desarmados) importa las piezas
desde el norte de Europa para abaratar costos. En cierto modelo, el cliente debe insertar cuatro
patas redondas en hoyos ya perforados. Para un ajuste adecuado, el diametro de las patas debe ser
ligeramente menor que un centmetro. Inevitablemente, hay cierta variacion en los diametros de
las patas. El vendedor compra patas a un proveedor bajo la especificacion de que el diametro medio
debe ser de 0.995 cm y desviacion estandar menor que 0.03 cm. Como parte del control de calidad
se obtuvo una muestra aleatoria de 121 patas la cual arrojo una media de 0.99516 y desviaci
on
est
andar de 0.01825. Calcule un IC al 95 % para la desviacion estandar del lote.
En caso de contar dos muestras aleatorias, puede ser de interes comparar los siguientes parametros :

17.4.

Intervalo de Confianza para la diferencia de medias


iid

iid

2
) e Y1 , . . . , Ym N (Y , Y2 ), ambas muestras independientes. Un
Sean X1 , . . . , Xn N (X , X
intervalo de confianza para la diferencia de media entre poblaciones esta dado por

(x y) E
donde E cambiara de acuerdo a la informacion con respecto a la varianza.
Podemos identificar 3 casos:
2
y Y2 conocidas.
a) X

r
E = z1/2
es decir

2
X
2
+ Y
n
m

r


2
X
Y2
(X Y ) (x y) z1/2
+
n
m

2
2
y Y2 desconocidas pero iguales (X
= Y2 = 2 ).
b) X

Se utiliza el estimador de 2 dado por


s2p =
con
s2X =

(n 1)s2X + (m 1)s2Y
n+m2

1 X
(Xi X)2
n1

s2Y =

1 X
(Yi Y )2
m1

El margen de error esta dado por


r
E = t(n+m2,1/2) sp
90

1
1
+
n m

Por lo tanto, el IC para la diferncia de medias cuando las varianzas son iguales pero desconocidas esta dado por
r


1
1
(X Y ) (x y) t(n+m2,1/2) sp
+
n m
2
c) X
y Y2 desconocidas y distintas.

Se define

r
E = t(,1/2)

donde
=

s2x
n
(s2x /n)2
n1

+
+

s2X s2Y
+
n
m

s2y 2
m
(s2y /m)2
m1

As, el IC para la diferncia de medias cuando las varianzas son desconocidas y distintas
esta dado por
r


s2X s2Y
(X Y ) (x y) t(,1/2)
+
n
m
Ejemplo 17.6 .
a) Se realiza un estudio para comparar los contenidos de nicotina de dos marcas de cigarrillos.
10 cigarrillos de la marca A dieron un contenido promedio de nicotina de 3,1ml/gr, con una
desviacion estandar de 0,5ml/gr, mientras que 8 cigarrillos de la marca B dieron un contenido
promedio de nicotina 2,7ml/gr, con una desviacion estandar de 0,7ml/gr. Suponiendo que los
datos son muestras aleatorias provenientes de dos poblaciones normales con varianzas iguales.
Encuentre un IC del 95 % para la verdadera diferencia en el contenido de nicotina de las dos
marcas.
b) Una compa
na tiene dos departamentos que producen identicos productos. Se sospecha que las
producciones por hora son diferentes en los dos departamentos. Para averiguar esto se consideran muestras aleatorias de horas de produccion que proporcionan la siguiente informaci
on:
Departamento 1
Departamento 2

n1 = 64
n2 = 49

x1 = 100
x2 = 90

12 = 256
22 = 196

Hallar un IC del 95 % para la diferencia verdadera entre las producciones medias de los departamentos. Comente.

91

17.5.

Intervalo de Confianza para la comparaci


on de varianzas
iid

iid

2
Sean X1 , . . . , Xn N (X , X
) e Y1 , . . . , Ym N (Y , Y2 ), ambas muestras independientes y de
media desconocida. Para comparar las varianzas de ambas muestras podemos utilizar el intervalo
de confianza para la diferencia para el cuociente x2 /y2 dado por

s2x
s2x

F
,
F(n1,m1,1/2)
(n1,m1,/2)
s2y
s2y

Ejemplo 17.7 Se realiza un estudio para comparar los contenidos de nicotina de dos marcas de
cigarrillos. 10 cigarrillos de la marca A dieron un contenido promedio de nicotina de 3,1ml/gr, con
una desviacion estandar de 0,5ml/gr, mientras que 8 cigarrillos de la marca B dieron un contenido
promedio de nicotina 2,7ml/gr, con una desviacion estandar de 0,7ml/gr. Suponiendo que los datos
son todos independientes, encuentre un IC del 95 % para la diferencia de varainzas.

92

Ejercicios 19 .
1. Se ha tomado una muestra aleatoria de 100 individuos a los que se ha medido el nivel de
glucosa en sangre, obteniedose una media muestral de 110 mg/cc. Se sabe que la desviaci
on
tpica de la poblacion es de 20 mg/cc.
a) Obtenga un intervalo de confianza, al 90 %, para el nivel de glucosa en sangre en la
poblacion
b) Que error maximo se comete con la estimacion anterior?
2. La media de edad de los alumnos que se presentan a pruebas de acceso a la Universidad es de
18.1 a
nos, y la desviacion estandar 0.6 a
nos.
a) De los alumnos anteriores se elige, al azar, una muestra de 100. Cual es la probabilidad
de que la media de la edad de la muestra este comprendida entre 17.9 y 18.2 a
nos?.
b) Que tama
no debe tener una muestra de dicha poblacion para que su media este comprendida entre 17.9 y 18.3 a
nos, con una confianza del 99.5 %?
3. Las medidas de los diametros de una muestra tomada al azar, de 200 ca
neras, hechas por
una determinada maquina, dieron una media de 2 cm y una desviacion estandar de 0,1 cm.
Hallar los intervalos de confianza del:
- 68,26 %
- 95,44 %
- 99,73 %
para el diametro de todas las ca
neras.
4. La longitud de las barras producidas por una cadena de produccion es una variable aleatoria
con distribucion normal y desviacion estandar 1.8 mm. Se extrae una muestra aleatoria simple
de 9 observaciones y se obtiene el siguiente intervalo de confianza al nivel del 99 % para la
longitud media poblacional: [194.65,197.75]. El director cree que el intervalo es demasiado
amplio y exige uno con el mismo nivel de confianza pero cuya longitud no sea superior a
1mm. Cuantas observaciones debe tener la muestra para construir dicho intervalo?
5. Un fabricante de vehculos sabe que el consumo de gasolina de sus vehculos se distribuye normalmente. Se selecciona una muestra aleatoria simple de coches y se observa el consumo cada
cien kilometros obteniendo las siguientes observaciones: (19.2, 19.4, 18.4, 18.6, 20.5, 20.8).
Obtenga el intervalo de confianza para el consumo medio de gasolina de todos los vehculos de
este fabricante, al nivel de confianza del 99 %.
6. Para estimar la proporcion de familias de una determinada ciudad que pseen microondas,
se quiere realizar una muestra aleatoria de tama
no n. Calcula el valor mnimo de n para
garantizar que, a un nivel de confianza del 95 %, el error en la estimacion sea menor que 0,05.
(Como se desconoce la proporcion, se ha de tomar el caso mas desfavorable, que sera 0,5)
7. Se selecciona una muestra aleatoria simple de 600 familias a las que se les pregunta si tienen
computador en casa, resultando que 240 contestan afirmativamente. Obtener un intervalo de
confianza al nivel del 95 % para estimar la proporcion real de familias que poseen computador.
93

8. Se realizo un experimento considerando 64 pacientes varones de similares caractersticas que


llegan a un servicio de urgencia con fuertes dolores producidos por calculos renales. Se les
suministro una dosis de 5 ml. de un nuevo farmaco para calcular tales dolores, midiendose el
tiempo transcurrido hasta que el dolor desaparece completamente. Los resultados del experimento entregaron los siguientes resultados: x=20 minutos, s = 5 minutos. Ademas 7 pacientes
reaccionaron negativamente por la dosis.
a) Mediante un intervalo de confianza del 95 %, encuentre los lmites que permitan estimar,
el tiempo que tarda el medicamento en eliminar el dolor. (Asuma que el tiempo medio
transcurrido hasta que el dolor desaparezca completamente tiene una distribucion normal)
b) Estime mediante un intervalo de confianza del 90 %, la proporcion de pacientes que reaccionaran de manera negativa ante la suministracion de la dosis.
9. Un constructor civil debe seleccionar de entre dos tipos de hormigon, aquel que le ofrezca una
mayor resistencia compresiva. Para ello selecciona una muestra de 8 probetas de hormig
on tipo
1 obteniendo una resistencia compresiva media de 312 kg/cm2 con una desviacion est
andar
de 23 kg/cm2 y una muestra de 10 probetas de hormigon tipo 2, obteniendo una resistencia
compresiva media de 298 kg/cm2 con una desviacion estandar de 8.2 kg/cm2. Mediante un
Intervalo del 95 % de confianza, podra concluir si existe evidencia para determinar que un
tipo de hormigon es mejor que el otro en lo referente a la resistencia compresiva promedio?
10. Se esta realizando un estudio para determinar el nivel educacional en la parte obrera de las
construcciones de viviendas en el gran Santiago. Para ello, se seleccionan dos constructoras
y se toma una muestra de 130 obreros de la Constructora E, de los cuales 98 tenan cursado
hasta cuarto medio y 32 solo haban llegado hasta tercero medio. Por otro lado de la Constructora D, se seleccionaron 165 obreros, de los cuales 50 tenan cursado hasta cuarto medio
y 115 solo llegaron hasta tercero medio. Por medio de un intervalo de confianza adecuado al
99 % de confianza, Puede determinar que constructora es mas exigente en cuanto el nivel de
estudio de sus obreros?
11. Un fabricante produce anillos para los pistones de un motor de automovil. Se sabe que el
diametro del anillo esta distribuido aproximadamente de manera normal, y que tiene una
desviacion estandar = 0,001mm. Una muestra aleatoria de 15 anillos tiene un di
ametro
promedio de x = 74,036mm.
a) Construya un IC bilateral del 99 % para el diametro promedio del anillo.
b) Construya un lmite inferior de confianza del 95 % para el diametro promedio del anillo.
12. Se utilizan dos maquinas para llenar botellas de plastico con detergente para maquinas lavaplatos. Se sabe que las desviaciones estandar del volumen de llenado son 1 = 0,10 onzas de
lquido y 2 = 0,15 onzas de lquido para las dos maquinas, respectivamente.
Se toman dos muestras aleatorias, n1 = 12 botellas de la maquina 1 y n2 = 10 botellas de la
maquina 2. Los volumenes promedio de llenado son x1 = 30,87 onzas de lquido y x2 = 30,68
onzas de lquido.
a) Construya un IC bilateral del 90 % para la diferencia entre las medias del volumen de
llenado.
94

b) Construya un IC bilateral del 95 % para la diferencia entre las medias del volumen de
llenado. Compare el ancho de este interfvalo con el ancho del calculo en el inciso a).
c) Construya un IC superior del 95 % para la diferencia de medias del volumen del llenado.
13. Se prueban dos formulas diferentes de un combustible oxigenado para motor en cuanto al
octanaje. La varianza del octanaje para la formula 1 es 12 = 1,5; mientras que para la formula
2 es 22 = 1,2. Se prueban dos muestras aleatorias del tama
no n1 = 15 y n2 = 20. Los octanajes
promedios observados son x1 = 89,6 y x2 = 92,5. Construya un IC bilateral del 95 % para la
diferencia en el octanaje promedio.
14. Considere la situacion sobre pruebas de octanaje descrita en el ejercicio anterior. Que tama
no
de muestra se requiere para cada poblacion si se desea tener una confianza del 95 % de que el
error al estimar la diferencia entre las medias de octanaje sea menor que 1?
15. Supongamos que un fabricante necesita cierta pieza que puede ser proporcionada por dos abastecedores A y B, a un mismo precio. Las piezas de A son defectuosas con probabilidad p1 y las
de B con probabilidad p2 . Supongamos ademas que de 100 piezas del proveedor A se encontraron 10 piezas defectuosas, mientras que de 150 del proveedor B se encontro 11 defectuosas.
Cual es el provedor con menor proporcion de piezas defectuosas?.
16. Una maderera minorista inspecciona los embarques de madera que llegan de sus proveedores.
Para los embarques de pino de calidad selecta, de 8 pies (2 por 4) el supervisor escoge aleatoriamente una gruesa (12 docenas o 144 hojas) de un embarque de varias decenas de miles de
hojas. En la muestra 18 hojas no pueden venderse como calidad selecta.
a) Calcule un IC al 95 % para la proporcion de hojas de todo el embarque que no pueden
venderse como calidad selecta.
b) Si el 20 % o mas del embarque no pueden venderse como madera de calidad selecta, el
embarque no es rentable. Indica el IC que hay razones para pensar que el embarque no
es rentable?
17. El metodo usual para tratar la leucemia mieloblastica aguda es tratar al paciente intensamente
con quimioterapia en el momento del diagnostico. Historicamente esto ha producido una tasa
de remision del 70 %. Estudiando un nuevo metodo de tratamiento, se utilizaron 50 voluntarios. Cuantos de los pacientes deberan haber remitido para que los investigadores pudiesen
afirmar con =0.025, que el nuevo metodo produce emisiones mas altas que el antiguo?.
18. Se desea estimar la diferencia entre el ciclo medio de vida u
til de dos marcas de focos en el
mercado. En relacion con una muestra aleatoria para la primera marca de n1 =10 focos, el
ciclo medio de vida de los focos es x1 = 4600 horas, con s1 =250 hr. El ciclo medio de vida
y la desviacion estandar para la segunda marca con una muestra de n2 =8 focos es x2 =4000
hr y s2 =200 hr, respectivamente. Se supone que el ciclo de vida de ambas marcas tiene una
distribucion normal. Determine la relacion entre las varianzas (si son iguales o distintas) y
con est informacion calcule un IC para la diferencia en los ciclos de vida medios de los focos.
Use = 0,05.

95

19. Una industria dedicada a la fabricacion de harina, para llenar los paquetes usa dos maquinas.
Se considera que el contenido de harina (kilos) en los paquetes tiene una distribucion normal.
Para estudiar el contenido de estos paquetes, se toma una muestra aleatoria de cada m
aquina
obteniendo los siguientes resultados:
Maquina A 1.03
Maquina B 1.04

1.05
1.08

1.08
0.9

0.9
1

1.1
1.06

1.2
1.08

1.09
1.15

1.13
0.92

1.07

a) Se considera que un paquete no cumple con las normas, si su contenido es inferior a un


kilo. En base a la muestra total (17 paquetes) y usando un nivel de significancia del 8 %,
estime la proporcion de paquetes que cumplan con la norma. Que sucede con el tama
no
del intervalo anterior si el nivel de significancia es del 5 %?
b) La persona encargada de la mantencion de la maquina A, sospecha que esta no est
a funcionando correctamente y que existira una diferencia, respecto del contenido medio de los
paquetes llenados por la maquina B. Basandose en la muestra aceptara Ud. la sospecha
del encargado. Use un nivel de confianza del 99 %.
20. Una empresa embotelladora lo contrata a Ud. para realizar algunos analisis estadsticos para
su lnea de produccion, debido a varios reclamos sobre la cantidad de lquido en cada botella.
Si la maquina embotelladora sigue una distribucion normal con media y desviacion est
andar
10c.c.
a) En cuanto debe ser regulado el llenado medio para que solo el 25 % de las botellas tenga
menos de 300 c.c.?
b) Construya un I.C. de nivel = 0,04 para el llenado medio(), si en una muestra de 4
botellas se observa un promedio de 350 c.c. Este intervalo contiene a ?
c) Cual debera ser el tama
no mnimo necesario para estimar con un error no mayor a
5 c.c. y con una confianza del 90 %?
Si la confianza sube al 99.9 % Que sucede con el tama
no muestral?

96