Vous êtes sur la page 1sur 99

Estadstica y Probabilidad I

Apuntes de Clase
Ra

ul Eyzaguirre
Escuela Universitaria de Ingeniera
Universidad de Lima
13 de agosto de 2012
Prefacio
Estos apuntes fueron desarrollados para el dictado del curso Estadstica y Probabilidad
I en la escuela de ingeniera de la Universidad de Lima. Si bien este material esta dirigido
especialmente a los estudiantes de dicho curso, puede ser de utilidad para cualquier estudiante
de pregrado que este llevando su primer curso de estadstica.
Estos apuntes cubren los temas de estadstica descriptiva y calculo de probabilidades. En
el captulo 1 se presentan una serie de deniciones basicas a tener en cuenta en captulos pos-
teriores. En el captulo 2 se trata el tema de organizacion y resumen de datos mediante tablas
de frecuencias y gracos. En el captulo 3 se estudian las principales medidas de posicion,
variabilidad y forma, utiles para describir cualquier conjunto de datos. En el captulo 4 se
presentan dos herramientas de analisis exploratorio de datos, el graco de cajas y el graco
de tallos y hojas. En el captulo 5 se inicia el estudio del calculo de probabilidades. Este cap-
tulo empieza con una revision de los metodos de enumeracion, para luego presentar algunas
deniciones de probabilidad y los temas de probabilidad condicional e independencia. En el
captulo 6 se toca el tema de las variables aleatorias discretas y continuas. Finalmente, en
los captulos 7 y 8, se presentan las principales distribuciones de probabilidad para variables
discretas y continuas.
Para quienes lleven el curso de Estadstica y Probabilidad I en la Universidad de Lima con
estos apuntes se recomienda, como material adicional, a Barreno et. al [1], y a Montgomery y
Runger [3]. La forma en la que son tratados los temas no es dependiente de ning un software
estadstico, aunque el curso de Estadstica y Probabilidad I se desarrolla utilizando MINITAB
(http://www.minitab.com). Cabe mencionar que algunos de los calculos y gracos presen-
tados en estos apuntes fueron realizados utilizando R [4]. Un buen material de consulta sobre
los temas de estadstica descriptiva e inferencia estadstica utilizando R [4] es Trosset [5].
i
ii

Indice general
Prefacio I
1. Conceptos Basicos 1
1.1. Estadstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Poblacion, muestra y unidad elemental . . . . . . . . . . . . . . . . . . . . . . . 1
1.3. Variable y observacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4. Escalas de medida (Estudio opcional) . . . . . . . . . . . . . . . . . . . . . . . 3
1.5. Parametro y estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.6. Estadstica descriptiva e inferencia estadstica . . . . . . . . . . . . . . . . . . . 4
1.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2. Organizacion de Datos 7
2.1. Organizacion de datos cualitativos . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Organizacion de datos cuantitativos discretos . . . . . . . . . . . . . . . . . . . 8
2.3. Organizacion de datos cuantitativos continuos . . . . . . . . . . . . . . . . . . . 10
2.3.1. Tabla de frecuencias con datos cuantitativos continuos . . . . . . . . . . 10
2.3.2. Interpolacion a partir de la tabla de frecuencias . . . . . . . . . . . . . . 12
2.3.3. Histograma de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.4. Polgono de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.5. Polgono de frecuencias acumuladas o curva ojiva . . . . . . . . . . . . . 15
2.4. Graco de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3. Medidas de Posicion, Varibilidad y Forma 19
3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2. Medidas de posicion central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.1. Media aritmetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.2. Media ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2.3. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2.4. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
iii
iv

INDICE GENERAL
3.3. Cuantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4. Medidas de variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4.1. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4.2. Rango intercuartlico (RIC) . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.4.3. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.4.4. Desviacion estandar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4.5. Coeciente de variacion . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.5. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5.1. Asimetra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5.2. Curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4. Analisis Exploratorio de Datos 33
4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2. Graco de cajas y bigotes (Boxplot o box-and-whisker plot) . . . . . . . . . . . 33
4.3. Graco de tallos y hojas (Steam and leaf) . . . . . . . . . . . . . . . . . . . . . 35
4.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5. Probabilidades 37
5.1. Metodos de enumeracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1.1. Principio de multiplicacion . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1.2. Principio de adicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1.3. Factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1.4. Combinacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.1.5. Permutacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.1.6. Permutacion con elementos iguales . . . . . . . . . . . . . . . . . . . . . 38
5.2. Conceptos de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.2.1. Experimento aleatorio () . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.2.2. Espacio Muestral () y punto muestral () . . . . . . . . . . . . . . . . 39
5.2.3. Evento o suceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.2.4. Denicion clasica o a priori de probabilidad . . . . . . . . . . . . . . . . 40
5.2.5. Denicion de probabilidad a partir de frecuencias relativas o a posteriori 41
5.2.6. Denicion axiomatica de probabilidad . . . . . . . . . . . . . . . . . . . 41
5.2.7. Denicion subjetiva de probabilidad . . . . . . . . . . . . . . . . . . . . 41
5.2.8. Teoremas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.3. Probabilidad condicional e independencia . . . . . . . . . . . . . . . . . . . . . 42
5.3.1. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.3.2. Axiomas de probabilidad condicional . . . . . . . . . . . . . . . . . . . . 42
5.3.3. Teoremas de probabilidad condicional . . . . . . . . . . . . . . . . . . . 43

INDICE GENERAL v
5.3.4. Regla de la multiplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.3.5. Teorema de probabilidad total . . . . . . . . . . . . . . . . . . . . . . . 43
5.3.6. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.3.7. Independencia de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6. Variables Aleatorias 51
6.1. Denicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.2. Variable aleatoria discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.2.1. Funcion de masa de probabilidad de una variable aleatoria discreta (fmp) 51
6.2.2. Funcion de distribucion acumulada de una variable aleatoria discreta
(fda) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
6.3. Variable aleatoria continua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.3.1. Funcion de densidad de probabilidad de una variable aleatoria continua
(fdp) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.3.2. Probabilidad de un evento . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6.3.3. Funcion de distribucion acumulada de una variable aleatoria continua
(fda) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.4. Valor esperado y varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.4.1. Valor esperado o esperanza matematica de una funcion de una variable
aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.4.2. Media, valor esperado o esperanza matematica de una variable aleatoria 56
6.4.3. Varianza de una variable aleatoria . . . . . . . . . . . . . . . . . . . . . 56
6.4.4. Propiedades del valor esperado y de la varianza . . . . . . . . . . . . . . 57
6.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7. Distribuciones de Probabilidad Discretas 63
7.1. Distribucion binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.1.2. Caractersticas de la distribucion binomial . . . . . . . . . . . . . . . . . 64
7.1.3. Distribucion de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2. Distribucion hipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2.2. Caractersticas de la distribucion hipergeometrica . . . . . . . . . . . . . 65
7.3. Distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.3.2. Caractersticas de la distribucion de Poisson . . . . . . . . . . . . . . . . 67
7.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
8. Distribuciones de Probabilidad Continuas 73
vi

INDICE GENERAL
8.1. Distribucion uniforme continua . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.1.2. Caractersticas de la distribucion uniforme continua . . . . . . . . . . . 73
8.2. Distribucion normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.2.2. Caractersticas de la distribucion normal . . . . . . . . . . . . . . . . . . 75
8.2.3. Distribucion normal estandar . . . . . . . . . . . . . . . . . . . . . . . . 76
8.3. Distribucion gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.3.2. Caractersticas de la distribucion gamma . . . . . . . . . . . . . . . . . 78
8.4. Distribucion exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4.2. Caractersticas de la distribucion exponencial . . . . . . . . . . . . . . . 79
8.5. Distribucion de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
8.5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
8.5.2. Caractersticas de la distribucion de Weibull . . . . . . . . . . . . . . . . 80
8.6. Distribucion ji-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.6.2. Caractersticas de la distribucion ji-cuadrado . . . . . . . . . . . . . . . 81
8.7. Distribucion t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.7.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.7.2. Caractersticas de la distribucion t de Student . . . . . . . . . . . . . . . 82
8.8. Distribucion F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.8.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.8.2. Caractersticas de la distribucion F . . . . . . . . . . . . . . . . . . . . . 84
8.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Bibliografa 91
Captulo 1
Conceptos Basicos
1.1. Estadstica
Estadstica es la ciencia que se ocupa de la recoleccion, organizacion y analisis de datos,
y de la posterior presentacion e interpretacion de los resultados. El objetivo nal suele ser
tomar una decision a partir de toda la informacion disponible, y en este sentido la estadstica
busca tambien evaluar la conabilidad de las conclusiones que se puedan derivar de dicha
informacion. La estadstica es principalmente util en el analisis de datos en situaciones de in-
certidumbre por lo que los resultados estadsticos estaran siempre sujetos a cierta probabilidad
de error.
1.2. Poblacion, muestra y unidad elemental
Tal vez la forma mas simple de denir a una poblacion sea como el conjunto de todos los
elementos o unidades que presentan cierta caracterstica com un. En este sentido, si el interes
es investigar el nivel educativo de los habitantes de cierta ciudad (la caracterstica com un es
que todos viven en la ciudad), todos los habitantes de dicha ciudad constituiran la poblacion
de interes; si el interes es investigar la distribucion de cierta plaga en un cultivo de palma
aceitera, la poblacion podra estar constituida por todos los arboles de la plantacion.
En un sentido mas amplio, el termino poblacion podra estar referido al total de observa-
ciones de interes. Entonces, por poblacion podra uno referirse a:
Una poblacion fsica, como por ejemplo las poblaciones humanas o cualquier grupo de
individuos u objetos.
Una poblacion conceptual, como por ejemplo el conjunto de todos los resultados que
podran obtenerse si un experimento fuese repetido indenidamente.
La primera denicion sera predominante en la primera parte del curso en donde se tratara
el tema de la estadstica descriptiva; la segunda denicion sera mas apropiada en la segunda
parte del curso, en donde se tratara el tema de probabilidades, y en el curso de Estadstica
y Probabilidad II en donde se estudiaran algunos metodos de la inferencia estadstica. Una
poblacion puede ser nita o innita; cuando la poblacion es nita su tama no sera denotado
por N.
1
2 CAP

ITULO 1. CONCEPTOS B

ASICOS
Una muestra es cualquier subconjunto de la poblacion y una unidad elemental, al menos
en el primer sentido de poblacion, es cada uno de sus elementos. El tama no de la muestra
sera denotado por n.
Ejemplo 1: Suponga que se desea realizar una investigacion sobre las preferencias electorales en el
Per u antes de una eleccion, y que para ello se cuenta con recursos para entrevistar a un total de 500
electores. Entonces, todos los peruanos inscritos en el padron electoral son la poblacion en estudio, los
500 electores seleccionados la muestra, y cada uno de los electores es una unidad elemental.
Ejemplo 2: Suponga que se desea estudiar la resistencia a la rotura de cierto tipo de material y que se
cuenta con recursos para efectuar 40 pruebas. En este caso la poblacion es conceptual, y esta compuesta
por todos los resultados que podran obtenerse al evaluar la resistencia a la rotura en materiales del
tipo sometido a prueba, la muestra esta compuesta por las 40 pruebas, y una unidad elemental es cada
una de las pruebas.
Dependiendo de la forma en que son seleccionados los elementos de la muestra, esta puede
ser aleatoria o no aleatoria. En una muestra aleatoria, todas las unidades tienen una probabi-
lidad conocida no nula de ser seleccionadas. Una muestra aleatoria permite inferir, bajo cierto
nivel de conabilidad, como podra ser la poblacion desde la cual fue extrada (a este proceso
se le conoce como inferencia estadstica).
El proceso de muestreo puede ser con reemplazo o sin reemplazo. En el muestreo con
reemplazo, un elemento que ya ha sido elegido en la muestra puede ser elegido otra vez.
Ejemplo 3: Suponga que se va a extraer una muestra de tama no 2 de la poblacion de letras {a, b, c,
d}. Si el muestreo es sin reemplazo, todas las muestras posibles son (a, b), (a, c), (a, d), (b, c), (b, d)
y (c, d). Si el muestreo es con reemplazo, todas las muestras posibles son (a, a), (a, b), (a, c), (a, d),
(b, b), (b, c), (b, d), (c, c), (c, d) y (d, d).
1.3. Variable y observaci on
Una variable es cualquier caracterstica de las unidades elementales que puede tomar
valores diferentes. Las variables se clasican en variables cuantitativas continuas, cuantitativas
discretas, cualitativas jerarquicas u ordinales y cualitativas nominales, y son denotadas por
letras may usculas, principalmente por X, Y, y Z.
Una variable cuantitativa es aquella cuyos resultados expresan una magnitud que puede
representarse numericamente. Una variable cuantitativa es discreta si sus distintos valores se
pueden enumerar en secuencia. Una variable cuantitativa es continua si puede tomar cualquier
valor en un intervalo dado.
Ejemplo 4:
Considere una poblacion de electores y sea X el n umero de elecciones en las que ha participado
un elector. Entonces X es una variable cuantitativa discreta.
Considere una fabrica que produce mermeladas y sea Y el contenido neto en gramos de los
frascos de mermelada. Entonces Y es una variable cuantitativa continua.

1.4. ESCALAS DE MEDIDA (ESTUDIO OPCIONAL) 3


Una variable cualitativa es aquella cuyos resultados no representan una magnitud. Una
variable cualitativa es jerarquica u ordinal si se puede establecer un orden para sus valores;
en caso contrario, la variable cualitativa es nominal.
Ejemplo 5:
Considere una fabrica que produce mermeladas y sea X la calidad de un frasco de mermelada,
pudiendo esta ser de primera, de segunda o de tercera. Entonces X es una variable cualitativa
jerarquica.
Considere una poblacion de electores y sea Y el candidato por el que los electores piensan votar
en las siguientes elecciones. Entonces Y es una variable cualitativa nominal.

Una observacion es el dato o valor registrado de una variable en una unidad elemental. El
valor observado en una variable sera denotado por letras min usculas, principalmente por x, y,
y z.
Ejemplo 6: Para cada uno de los ejemplos de variables indicados anteriormente se podran registrar
las siguientes observaciones:
Para la variable n umero de elecciones: Un elector ha participado en 5 elecciones.
Para la variable contenido neto de un frasco de mermelada: Un frasco tiene un contenido neto
de 989 gramos.
Para la variable calidad de la mermelada: Un frasco es de segunda.
Para la variable candidato de preferencia: El elector piensa votar por el candidato Juan Perez.

1.4. Escalas de medida (Estudio opcional)


La escala de medida de una variable describe la naturaleza de la informacion contenida en
sus distintos valores. Seg un la escala, distintas operaciones matematicas entre los valores de
una variable son posibles. Las escalas de medida, en orden de nivel o cantidad de informacion
contenida, son la nominal, la ordinal, la de intervalo y la de razon.
La escala de nivel mas bajo, y por tanto la que contiene menos informacion, es la nominal.
Una escala de medida es nominal si la unica relacion que se puede establecer entre los distintos
valores es la de igualdad. Ejemplos: Genero, nacionalidad, religion.
Una escala de medida es ordinal, si ademas de la relacion de igualdad, se puede establecer
una relacion de orden. Ejemplos: Grado de satisfaccion, estado de salud, grado de instruccion.
Una escala de medida es de intervalo si, ademas de las relaciones anteriores, es posible
realizar asignaciones numericas a las diferencias entre sus distintos valores. Para ello es nece-
sario poder establecer una unidad de medida, y que sea posible contabilizar cuantas veces esta
contenida dicha unidad de medida en la diferencia entre dos valores. Ejemplos: Temperaturas,
fechas, coordenadas. En estos ejemplos las unidades de medida podran ser, el grado Celsius
o grado Fahrenheit, el a no, mes o da, y el grado sexagesimal respectivamente. Notese que en
esta escala de medida, el valor cero es asignado arbitrariamente a cualquier valor de la escala.
4 CAP

ITULO 1. CONCEPTOS B

ASICOS
Una escala de medida es de razon o proporcion si, ademas de las relaciones anteriores, es
posible establecer una relacion de proporcionalidad entre sus distintos valores. Ello supone la
existencia de un cero intrnseco a la magnitud que se esta midiendo. Ejemplos: N umero de
hijos, peso, altura.
1.5. Parametro y estadstico
Un parametro es una caracterstica de una poblacion. Si la poblacion fuera nita, sus
parametros seran funciones de todas sus observaciones. Dado que la poblacion es unica, el
valor de los parametros es tambien unico, esto es, es una constante; dado que por lo general
no se tiene informacion de toda la poblacion, los parametros son generalmente constantes
desconocidas. Usualmente los parametros se denotan con letras griegas como (que representa
la media de una poblacion) o (que representa una proporcion poblacional).
Un estadstico es cualquier funcion de las observaciones de una muestra. Un estadstico es
una variable pues depende de los elementos de la muestra (distintas muestras daran distintos
valores para el estadstico).
Ejemplo 7:
Con una muestra de 500 electores se obtuvo que el 20 % no sabe a un por quien votar. Este
resultado corresponde a un valor estadstico (una proporcion muestral).
De la produccion total de frascos de mermelada se obtuvo un contenido neto medio de 998 gr.
Este resultado corresponde a un parametro (una media poblacional).

1.6. Estadstica descriptiva e inferencia estadstica


La estadstica descriptiva es la parte de la estadstica que se encarga de la recoleccion,
clasicacion, descripcion, y presentacion de los datos. La inferencia estadstica por su par-
te tiene como objetivo, a partir de lo observado en una muestra y utilizando la teora de
probabilidades, inferir como es la poblacion desde la cual fue extrada dicha muestra.
Ejemplo 8: Un estudiante de ingeniera de cierta universidad en su primer da de clases nota que en
su salon hay 25 hombres y 15 mujeres. Al llegar a casa, el estudiante le dice a sus padres lo siguiente:
En mi salon de clases hay 25 hombres y 15 mujeres.
Creo que en ingeniera hay mas estudiantes hombres que mujeres.
Bajo ciertos supuestos, y considerando ciertos modelos de probabilidad y lo observado en mi
clase, un profesor de estadstica me ha dicho que con una conanza del 90 % la proporcion de
hombres en ingeniera debe estar entre 50 % y 75 %.
En le primer enunciado el estudiante esta haciendo uso de la estadstica descriptiva; en el segundo
enunciado el estudiante esta haciendo una inferencia; en el tercer enunciado el estudiante y el profesor
estan haciendo una inferencia estadstica.
1.7. EJERCICIOS 5
1.7. Ejercicios
1. En cada uno de los siguientes casos dena de ser posible: Poblacion, muestra, unidad
elemental, variable, tipo de variable, escala de medida, parametro o valor estadstico, y
de un ejemplo de observacion.
(a) Al encuestar 200 amas de casa, se obtuvo que el 20 % desea consumir el jugo de
naranja que una fabrica desea lanzar al mercado.
(b) En una planta de leche se ha obtenido que el porcentaje de grasa medio por bolsa
de leche es de 3.25 %; este valor se obtuvo de una muestra de tama no 100.
(c) Una fabrica de vinos tiene un lote de 4800 botellas listas para la exportacion. Antes
de enviar el lote, se decide analizar el contenido de 40 botellas seleccionadas al azar.
Se encuentra que el volumen de alcohol esta entre 9 y 12 %.
2. A continuacion se presentan algunas proposiciones. Identique si la proposicion es co-
rrecta o incorrecta, y de ser incorrecta, efect ue las correcciones necesarias.
(a) Las variables cualitativas pueden ser nominales o jerarquicas. Una variable es no-
minal si no existe ning un orden entre sus valores.
(b) Una variable cuantitativa es continua cuando toma un n umero nito o innito
numerable de valores.
(c) Un parametro es una constante generalmente desconocida y un estadstico es una
variable.
3. A continuacion se presentan algunos resultados obtenidos en un estudio sobre las ca-
ractersticas de los jovenes en cierta ciudad. El informe fue elaborado a partir de los
resultados de una encuesta realizada a una muestra aleatoria conformada por 600 jove-
nes, de todos los niveles socioeconomicos y cuyas edades uct uan entre los 21 y 35 a nos
de edad.
El ingreso medio mensual es de 922 nuevos soles.
El 1 % tiene estudios de posgrado y el 12 % educacion universitaria completa.
El 68 % usa computadoras.
A partir de la informacion aqu presentada responda lo siguiente:
(a) Identique la poblacion, muestra y unidad elemental.
(b) Indique las variables asociadas a los tres resultados presentados y el tipo de variable
al que corresponden.
(c) Los resultados presentados son parametros o valores estadsticos? Fundamente su
respuesta.
4. Una empresa productora de camotes fritos ha contratado a un mejorador genetico pa-
ra que trabaje en el desarrollo de una nueva variedad de camote, adecuada para sus
nes de produccion. El objetivo es lograr una variedad que cumpla con las siguientes
caractersticas:
6 CAP

ITULO 1. CONCEPTOS B

ASICOS
Forma homogenea, de ser posible como pelotas de tenis. Esto es importante para
la maquina cortadora. La forma es evaluada por el mejorador de manera subjetiva,
en una escala del 1 al 5, donde 5 es el optimo.
Un contenido de almidon cercano a cierto valor ideal. Un contenido bajo en almidon
producira un camote poco dulce, que probablemente no le guste a los consumido-
res, mientras que uno muy alto podra hacer que el producto frito sea muy duro.
El contenido de almidon se mide en porcentaje.
Un alto contenido de betacaroteno, lo cual le da al camote frito un vistoso color
naranja intenso. El betacaroteno se mide en mg por cada 100 g de materia seca.
Un alto rendimiento en campo, pues de nada sirve cultivar una variedad que no
rinda. El rendimiento en campo debe ser tan alto como sea posible, y de ninguna
manera menor a las 30 toneladas por hectarea.
Para empezar su trabajo el mejorador ha decido realizar un experimento para evaluar en
campo la variedad que usa la empresa actualmente. Para este experimento el mejorador
ha sembrado 20 plantas.
(a) En el experimento el mejorador ha registrado, para cada planta, la forma de los
camotes, el contenido de almidon y de betacaroteno en los camotes, el peso de
los camotes, y el n umero de camotes por planta. En este contexto, identique la
poblacion en estudio, la muestra, la unidad elemental, las variables, y el tipo al
que corresponden.
(b) Suponga que al nalizar el experimento con las 20 plantas, el mejorador ha en-
contrado un contenido medio de betacaroteno de 21 mg/100g de materia seca y
que la primera planta tena 5 camotes. Son estos n umeros parametros, valores
estadsticos u observaciones?
5. Mencione tres diferencias entre parametro y estadstico.
Captulo 2
Organizacion de Datos
2.1. Organizacion de datos cualitativos
Para la organizacion de datos cualitativos es necesario tener presente si estos corresponden
a una variable nominal o a una jerarquica. Si se van a resumir los datos en una tabla de
frecuencias o en un graco, con datos jerarquicos es recomendable respetar el orden natural de
la variable mientras que con datos nominales estos pueden presentarse en categoras ordenadas
de mayor a menor de acuerdo con las frecuencias observadas en cada una. En cualquier caso
se pueden representar dos tipos de frecuencias:
Frecuencia absoluta (f
i
): Representa el n umero de unidades elementales u observaciones
que hay en la clase o categora i.
Frecuencia relativa (fr
i
o h
i
): Representa la proporcion o porcentaje de unidades ele-
mentales u observaciones que hay en la clase o categora i.
Ejemplo 9: Organizacion de datos cualitativos nominales - Para investigar las preferencias de
los consumidores en el mercado de gaseosas, se tomo una muestra de 150 personas y se obtuvieron los
siguientes resultados: 60 preeren la gaseosa A, 43 la gaseosa B, 24 la gaseosa C y 23 otras gaseosas.
Estos datos se pueden presentar en una tabla de frecuencias como la que se muestra en la tabla 2.1, o
mediante un graco de barras como el que se muestra en la gura 2.1.
Ejemplo 10: Organizacion de datos cualitativos jerarquicos - A las 150 personas se les dio a
probar una nueva gaseosa sin identicacion y se les pidio que respondan a la siguiente pregunta: Cual
de las siguientes alternativas dene mejor su actitud hacia este nuevo producto? Las alternativas fueron:
Tabla 2.1: Tabla de frecuencias para los datos de la variable gaseosa de preferencia.
Gaseosa de preferencia f
i
h
i
A 60 0.40
B 43 0.29
C 24 0.16
Otras gaseosas 23 0.15
Total 150 1.00
7
8 CAP

ITULO 2. ORGANIZACI

ON DE DATOS
A B C Otras
Gaseosa de preferencia
%
0
1
0
2
0
3
0
4
0
Base: 150 personas
40%
29%
16%
15%
Figura 2.1: Graco de barras para los datos de la variable gaseosa de preferencia.
Tabla 2.2: Tabla de frecuencias para los datos de la variable actitud hacia la nueva gaseosa.
Actitud hacia la nueva gaseosa f
i
h
i
Denitivamente la comprare 18 0.12
Probablemente la compre 25 0.17
Probablemente no la compre 86 0.57
Denitivamente no la comprare 21 0.14
Total 150 1.00
Denitivamente la comprare, probablemente la compre, probablemente no la compre y denitivamente
no la comprare. Los resultados a la pregunta fueron 18, 25, 86 y 21 respuestas respectivamente para
cada alternativa. En la tabla 2.2 se presenta la tabla de frecuencias para estos datos y en la gura 2.2
se presenta un graco de barras.
Un buen graco puede ser en muchos casos la mejor opcion para presentar la informacion
contenida en los datos. Sin embargo, lograr un buen graco puede no ser una tarea del todo
trivial. Una buena referencia al respecto es Tufte [6].
2.2. Organizacion de datos cuantitativos discretos
Si se tienen datos cuantitativos discretos cuyo n umero de resultados diferentes no es gran-
de, estos pueden ser clasicados y presentados directamente sin perdida de la informacion
original, esto es, sin la necesidad de agrupar los datos en categoras. En la representacion de
datos cuantitativos es posible utilizar, ademas de las frecuencias absolutas y relativas antes
mencionadas, las siguientes frecuencias acumuladas:
Frecuencia absoluta acumulada (F
i
): Representa el n umero de unidades elementales u
observaciones acumuladas hasta la clase o categora i.
2.2. ORGANIZACI

ON DE DATOS CUANTITATIVOS DISCRETOS 9


Actitud hacia la nueva gaseosa
%
0
1
0
2
0
3
0
4
0
5
0
6
0
Definitivamente Probablemente Probablemente Definitivamente
la comprar la compre no la compre no la comprar
Base: 150 personas
12%
17%
57%
14%
Figura 2.2: Graco de barras para los datos de la variable actitud hacia la nueva gaseosa.
Tabla 2.3: Resultados para la variable n umero de hijos por familia.
0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2
2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3
3 3 3 3 3 3 4 4 4 4 5 5 5 5 6 6
Frecuencia relativa acumulada (Fr
i
o H
i
): Representa la proporcion o porcentaje de
unidades elementales u observaciones acumuladas hasta la clase o categora i.
Ejemplo 11: Se tomo una muestra aleatoria de 50 familias y se registro el n umero de hijos por familia.
Los resultados se presentan en la tabla 2.3. Dado que solo hay 7 respuestas diferentes, los datos pueden
ser organizados en una tabla de frecuencias sin la necesidad de agruparlos en categoras. La tabla de
frecuencias para los datos de este ejemplo se muestra en la tabla 2.4; en la gura 2.3 se presenta un
graco de barras.
Tabla 2.4: Tabla de frecuencias para los datos de la variable n umero de hijos por familia.
N umero de hijos f
i
F
i
h
i
H
i
0 4 4 0.08 0.08
1 8 12 0.16 0.24
2 13 25 0.26 0.50
3 15 40 0.30 0.80
4 4 44 0.08 0.88
5 4 48 0.08 0.96
6 2 50 0.04 1.00
Total 50 1.00
10 CAP

ITULO 2. ORGANIZACI

ON DE DATOS
0 1 2 3 4 5 6
Nmero de hijos por familia
%
0
5
1
0
1
5
2
0
2
5
3
0
Nmero de hijos
Base: 50 familias
8%
16%
26%
30%
8% 8%
4%
Figura 2.3: Graco de barras para los datos de la variable n umero de hijos por familia.
Datos cuantitativos discretos suelen representarse tambien mediante el llamado graco de
bastones. El graco de bastones es un graco de barras en donde cada barra es representada
por una linea, de modo que se resalta la naturaleza discreta de los datos. Este tipo de graco
puede obtenerse en MINITAB con el men u Graph/Histogram. . . usando la opcion Project
lines en Data View . . . . En la gura 2.4 se presenta el graco de bastones para los datos del
ejemplo 11.
2.3. Organizacion de datos cuantitativos continuos
2.3.1. Tabla de frecuencias con datos cuantitativos continuos
Dado que las observaciones para una variable continua son por lo general diferentes entre
s, estas tendran que ser agrupadas en categoras mutuamente excluyentes llamadas intervalos
de clase. Para que el proceso de agrupacion en categoras no desvirt ue la informacion dada
por los datos es recomendable que los intervalos sean del mismo tama no. Para la construccion
de una tabla de frecuencias con intervalos de igual tama no se podran considerar los siguientes
pasos:
1. Calcular el rango de los datos (r):
r = x
max
x
min
(2.1)
2. Determinar el n umero de intervalos (k). Una gua utilizada con frecuencia es la regla de
Sturges la cual indica que el n umero de intervalos debe ser
k 1 + 3.3 log n (2.2)
donde n es el n umero de datos. En esta formula, k se redondea al entero mas cercano.
Es importante mencionar que no existe una regla unica para determinar el n umero de
intervalos, y que el resultado de cualquier regla no es mas que una recomendacion.
2.3. ORGANIZACI

ON DE DATOS CUANTITATIVOS CONTINUOS 11


0 1 2 3 4 5 6
0
5
1
0
1
5
Distribucin del nmero de hijos por familia
Nmero de hijos
F
r
e
c
u
e
n
c
i
a
Figura 2.4: Graco de bastones para los datos de la variable n umero de hijos por familia.
3. Determinar el tama no de los intervalos de clase (c):
c r/k (2.3)
El tama no del intervalo de clase se redondea por exceso con igual n umero de decimales
que los datos.
4. Generar los lmites inferior (LI) y superior (LS) de los intervalos:
LI
1
= x
min
(2.4)
LI
i
= LI
i1
+c (2.5)
LS
i
= LI
i+1
= LS
i1
+c (2.6)
5. Clasicar las observaciones en los intervalos correspondientes. Para evitar que una ob-
servacion pueda ser considerada en mas de un intervalo, cada uno de los intervalos se
considera cerrado a la izquierda y abierto a la derecha.
6. Dado que los datos originales se pierden, sera necesario calcular un valor que sea re-
presentativo de todas las observaciones que pertenecen a un intervalo. Este valor es la
marca de clase (denotado por M o X

) y es denido por
M
i
= (LI
i
+LS
i
)/2 (2.7)
Notese que la marca de clase no es mas que el punto medio del intervalo.
7. Finalmente se procede a calcular las frecuencias absolutas y relativas, f
i
, F
i
, h
i
y H
i
.
Ejemplo 12: Suponga que en una muestra aleatoria de 50 clientes de un banco se ha observado los
saldos en cuentas de ahorro, en miles de soles, que se muestran en la tabla 2.5. En este caso el rango
es
r = x
max
x
min
= 16.1 0.4 = 15.7,
12 CAP

ITULO 2. ORGANIZACI

ON DE DATOS
Tabla 2.5: Resultados para la variable saldos en cuentas de ahorro en miles de soles.
0.4 0.9 1.0 1.2 2.0 3.0 3.0 3.2 4.0 4.0 4.2 4.5 4.9
5.2 5.6 5.6 5.7 6.2 6.2 6.3 6.3 6.4 6.4 6.6 6.9 7.1
7.2 7.8 7.8 8.0 8.2 8.4 8.4 8.4 8.5 8.6 9.0 9.5 9.8
9.9 10.0 10.1 10.5 10.5 11.5 12.0 13.0 13.5 15.0 16.1
Tabla 2.6: Tabla de frecuencias para los datos de la variable saldos en cuentas de ahorro.
Saldos (en miles de soles) M
i
f
i
F
i
h
i
H
i
[0.4 2.7) 1.55 5 5 0.10 0.10
[2.7 5.0) 3.85 8 13 0.16 0.26
[5.0 7.3) 6.15 14 27 0.28 0.54
[7.3 9.6) 8.45 11 38 0.22 0.76
[9.6 11.9) 10.75 7 45 0.14 0.90
[11.9 14.2) 13.05 3 48 0.06 0.96
[14.2 16.5] 15.35 2 50 0.04 1.00
Total 50 1.00
el n umero de intervalos seg un la regla de Sturges
k 1 + 3.3 log n = 1 + 3.3 log 50 = 6.6 7
y el tama no de los intervalos de clase
c r/k = 15.7/7 = 2.24 2.3.
La tabla de frecuencias para estos datos se muestra en la tabla 2.6. Los resultados presentados en una
tabla de frecuencias tienen una interpretacion directa. As por ejemplo, en la tabla 2.6 se tiene que:
M
2
= 3850 soles es el valor representativo del segundo intervalo.
f
3
= 14 clientes tienen entre 5000 y 7300 soles.
F
4
= 38 clientes tienen entre 400 y 9600 soles.
H
5
H
3
= 0.90 0.54 = 0.36 indica que el 36 % de los clientes tienen entre 7300 y 11900 soles.

2.3.2. Interpolacion a partir de la tabla de frecuencias


La presentacion de los datos mediante una tabla de frecuencias como la mostrada en la
tabla 2.6 conlleva una perdida de informacion, en el sentido de que no se preservan los valores
exactos de los datos sino solamente su pertenencia o no a cierto intervalo. Si uno desea
obtener a partir de una tabla de frecuencias alg un resultado que encaje con la denicion de
los intervalos, los resultados obtenidos a partir de la tabla de frecuencias seran los mismos
que se obtendran al observar los datos sin agrupar. En el ejemplo 12, este sera el caso si uno
quisiera saber cuantos clientes tienen entre 2700 y 7300 soles (la respuesta es 22 clientes si
se suman las frecuencias absolutas de las las 2 y 3) o que porcentaje de los clientes tienen
mas de 9600 soles (la respuesta es 24 % a partir del complemento de la frecuencia relativa
2.3. ORGANIZACI

ON DE DATOS CUANTITATIVOS CONTINUOS 13


acumulada de la la 4). Pero que se puede hacer si uno esta interesado en por ejemplo
calcular el porcentaje de clientes que tienen mas de 10 000 soles o denir entre que montos
se encuentran los clientes que pertenecen al 20 % inferior en cuanto a sus saldos. Estas dos
ultimas preguntas solo pueden ser aproximadas a partir de la tabla de frecuencias utilizando
alg un tipo de interpolacion. A continuacion se presentan los calculos para responder a estas
preguntas utilizando interpolacion lineal.
Para responder a la primera pregunta, el porcentaje de clientes que tienen mas de 10000
soles, primero note que la categora 4 tiene un porcentaje acumulado de 76 % hasta 9600 y
que la categora 5 tiene un porcentaje acumulado de 90 % hasta 11900. La idea del metodo
de interpolacion lineal consiste en calcular la recta que une los puntos (9.6, 0.76) y (11.9, 0.9),
para luego calcular Y en el punto (10, Y ) de dicha recta. Estos calculos se pueden resumir en
una regla de tres simple como la siguiente:
11.9 9.6 0.9 0.76
11.9 10 0.9 Y
Luego, la respuesta es Y = 0.7843, con lo que aproximadamente el 78.43 % de los clientes
tienen menos de 10000 soles y el 21.57 % de los clientes tienen mas de 10000 soles.
Para responder a la segunda pregunta, entre que montos se encuentran los clientes que
pertenecen al 20 % inferior, note que la categora 1 tiene un porcentaje acumulado de 10 %
hasta 2700 y que la categora 2 tiene un porcentaje acumulado de 26 % hasta 5000. Entonces,
procediendo de la misma manera que en el caso anterior, se puede plantear la regla de tres
simple
5 2.7 0.26 0.1
5 Y 0.26 0.2
cuya solucion es Y = 4.1375. Entonces, el 20 % de los clientes con menos dinero tienen
aproximadamente entre 400 y 4137.5 soles.
2.3.3. Histograma de frecuencias
Es un graco de barras, una a continuacion de la otra sin separacion entre ellas. La
altura de cada barra representa la frecuencia, absoluta o relativa, de un intervalo de clase,
mientras que el ancho de la barra representa el tama no del intervalo y su posicion en la
escala de la variable. En la gura 2.5 se muestra el histograma correspondiente a la tabla de
frecuencias mostrada en la tabla 2.6. Se puede obtener este graco en MINITAB con el men u
Graph/Histogram. . . .
2.3.4. Polgono de frecuencias
Es el graco que resulta al trazar un polgono que pase por los puntos (M
i
, f
i
) o por
los puntos (M
i
, h
i
) de un histograma. En este graco se debe considerar dos categoras o
intervalos adicionales, uno anterior al primero y uno posterior al ultimo, cada uno de ellos con
una frecuencia de cero. En la gura 2.6 se muestra el polgono de frecuencias correspondiente
a la tabla de frecuencias mostrada en la tabla 2.6; en el lado izquierdo de la gura se muestra
el polgono superpuesto con el histograma.
14 CAP

ITULO 2. ORGANIZACI

ON DE DATOS
Distribucin de los saldos en cuentas de ahorro
Saldos en miles de soles
%
1.55 3.85 6.15 8.45 10.75 13.05 15.35
0
1
0
2
0
3
0
Figura 2.5: Histograma para los datos de la variable saldos en cuentas de ahorro.
Distribucin de los saldos en cuentas de ahorro
Saldos en miles de soles
%
0.75 1.55 3.85 6.15 8.45 10.75 13.05 15.35 17.65
0
1
0
2
0
3
0
Distribucin de los saldos en cuentas de ahorro
Saldos en miles de soles
%
0.75 1.55 3.85 6.15 8.45 10.75 13.05 15.35 17.65
0
1
0
2
0
3
0
Figura 2.6: Polgono de frecuencias e histograma para los datos de la variable saldos en cuentas de
ahorro. En la gura de la izquierda se muestra el polgono de frecuencias superpuesto en el histograma.
En la gura de la derecha se muestra el polgono de frecuencias unicamente.
2.4. GR

AFICO DE PARETO 15
Distribucin acumulada de los saldos en
cuentas de ahorro
Saldos en miles de soles
H
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
0.4 2.7 5.0 7.3 9.6 11.9 14.2 16.5
Figura 2.7: Polgono de frecuencias acumuladas para los datos de la variable saldos en cuentas de
ahorro.
2.3.5. Polgono de frecuencias acumuladas o curva ojiva
Es el graco que resulta al trazar un polgono que pase por los puntos (LS
i
, H
i
). En este
graco se debe considerar adicionalmente el punto (LI
1
, 0). En la gura 2.7 se muestra el
polgono de frecuencias acumuladas correspondiente a la tabla de frecuencias mostrada en la
tabla 2.6.
2.4. Graco de Pareto
El graco de Pareto es un graco de barras desarrollado para datos cualitativos en el que
en el eje horizontal se representa alguna variable cualitativa cuyas categoras son ordenadas
de acuerdo con sus frecuencias de mayor a menor. Este graco es acompa nado con una curva
de proporciones acumuladas similar a la curva ojiva. La variable en estudio esta asociada por
lo general a defectos o problemas. Al ordenar las barras de mayor a menor seg un sus frecuen-
cias, el graco pretende mostrar que tipo de defectos o problemas corresponden a los pocos
vitales para diferenciarlos de los muchos triviales. El principio de Pareto establece que
aproximadamente el 80 % de los problemas o defectos corresponden al 20 % de las categoras
con mayor frecuencia.
Ejemplo 13: En la gura 2.8 se presenta un ejemplo con datos simulados para una muestra de 300
casos. La variable en estudio es el aspecto que los clientes de un centro comercial cticio consideran
que la gerencia debe mejorar. Este graco se puede realizar en MINITAB en el men u Stat/Quality
Tools/Pareto Chart. . . .
16 CAP

ITULO 2. ORGANIZACI

ON DE DATOS
Figura 2.8: Graco de Pareto para la variable aspecto a mejorar en un centro comercial.
Tabla 2.7: Resultados para la variable tiempo requerido para realizar una tarea.
105 105 107 108 108 108 109 109 110 111 111 111
113 114 114 117 118 119 121 121 123 125 126 126
126 126 128 129 130 131 134 134 137 145 145 150
150 152 153 154 157 157 158 164 170 171 179 183
2.5. Ejercicios
1. Una compa na manufacturera tiene a prueba a 48 nuevos trabajadores. Para evaluar
su rendimiento se les asigno una tarea rutinaria y se midio el tiempo que tardaron en
realizarla. Los tiempos observados en minutos se presentan en la tabla 2.7.
(a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el n u-
mero de intervalos.
(b) A partir de la tabla de frecuencias interprete f
5
, y 1 H
4
.
(c) A partir de la tabla de frecuencias aproximadamente que porcentaje de los traba-
jadores termino la tarea en menos de 134 minutos? (Rpta.: 61.46 %)
2. Se realizo un estudio para evaluar el tiempo de atencion en un banco. Con los resultados
obtenidos con una muestra de 100 clientes se construyo una tabla de frecuencias, la cual
se muestra con algunos vacos en la tabla 2.8.
(a) Identique el tipo de variable en estudio y la unidad elemental.
(b) Complete la tabla de frecuencias.
(c) Interprete M
4
, h
3
y f
3
+f
4
.
2.5. EJERCICIOS 17
Tabla 2.8: Tabla de frecuencias para los datos de la variable tiempo de atencion en una muestra de
100 clientes de un banco.
Tiempo de atencion (en minutos) M
i
f
i
F
i
h
i
H
i
[1.0 1.5) 4
[1.5 2.0) 15
[2.0 2.5) 49
[2.5 3.0) 22
[3.0 3.5) 19
[3.5 4.0] 10
Total
(d) Utilice interpolacion lineal para aproximar el tiempo maximo de atencion para que
un cliente este incluido dentro del 10 % de los que son atendidos mas rapido.
3. En el archivo SUELDOS.MTW se presentan los sueldos anuales (en miles de Nuevos
Soles) de los directores ejecutivos de 120 peque nas empresas (columna C1) clasicados
seg un el rubro de la empresa (columna C2).
(a) Construya una tabla de frecuencias y un graco para mostrar los datos de la
columna C2. Que porcentaje de las empresas corresponden a cada uno de los
rubros?
(b) Construya una tabla de frecuencias para los datos de la columna C1. Utilice la
regla de Sturges para determinar el n umero de intervalos.
(c) A partir de la tabla de frecuencias anterior construya el histograma, el polgono de
frecuencias y la curva ojiva.
(d) A partir de la tabla de frecuencias interprete f
2
, F
3
, y H
4
.
4. Considere las siguientes situaciones:
Un profesor ha registrado el total de tardanzas de sus alumnos a clase durante un
periodo academico. Luego de tabular los datos ha encontrado que aproximadamente
el 80 % de las tardanzas corresponden al 20 % de sus alumnos.
Un fanatico del f utbol indica que aproximadamente el 80 % de los campeonatos de
primera division fueron ganados por aproximadamente el 20 % de los clubes que
alguna vez participaron en primera.
Aplica el principio de Pareto a esto casos?
18 CAP

ITULO 2. ORGANIZACI

ON DE DATOS
Captulo 3
Medidas de Posicion, Varibilidad y
Forma
3.1. Introducci on
En este captulo se presentan una serie de medidas cuyo objetivo es describir distintos
aspectos (la posicion, dispersion y forma) de la distribucion de un conjunto de datos. A estas
medidas se les conoce como estadsticas descriptivas, y pueden verse como distintos res umenes
de la informacion contenida en los datos, cada una tratando de describir un aspecto diferente.
Todas estas medidas, y algunas mas, pueden calcularse en MINITAB en el men u Stat/Basic
Statistics/Display Descriptive Statistics.
3.2. Medidas de posici on central
Las medidas de posicion central o tendencia central son medidas estadsticas que repre-
sentan el centro de la distribucion de los datos. En la gura 3.1 se muestran dos distribuciones
de datos con diferente posicion pero con la misma variabilidad o dispersion.
3.2.1. Media aritmetica
Es la suma de todas las observaciones de una poblacion o muestra dividida entre el tama no
de la poblacion o muestra. Para una poblacion de tama no N la media poblacional se dene
por
=
1
N
N

i=1
x
i
. (3.1)
Para una muestra de tama no n la media muestral se dene por
x =
1
n
n

i=1
x
i
. (3.2)
Si los datos estan agrupados en una tabla de frecuencias con k clases o categoras la media
muestral puede aproximarse utilizando las marcas de clase como valores representativos, y
19
20 CAP

ITULO 3. MEDIDAS DE POSICI

ON, VARIBILIDAD Y FORMA


0 10 20 30 40 0 10 20 30 40
Figura 3.1: Distribuciones con diferente posicion. La curva izquierda tiene un promedio de 15 mientras
que la curva derecha tiene un promedio de 25.
entonces
x =
1
n
k

i=1
M
i
f
i
=
k

i=1
M
i
fr
i
. (3.3)
Ejemplo 14: En la tabla 2.3 se presentan datos para la variable n umero de hijos por familia para una
muestra de 50 familias. Con estos datos, la media muestral, calculada con la formula 3.2 es
x =
1
n
n

i=1
x
i
=
0 + 0 +. . . + 6
50
= 2.54 hijos.

Ejemplo 15: En la tabla 2.5 se presentan datos para la variable saldo en una muestra de 50 cuentas
de ahorro. Con estos datos, la media muestral, calculada con la formula 3.2, es
x =
1
n
n

i=1
x
i
=
0.4 + 0.9 +. . . + 16.1
50
= 7.17 miles de soles.
Si no se contara con los datos originales sino solo con la tabla de frecuencias mostrada en la tabla 2.6,
se podra aproximar el valor de la media con la formula 3.3 de la siguiente manera:
x =
1
n
k

i=1
M
i
f
i
=
1.55 5 + 3.85 8 +. . . + 15.35 2
50
= 7.254 miles de soles.

La media aritmetica es una medida sensible a valores extremos, esto es, uno o unos pocos
valores extremadamente altos o bajos pueden tener un efecto importante en su valor. A
continuacion se presentan algunas propiedades matematicas de la media aritmetica:
3.2. MEDIDAS DE POSICI

ON CENTRAL 21
1. La suma de las desviaciones de las observaciones respecto a la media aritmetica es cero,
esto es,

n
i=1
(x
i
x) = 0.
2. La sumatoria

n
i=1
(x
i
k)
2
es mmina en k = x.
3. Si a cada observacion se le multiplica por una constate b y se le suma otra constante a, la
media aritmetica queda multiplicada por la primera constate y sumada por la segunda,
esto es, si y
i
= a +bx
i
para cada i, entonces y = a +b x.
Ejemplo 16: Suponga que la media del sueldo de los trabajadores de una empresa es 1200 soles y
que se planea efectuar un primer aumento del 10 % y luego un segundo aumento de 200 soles a todos
los trabajadores. Entonces, si X denota el sueldo de los trabajadores antes del aumento y Y el sueldo
de los trabajadores despues del aumento, seg un la propiedad n umero 3 se tiene que la media de los
sueldos despues del aumento sera y = 200 + 1.1 x = 200 + 1.1 1200 = 1520 soles.
3.2.2. Media ponderada
La media ponderada de un conjunto de observaciones x
1
, . . . x
k
, con pesos o ponderaciones
P
1
, . . . , P
k
se dene como
x =

k
i=1
P
i
x
i

k
i=1
P
i
(3.4)
Ejemplo 17: Un estudiante obtiene 15 en su primer examen de estadstica, 12 en el segundo y 17 en
el tercero. Considerando que el primer examen tiene un peso de 20 %, el segundo un peso de 30 % y el
tercero un peso de 50 %, su nota nal en el curso sera, usando la formula 3.4
x =
0.2 15 + 0.3 12 + 0.5 17
0.2 + 0.3 + 0.5
= 15.1.

Ejemplo 18: En una compa na los trabajadores estan considerados en tres categoras, A, B y C. El
ingreso medio de los 300 trabajadores de la categora B es de S/. 6000 y de los 150 trabajadores de
la categora C es de S/. 8000. A los trabajadores de la categora A se les hace un aumento del 20 %
mas una bonicacion de S/. 600, a los de la categora B se les aumenta un 25 % mas una bonicacion
de S/. 800 y a los de la categora C se les hace un aumento del 35 % mas una bonicacion de S/. 500.
Si el ingreso medio de los 650 trabajadores de la compa na despues del aumento es de S/. 8100, cual
era el ingreso promedio de los trabajadores de la categora A antes de los aumentos?
Sea X el ingreso de un trabajador antes de los aumentos. Utilizando la formula 3.4, la media de
todos los trabajadores antes de los aumentos es
x =
200 x
A
+ 300 x
B
+ 150 x
C
650
.
Sea Y el ingreso de un trabajador despues de los aumentos. Por la propiedad n umero 3 se tiene que
y =
200(600 + 1.2 x
A
) + 300(800 + 1.25 x
B
) + 150(500 + 1.35 x
C
)
650
.
Dado que y = 8100, x
B
= 6000 y x
C
= 8000, se tiene que
8100 =
200(600 + 1.2 x
A
) + 300(800 + 1.25 6000) + 150(500 + 1.35 8000)
650
.
Depejando x
A
en esta ultima expresion se tiene que x
A
= 4000.
22 CAP

ITULO 3. MEDIDAS DE POSICI

ON, VARIBILIDAD Y FORMA


3.2.3. Mediana
La mediana de un conjunto de observaciones ordenadas de acuerdo con su magnitud es el
valor de la observacion que ocupa la posicion central de dicho conjunto. Dada una muestra
de tama no n, la mediana esta dada por
me = x
(
n+1
2
)
(3.5)
si n es impar y
me =
x
(
n
2
)
+x
(
n
2
+1)
2
(3.6)
si n es par. En esta notacion el subndice en parentesis indica la posicion en la que se encuentra
el dato luego de ordenar todos los datos de menor a mayor.
Si los datos estan agrupados en una tabla de frecuencias con k intervalos, la mediana puede
aproximarse utilizando interpolacion lineal (revise 2.3.2). El uso de interpolacion lineal da
como resultado la siguiente expresion
me = LI
i
+
_
n
2
F
i1
f
i
_
c
i
= LI
i
+
_
0.5 H
i1
fr
i
_
c
i
(3.7)
donde i es el n umero del intervalo que contiene a la mediana.
Ejemplo 19: Considere el siguiente conjunto de datos: 5, 6, 7, 9, 11, 12 y 16. Dado que n = 7 es
impar, aplicando la formula 3.5 se tiene que la mediana es
me = x
(
7+1
2
)
= x
(4)
= 9.

Ejemplo 20: Considere el siguiente conjunto de datos: 9,12,16,16,17,18,19 y 21. Dado que n = 8 es
par, aplicando la formula 3.6 se tiene que la mediana es
me =
x
(
8
2
)
+x
(
8
2
+1)
2
=
x
(4)
+x
(5)
2
=
16 + 17
2
= 16.5.

Ejemplo 21: Con los datos de la tabla 2.4, y dado que n = 50 es par, aplicando la formula 3.6 se
tiene que la mediana para el n umero de hijos por familia es
me =
x
(
50
2
)
+x
(
50
2
+1)
2
=
x
(25)
+x
(26)
2
=
2 + 3
2
= 2.5 hijos.

Ejemplo 22: Para la variable saldo en cuentas de ahorro, con la informacion mostrada en la tabla 2.6,
la mediana pertenece al tercer intervalo ya que a este le corresponden frecuencias relativas acumuladas
de entre 0.26 y 0.54 (La mediana corresponde a una frecuencia relativa acumulada de 0.5). Luego,
aplicando la formula 3.7, la mediana en este caso es aproximada por
me = LI
3
+
_
n
2
F
31
f
3
_
c
3
= 5 +
_
25
2
13
14
_
2.3 = 6.97 miles de soles.
3.3. CUANTILES 23

A diferencia de la media, la mediana no se ve afectada por valores extremos. A continuacion


se presentan algunas propiedades de la mediana:
1. La sumatoria

n
i=1
|x
i
k| es mmina en k = me.
2. Si a cada observacion se le multiplica por una constate b y se le suma otra constante a,
la mediana queda multiplicada por la primera constate y sumada por la segunda, esto
es, si y
i
= a +bx
i
para cada i, entonces me
y
= a +b me
x
.
3.2.4. Moda
Es el valor con mayor frecuencia. Si los datos estan agrupados en una tabla de frecuencias
con k intervalos, la moda puede aproximarse con la expresion
mo = LI
i
+
_

1

1
+
2
_
c
i
(3.8)
donde i es el n umero del intervalo que contiene a la moda (intervalo con mayor frecuencia),

1
= f
i
f
i1
y
2
= f
i
f
i+1
. Alternativamente,
1
y
2
pueden denirse por
1
= h
i
h
i1
y
2
= h
i
h
i+1
.
Ejemplo 23: Con los datos de la tabla 2.4 la moda es 3 hijos, pues es el valor con mayor frecuencia,
en este caso, una frecuencia de 15.
Ejemplo 24: Para la variable saldo en cuentas de ahorro, con los datos mostrados en la tabla 2.6, la
moda se encuentra en el tercer intervalo, pues es el intervalo con mayor frecuencia absoluta. Luego,
aplicando la formula 3.8 se tiene que

1
= f
3
f
2
= 14 8 = 6
2
= f
3
f
4
= 14 11 = 3
y la moda es aproximada por
mo = LI
3
+
_

1

1
+
2
_
c
3
= 5 +
_
6
6 + 3
_
2.3 = 6.53 miles de soles.

3.3. Cuantiles
Se pueden considerar como medidas de posicion no central. Los cuantiles son utilizados
para dividir a un conjunto de datos ordenados en subconjuntos de igual tama no; los cuantiles
son los valores que determinan los lmites entre estos subconjuntos consecutivos. Algunos
cuantiles reciben nombres especiales:
Percentiles (P): Conjunto de valores que dividen a los datos en 100 partes iguales.
Deciles (D): Conjunto de valores que dividen a los datos en 10 partes iguales.
Cuartiles (Q): Conjunto de valores que dividen a los datos en 4 partes iguales.
24 CAP

ITULO 3. MEDIDAS DE POSICI

ON, VARIBILIDAD Y FORMA


Tabla 3.1: Volumen de venta en miles de soles para una muestra de 36 establecimientos comerciales.
1.5 2.1 3.2 3.7 4.2 4.5 4.6 4.6 4.7 5.3 5.4 5.7
6.1 6.4 6.6 6.7 7.2 7.4 7.4 7.7 7.8 8.4 8.5 8.8
9.1 9.6 10.1 10.5 10.9 11.2 11.5 11.7 12.7 13.8 13.9 14.8
Note por ejemplo que la mediana es un cuantil, y corresponde al percentil 50, al decil 5 y al
cuartil 2. Dado que cualquier cuartil o decil es equivalente a un percentil, a continuacion se
presentaran expresiones solo para el calculo de percentiles.
Sea P
q
el percentil que divide a un conjunto ordenado de observaciones en un q % menores
que P
q
y un (100q) % mayores que P
q
. Entonces el percentil P
q
corresponde a la observacion
que ocupa la posicion
n+1
100
q, esto es
P
q
= x
(
n+1
100
q)
. (3.9)
Si el valor
n+1
100
q no es entero, entonces el percentil es aproximado por
P
q
= x
(E)
+ 0.d (x
(E+1)
x
(E)
) (3.10)
donde E es la parte entera de
n+1
100
q y d la parte decimal. Si los datos estan agrupados en
una tabla de frecuencias con k intervalos, el percentil P
q
puede aproximarse con la siguiente
expresion:
P
q
= LI
i
+
_
qn
100
F
i1
f
i
_
c
i
(3.11)
donde i es el n umero del intervalo que contiene al percentil q.
Ejemplo 25: Considere los datos que se presentan en la tabla 3.1. Con estos datos, y utilizando las
formulas 3.9 y 3.10, el percentil 62 es
P
62
= x
(
36+1
100
62)
= x
(22.94)
= x
(22)
+0.94(x
(23)
x
(22)
) = 8.4+0.94(8.58.4) = 8.494 miles de soles,
el decil 3 es
D
3
= P
30
= x
(
36+1
100
30)
= x
(11.1)
= x
(11)
+0.1(x
(12)
x
(11)
) = 5.4+0.1(5.75.4) = 5.43 miles de soles,
y el cuartil 3 es
Q
3
= P
75
= x
(
36+1
100
75)
= x
(27.75)
= x
(27)
+ 0.75(x
(28)
x
(27)
) = 10.1 + 0.75 (10.5 10.1)
= 10.4 miles de soles.

Ejemplo 26: Con los datos de la tabla 2.6, el primer cuartil, que corresponde al percentil 25, pertenece
al segundo intervalo, ya que este contiene frecuencias relativas acumuladas entre 0.10 y 0.26. Luego,
utilizando la formula 3.11, el percentil 25 es aproximado por
P
25
= LI
2
+
_
2550
100
F
21
f
2
_
c
2
= 2.7 +
_
12.5 5
8
_
2.3 = 4.85625 miles de soles.

3.4. MEDIDAS DE VARIABILIDAD 25


0 10 20 30 40 0 10 20 30 40
Figura 3.2: Distribuciones con diferente variabilidad. Ambas curvas tienen un promedio de 20, pero
la curva con el pico mas alto presenta menor variabilidad
3.4. Medidas de variabilidad
Llamadas tambien medidas de dispersion, son medidas estadsticas que permiten conocer
el grado de homogeneidad o heterogeneidad de un conjunto de datos. En la gura 3.2 se
muestran dos distribuciones de datos con diferente variabilidad pero con la misma posicion
central.
3.4.1. Rango
Es la diferencia entre la observacion de mayor valor y la de menor valor. Dado un conjunto
de datos sin agrupar, el rango esta denido por
r = x
max
x
min
. (3.12)
Si los datos estan agrupados en una tabla de frecuencia con k clases o categoras, entonces
r = LS
k
LI
1
. (3.13)
Es una medida inestable pues cambia de valor rapidamente al pasar de una muestra a otra.
Se ve afectada por valores extremos y no mide la variacion de los datos intermedios.
Ejemplo 27: En la tabla 2.3 se presentan datos para la variable n umero de hijos por familia para
una muestra de 50 familias. Con estos datos el rango de la variable n umero de hijos, calculado con la
formula 3.12, es
r = 6 0 = 6 hijos.

Ejemplo 28: En la tabla 2.6 se presentan datos para la variable saldo en una muestra de 50 cuentas
de ahorro. Con estos datos el rango de la variable saldo en cuentas de ahorro, calculado con la formula
26 CAP

ITULO 3. MEDIDAS DE POSICI

ON, VARIBILIDAD Y FORMA


3.13, es
r = 16.5 0.4 = 16.1 miles de soles.

3.4.2. Rango intercuartlico (RIC)


El rango intercuartlico se dene como la diferencia entre el primer y tercer cuartil.
RIC = Q
3
Q
1
= P
75
P
25
. (3.14)
El RIC excluye el 25 % mas alto y el 25 % mas bajo de un conjunto de datos, dando un rango
dentro del cual se encuentra el 50 % central de los datos. A diferencia del rango total, el rango
intercuartlico no se encuentra afectado por valores extremos.
Ejemplo 29: En la tabla 3.1 se presentan datos para la variable volumen de venta en miles de soles
registrada en un total de 36 establecimientos. Con estos datos el primer y tercer cuartil estan dados
por
P
25
= x
(
36+1
100
25)
= x
(9.25)
= x
(9)
+ 0.25(x
(10)
x
(9)
) = 4.7 + 0.25(5.3 4.7) = 4.85
y
P
75
= x
(
36+1
100
75)
= x
(27.75)
= x
(27)
+ 0.75(x
(28)
x
(27)
) = 10.1 + 0.75(10.5 10.1) = 10.4.
Entonces, el rango intercuartlico es
RIC = 10.4 4.85 = 5.55 miles de soles.

3.4.3. Varianza
La varianza de las observaciones de una poblacion nita de tama no N esta dada por

2
=
1
N
N

i=1
(x
i
)
2
=
1
N
_
N

i=1
x
2
i
N
2
_
. (3.15)
La varianza de las observaciones de una muestra de tama no n esta dada por
s
2
=
1
n 1
n

i=1
(x
i
x)
2
=
1
n 1
_
n

i=1
x
2
i
n x
2
_
. (3.16)
Si los datos obtenidos con una muestra estan agrupados en una tabla de frecuencia con k
categoras, la varianza muestral puede aproximarse con la expresion
s
2
=
1
n 1
k

i=1
(M
i
x)
2
f
i
=
1
n 1
_
k

i=1
M
2
i
f
i
n x
2
_
. (3.17)
A partir de las formulas anteriores para el calculo de la varianza se puede notar la siguiente
propiedad: Si a cada observacion x se le aplica la transformacion y = a + bx, la varianza de
la variable transformada Y es igual a la varianza de X multiplicada por b
2
.
Ejemplo 30: Suponga que la varianza de los sueldos, denotados por X, de los trabajadores de una
empresa es
2
X
= 200 soles
2
. Si a cada trabajador se le hace un primer aumento del 10 % y luego un
segundo aumento de 200 soles, entonces su nuevo sueldo, denotado por Y , sera Y = 200 + 1.1X y la
varianza de Y sera
2
Y
= 1.1
2

2
X
= 1.1
2
200 = 242 soles
2
.
3.4. MEDIDAS DE VARIABILIDAD 27
Tabla 3.2: Datos observados en dos muestras de tama no 5.
Muestra A 5 8 11 12 16
Muestra B 1015 1036 1050 1051 1100
3.4.4. Desviaci on estandar
Un problema en la interpretacion de la varianza es que esta expresada en las unidades de
las observaciones elevadas al cuadrado. Para evitar este problema se dene otra medida de
variabilidad, denominada desviacion estandar, que es igual a la raz cuadrada positiva de la
varianza. As, la desviacion estandar poblacional esta dada por
= +

2
(3.18)
y la desviacion estandar muestral por
s = +

s
2
. (3.19)
3.4.5. Coeciente de variaci on
Expresa el n umero de veces que la desviacion estandar contiene a la media expresado como
un porcentaje. El coeciente de variacion poblacional esta dado por
CV =

||
100 % (3.20)
y el coeciente de variacion muestral por
cv =
s
| x|
100 %. (3.21)
Dado que el coeciente de variacion carece de unidades, es util para comparar la variabilidad de
dos o mas conjuntos de datos con diferentes unidades de medida o con valores muy diferentes
para sus medias.
Ejemplo 31: Considere las observaciones dadas en la tabla 3.2 para dos muestras de tama no 5. Para
la muestra A la varianza (usando la formula 3.16), desviacion estandar y coeciente de variacion estan
dados por
s
2
A
=
5
2
+ 8
2
+ 11
2
+ 12
2
+ 16
2
5 10.4
2
5 1
= 17.3 con x
A
= 10.4,
s
A
=

17.3 = 4.16 y
cv
A
=
4.16
10.4
100 % = 39.99 %,
mientras que para la muestra B se tiene
s
2
B
=
1015
2
+ 1036
2
+ 1050
2
+ 1051
2
+ 1100
2
5 1050.4
2
5 1
= 980.3 con x
B
= 1050.4,
s
B
=

980.3 = 31.31 y
cv
B
=
31.31
1050.4
100 % = 2.98 %.
28 CAP

ITULO 3. MEDIDAS DE POSICI

ON, VARIBILIDAD Y FORMA


Entonces, a partir de la varianza y la desviacion estandar se observa que en terminos absolutos la
muestra B tiene datos mas variables, mientras que por el coeciente de variacion se observa que en
terminos relativos la muestra A tiene datos mas variables.
Ejemplo 32: Con los datos de la tabla 2.3, y utilizando la formula 3.16, la varianza para la variable
n umero de hijos por familia es
s
2
=
0
2
+ 0
2
+. . . + 6
2
50 2.54
2
50 1
= 2.21 hijos
2
,
y la desviacion estandar y coeciente de variacion son
s =

2.21 = 1.49 hijos y


cv =
1.49
2.54
100 % = 58.56 %.

Ejemplo 33: Con los datos de la tabla 2.6, y utilizando la formula 3.17, la varianza para la variable
saldo en cuentas de ahorros es
s
2
=
1.55
2
5 + 3.85
2
8 +. . . + 15.35
2
2 50 7.254
2
50 1
= 12.36 miles de soles
2
,
y la desviacion estandar y coeciente de variacion son
s =

12.36 = 3.52 miles de soles y


cv =
3.52
7.254
100 % = 48.46 %.

3.5. Medidas de forma


3.5.1. Asimetra
En la gura 3.3 se muestran tres distribuciones de datos, dos asimetricas y una simetrica.
Si una distribucion es simetrica, entonces = Me = Mo. Con informacion de una muestra
se debera tener que x me mo. Si una distribucion es asimetrica positiva entonces
> Me > Mo; si una distribucion es asimetrica negativa entonces < Me < Mo.
Se puede evaluar la simetra o asimetra de una distribucion de frecuencias mediante
medidas de asimetra o gracos. Por ejemplo, el histograma de frecuencias y el polgono de
frecuencias tratados anteriormente permiten evaluar la asimetra de una distribucion; otro
graco importante en este sentido es el graco de cajas que se vera en la seccion siguiente. En
cuanto a medidas de asimetra, una alternativa son los coecientes de asimetra de Pearson
denidos por
x mo
s
, (3.22)
3( x mo)
s
(3.23)
y
3( x me)
s
. (3.24)
3.5. MEDIDAS DE FORMA 29
Distribucin Asimtrica Positiva
o a la Derecha
Distribucin Simtrica
Distribucin Asimtrica Negativa
o a la Izquierda
Figura 3.3: Distribuciones con diferente tipo de asimetra.
Estos coecientes se basan en el principio de que para distribuciones simetricas, la media,
mediana y moda coinciden, pero son solo validos para distribuciones acampanadas unimodales.
MINITAB por su parte calcula el coeciente de asimetra (skewness) usando la formula
_
n(n 1)
n 2
1
n

n
i=1
(x
i
x)
3
_
1
n

n
i=1
(x
i
x)
2
_
3/2
. (3.25)
En general, un coeciente de asimetra igual a cero indica que la distribucion es simetrica.
Conforme mas se aleja el coeciente de asimetra de cero hacia el lado negativo o positivo,
mas asimetrica negativa o positiva sera la distribucion.
Ejemplo 34: En la tabla 3.1 se presentan datos para la variable volumen de venta en miles de soles
registrada en un total de 36 establecimientos. La media, mediana y desviacion estandar de este conjunto
de datos son
x = 7.731, me = 7.4, s = 3.398.
Entonces, el coeciente de asimetra de Pearson denido en (3.24) es
as =
3(7.731 7.4)
3.398
= 0.29.
Este valor indica cierta asimetra positiva en la distribucion de los datos.
3.5.2. Curtosis
La curtosis es una medida del apuntamiento (concentracion en torno al pico maximo) de
una distribucion. Una curtosis alta (distribucion leptoc urtica) indica que la mayor parte de
la varianza es debida a valores muy extremos poco frecuentes mientras que una curtosis baja
(distribucion platic urtica) indica que la mayor parte de la varianza es debida a valores no tan
extremos pero mas frecuentes. En la gura 3.4 se muestran tres distribuciones de datos con
diferente medida de curtosis.
Se puede evaluar la curtosis de un conjunto de datos mediante el coeciente
k =
1
n

n
i=1
(x
i
x)
4
_
1
n

n
i=1
(x
i
x)
2
_
2
. (3.26)
30 CAP

ITULO 3. MEDIDAS DE POSICI

ON, VARIBILIDAD Y FORMA


Distribucin Leptocrtica Distribucin Mesocrtica Distribucin Platicrtica
Figura 3.4: Distribuciones con diferente curtosis.
Si k es mayor que 3 se dice que la distribucion es leptoc urtica, si k es igual a 3 se dice que la
distribucion es mesoc urtica, y si k es menor que 3 se dice que la distribucion es platic urtica.
Ejemplo 35: Con los datos de la tabla 3.1, y utilizando la formula (3.26), se tiene
k =
1
36
10549.73
_
1
36
404.18
_
2
= 2.325.
Este coeciente indica una distribucion platic urtica, esto es, con pocos valores concentrados en torno
a la media.
3.6. Ejercicios
1. Una compa na ha desarrollado un ltro para reducir la contaminacion producida por los
automoviles. Sin embargo, se cree que el ltro podra tener un efecto en otros aspectos
como por ejemplo los niveles de ruido. En la gura 3.5 se presenta un histograma con los
resultados obtenidos para los niveles de ruido en decibeles en 100 pruebas experimentales
llevadas a cabo con 100 automoviles de similares caractersticas.
(a) Calcule la media de los niveles de ruido de los 100 automoviles. (Rpta.: 799.36)
(b) Calcule e interprete la mediana. (Rpta.: 799.33)
(c) Calcule e interprete la moda. (Rpta.: 799.65)
(d) Calcule e interprete la frecuencia relativa en el segundo intervalo.
(e) Calcule e interprete el percentil 35. (Rpta.: 797.13)
(f) Suponga que el nivel de ruido maximo tolerable para la compa na es 805 decibeles.
Aproximadamente que porcentaje de los automoviles superan este valor? (Rpta.:
15 %)
(g) Calcule la varianza, desviacion estandar y coeciente de variacion para los niveles
de ruido. (Rpta.: s
2
= 26.41, s = 5.14, cv = 0.643 %)
(h) Calcule el coeciente de asimetra de Pearson. Comente acerca de la simetra o
asimetra de la distribucion.
(i) Eval ue la curtosis de este conjunto de datos.
3.6. EJERCICIOS 31
Niveles de ruido
Decibeles
F
r
e
c
u
e
n
c
i
a

a
b
s
o
l
u
t
a
0
5
1
0
1
5
2
0
2
5
3
0
1
16
23
30
20
8
2
786 790 794 798 802 806 810 814
Figura 3.5: Histograma para la variable nivel de ruido en una muestra de 100 automoviles de similares
caractersticas.
Tabla 3.3: N umero de habitantes por hogar.
N umero de habitantes (x
i
) 1 2 3 4 5 6 7 8
N umero de hogares (f
i
) 14 49 88 215 148 64 29 9
2. En la tabla 3.3 se presentan datos para la variable n umero de habitantes por hogar para
una peque na comunidad.
(a) Identique en este contexto la poblacion en estudio, la unidad elemental y el tipo
de variable en estudio.
(b) Calcule la media. (Rpta.: 4.2776)
(c) Calcule e interprete la mediana. (Rpta.: 4)
(d) Calcule e interprete la moda. (Rpta.: 4)
(e) Suponga que el municipio recibe por concepto de arbitrios una cantidad base de
100 soles por hogar mas 15 soles por cada habitante. Calcule la media, la mediana,
la desviacion estandar y el coeciente de variacion para el ingreso del municipio
por hogar.
(f) Calcule e interprete el primer cuartil.
3. En el archivo SUELDOS.MTW se presentan los sueldos anuales (en miles de Nuevos
Soles) de los directores ejecutivos de 120 peque nas empresas (columna C1) clasicados
seg un el rubro de la empresa (columna C2).
(a) Calcule e interprete la mediana. (Rpta.: 282.5)
(b) Entre que valores se encuentra el sueldo del 15 % de ejecutivos que mas ganan?
(Rpta.: Entre 536000 y 780000)
32 CAP

ITULO 3. MEDIDAS DE POSICI

ON, VARIBILIDAD Y FORMA


(c) Compare los sueldos de los ejecutivos en los tres rubros. En que rubro se tienen
sueldos en promedio mas altos? En que rubro se tienen sueldos mas variables?
4. En un estudio sobre el gasto mensual familiar en alimentacion con una muestra de
50 familias se encontro un mnimo de 300 soles, un maximo de 1200 soles, una media
aritmetica de 700 soles y una mediana de 720 soles. Luego de publicar los datos se
encontro un error en el registro correspondiente a la familia con mayor gasto, el cual
en lugar de 1200 deba ser 1400. Calcule el valor de la media y la mediana para esta
muestra considerando la correccion.
5. El sueldo de los vendedores de una compa na esta denido de la siguiente manera: Un
basico de 1000 soles mas una comision de 10 soles por artculo vendido, y sobre este
total se aumenta un 10 % por concepto de reparto de utilidades. Si en el mes anterior los
trabajadores vendieron un promedio de 12 artculos por vendedor, cual fue su sueldo
medio? (Rpta.: 1232)
Captulo 4
Analisis Exploratorio de Datos
4.1. Introducci on
El analisis exploratorio de datos involucra una serie de tecnicas estadsticas, gracas y
cuantitativas, utiles para obtener una primera impresion sobre lo que nos pueden decir los
datos, por lo general utilizadas como un paso previo al uso de la inferencia estadstica. En
este captulo se presentan dos herramientas gracas: El graco de cajas y bigotes y el graco
de tallos y hojas.
4.2. Graco de cajas y bigotes (Boxplot o box-and-whisker
plot)
Es un graco construido a partir de los tres cuartiles de los datos. Estos gracos son
bastante utiles para comparar dos o mas conjuntos de datos, ya que permiten determinar lo
siguiente:
Valores extremos.
La tendencia central.
La variabilidad.
La simetra o asimetra de la distribucion.
Para la construccion de estos gracos considere lo siguiente:
La linea central de la caja corresponde a la mediana.
El lmite inferior y superior de cada caja corresponden al primer y tercer cuartil respec-
tivamente.
Para la determinacion de los bigotes calcule primero A = P
25
1.5RIC y B = P
75
+
1.5RIC. El bigote inferior se extiende hasta el dato mas peque no que sea mayor o igual
a A y el bigote superior se extiende hasta el dato mas grande que sea menor o igual a
B.
33
34 CAP

ITULO 4. AN

ALISIS EXPLORATORIO DE DATOS


Tabla 4.1: Nivel de colesterol de 47 pacientes antes y despues del tratamiento.
Antes Despues
146 202 220 242 270 288 142 178 184 198 216 248
160 210 226 244 272 294 156 178 186 200 218 256
182 214 234 244 276 294 160 182 188 200 230 256
186 216 234 248 276 350 162 182 188 204 232 264
186 218 236 248 278 385 164 182 196 204 236 264
190 218 236 258 278 401 166 182 198 206 238 280
200 220 238 266 282 420 168 182 198 212 242 294
200 220 240 270 288 170 182 198 214 242
Antes Despus
1
5
0
2
0
0
2
5
0
3
0
0
3
5
0
4
0
0
N
i
v
e
l

d
e

c
o
l
e
s
t
e
r
o
l
Figura 4.1: Graco de cajas para el nivel de colesterol de 47 pacientes antes y despues del tratamiento.
El graco de cajas puede realizarse en MINITAB en el men u Stat/EDA/Boxplot. . . o en el
men u Graph/Boxplot. . .
Ejemplo 36: Los registros del nivel de colesterol de 47 pacientes que fueron sometidas a un tratamiento
para disminuir el nivel de colesterol en sangre, antes y despues de realizado el tratamiento, se presentan
en la tabla 4.1. En la gura 4.1 se presentan los gracos de cajas para ambas mediciones. Para los
datos antes del tratamiento se tiene
A = P
25
1.5RIC = 216 1.5(276 216) = 126
B = P
75
+ 1.5RIC = 276 + 1.5(276 216) = 366.
Entonces, el bigote inferior se extiende hasta 146, que es el dato mas peque no mayor o igual a 126. El
bigote superior se extiende hasta 350 que es el dato mas grande menor o igual a 366. Hay tres datos
mayores a 366: 385, 401 y 420. Estos tres datos son marcados como valores extremos.
Para los datos despues del tratamiento se tiene
A = P
25
1.5RIC = 182 1.5(232 182) = 107
B = P
75
+ 1.5RIC = 232 + 1.5(232 182) = 30.
4.3. GR

AFICO DE TALLOS Y HOJAS (STEAM AND LEAF) 35


Figura 4.2: Graco de tallos y hojas para el nivel de colesterol de 47 pacientes antes y despues del
tratamiento.
El bigote inferior se extiende hasta 142, que es el dato mas peque no mayor o igual a 107. El bigote
superior se extiende hasta 294 que es el dato mas grande menor o igual a 307. En este caso no se
detectan valores extremos.
A partir de estos gracos se puede concluir que antes del tratamiento haban 3 valores extremos,
correspondientes a tres personas con un nivel de colesterol inusualmente alto (en comparacion con el
resto de los participantes). Comparando ambos gracos queda claro que el nivel de colesterol promedio
ha disminuido debido al tratamiento, y que los resultados despues del tratamiento son algo menos
variables que antes del tratamiento. En cuanto a la asimetra de la distribucion, en ambos casos se
aprecia cierta asimetra positiva.
4.3. Graco de tallos y hojas (Steam and leaf)
Este graco permite presentar un conjunto de datos cuantitativos, de manera similar al
histograma, con el objetivo de ayudar en la visualizacion de la forma de la distribucion de los
datos. A diferencia de los histogramas, el graco de tallos y hojas permite retener los datos
originales con al menos dos cifras signicativas. El graco de tallos y hojas se puede realizar en
MINITAB en el men u Stat/EDA/Steam-and-Leaf. . . o en el men u Graph/Stem-and-Leaf. . .
Ejemplo 37: En la gura 4.2 se presenta el graco de tallos y hojas para las mediciones de colesterol
antes y despues de aplicar el tratamiento. En la primera columna se observan las frecuencias acumuladas
contadas en las dos direcciones, desde el dato menor y desde el dato mayor. Estas frecuencias conuyen
en la categora que contiene a la mediana, para la cual se muestra la frecuencia absoluta entre parentesis.
En la segunda columna se muestran los tallos. En el caso de los datos antes del tratamiento, los tallos
corresponden a las cifras que ocupan el lugar de las centenas, y para los datos despues del tratamiento,
las centenas y decenas. En la tercera columna se muestran las hojas, que en el caso de los datos antes
del tratamiento corresponden a las cifras que ocupan el lugar de las decenas, y para los datos despues
del tratamiento, las cifras que ocupan el lugar de las unidades. La indicacion de la posicion en el dato
original que ocupa la cifra mostrada en las hojas aparece en la parte superior del graco. Para el caso
de los datos antes del tratamiento se lee Leaf Unit = 10 y para los datos despues del tratamiento se
lee Leaf Unit = 1.0. Note que en el caso de los datos antes del tratamiento se pierde la informacion
36 CAP

ITULO 4. AN

ALISIS EXPLORATORIO DE DATOS


correspondiente a las unidades.
4.4. Ejercicios
1. En el archivo SUELDOS.MTW se presentan los sueldos anuales (en miles de Nuevos
Soles) de los directores ejecutivos de 120 peque nas empresas (columna C1) clasicados
seg un el rubro de la empresa (columna C2).
(a) Construya un diagrama de tallos y hojas para los sueldos de los 120 ejecutivos.
(b) Construya un diagrama de cajas que permita comparar los sueldos de los ejecutivos
entre los tres rubros. Comente las diferencias apreciadas en los gracos.
Captulo 5
Probabilidades
5.1. Metodos de enumeracion
5.1.1. Principio de multiplicacion
Suponga que un procedimiento, designado como 1, puede hacerse de n
1
maneras, y que un
segundo procedimiento, designado como 2, puede hacerse de n
2
maneras. Tambien suponga
que cada una de las maneras de efectuar 1 puede ser seguida por cualquiera de las maneras
de efectuar 2. Entonces el procedimiento que consta de 1 seguido de 2 se puede hacer de n
1
n
2
maneras.
Ejemplo 38: Un hombre tiene 2 pares de zapatos, 3 pantalones y 4 camisas. Entonces puede combinar
su ropa para vestirse de 2 3 4 = 24 maneras diferentes.
5.1.2. Principio de adici on
Suponga que un procedimiento, designado como 1, puede hacerse de n
1
maneras, y que
un segundo procedimiento, designado como 2, puede hacerse de n
2
maneras. Suponga ademas
que no es posible que ambos procedimientos, 1 y 2, se hagan simultaneamente. Entonces el
n umero de maneras en que se puede hacer 1 o 2 es n
1
+n
2
.
Ejemplo 39: Un hombre tiene 3 jeans, 4 pantalones de dril y 2 pantalones de lanilla. Entonces puede
escoger un pantalon para vestir de 3 + 4 + 2 = 9 maneras diferentes.
5.1.3. Factorial
El factorial de un n umero n, denotado por n!, se dene de la siguiente manera: n! =
n(n 1)(n 2) . . . (2)(1) con 0! = 1. El factorial de n representa el n umero de maneras
diferentes en las que n elementos pueden ordenarse uno detras de otro.
Ejemplo 40: Cinco alumnos se van a sentar en una la con 5 carpetas. Entonces los alumnos pueden
ser ubicados de 5! = 120 maneras diferentes.
37
38 CAP

ITULO 5. PROBABILIDADES
5.1.4. Combinacion
El n umero de grupos diferentes de r elementos que pueden formarse a partir de un total
de n elementos sin importar el orden de la seleccion es
C
n
r
=
_
n
r
_
=
n!
r!(n r)!
. (5.1)
De esta denicion notese que C
n
r
= C
n
nr
. Ademas, dado que 0! = 1, se tiene que C
n
0
= C
n
n
= 1.
Ejemplo 41: El profesor de una clase de 20 alumnos desea escoger al azar un grupo de 3 alumnos
para realizar una actividad. Entonces el profesor puede formar C
20
3
= 1140 grupos diferentes.
5.1.5. Permutacion
El n umero de maneras diferentes en que r elementos pueden elegirse y ordenarse uno
detras de otro a partir de un total de n elementos es
P
n
r
=
n!
(n r)!
. (5.2)
De esta denicion notese que P
n
n
= n!.
Ejemplo 42: Suponga que se dispone de 8 banderas de distinto color y que se va a seleccionar 3 para
formar una se nal colocandolas en lnea. Entonces se pueden formar P
8
3
= 336 se nales diferentes.
5.1.6. Permutacion con elementos iguales
El n umero maneras diferentes en las que se puede ordenar n elementos, de los cuales
n
1
, n
2
, . . . , n
k
son iguales entre s para efectos del ordenamiento, con n = n
1
+n
2
+. . . +n
k
,
es dado por
P
n
n
1
,n
2
,...,n
k
=
n!
n
1
!n
2
! . . . n
k
!
. (5.3)
Ejemplo 43: Suponga que se dispone de 8 banderas de las cuales 3 son amarillas, 3 rojas y 2 azules.
Colocando estas banderas en lnea se pueden formar P
8
3,3,2
= 560 se nales diferentes.
5.2. Conceptos de probabilidad
5.2.1. Experimento aleatorio ()
Es todo experimento cuyos resultados pueden ser diferentes aun cuando es repetido de la
misma manera cada vez. Por ejemplo:

1
: Lanzar una moneda 2 veces y registrar los resultados.

2
: Lanzar un dado y registrar el resultado.

3
: Observar el tiempo de vida de un componente electrico.
5.2. CONCEPTOS DE PROBABILIDAD 39

4
: Lanzar un dado hasta obtener un 6 y registrar el n umero de lanzamientos requeridos.

5
: Extraer una bola y observar el color desde una caja que contiene 3 bolas blancas y
5 rojas.
5.2.2. Espacio Muestral () y punto muestral ()
El espacio muestral es el conjunto de todos los posibles resultados de un experimento alea-
torio. Los espacios muestrales pueden ser nitos o innitos. Los espacios muestrales innitos
pueden a su vez clasicarse en numerables y no numerables. Por ejemplo, para los experimen-
tos aleatorios denidos con anterioridad, los siguientes seran sus correspondientes espacios
muestrales.

1
= {(c, c), (c, s)(s, c), (s, s)}, que es nito.

2
= {1, 2, 3, 4, 5, 6}, que es nito.

3
= {t R|t > 0}, que es innito no numerable.

4
= {1, 2, 3, 4, . . .}, que es innito numerable.

5
= {blanca, roja}, que es nito.
Un punto muestral es cada uno de los posibles resultados de un experimento aleatorio. Por
ejemplo, para cada uno de los espacios muestrales denidos con anterioridad, los siguientes
son ejemplos de puntos muestrales.

1
= (c, c).

2
= 2.

3
= 125.36 horas.

4
= 9.

5
= blanca.
5.2.3. Evento o suceso
Es cualquier subconjunto del espacio muestral de un experimento aleatorio. Se les repre-
senta con letras may usculas. Por ejemplo, dado el experimento
2
denido con anterioridad,
A = {2}, B = {1, 2}, C = {2, 4, 6} y D = {1, 3, 5} son algunos eventos.
Dado que los eventos son subconjuntos, se pueden utilizar las operaciones de conjuntos con
ellos y los resultados de estas operaciones seran otros eventos. Algunas de estas operaciones
se describen a continuacion:
La union de dos eventos, E
1
y E
2
, es el evento que consiste de todos los puntos muestrales
que pertenecen al menos a uno de los dos eventos, y es denotada por E
1
E
2
. Por ejemplo,
A D = {1, 2, 3, 5}.
40 CAP

ITULO 5. PROBABILIDADES
La interseccion de dos eventos, E
1
y E
2
, es es el evento que consiste de todos los puntos
muestrales que pertenecen a ambos eventos, y es denotada por E
1
E
2
. Por ejemplo,
B C = {2}.
El complemento de un evento, E, en un espacio muestral, es el evento que consiste de
todos los puntos muestrales en el espacio muestral que no pertenecen a dicho evento, y
es denotado por E

,

E o E
c
. Por ejemplo, B

= {3, 4, 5, 6}.
Ademas, es importante tener presente las siguientes reglas:
Ley distributiva: (AB) C = (AC) (B C) y (AB) C = (AC) (B C).
Leyes de Morgan: (A B)

= A

, y (A B)

= A

.
Tambien es usual utilizar diagramas de Venn para representar espacios muestrales y eventos.
Eventos mutuamente excluyentes: Dos eventos E
1
y E
2
denidos sobre un mismo es-
pacio muestral son mutuamente excluyentes si E
1
E
2
= . Por ejemplo, en el experimento

2
, los eventos A = {2} y D = {1, 3, 5} son mutuamente excluyentes.
Eventos complementarios: Dos eventos E
1
y E
2
denidos sobre un mismo espacio mues-
tral son complementarios si son mutuamente excluyentes y ademas E
1
E
2
= . Por ejemplo,
en el experimento
2
, los eventos C = {2, 4, 6} y D = {1, 3, 5} son complementarios.
5.2.4. Denicion clasica o a priori de probabilidad
Si un experimento aleatorio tiene n() posibles resultados, todos ellos igualmente pro-
bables, y si n(E) de estos resultados pertenecen a un evento E, entonces la probabilidad de
ocurrencia del evento E es
P(E) =
n(E)
n()
. (5.4)
Ejemplo 44: Para cubrir 6 puestos de trabajo se han presentado 7 hombres y 4 mujeres. Si la seleccion
es al azar, cual es la probabilidad de que una sola mujer sea elegida en el grupo de 6?
Dena el evento A = {una sola mujer es elegida}. Entonces, aplicando la denicion en (5.4)
P(A) =
n(A)
n()
=
C
7
5
C
4
1
C
11
6
=
84
462
= 0.1818.

Ejemplo 45: Una urna tiene 8 bolas blancas y 5 negras. Si se extraen al azar y con reemplazo 4 bolas,
cual es la probabilidad de que 3 bolas blancas y 1 negra sean extradas?
Dena el evento A = {se extraen 3 bolas blancas y 1 negra}. Entonces, aplicando la denicion en
(5.4)
P(A) =
n(A)
n()
=
P
4
3,1
8
3
5
13
4
=
10240
28561
= 0.3585.

5.2. CONCEPTOS DE PROBABILIDAD 41


Ejemplo 46: Una urna tiene 8 bolas blancas y 5 negras. Si se extraen al azar y sin reemplazo 4 bolas,
cual es la probabilidad de que 3 bolas blancas y 1 negra sean extradas?
Dena el evento A = {se extraen 3 bolas blancas y 1 negra}. Entonces, aplicando la denicion en
(5.4)
P(A) =
n(A)
n()
=
C
8
3
C
5
1
C
13
4
=
280
715
= 0.3916.

5.2.5. Denicion de probabilidad a partir de frecuencias relativas o a pos-


teriori
Si un experimento aleatorio se repite n veces bajo las mismas condiciones y n
E
resultados
estan a favor de un evento E, entonces
h
E
=
n
E
n
(5.5)
es la frecuencia relativa del evento E. La probabilidad del evento E es denida por
P(E) = lm
n
h
E
= lm
n
n
E
n
. (5.6)
En este caso, la frecuencia relativa del evento E proporciona una estimacion de la probabilidad
real del evento E.
Ejemplo 47: Una moneda es lanzada 1000 veces y se obtienen los siguientes resultados: Cara 440 veces
y sello 560 veces. Entonces, la frecuencia relativa del evento A = {cara} es 0.44, pero la probabilidad
real de A, bajo el supuesto de que la moneda es balanceada, es 0.5.
5.2.6. Denicion axiomatica de probabilidad
Sea un experimento aleatorio y su espacio muestral. Una medida de probabilidad P
es una funcion que asigna n umeros reales a los eventos en y que cumple con las siguientes
condiciones (axiomas):
1. Para cualquier evento E en , 0 P(E) 1.
2. P() = 1.
3. Sean E
1
y E
2
dos eventos mutuamente excluyentes en , entonces P(E
1
E
2
) = P(E
1
)+
P(E
2
).
Los axiomas no determinan probabilidades; las probabilidades son asignadas con base en el
conocimiento que se tiene sobre lo que se esta estudiando.
5.2.7. Denicion subjetiva de probabilidad
Es el grado de creencia de un individuo en particular con respecto a la ocurrencia de
un evento. Esta denicion es pieza fundamental de un enfoque diferente en la estadstica,
conocido como la estadstica bayesiana.
42 CAP

ITULO 5. PROBABILIDADES
5.2.8. Teoremas de probabilidad
Teorema 1. La probabilidad del evento vaco es cero: P() = 0.
Teorema 2. Para cualquier evento E, P(E

) = 1 P(E).
Teorema 3. Si E
1
y E
2
son dos eventos tales que E
1
E
2
, entonces P(E
1
) P(E
2
).
Teorema 4. Si E
1
y E
2
son dos eventos de un espacio muestral entonces
P(E
1
E
2
) = P(E
1
) +P(E
2
) P(E1 E
2
). (5.7)
Este teorema puede extenderse a la union de k eventos.
Ejemplo 48: En un grupo de personas el 20 % ha hecho un posgrado, el 60 % tiene hijos y el 10 %
tiene posgrado y tiene hijos. Si se escoge una persona al azar, cual es la probabilidad de que tenga
posgrado o tenga hijos?
Dena los eventos A = {la persona elegida tiene posgrado} y B = {la persona elegida tiene hijos}.
Entonces, P(A) = 0.2, P(B) = 0.6 y P(A B) = 0.1. Al aplicar el resultado (5.7) se tiene que
P(A B) = P(A) +P(B) P(A B) = 0.2 + 0.6 0.1 = 0.7.

5.3. Probabilidad condicional e independencia


5.3.1. Probabilidad Condicional
La probabilidad condicional de que ocurra un evento A dado que ha ocurrido el evento B,
con P(B) > 0, es
P(A|B) =
P(A B)
P(B)
. (5.8)
Ejemplo 49: Sea el experimento aleatorio consistente en lanzar un dado. Cual es la probabilidad de
obtener un 2? Cual es la probabilidad de que se haya obtenido un 2 si se sabe que el resultado fue
par?
Sean los eventos A = {2} y B = {2, 4, 6}. Con un dado regular se tiene que P(A) = 1/6. Si se sabe
que el resultado fue par entonces, por el resultado (5.8) se tiene que
P(A|B) =
P(A B)
P(B)
=
P({2})
P({2, 4, 6})
=
1/6
3/6
=
1
3
.

5.3.2. Axiomas de probabilidad condicional


Dado un evento B con P(B) > 0:
1. 0 P(E|B) 1.
5.3. PROBABILIDAD CONDICIONAL E INDEPENDENCIA 43
2. P(|B) = 1.
3. Sean E
1
y E
2
dos eventos mutuamente excluyentes en , entonces P(E
1
E
2
|B) =
P(E
1
|B) +P(E
2
|B).
5.3.3. Teoremas de probabilidad condicional
Teorema 1. P(|B) = 0.
Teorema 2. Para cualquier evento E, P(E

|B) = 1 P(E|B).
Teorema 3. Si E
1
y E
2
son dos eventos tales que E
1
E
2
, entonces P(E
1
|B) P(E
2
|B).
Teorema 4. Si E
1
y E
2
son dos eventos de un espacio muestral entonces P(E
1
E
2
|B) =
P(E
1
|B) +P(E
2
|B) P(E1 E
2
|B). Este teorema puede extenderse a la union de k eventos.
5.3.4. Regla de la multiplicacion
Si A y B son dos eventos pertenecientes a un espacio muestral , entonces
P(A B) = P(A)P(B|A) = P(B)P(A|B). (5.9)
Este resultado es una consecuencia directa de la denicion de probabilidad condicional dada
en (5.8) y puede generalizarse a la interseccion de k eventos. As, si E
1
, E
2
, . . . E
k
son eventos
pertenecientes a un espacio muestral , entonces
P(E
1
E
2
. . . E
k
) = P(E
1
)P(E
2
|E
1
)P(E
3
|E
1
E
2
) . . . P(E
k
|E
1
E
2
. . . E
k1
). (5.10)
Ejemplo 50: Al preguntar a un grupo de amas de casa que compran carne por el tipo de carne que
compran mensualmente se obtuvo la siguiente informacion: El 50 % compran carne de res, el 30 %
no compran carne de cerdo y el 60 % de las que compran cerdo no compran carne de res. Si se elige
aleatoriamente un ama de casa que compra carne, cual es la probabilidad de que compre carne de
cerdo si se sabe que compra carne de res.
Considere los siguientes eventos: R = {el ama de casa compra carne de res} y C = {el ama de
casa compra carne de cerdo}. Entonces se tiene que P(R) = 0.5, P(C) = 0.7 y P(R|C) = 0.4. Luego,
aplicando los resultados (5.8) y (5.9) se tiene que
P(C|R) =
P(C R)
P(R)
=
P(C)P(R|C)
P(R)
=
0.7 0.4
0.5
= 0.56.

5.3.5. Teorema de probabilidad total


Se dice que un conjunto de eventos E
1
, E
2
, . . . , E
k
son exhaustivos si E
1
E
2
. . .E
k
= .
Un conjunto de eventos mutuamente excluyentes y exhaustivos constituyen una particion del
espacio muestral.
44 CAP

ITULO 5. PROBABILIDADES
Sean E
1
, E
2
, . . . , E
k
cualquier particion de un espacio muestral y sea B un evento
cualquiera de dicho espacio muestral. Entonces, la probabilidad del evento B puede escribirse
como
P(B) =
k

i=1
P(B E
i
) =
k

i=1
P(E
i
)P(B|E
i
). (5.11)
5.3.6. Teorema de Bayes
Sean E
1
, E
2
, . . . , E
k
cualquier particion de un espacio muestral y sea B un evento
cualquiera no nulo de dicho espacio muestral. Entonces se tiene que
P(E
j
|B) =
P(E
j
)P(B|E
j
)

k
i=1
P(E
i
)P(B|E
i
)
. (5.12)
Notese que esta formula puede deducirse a partir de la denicion de probabilidad condicional
dada en (5.8), la regla de la multiplicacion dada en (5.9) y el teorema de la probabilidad total
dado en (5.11).
Ejemplo 51: Una fabrica tiene 3 maquinas (M1, M2 y M3) que producen respectivamente el 50 %,
30 % y 20 % del total de artculos. Se sabe que el 5 % de los artculos producidos por M1, el 10 % de
los producidos por M2 y el 20 % de los producidos por M3 son defectuosos. Si se selecciona un artculo
al azar de la produccion de un da, la probabilidad de que sea defectuoso (evento D) es, aplicando el
teorema de probabilidad total dado en (5.11),
P(D) = P(M
1
)P(D|M
1
) +P(M
2
)P(D|M
2
) +P(M
3
)P(D|M
3
)
= 0.5 0.05 + 0.3 0.1 + 0.2 0.2 = 0.095.
Si se selecciona un artculo al azar y se observa que es defectuoso, la probabilidad de que haya sido
producido por la maquina M1 es, por el teorema de Bayes dado en (5.12),
P(M
1
|D) =
P(M
1
)P(D|M
1
)
P(D)
=
0.5 0.05
0.095
= 0.2632.
De manera similar se puede calcular P(M
2
|D) y P(M
3
|D).
5.3.7. Independencia de eventos
Los eventos A y B son independientes si la ocurrencia de uno de ellos no afecta la pro-
babilidad de ocurrencia del otro. A y B son independientes si se cumple cualquiera de las
siguientes condiciones:
1. P(A|B) = P(A).
2. P(B|A) = P(B).
3. P(A B) = P(A)P(B).
En general, si E
1
, E
2
, . . . , E
k
son eventos independientes, entonces
P(E
1
E
2
. . . E
k
) = P(E
1
)P(E
2
) . . . P(E
k
).
Ademas, si dos eventos A y B son independientes, entonces
5.4. EJERCICIOS 45
A

y B

son independientes.
A y B

son independientes.
A

y B son independientes.
Ejemplo 52: Juan, Luis y Manuel son tres amigos que suelen llegar tarde a clase. El profesor ha
determinado que Juan llega tarde al 30 % de las clases (evento J), Luis al 50 % (evento L) y Manuel
al 60 % (evento M). Para un da cualquiera, la probabilidad de que solo uno de los tres llegue tarde es
P(solo uno llegue tarde) = P((J L

) (J

L M

) (J

M)).
Dado que los tres eventos en la union son mutuamente excluyentes se tiene que
P(solo uno llegue tarde) = P(J L

) +P(J

L M

) +P(J

M).
Finalmente, asumiendo independencia entre J, L y M
P(solo uno llegue tarde) = P(J)P(L

)P(M

) +P(J

)P(L)P(M

) +P(J

)P(L

)P(M)
= 0.3 0.5 0.4 + 0.7 0.5 0.4 + 0.7 0.5 0.6
= 0.41.

5.4. Ejercicios
1. De cuantas maneras diferentes se pueden colocar las guras blancas (2 caballos, 2
torres, 2 alles, el rey y la reina) en la primera la del tablero de ajedrez? (Rpta.: 5040)
2. De A a B hay 6 caminos y de B a C hay 4 caminos. De cuantas maneras se puede ir
de A a C pasando por B? (Rpta.: 24)
3. De cuantas maneras se pueden acomodar las letras a, b, c, d, e, f, de modo que c y d
esten siempre juntas? (Rpta.: 240) De cuantas maneras de modo que c y d nunca esten
juntas? (Rpta.: 480)
4. Cinco polticos se encuentran en una sesion. Cuantos saludos de mano intercambian si
cada poltico estrecha la mano de todos los demas solo una vez? (Rpta.: 10)
5. De cuantas maneras se pueden colocar a 12 personas en tres habitaciones si la primera
puede contener a 2, la segunda a 6 y la tercera a 4? (Rpta.: 13860)
6. Una persona tiene 6 amigos y desea invitar a su casa a 3 de ellos cada da de modo que
el grupo no se repita ni una sola vez. Durante cuantos das podra invitar a sus amigos?
(Rpta.: 20)
7. De un grupo formado por 7 hombres y 4 mujeres hay que escoger 6 personas de manera
que entre ellos haya al menos 2 mujeres. De cuantas maneras puede efectuarse la
seleccion? (Rpta.: 371)
8. Se tienen 10 cartas numeradas del 0 al 9. Cuantos n umeros distintos pueden formarse
si se extraen 5 cartas con reemplazo? (Rpta.: 100000) Y sin reemplazo? (Rpta.: 30240)
46 CAP

ITULO 5. PROBABILIDADES
9. Un inspector visita 6 maquinas diferentes durante el da. A n de evitar que los opera-
dores sepan cuando los inspeccionara, vara el orden de sus visitas. De cuantas maneras
puede hacerlo? (Rpta.: 720)
10. En una ciudad hay 3 gasteros (A, B y C). Un da 5 residentes llaman a un gastero
seleccionado al azar.
(a) De cuantas maneras pueden elegir a todos los gasteros? (Rpta.: 150)
(b) De cuantas maneras pueden elegir solo a 2 gasteros? (Rpta.: 90)
(c) De cuantas maneras pueden elegir solo a los gasteros A y B? (Rpta.: 30)
11. Extienda el resultado (5.7) al caso de 3 eventos.
12. En un salon de clases con 10 estudiantes, cual es la probabilidad de que al menos dos
estudiantes cumplan a nos el mismo da? Asuma a nos de 365 das y que todos los das
son igualmente probables para el nacimiento de una persona. (Rpta.: 0.1169)
13. Si se colocan en un estante en orden aleatorio 4 vol umenes de una cierta obra, cual es
la probabilidad de que el orden sea perfecto (Ascendente o descendente)? (Rpta.: 1/12)
14. Un cuestionario consta de 20 preguntas. Si se escogen al azar tres preguntas, cual es la
probabilidad de que a un alumno que se ha preparado en 6 preguntas le toque al menos
una de las que sabe? (Rpta.: 0.6807)
15. Un lote consta de 10 artculos buenos, 4 con peque nos defectos y 2 con defectos graves.
Si se escogen 2 artculos al azar, calcular la probabilidad de que:
(a) Ambos sean buenos. (Rpta.: 0.375)
(b) Por lo menos uno sea bueno. (Rpta.: 0.875)
(c) A lo mas uno sea bueno. (Rpta.: 0.625)
(d) Ninguno tenga defectos graves. (Rpta.: 0.7583)
16. La gerente de una tienda de ropa para dama desea determinar la relacion entre el tipo
de cliente y la forma de pago. Para ello ha recopilado la siguiente informacion sobre una
muestra de 200 clientes:
Forma de pago
Tipo de cliente Credito Contado Total
Habitual 70 50 120
No habitual 40 40 80
Total 110 90 200
Si se selecciona un cliente al azar:
(a) Cual es la probabilidad de que no sea habitual o pague a credito? (Rpta.: 0.75)
(b) Cual es la probabilidad de que sea habitual y pague a credito? (Rpta.: 0.35)
(c) Si se sabe que es habitual, cual es la probabilidad de que pague a credito? (Rpta.:
0.5833)
5.4. EJERCICIOS 47
(d) Si se seleccionan 3 clientes sin reemplazo, cual es la probabilidad de que al menos
uno pague al contado? (Rpta.: 0.8357)
(e) Si se seleccionan 3 clientes con reemplazo, cual es la probabilidad de que 2 sean
habituales? (Rpta.: 0.432)
17. Suponga que A, B y C son eventos tales que P(A) = P(B) = P(C) = 1/4, P(AB) =
P(B C) = 0 y P(A C) = 1/8. Calcular la probabilidad de que al menos uno de los
sucesos ocurra. (Rpta.: 5/8)
18. Suponga que A y B son eventos tales que P(A B) = 0.7 y P(A B

) = 0.9. Calcular
P(A). (Rpta.: 0.6)
19. La probabilidad de que el sabado un alumno vaya al cine es 0.25, de que haga deporte
0.2 y de que haga ambas cosas 0.08.
(a) Cual es la probabilidad de que vaya al cine o haga deporte? (Rpta.: 0.37)
(b) Cual es la probabilidad de que haga deporte pero no vaya al cine? (Rpta.: 0.12)
(c) Cual es la probabilidad de que haga deporte o no vaya al cine? (Rpta.: 0.83)
20. El encargado de control de calidad de una fabrica ha seleccionado 200 artculos produ-
cidos durante un da y encontr o que 10 artculos tienen fallas de tipo A, 10 tienen fallas
de tipo B, 12 de tipo C, 2 tienen A y B pero no C, 3 tienen fallas de tipo A y C pero
no B, 5 tienen de tipo B y C pero no A y un artculo tiene las tres fallas. Calcule la
probabilidad de que un artculo seleccionado al azar:
(a) No tenga fallas de tipo A. (Rpta.: 190/200)
(b) Tenga fallas de tipo A o B. (Rpta.: 17/200)
(c) Tenga A pero no C. (Rpta.: 6/200)
(d) Tenga B o no tenga C. (Rpta.: 194/200)
(e) No tenga A o no tenga B. (Rpta.: 197/200)
(f) No tenga ni A ni B. (Rpta.: 183/200)
(g) Tenga solo 2 fallas. (Rpta.: 10/200)
21. Muestre si las siguientes proposiciones son ciertas o falsas:
(a) Si P(A) +P(B) = 1 entonces A B = .
(b) Si P(A) = P(B) = p entonces P(A B) < p
2
.
(c) Si P(A) = P(B

) entonces A

= B.
(d) Si P(A) = 0 entonces A

= .
(e) Si P(A) = 0 y P(B) = 1, entonces P(A B) = 0.
22. Si se lanza una moneda regular 10 veces, cual es la probabilidad de obtener exactamente
3 caras? (Rpta.: 0.1172)
23. En una clase hay 15 chicos y 30 chicas. Se seleccionan al azar 10 estudiantes para
una tarea especial. Que probabilidad hay de seleccionar exactamente 3 chicos? (Rpta.:
0.2904)
48 CAP

ITULO 5. PROBABILIDADES
24. Las caras numeradas 1, 2 y 3 de un dado son de color rojo, las caras 4 y 5 son de color
blanco y la cara 6 es azul.
(a) Al lanzar este dado, cu al es la probabilidad que aparezca una cara roja o un
n umero mayor que 4? (Rpta.: 5/6)
(b) Si aparecio un n umero impar, cual es la probabilidad de que la cara sea roja?
(Rpta.: 2/3)
25. Si se sabe que al lanzar 5 monedas aparecieron al menos 2 caras, cual es la probabilidad
de que hayan aparecido exactamente 3? (Rpta.: 0.3846)
26. Un conjunto electronico consta de dos subsistemas, digamos A y B. A partir de una serie
de pruebas previas se determin o que la probabilidad de que falle A es 0.2, la probabilidad
de que falle B pero no A es 0.15, y la probabilidad de que fallen los dos es 0.15. Calcular
las siguientes probabilidades:
(a) P(Falle A|Fallo B) (Rpta.: 0.5)
(b) P(Solo falle A) (Rpta.: 0.05)
27. En una ciudad se publican los periodicos A, B y C. Una encuesta reciente indica que
la poblacion adulta tiene las siguientes preferencias: 20 % lee A, 16 % lee B, 14 % lee C,
8 % lee A y B, 5 % lee A y C, 4 % lee B y C, y 2 % lee los tres. Para un adulto escogido
al azar, calcular la probabilidad de que:
(a) No lea ninguno de los periodicos. (Rpta.: 0.65)
(b) Lea exactamente uno de los periodicos. (Rpta.: 0.22)
(c) Lea al menos A y B si se sabe que lee al menos uno de los periodicos publicados.
(Rpta.: 8/35)
28. Una empresa de seguros clasica a sus 10000 asegurados de acuerdo con el genero
(hombre o mujer), la edad (joven o adulto), y el estado civil (casado o soltero). De estos
asegurados se sabe que 3000 son personas jovenes, 4600 son hombres, 7000 son personas
casadas, 1320 son hombres jovenes, 3010 son hombres casados, 1400 son personas jovenes
casadas y 600 son hombres jovenes casados. Si se elige un asegurado al azar, hallar la
probabilidad de que:
(a) Sea una mujer joven soltera.
(b) Sea soltero sabiendo que es hombre. (Rpta.: 0.3456)
(c) Sea un hombre casado sabiendo que es adulto. (Rpta.: 0.3443)
29. Suponga que el 20 % de cierta poblacion es hipertensa y que se cuenta con una maquina
automatica para medir la presion arterial que identica como hipertensos al 84 % de los
hipertensos y al 23 % de los no hipertensos. Una persona es seleccionada aleatoriamente
desde esta poblacion.
(a) Cual es la probabilidad de que la maquina la identique como hipertensa? (Rpta.:
0.352)
(b) Si la maquina la identica como hipertensa, cual es la probabilidad de que real-
mente lo sea? (Rpta.: 0.4773)
5.4. EJERCICIOS 49
30. Inocencio llega a su trabajo despues de las 8 a.m. con una probabilidad de 0.2. Si llega
despues de las 8 a.m. hay una probabilidad de 0.6 de que olvide marcar su tarjeta en
tanto que esta es solo de 0.05 si llega antes de las 8 a.m. Hallar la probabilidad de que
en un da cualquiera:
(a) Inocencio marque su tarjeta. (Rpta.: 0.84)
(b) Si en un da Inocencio olvido marcar su tarjeta, cual es la probabilidad de que
haya llegado despues de las 8 a.m.? (Rpta.: 0.75)
31. Una compa na de seguros sabe que el 70 % de los incendios son iniciados por causas
fortuitas y el 30 % restante por alg un tipo de negligencia. Cuando la causa es fortuita,
la compa na de seguros asume los costos de las perdidas en un 95 % de las veces, mientras
que cuando el incendio se produce por una negligencia, la compa na asume los costos
de las perdidas en solo un 10 % de las veces.
(a) Si un asegurado sufre un incendio, cual es la probabilidad de que la compa na de
seguros le cubra los costos de las perdidas? (Rpta.: 0.695)
(b) Si la compa na asume los costos de las perdidas en un incendio, cual es la proba-
bilidad de que el incendio haya sido iniciado por una negligencia? (Rpta.: 0.04317)
(c) Suponga que en el ultimo a no la compa na atendio 6 incendios. Cual es la proba-
bilidad de que 2 hayan sido ocasionados por una negligencia? (Rpta.: 0.3241)
32. Un banco ha comprobado que la probabilidad de que un cliente con fondos extienda un
cheque con fecha equivocada es de 0.05; en cambio, esta probabilidad es de 0.8 para los
clientes sin fondos. El 90 % de los clientes del banco tienen fondos. Si se recibe en caja
un cheque con fecha equivocada, cual es la probabilidad de que sea de un cliente sin
fondos?
33. Suponga que tres candidatos A, B y C compiten por el control del consejo de adminis-
tracion de una empresa. Las probabilidades de que estos candidatos ganen son 0.2, 0.3
y 0.5 respectivamente. Si la probabilidad de fabricar un nuevo producto X es 0.7 si gana
A, 0.6 si gana B y 0.1 si gana C, hallar la probabilidad de que el candidato C haya sido
elegido si el producto X fue fabricado despues de las elecciones. (Rpta.: 0.1351)
34. Suponga que una empresa dedicada a realizar revisiones tecnicas tiene dos talleres A
y B. Se sabe que el 60 % de los conductores eligen el taller A y el 40 % restante el
taller B. Para un vehculo que pasa por el taller A, la probabilidad de que apruebe el
examen es 0.9 mientras que para un vehculo que pasa por el taller B la probabilidad
correspondiente es 0.85.
(a) Si se sabe que un vehculo desaprobo la revision tecnica, cual es la probabilidad
de que haya escogido el taller B? (Rpta.: 0.5)
(b) Si 3 amigos escogen el taller A, cual es la probabilidad de que solo uno desapruebe?
Considere los resultados de las tres revisiones como independientes. (Rpta.: 0.243)
35. Miguel tiene actualmente una caja que contiene 6 pares de aretes de oro de 14 kilates
en tres diferentes tama nos: dos de 3mm, dos de 4mm y dos de 5mm. Cada vez que
Miguel necesita un regalo poco costoso para alguna amiga selecciona aleatoriamente un
50 CAP

ITULO 5. PROBABILIDADES
par de aretes desde la caja. Si el par seleccionado es de 3mm, no lo reemplaza; si el
par seleccionado es de 4mm, el lo reemplaza luego por uno identico; nalmente si el
par seleccionado es de 5mm, entonces lo reemplaza por dos pares de 5mm. Cual es la
probabilidad de que el segundo par seleccionado sea uno de 4mm? (Rpta.: 0.3397)
36. Tres aventureros deben elegir a uno de ellos para una mision arriesgada. Para ello toman
una urna con dos bolas blancas y una negra y extraen cada uno sucesivamente una bola
sin reemplazo. El elegido sera el que escoja la bola negra. Demuestre que todos tienen
la misma probabilidad de ser seleccionados para la mision, sea cual sea el orden en que
efect uen las extracciones.
37. Existen dos vas que conducen de la ciudad A a la ciudad B y dos vas que conducen
de la ciudad B a la ciudad C. En epoca de lluvias, cada una de las 4 vas tiene una
probabilidad de 0.6 de ser interrumpida por la cada de huaycos, independiente las unas
de las otras. Con que probabilidad se podra pasar de la ciudad A a la ciudad C en un
momento dado en epoca de lluvias? (Rpta.: 0.4096)
38. Cada vez que se hace un experimento la ocurrencia de un evento particular A es igual
a 0.2. El experimento se repite, independientemente, hasta que A ocurre.
(a) Calcule la probabilidad de que A ocurra en el cuarto experimento. (Rpta.: 0.1024)
(b) Si se van a realizar n experimentos, calcule el valor de n de modo que la probabilidad
de que ninguno de ellos resulte en A sea 0.32768. (Rpta.: 5)
39. Las probabilidades de que tres tiradores A, B y C den en el blanco son, respectivamente,
1/3, 1/4 y 1/5. Si cada uno de ellos hace un disparo, calcular la probabilidad de que:
(a) Solamente dos den en el blanco. (Rpta.: 3/20)
(b) Ninguno de en el blanco. (Rpta.: 2/5)
40. Un ingeniero tiene tres proyectos en ejecucion, cada uno de los cuales puede resultar en
un exito o un fracaso. Las probabilidades de exito para estos proyectos son 0.8, 0.7 y 0.6.
El ingeniero conservara su trabajo si al menos dos de sus proyectos resultan exitosos.
Asumiendo independencia entre los tres proyectos, cual es la probabilidad de que el
ingeniero se quede sin trabajo? (Rpta.: 0.212)
41. El 60 % de los clientes de una entidad nanciera son hombres, el 70 % tienen casa propia,
y el 30 % son mujeres que tienen casa propia.
(a) Si se elige un cliente al azar, cual es la probabilidad de que sea hombre y no tenga
casa propia?. (Rpta.: 0.2)
(b) Si se eligen al azar 3 clientes, cual es la probabilidad de que solo uno de ellos
no tenga casa propia?. Asuma independencia entre la condicion de los 3 clientes.
(Rpta.: 0.441)
Captulo 6
Variables Aleatorias
6.1. Denicion
Una variable aleatoria es una funcion X() que tiene como dominio al espacio muestral y
como rango a un subconjunto de los n umeros reales R
X
. Considere por ejemplo el experimento
aleatorio trivial consistente en lanzar dos monedas y la variable aleatoria X que representa el
n umero de caras que aparecen. En este caso el espacio muestral consiste de los cuatro posibles
resultados, esto es, = {
1
= SS,
2
= SC,
3
= CS,
4
= CC} y la variable aleatoria X
es la funcion denida de la siguiente manera: X(
1
) = 0, X(
2
) = X(
3
) = 1 y X(
4
) = 2.
6.2. Variable aleatoria discreta
Una variable aleatoria X es discreta si el n umero de valores posibles de la variable es nito
o innito numerable.
6.2.1. Funcion de masa de probabilidad de una variable aleatoria discreta
(fmp)
Sea X una variable aleatoria discreta con rango R
X
. Una funcion f(x) es llamada la
funcion de masa de probabilidad de X si tiene como dominio a R
X
y como rango a un
conjunto de n umeros reales f(x) = P(X = x) que cumplen con las siguientes condiciones:
1. 0 f(x) 1.
2.

x
i
R
X
f(x
i
) = 1.
Ejemplo 53: En un examen hay 3 preguntas del tipo verdadero o falso. Un alumno, que no tiene
ning un conocimiento sobre el tema, va ha responder aleatoriamente. Sea la variable aleatoria discreta
X el n umero de respuestas correctas. En este caso, para cada pregunta, la probabilidad de que el
alumno marque la respuesta correcta es 0.5. En la gura 6.1 se presentan el espacio muestral de este
experimento aleatorio, el rango de la variable aleatoria y la fmp. En la gura 6.3 (lado izquierdo) se
presenta el graco de la fmp.
51
52 CAP

ITULO 6. VARIABLES ALEATORIAS


Espacio Muestral Rango de X f(x) = P(X = x)
III
CII
ICI
IIC
CCI
CIC
ICC
CCC
0
1
2
3
1/8
3/8
3/8
1/8
-
-
-
-
-
-
-
-
_
_
Figura 6.1: Espacio muestral asociado, rango y fmp para la variable aleatoria n umero de respuestas
correctas.
Espacio Muestral Rango de Y f(y) = P(Y = y)
BBB
BBN
BNN
NNN
0
1
2
3
5/30
15/30
9/30
1/30
-
-
-
-
-
-
-
-
Figura 6.2: Espacio muestral asociado, rango y fmp para la variable aleatoria n umero de ovejas
negras.
Ejemplo 54: En un corral hay 6 ovejas blancas y 4 negras. Se extraen al azar y sin reemplazo 3
ovejas. Sea la variable aleatoria discreta Y el n umero de ovejas negras en la muestra. Cual sera la
probabilidad de obtener menos de 2 ovejas negras en la muestra? La probabilidad de obtener a lo
mas 2? En la gura 6.2 se presentan el espacio muestral de este experimento aleatorio, el rango de la
variable aleatoria y la fmp. A partir de la fmp se tiene que P(Y < 2) = P(Y = 0) +P(Y = 1) = 2/3
y P(Y 2) = P(Y = 0) +P(Y = 1) +P(Y = 2) = 29/30. En la gura 6.3 (lado derecho) se presenta
el graco de esta fmp.
6.2.2. Funcion de distribucion acumulada de una variable aleatoria discreta
(fda)
La funcion de distribucion acumulada de una variable aleatoria discreta X, denotada por
F(x), es denida por
F(x) = P(X x) =

x
i
x
f(x
i
). (6.1)
A continuacion se presenta la fda correspondiente a los dos ejemplos anteriores.
F(x) =
_

_
0 x < 0
1/8 0 x < 1
4/8 1 x < 2
7/8 2 x < 3
1 x 3
F(y) =
_

_
0 y < 0
5/30 0 y < 1
20/30 1 y < 2
29/30 2 y < 3
1 y 3
.
6.3. VARIABLE ALEATORIA CONTINUA 53
0 1 2 3
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
X
f
(
x
)
0 1 2 3
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Y
f
(
y
)
Figura 6.3: Graco de la fmp para las variables aleatorias n umero de respuestas correctas (X) y
n umero de ovejas negras (Y).
6.3. Variable aleatoria continua
Una variable aleatoria X es continua si el n umero de valores posibles de la variable es
innito no numerable.
Ejemplo 55: Una fabrica produce varillas de acero con una longitud de entre 2 y 4 pulgadas. Se
selecciona una varilla al azar de la lnea de produccion y se dene la variable aleatoria continua X
como la longitud de la varilla seleccionada. En este caso, D
X
= = {
i
:
i
lnea de produccion} y
R
X
= {X : 2 < X < 4}.
6.3.1. Funcion de densidad de probabilidad de una variable aleatoria con-
tinua (fdp)
Sea X una variable aleatoria continua con rango R
X
. Una funcion f(x) es llamada la
funcion de densidad de probabilidad de X si tiene como dominio a R
X
y como rango a un
conjunto de n umeros reales f(x) que cumplen con las siguientes condiciones:
1. 0 f(x).
2.
_
R
X
f(x)dx = 1.
Ejemplo 56: Suponga que la longitud de ciertas varillas de acero es una variable aleatoria continua
X con fdp
f(x) =
3
56
x
2
I
(2,4)
(x).
Constituye f(x) una fdp?
54 CAP

ITULO 6. VARIABLES ALEATORIAS


2.0 2.5 3.0 3.5 4.0
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
0
.
7
0
.
8
X
f
(
x
)
Figura 6.4: Graco de la fdp para la variable aleatoria longitud de una varilla.
Se verica de inmediato que f(x) 0 para todo X. Ademas se tiene que
_
4
2
3
56
x
2
dx =
x
3
56

4
2
=
64
56

8
56
= 1.
Por lo tanto, f(x) s es una fdp. En la gura 6.4 se presenta el graco de la fdp de esta variable.
En el ejemplo anterior aparece una expresion de la forma I
(a,b)
(x), que sera utilizada con
frecuencia de aqu en adelante. I
(a,b)
(x) es la funcion indicadora, y se dene como la funcion
que toma el valor 1 cuando la variable X esta en el intervalo (a, b) y 0 en caso contrario.
6.3.2. Probabilidad de un evento
La probabilidad de que una variable aleatoria continua X tome valores en el intervalo
[a, b] esta dada por
P(X [a, b]) =
_
b
a
f(x)dx. (6.2)
Ejemplo 57: La probabilidad de que una varilla seleccionada al azar mida mas de 3 y menos de 3.5
pulgadas es
P(3 < X < 3.5) =
_
3.5
3
3
56
x
2
dx =
x
3
56

3.5
3
= 0.2835.
Esta probabilidad es representada por el area sombreada en la gura 6.5.
Ejemplo 58: La probabilidad de que una varilla mida mas de 3 y menos de 3.5 pulgadas si se sabe
que mide mas de 2.5 pulgadas es
P(3 < X < 3.5|X > 2.5) =
P(3 < X < 3.5)
P(X > 2.5)
=
_
3.5
3
3
56
x
2
dx
_
4
2.5
3
56
x
2
dx
=
0.2835
0.7210
= 0.3932.

6.3. VARIABLE ALEATORIA CONTINUA 55


2.0 2.5 3.0 3.5 4.0
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
0
.
7
0
.
8
X
f
(
x
)
Figura 6.5: Graco de la fdp para la variable aleatoria longitud de una varilla. El area sombreada
representa P(3<X<3.5).
6.3.3. Funcion de distribuci on acumulada de una variable aleatoria conti-
nua (fda)
La funcion de distribucion acumulada de una variable aleatoria continua X, denotada por
F(x), es denida por
F(x) = P(X x) =
_
x

f(x)dx. (6.3)
Esta funcion cumple con las siguientes propiedades (tanto para el caso de variables aleatorias
continuas como discretas):
1. lm
x
F(x) = 0.
2. lm
x
F(x) = 1.
3. Si x y, entonces F(x) F(y).
Ejemplo 59: Para el ejemplo tratado en esta seccion se tiene que
P(X x) =
_
x

3
56
x
2
dx =
_
x
2
3
56
x
2
dx =
x
3
56

x
2
=
x
3
8
56
.
Entonces, la fda se dene por
F(x) =
_

_
0 x < 2
x
3
8
56
2 x < 4
1 x 4
.

56 CAP

ITULO 6. VARIABLES ALEATORIAS


6.4. Valor esperado y varianza
6.4.1. Valor esperado o esperanza matematica de una funcion de una va-
riable aleatoria
Sea X una variable aleatoria con funcion de probabilidad f(x) y sea g(x) una funcion
cualquiera de X. Entonces, el valor esperado o esperanza matematica de g(x) se dene como:
E(g(x)) =

R
X
g(x)f(x) si X es una variable aleatoria discreta (6.4)
E(g(x)) =
_
R
X
g(x)f(x)dx si X es una variable aleatoria continua (6.5)
6.4.2. Media, valor esperado o esperanza matematica de una variable alea-
toria
Sea X una variable aleatoria con funcion de probabilidad f(x). Entonces la media, valor
esperado o esperanza matematica de X se dene como:
= E(X) =

R
X
xf(x) si X es una variable aleatoria discreta (6.6)
= E(X) =
_
R
X
xf(x)dx si X es una variable aleatoria continua (6.7)
Note que los resultados (6.6) y (6.7) se desprenden de los resultados (6.4) y (6.5) respectiva-
mente haciendo g(x) = x.
Ejemplo 60: Considere la variable aleatoria discreta X, n umero de respuestas correctas, denida en
el ejemplo 53. En la gura 6.1 se presenta la fmp de esta variable. Utilizando la formula (6.6) con esta
variable se tiene que
= E(X) = 0
1
8
+ 1
3
8
+ 2
3
8
+ 3
1
8
= 1.5 respuestas correctas.

Ejemplo 61: Considere la variable aleatoria continua X, longitud de una varilla, denida en el ejemplo
56. Utilizando la formula (6.7) con esta variable se tiene que
= E(X) =
_
4
2
x
3
56
x
2
dx =
_
4
2
3
56
x
3
dx =
3
224
x
4

4
2
= 3.214 pulgadas.

6.4.3. Varianza de una variable aleatoria


Sea X una variable aleatoria con funcion de probabilidad f(x). Entonces la varianza de
X se dene como

2
= V (X) = E[(X )
2
]. (6.8)
6.4. VALOR ESPERADO Y VARIANZA 57
Si la variable aleatoria es discreta, a partir del resultado (6.4) se tiene que

2
= V (X) =

R
X
(x )
2
f(x). (6.9)
Si la variable aleatoria es continua, a partir del resultado (6.5) se tiene que

2
= V (X) =
_
R
X
(x )
2
f(x)dx. (6.10)
Un poco de algebra a partir de los resultados (6.9) o (6.10) permite demostrar que, tanto para
variables aleatorias discretas como continuas, la varianza puede escribirse tambien como
V (X) = E[(X )
2
] = E[X
2
]
2
. (6.11)
Ejemplo 62: Considere la variable aleatoria discreta X, n umero de respuestas correctas, denida en
el ejemplo 53. En la gura 6.1 se presenta la fmp de esta variable. Utilizando la formula (6.4) sobre
X
2
se tiene que
E(X
2
) = 0
2

1
8
+ 1
2

3
8
+ 2
2

3
8
+ 3
2

1
8
= 3
y entonces, aplicando el resultado (6.11), la varianza de X resulta
V (X) = E[X
2
]
2
= 3 1.5
2
= 0.75 respuestas correctas
2
.

Ejemplo 63: Considere la variable aleatoria continua X, longitud de una varilla, denida en el ejemplo
56. Utilizando la formula (6.5) sobre X
2
se tiene que
E(X
2
) =
_
4
2
x
2
3
56
x
2
dx =
_
4
2
3
56
x
4
dx =
3
280
x
5

4
2
= 10.6286
y entonces, aplicando el resultado (6.11), la varianza de X resulta
V (X) = E[X
2
]
2
= 10.6286 3.214
2
= 0.2969 pulgadas
2
.

6.4.4. Propiedades del valor esperado y de la varianza


Sean X y Y dos variables aleatorias con funciones de probabilidad f(x) y f(y) respecti-
vamente y sean a y b dos constates. Entonces:
1. E(a) = a.
2. E(aX) = aE(X).
3. E(a +bX) = a +bE(X).
4. E(aX +bY ) = aE(X) +bE(Y ).
5. V (a) = 0.
6. V (aX) = a
2
V (X).
7. V (a +bX) = b
2
V (X).
8. Si X y Y son independientes, entonces V (aX +bY ) = a
2
V (X) +b
2
V (Y ).
58 CAP

ITULO 6. VARIABLES ALEATORIAS


6.5. Ejercicios
1. Un individuo puede participar en un negocio hasta cuatro veces y de manera indepen-
diente cada vez gana o pierde 1000 soles. La probabilidad de ganar en cada intervencion
es igual a la de perder. La persona comienza con 2000 soles y dejara de participar en
el negocio si pierde todo su dinero o si obtiene una utilidad de 3000 soles (es decir si
termina con 5000 soles).
(a) Presente el espacio muestral asociado a este experimento.
(b) Halle la fmp y la fda de la variable aleatoria utilidad.
2. Dos jugadores, A y B, juegan en un torneo. El primero que gane dos partidos seguidos
o un total de 3 gana el torneo (no hay empates). Suponga que ambos jugadores son
igualmente habiles por lo que para un partido dado sus probabilidades de ganar son
iguales.
(a) Calcular la fmp del n umero de partidos en el torneo.
(b) Encuentre el n umero esperado de partidos en el torneo. (Rpta.: 2.875)
(c) Encuentre la moda del n umero de partidos en el torneo. (Rpta.: 2)
(d) Si un jugador recibe $200 por partido, cual es la desviacion estandar de su ingreso
en el torneo? (Rpta.: 210.65)
3. En la reunion de n de a no de cierta compa na, a la que asistieron 3 gerentes, 8 tecnicos
y 5 secretarias, se sorteo 2 regalos entre los asistentes. Sea la variable aleatoria X el
n umero de secretarias que obtuvieron un regalo. Construya la funcion de distribucion
acumulada de X.
4. Un restaurante tiene 3 repartidores a domicilio, Abel, Benito y Cesar, y maneja la
poltica de en menos de 30 minutos o gratis. Se sabe que Abel llega tarde el 10 % de
las veces, Benito el 5 % y Cesar el 8 %. Suponga que en un da dado cada uno de los tres
repartidores atiende un pedido. Cuantos pedidos se espera que lleguen tarde? (Rpta.:
0.23)
5. Suponga que el n umero de accidentes por semana que ocurren en una empresa es una
variable aleatoria X con fmp dada por:
X 0 1 2 3
f(x) 0.28 0.35 0.22 0.15
(a) Hallar la media y la varianza de X. (Rpta.: E(X) = 1.24, V (X) = 1.0424)
(b) La empresa incurre en una perdida semanal Y seg un el n umero de accidentes dada
por Y = 10 + 8X. Hallar la perdida esperada semanal. (Rpta.: E(Y ) = 19.92)
(c) Si en una semana se sabe que ocurrio al menos un accidente, cual es la probabilidad
de que haya ocurrido exactamente uno? (Rpta.: 0.4861)
6. La variable aleatoria X denida como el n umero de refrigeradoras vendidas por da en
cierta casa comercial tiene la siguiente fmp:
6.5. EJERCICIOS 59
X 1 2 3 4 5 6
f(x) c c 1/8 1/8 2c 2c
(a) Hallar el valor de c. (Rpta.: 1/8)
(b) Hallar la media, variancia y moda de X. (Rpta.: E(X) = 4, V (X) = 3, Mo =
{5, 6})
(c) Cual es la probabilidad de que se vendan menos de 5 refrigeradoras en un da?
(Rpta.: 1/2)
(d) Si se han vendido mas de 2 refrigeradoras en un da, cual es la probabilidad de
que se hayan vendido menos de 5? (Rpta.: 1/3)
(e) Si la ganancia diaria de la casa comercial es Y = 100X 150 (en soles), hallar la
media y variancia de la ganancia diaria de la casa comercial. (Rpta.: E(Y ) = 250,
V (Y ) = 30000)
(f) Cual es la probabilidad de que la ganancia de la casa comercial sea menor que
250 soles? (Rpta.: 3/8)
7. Suponga que una tienda de abarrotes compra 3 botellas de leche descremada a un precio
de mayoreo de 1.2 soles por botella y revende la leche a 1.65 por botella. Despues de
la fecha de vencimiento, la leche que no se vendio se saca de los anaqueles y la tienda
recibe del distribuidor una cantidad igual a 3/4 del precio de mayoreo por cada botella
no vendida. Si la fmp de la variable aleatoria X (n umero de botellas que no se vendio)
esta dada por:
X 0 1 2 3
f(x) 2/15 3/15 5/15 5/15
(a) Hallar la media del n umero de botellas que no se vendio. (Rpta.: 28/15)
(b) Hallar la fmp de la ganancia neta y luego determine su valor esperado. (Rpta.:
Ganancia = 1.35 0.75X, E(Ganancia) = 0.05)
(c) Si se sabe que por lo menos se vendio una botella, cual es la probabilidad de que
se hayan vendido mas de 2? (Rpta.: 1/5)
8. El n umero de cursos en los que se matricula un alumno en cierta universidad en un
periodo academico es una variable aleatoria con la siguiente fmp:
X 1 2 3 4 5 6
f(x) 0.05 0.05 0.15 0.45 0.20 0.10
(a) Calcule el n umero esperado de cursos en los que un alumno se matricula. (Rpta.:
4)
(b) Para cuatro alumnos seleccionados al azar, cual es la probabilidad de que todos se
matriculen en mas de 3 cursos? Asuma que los cuatro alumnos realizan su matrcula
de manera independiente. (Rpta.: 0.3164)
9. Un comerciante estima las ventas diarias de un determinado tipo de pan mediante la
siguiente fda:
60 CAP

ITULO 6. VARIABLES ALEATORIAS


Demanda X 0 1 2 3 4 5
F(x) 0.1 0.3 0.6 0.8 0.9 1
(a) Calcule el valor esperado y la desviacion estandar de la venta diaria. (Rpta.:
E(X) = 2.3,
X
= 1.418)
(b) El costo por unidad de pan es de 25 centimos y el precio de venta es de 50 centimos.
El pan se ordena con un da de anticipacion y cada unidad no vendida en el da se
remata al da siguiente a 10 centimos. Si el comerciante ordena 5 panes diariamente,
calcule el esperado y la variancia de la utilidad diaria. (Rpta.: E(Utilidad) = 17,
V (Utilidad) = 3216)
10. Una fabrica tiene 5 generadores de energa. Si en un momento dado se hace una inspec-
cion a los generadores, estos pueden estar trabajando normalmente o presentar alg un
tipo de problemas. Suponga que X, el n umero de generadores con problemas en el
momento de la inspeccion, tiene la siguiente fmp:
f(x) = kx x = 0, 1, 2, 3, 4, 5.
(a) Hallar el valor de k. (Rpta.: 1/15)
(b) Hallar P(1 X < 4). (Rpta.: 0.4)
(c) Suponga que le empresa contratada para hacer la inspeccion cobra 400 soles como
monto jo, 90 soles por cada generador con problemas y 25 soles por cada generador
sin problemas. Determine el monto que se espera pagar por la inspeccion de los 5
generadores. (Rpta.: 763.33 soles)
11. El volumen llenado en botellas de un litro por una maquina es una variable aleatoria X
(en decilitros) con fdp dada por
f(x) =
_
x 9 9 < x < 10
11 x 10 x < 11
(a) Graque f(x).
(b) Calcule la probabilidad de que una botella seleccionada al azar contenga mas de
9.8 dl. (Rpta.: 0.68)
(c) Calcule la media y la desviacion estandar de X. (Rpta.: = 10, = 0.4082)
(d) Calcule la moda y la mediana de X.
12. El peso en onzas de un artculo es una variable aleatoria X con fdp
f(x) = k(x 8) 8 x 10
(a) Halle k. (Rpta.: 1/2)
(b) Graque f(x).
(c) Halle E(X) y V (X). (Rpta.: E(X) = 9.333, V (X) = 0.2222)
(d) Halle la mediana de X. (Rpta.: Me = 9.41)
6.5. EJERCICIOS 61
(e) Si la empresa que transporta los artculos cobra 2 soles por onza mas un costo jo
de 22 soles por artculo, encuentre el coeciente de variacion del costo de transporte
por artculo. (Rpta.: CV = 2.318 %)
(f) El precio de venta de cada artculo es de S/.200 y el costo de S/.100. La empresa
garantiza un reintegro cuando el peso es menor de 8.25 onzas. Cual es la utilidad
esperada por artculo? (Rpta.: E(Utilidad) = 96.875)
(g) Si un lote consta de 20 artculos, cual es la probabilidad que en 2 artculos sea
necesario un reintegro? (Rpta.: 0.0349)
(h) Los artculos con un peso menor a 8.5 onzas son separados. Cual es la probabilidad
de que un artculo, seleccionado al azar de los restantes, pese mas de 9 onzas?
(Rpta.:0.8)
13. Se supone que el diametro de un cable electrico, X (en cm), es una variable aleatoria
con la siguiente fdp:
f(x) = 6x(1 x) 0 < x < 1.
(a) Encuentre la media y la desviacion estandar de X. (Rpta.: = 0.5, = 0.2236)
(b) Cual es la probabilidad de que un cable seleccionado al azar tenga un diametro
mayor a 0.6 cm? (Rpta.: 0.352)
(c) Si se seleccionan 10 cables al azar, cual es la probabilidad de que 3 cables tengan
un diametro superior a 0.6 cm? (Rpta.: 0.2511)
(d) Suponga que el precio de un cable con un diametro inferior de 0.4 cm es S/.5, el
de un cable con un diametro de entre 0.4 y 0.6 cm es S/.8 y el de un cable con
un diametro superior a los 0.6 cm es S/.12. Calcule el valor esperado del precio.
(Rpta.: 8.352 soles)
14. Sea X una variable aleatoria continua con funcion de densidad f(x) = 2(x 1) para
1 < X < 2.
(a) Calcule P(X < 1.6). (Rpta.: 0.36)
(b) Calcule P(X < 1.8|X > 1.3). (Rpta.: 0.6044)
(c) Calcule la media y la varianza de X. (Rpta.: E(X) = 5/3, V (X) = 0.05556)
(d) Calcule el esperado de X
2
+ 3X 2. (Rpta.: 35/6)
15. El tiempo en minutos que tarda un alumno en matricularse mediante una aplicacion
web es una variable aleatoria con funcion de densidad f(x) =
1
5
exp(x/5) para X > 0.
(a) Cual es la probabilidad de que un alumno demore menos de 8 minutos en matri-
cularse? (Rpta.: 0.7981)
(b) Calcule la mediana de X (Rpta.: 3.4657 minutos)
16. Suponga que la variable aleatoria continua X toma valores en el rango [a, b], tiene
funcion de densidad f(x) = x/4 y P(X < 2) = 0.1. Calcule a y b.
62 CAP

ITULO 6. VARIABLES ALEATORIAS


Captulo 7
Distribuciones de Probabilidad
Discretas
7.1. Distribucion binomial
7.1.1. Introducci on
Considere los siguientes experimentos aleatorios y sus variables aleatorias asociadas.
1. Sea X el n umero de caras obtenidas en 10 lanzamientos de una moneda.
2. En un examen con 10 preguntas de seleccion m ultiple sea X el n umero de respuestas
correctas obtenidas por un estudiante que a tratado de adivinar todas las repuestas.
3. Una maquina produce un 1 % de artculos defectuosos. Sea X el n umero de artculos
defectuosos encontrados en los 50 siguientes artculos producidos.
4. Suponga que la respuesta de una persona a un nuevo producto puede ser positiva con
probabilidad de 0.8 (esto es, que este dispuesto a probarlo). Sea X el n umero de personas
dispuestas a probar el nuevo producto en una muestra de 20.
5. Sea X el n umero de ni nas nacidas entre los proximos 20 nacimientos en un hospital.
Cada uno de estos experimentos aleatorios pueden entenderse como consistentes en la repe-
ticion de una serie de experimentos o pruebas individuales (lanzar una moneda, responder
a una pregunta, producir un artculo, evaluar la respuesta de una persona, un nacimiento)
cada uno de ellos con dos posibles resultados (cara o sello, acertar o fallar, defectuoso o no
defectuosos, respuesta negativa o positiva, ni na o ni no). Dena a estos dos posibles resultados
como exito y fracaso (arbitrariamente). En todos los ejemplos la variable aleatoria X se de-
ne como el n umero de exitos registrados en los n experimentos individuales. Si esta variable
cumple con las siguientes condiciones, entonces su distribucion de probabilidades es conocida
como la distribucion binomial:
Los experimentos individuales son independientes. Esto implica que el resultado de un
experimento individual no afecta el resultado de ninguno de los otros.
La probabilidad de exito en cada experimento individual es constante.
63
64 CAP

ITULO 7. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS


7.1.2. Caractersticas de la distribucion binomial
Considere un experimento aleatorio conformado por n experimentos individuales tales que:
1. Los experimentos individuales son independientes.
2. Cada experimento individual puede generar solo dos posibles resultados, denominados
como exito y fracaso.
3. La probabilidad de exito en cada experimento individual, denotada por , es constante.
Entonces, la variable aleatoria X, denida como el n umero de exitos observados en los n expe-
rimentos tiene una distribucion de probabilidades binomial. La fmp de una variable aleatoria
X con distribucion binomial es
f(x) = P(X = x) =
_
n
x
_

x
(1 )
nx
x = 0, 1, . . . , n. (7.1)
Notacion: X Bin(n, ) (Se lee X tiene distribucion binomial con parametros n y ).
Si X tiene una distribucion binomial con parametros n y , entonces su media y varianza
estan dadas por
= E(X) = n
2
= V (X) = n(1 ). (7.2)
La fmp de una variable con distribucion binomial es simetrica para = 0.5, asimetrica positiva
para < 0.5 y asimetrica negativa para > 0.5. La varianza de una variable con distribucion
binomial es maxima cuando = 0.5. Se pueden calcular probabilidades para una variable con
distribucion binomial en MINITAB en el men u Calc/Probability Distributions/Binomial. . .
Ejemplo 64: Con el objetivo de disminuir sus costos de produccion, una empresa azucarera empaca
900 gr en el 20 % de las bolsas de un kilo de su produccion. Un cliente compra 20 bolsas y decide
vericar el peso de cada una de ellas. Suponiendo que la variable aleatoria X, n umero de bolsas con
900 gr, sigue una distribucion de probabilidades binomial, responda lo siguiente:
(a) Dena el rango de la variable y calcule su valor esperado y varianza.
Asumiendo que X Bin(20, 0.2), el rango de X es 0, 1, . . . , 20. La media y la varianza estan
dadas por:
= E(X) = 20 0.2 = 4 bolsas

2
= V (X) = 20 0.2 (1 0.2) = 3.2 bolsas
2
.
(b) Cual es la probabilidad de que el cliente encuentre 3 bolsas con 900 gr?
P(X = 3) =
_
20
3
_
0.2
3
(1 0.2)
203
= 0.2054.
(c) Cual es la probabilidad de que el cliente encuentre mas de 3 pero menos de 7 bolsas con 900
7.2. DISTRIBUCI

ON HIPERGEOM

ETRICA 65
gr?
P(3 < X < 7) = P(X = 4) +P(X = 5) +P(X = 6)
=
_
20
5
_
0.2
5
(1 0.2)
205
+
_
20
5
_
0.2
5
(1 0.2)
205
+
_
20
6
_
0.2
6
(1 0.2)
206
= 0.2182 + 0.1746 + 0.1091
= 0.5019.
(d) Cual es la probabilidad de que el cliente encuentre mas de 3 bolsas si se sabe que no hay mas
de 5 con 900 gr?
P(X > 3|X 5) =
P(3 < X 5)
P(X 5)
=
P(X = 4) +P(X = 5)
P(X 5)
=
0.2182 + 0.1746
0.8042
= 0.4884.

7.1.3. Distribucion de Bernoulli


La distribucion binomial con n = 1 es conocida como la distribucion de Bernoulli, y cada
uno de los experimentos individuales independientes que dan origen a la variable binomial
es conocido como un ensayo de Bernoulli. Entonces, una variable aleatoria con distribucion
B(n, ) puede ser vista como el resultado de la suma de n variables aleatorias independientes
con distribucion Bernoulli con parametro .
7.2. Distribucion hipergeometrica
7.2.1. Introducci on
Suponga que se tiene un lote de 20 artculos, 8 de los cuales presentan alg un tipo de falla.
Si usted selecciona dos artculos al azar y sin reemplazo, la probabilidad de que el primero sea
defectuoso sera de 8/20, pero la probabilidad de que el segundo sea defectuosos dependera de
la condicion del primero (7/19 si el primero fue defectuoso y 8/19 si el primero no lo fue). Este
ejemplo diere de los tratados en el caso de la distribucion binomial en el hecho de que ambos
experimentos individuales (la observacion de la condicion del primer y el segundo artculo) no
son independientes, y ademas, la probabilidad de exito no permanece constante. Es en este
contexto que surge la distribucion de probabilidades hipergeometrica. Note sin embargo que
si la muestra fuese extrada con reemplazo, entonces los resultados s seran independientes y
la probabilidad de exito constante, por lo que la variable s tendra una distribucion binomial.
7.2.2. Caractersticas de la distribucion hipergeometrica
Considere un total de N objetos de los cuales M poseen cierta caracterstica; podra clasi-
car a estos M como exitos y a los restantes N M como fracasos. Una muestra aleatoria de
tama no n es seleccionada sin reemplazo desde el total N, y se dene la variable aleatoria X
66 CAP

ITULO 7. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS


como el n umero de exitos en la muestra. Entonces la variable aleatoria X tiene una distribu-
cion de probabilidades hipergeometrica. La fmp de una variable aleatoria X con distribucion
hipergeometrica es
f(x) = P(X = x) =
_
M
x
__
NM
nx
_
_
N
n
_ x = max{0, n +M N}, . . . , mn{M, n}. (7.3)
Notacicion: X Hip(n, M, N) (Se lee X tiene distribucion hipergeometrica con parame-
tros n, M y N).
Si X tiene una distribucion hipergeometrica con parametros n, M y N, entonces su media
y varianza estan dadas por
= E(X) = n
M
N

2
= V (X) = n
M
N
_
1
M
N
__
N n
N 1
_
. (7.4)
La fmp hipergeometrica con parametros n, M y N se aproxima a la fmp binomial con pa-
rametros n y = M/N conforme N , M y M/N . Se pueden calcular
probabilidades para una variable con distribucion hipergeometrica en MINITAB en el men u
Calc/Probability Distributions/Hypergeometric. . . .
Ejemplo 65: Tres ni nos se acercan a una maquina vendedora de goma de mascar esferica de colores.
La maquina se acaba de llenar con 20 bolillas rojas y 30 bolillas amarillas. Si un ni no compra 5
gomas de mascar, y asumiendo que el n umero de bolillas de color rojo obtenidas tiene una distribucion
hipergeometrica, responda lo siguiente:
(a) Dena el rango de la variable y calcule su valor esperado y varianza.
Asumiendo que X Hip(5, 20, 50), el rango de X es 0, 1, . . . , 5. La media y la varianza estan
dadas por:
= E(X) = 5
20
50
= 2 bolillas rojas.

2
= V (X) = 5
20
50
_
1
20
50
__
50 5
50 1
_
= 1.102 bolillas rojas
2
.
(b) Cual es la probabilidad de que el ni no obtenga una bolilla roja y 4 amarillas?
P(X = 1) =
_
20
1
__
5020
51
_
_
50
5
_ = 0.2587.
(c) Cual es la probabilidad de que el ni no obtenga a lo mas 2 bolillas rojas?
P(X 2) = P(X = 0) +P(X = 1) +P(X = 2)
=
_
20
0
__
5020
50
_
_
50
5
_ +
_
20
1
__
5020
51
_
_
50
5
_ +
_
20
2
__
5020
52
_
_
50
5
_
= 0.0673 + 0.2587 + 0.3641
= 0.6900

7.3. DISTRIBUCI

ON DE POISSON 67
7.3. Distribucion de Poisson
7.3.1. Introducci on
Esta distribucion fue desarrollada por el matematico frances Simeon Denis Poisson (1781 -
1840), y expresa la probabilidad de una variable aleatoria denida como el n umero de eventos
que ocurren por cierta unidad de observacion, usualmente relacionada al tiempo, bajo el
supuesto de que estos eventos ocurren en forma aleatoria con una tasa media de ocurrencia
conocida. Las siguientes variables podran tener una distribucion de Poisson:
1. N umero de bacterias por ml.
2. N umero de accidentes por semana en una interseccion.
3. N umero de errores tipogracos por pagina.
4. N umero de clientes que llegan a una agencia bancaria por hora.
5. N umero de arboles de pino por kilometro cuadrado.
6. N umero de emergencias atendidas en un hospital por da.
7. N umero de personas que sufren ataques cardacos por cada 100 000 habitantes al a no.
Es importante denir la unidad de observacion con cuidado. As por ejemplo, si el n umero
de clientes que llegan por hora a una ventanilla de atencion tiene distribucion de Poisson con
una tasa media de 15 clientes por hora, el n umero de clientes que llegan en tres horas tendra
distribucion de Poisson con una tasa media de 45 clientes por cada tres horas.
7.3.2. Caractersticas de la distribucion de Poisson
La fmp de una variable aleatoria X con distribucion de Poisson es
f(x) = P(X = x) =
e

x
x!
x = 0, 1, 2 . . . . (7.5)
Notacion: X Poisson() (Se lee X tiene distribucion de Poisson con parametro ).
Si X tiene una distribucion de Poisson con parametro entonces su media y varianza
estan dadas por
= E(X) =
2
= V (X) = . (7.6)
La fmp binomial con parametros n y p se aproxima a la fmp Poisson con parametro =
np conforme n , y p 0. Se pueden calcular probabilidades para una variable con
distribucion de Poisson en MINITAB en el men u Calc/Probability Distributions/Poisson. . . .
Ejemplo 66: Suponga que el n umero de accidentes que ocurren en una interseccion por semana es una
variable aleatoria que sigue una distribucion de Poisson con tasa media de 2 accidentes por semana.
68 CAP

ITULO 7. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS


(a) Dena el rango de la variable y calcule su valor esperado y varianza.
Asumiendo que X Poisson(2), el rango de X es 0, 1, . . . . La media y la varianza estan
dadas por:
= E(X) = 2 accidentes.

2
= V (X) = 2 accidentes
2
.
(b) Cual es la probabilidad de que en una semana ocurran 3 accidentes?
P(X = 3) =
e
2
2
3
3!
= 0.1804.
(c) Cual es la probabilidad de que en una semana ocurran mas de 3 accidentes?
P(X > 3) = P(X = 4) +P(X = 5) +P(X = 6) +. . .
= 1 P(X = 0) +P(X = 1) +P(X = 2) P(X = 3)
= 1
e
2
2
0
0!

e
2
2
1
1!

e
2
2
2
2!

e
3
2
3
0!
= 0.1429.
(d) Cual es la probabilidad de que en tres semanas ocurran 5 accidentes?
P(X = 5) =
e
6
6
5
5!
= 0.1606.

7.4. Ejercicios
1. Los resultados de una investigacion de mercado se nalan que aproximadamente uno de
cada 10 consumidores preeren el refresco de cola marca A. Si se selecciona una muestra
aleatoria de 30 consumidores, cual es la probabilidad de que por lo menos 5 preeran
el refresco A?
2. Una compa na de seguros sabe que la probabilidad de que una persona sufra cierto tipo
de accidente durante un a no es 8 %. Se sabe que la compa na tiene 25 asegurados contra
este tipo de accidente.
(a) Cual es la probabilidad de que la compa na tenga que afrontar los gastos de 2 de
sus asegurados? (Rpta.: 0.2821)
(b) Cual es la probabilidad de que la compa na tenga que afrontar los gastos de a lo
mas 3 asegurados? (Rpta.: 0.8649)
(c) Suponga que la compa na tiene que pagar 2500 soles por cada asegurado que sufre
este accidente. Calcule el gasto esperado de la compa na durante el a no. (Rpta.:
5000)
3. Un fabricante vende sus productos en cajas de 10 unidades y se sabe que la probabili-
dad de que una unidad este defectuosa es 5 %. Asumiendo que el n umero de unidades
defectuosas por caja sigue una distribucion binomial calcule lo siguiente.
(a) La probabilidad de que una caja no contenga unidades defectuosas? (Rpta.: 0.5987)
7.4. EJERCICIOS 69
(b) Si una caja no tiene unidades defectuosas es considerada perfecta y no produce
perdida alguna, si tiene una o dos unidades defectuosas produce una perdida de 10
soles, y si tiene mas de dos unidades defectuosas produce una perdida de 30 soles.
Calcule la perdida esperada por caja para el fabricante. (Rpta.: 4.2427)
4. Un examen objetivo consta de 20 preguntas con 4 alternativas cada una.
(a) Si un alumno que no estudio decide responder aleatoriamente (probar suerte en el
examen), cual sera su n umero esperado de puntos en el examen? (Rpta.: 5)
(b) Cual es la probabilidad de que este alumno obtenga un 5? (Rpta.: 0.2023)
(c) Cual es la probabilidad de que este alumno obtenga por lo menos un 4? (Rpta.:
0.7748)
5. Las probabilidades de que un automovil que se somete a una revision tecnica tenga los
frenos en buen estado, en estado regular o malo son 0.7, 0.2 y 0.1 respectivamente. Para
10 automoviles seleccionados al azar, calcule la probabilidad de que:
(a) Por lo menos 7 tengan los frenos en buen estado. (Rpta.: 0.6496)
(b) A lo mas 2 tengan los frenos en mal estado. (Rpta.: 0.9298)
(c) Se encuentren autos con frenos en las 3 condiciones mencionadas. (Rpta.: 0.5722)
6. En un grupo de 40 personas se sabe que 8 estan a favor de legalizar el aborto. Suponga
que se selecciona al azar un grupo de 10 personas desde estas 40, y dena la variable
aleatoria X como el n umero de personas en la muestra que estan a favor de legalizar el
aborto.
(a) Dena el rango de la variable y calcule su valor esperado y varianza. (Rpta.: R
X
=
{0, 1, . . . , 8}, E(X) = 2, V (X) = 1.2308)
(b) Cual es la probabilidad de encontrar entre 3 y 5 personas a favor de legalizar el
aborto? (Rpta.: 0.3105)
7. De un lote de 25 artculos que contiene 5 defectuosos se selecciona una muestra de 4
al azar. Sea la variable aleatoria X el n umero de artculos defectuosos encontrados en
la muestra. Calcule la probabilidad de obtener mas de 2 defectuosos para los casos en
que el muestreo sea con y sin reemplazo. (Rpta.: Con reemplazo 0.0272 y sin reemplazo
0.0162)
8. En un intento para burlar la vigilancia de la aduana en un aeropuerto, un viajero coloco
en un frasco 8 tabletas de narcotico junto con 20 pastillas de vitaminas de apariencia
semejante. Si el inspector de aduana selecciona 5 tabletas al azar para analizarlas.
(a) Cual es la probabilidad de que el viajero sea descubierto y arrestado por posesion
ilegal de narcoticos? (Rpta.:0.8422)
(b) Cual es la probabilidad de que el inspector encuentre 2 tabletas de narcotico?
(Rpta.:0.3248)
9. La empresa FERTISA se dedica a la produccion de fertilizantes y tiene ciertos problemas
en el envasado de sus productos. Un lote de 100 sacos que contienen 8 defectuosamente
envasados ha sido remitido a la rma AGROUNA.
70 CAP

ITULO 7. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS


(a) Si AGROUNA selecciona 10 sacos aleatoriamente, cual es la probabilidad de que
encuentre 3 sacos mal envasados? (Rpta.: 0.02834)
(b) AGROUNA aceptara el lote si al seleccionar 10 sacos no encuentra defecto en
ninguno de ellos. Si se remiten 10 lotes con 8 sacos defectuosos cada uno, cual es
la probabilidad de que a lo mas 1 lote sea rechazado?
10. Una empresa de transportes tiene 30 vehculos, 20 en perfectas condiciones y 10 con
problemas mecanicos.
(a) Si se seleccionan 8 vehculos al azar, cual es la probabilidad de que menos de 5
esten en perfectas condiciones? (Rpta.: 0.2302)
(b) Si se seleccionan 7 vehculos al azar, cual es la media y la varianza del n umero de
vehculos en perfectas condiciones en la muestra? (Rpta.: = 4.6667,
2
= 1.2337)
11. La experiencia ha demostrado que el n umero de llamadas que llegan a una central
telefonica sigue una distribucion de Poisson con una media de 2 llamadas por minuto.
(a) Cual es la probabilidad de recibir 3 llamadas en 1 minuto? (Rpta.: 0.1804)
(b) Cual es la probabilidad de recibir 5 llamadas en 3 minutos? (Rpta.: 0.1606)
(c) Cual es la probabilidad de recibir mas de 10 llamadas en 3 minutos? (Rpta.:
0.0426)
(d) Cual es la probabilidad de que se tenga que esperar mas de 2 minutos para recibir
una llamada? (Rpta.: 0.0183)
12. Los automoviles llegan a una garita de peaje aleatoriamente con un promedio de 350
autos por hora.
(a) Cual es la probabilidad de que lleguen por lo menos 8 durante 3 minutos? (Rpta.:
0.9960)
(b) Calcule la media y la varianza del n umero de autos que llegan cada 10 minutos.
(Rpta.: =
2
= 58.33)
13. La gerencia de una agencia bancaria ha determinado que los clientes llegan a ventanilla
a razon de 2 cada 5 minutos siguiendo una distribucion de Poisson.
(a) Calcule la probabilidad de que no llegue ning un cliente en un lapso de 10 minutos.
(Rpta.: 0.0183)
(b) Cuantos clientes se esperara lleguen en media hora? (Rpta.: 12)
(c) Cual es la probabilidad de que en media hora lleguen por lo menos 10 clientes?
(Rpta.: 0.7576)
14. Una empresa tiene 2 centrales telefonicas, A y B. El n umero de llamadas que ingresan
en la central A por minuto sigue una distribucion de Poisson con media 7 y el n umero
de llamadas que ingresan en la central B por minuto sigue una distribucion de Poisson
con media 5. Calcule el coeciente de variacion del n umero de llamadas que ingresan
por minuto en total en las dos centrales.
7.4. EJERCICIOS 71
15. El n umero de emergencias que atiende una compa na de bomberos es una variable
aleatoria con distribucion de Poisson. Si la probabilidad de que en una hora no se
atienda ninguna emergencia es 0.2, calcule la probabilidad de que en una hora se tenga
que atender una emergencia. (Rpta.: 0.3219)
16. Una vacuna produce inmunidad contra cierta enfermedad en un 99.99 %. Suponga que
la vacuna ha sido administrada a 10000 personas.
(a) Encuentre el n umero esperado de personas que no han sido inmunizadas.
(b) Cual es la probabilidad de que menos de 2 personas no hayan sido inmunizadas?
72 CAP

ITULO 7. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS


Captulo 8
Distribuciones de Probabilidad
Continuas
8.1. Distribucion uniforme continua
8.1.1. Introducci on
La distribucion uniforme continua es una distribucion de probabilidades que cumple con la
condicion de que todos los intervalos del mismo tama no denidos sobre el rango de la variable
correspondiente son igualmente probables.
8.1.2. Caractersticas de la distribucion uniforme continua
La fdp de una variable aleatoria X con distribucion uniforme continua es
f
X
(x) =
1
b a
I
[a,b]
(x), < a < b < . (8.1)
En esta expresion, I
[a,b]
(x) es la funcion indicadora que toma el valor de 1 si x [a, b] y 0 en
caso contrario.
Notacion: X U(a, b) (Se lee X tiene distribucion uniforme continua en el intervalo [a, b]).
En la gura 8.1 se presenta el graco de la fdp de esta distribucion. Si X tiene una
distribucion uniforme continua con parametros a y b, entonces
E(X) =
a +b
2
V (X) =
(b a)
2
12
. (8.2)
Por integracion se obtiene que
P(X x) =
_

1
b a
dx =
x a
b a
.
73
74 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


U(a,b)
a b














1
/
(
b

a
)
Figura 8.1: fdp para una distribucion uniforme continua en el intervalo [a,b].
Luego, la fda esta dada por
F(x) =
_

_
0 si x < a
(x a)/(b a) si a x < b
1 si x b
. (8.3)
Esta distribucion es util para generar n umeros aleatorios para variables con distintas distribu-
ciones de probabilidad, tanto continuas como discretas. Se pueden calcular probabilidades para
una variable con distribucion uniforme continua en MINITAB en el men u Calc/Probability
Distributions/Uniform. . . .
Ejemplo 67: Suponga que el peso neto de un paquete de cereal es una variable aleatoria con distri-
bucion uniforme continua en el intervalo de 195 a 205 gramos.
(a) Calcule la probabilidad de que un paquete seleccionado al azar tenga menos de 197 gramos.
P(X 197) =
197 195
205 195
= 0.2.
(b) Calcule el valor esperado y la varianza del peso de los paquetes.
E(X) =
195 + 205
2
= 200.
V (X) =
(205 195)
2
12
= 8.333.
(c) Calcule el primer cuartil de la distribucion de los pesos.
El primer cuartil es un valor q
1
que satisface la condicion
P(X q
1
) =
q
1
195
205 195
= 0.25.
Luego, despejando se tiene que q
1
= 197.5.

8.2. DISTRIBUCI

ON NORMAL 75
10 5 0 5 10 15 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
N(5, 5
2
)
X
f
(
x
)
10 5 0 5 10 15 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
N(10, 3
2
)
X
f
(
x
)
10 5 0 5 10 15 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
N(3, 2
2
)
X
f
(
x
)
Figura 8.2: fdp normal para diferentes valores de la media y varianza.
8.2. Distribucion normal
8.2.1. Introducci on
Sin lugar a dudas, la distribucion normal constituye el modelo de probabilidad mas utili-
zado. Una de las razones de su gran aplicabilidad es el teorema del lmite central, desarrollado
por De Moivre en 1733 y por Gauss casi 100 a nos despues (por esta razon, la curva normal
es tambien conocida como Gaussiana). El teorema del lmite central establece que la variable
aleatoria que corresponde al promedio o suma del resultado de varias mediciones tiende a una
distribucion normal conforme el n umero de mediciones aumenta. As por ejemplo, aunque el
ingreso mensual de las personas en una comunidad podra tener una distribucion bastante
diferente de la normal, el ingreso promedio de los individuos de la comunidad podra ajustarse
bastante bien. Por otro lado, si el ingreso mensual de una persona esta constituido por la suma
de varios pagos, su ingreso tambien podra ajustarse bastante bien a la normal. En general,
cualquier variable aleatoria continua cuya distribucion exhiba simetra y colas poco pesadas
podra ajustarse bien a la distribucion normal, como por ejemplo algunos pesos, longitudes,
vol umenes, tiempos de vida, errores de medicion, etc.
8.2.2. Caractersticas de la distribucion normal
La fdp de una variable aleatoria X con distribucion normal es
f
X
(x) =
1

2
exp
_

(x )
2
2
2
_
I
(,)
(x), < < , > 0. (8.4)
Notacion: X N(,
2
) (Se lee X tiene distribucion normal con media y varianza
2
).
Si X tiene una distribucion normal con parametros y
2
, entonces
E(X) = V (X) =
2
. (8.5)
En la gura 8.2 se presenta la fdp normal para tres combinaciones diferentes de los parametros.
La distribucion normal tiene forma acampanada y es simetrica con respecto a su media. Por
lo tanto, se puede vericar que si X tiene distribucion N(,
2
), entonces P(X < ) =
76 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


5 10 15
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
X
f
(
x
)
Figura 8.3: Graco de la fdp N(10, 2
2
). El area sombreada representa P(7<X<10).
P(X > ) = 0.5 y P(X < + a) = P(X > a) para cualquier valor real a. Se pueden
calcular probabilidades para una variable con distribucion normal en MINITAB en el men u
Calc/Probability Distributions/Normal. . . .
Ejemplo 68: Suponga que la variable X tiene distribucion N(10, 2
2
). Entonces
P(7 < X < 10) =
_
10
7
1

22
exp
_

(x 10)
2
2 2
2
_
dx = 0.4331928.
Esta probabilidad esta dada por el area sombreada en la gura 8.3.
Otra caracterstica importante de la distribucion normal es que la suma de variables
aleatorias con distribucion normal, tambien tiene distribucion normal. As, si X
1
, X
2
, . . . , X
n
son variables aleatorias independientes con distribuciones N(
i
,
2
i
), dadas las constantes
a
1
, a
2
, . . . , a
n
, la variable aleatoria Y =

n
i=1
a
i
x
i
tiene distribucion normal con media y
varianza dadas por
y
=

n
i=1
a
i

i
y
2
y
=

n
i=1
a
2
i

2
i
.
Ejemplo 69: Se sabe que el salario mensual de una pareja de esposos, X
1
y X
2
, son variables alea-
torias normales con medias 1000 y 1500 soles, y desviaciones estandar de 100 y 120 soles. Cual es la
probabilidad de que un mes determinado el ingreso conjunto de ambos esposos supere los 3000 soles?
Para resolver este problema dena la variable aleatoria ingreso conjunto por Y = X
1
+X
2
. Entonces
se tiene que Y N(1000 + 1500, 100
2
+ 120
2
) y P(Y > 3000) = 0.000685.
8.2.3. Distribucion normal estandar
Sea X una variable aleatoria con distribucion N(,
2
). Entonces la variable
Z =
X

(8.6)
8.2. DISTRIBUCI

ON NORMAL 77
4 2 0 2 4
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
Distribucin Normal Estndar
Z
Figura 8.4: Graco de la fdp N(0, 1).
tiene distribucion N(0, 1). A esta distribucion se le conoce como la normal estandar y su fdp
esta dada por
f
Z
(z) =
1

2
exp
_

z
2
2
_
I
(,)
(z). (8.7)
En la gura 8.4 se presenta el graco de la fdp de esta distribucion. La fda de la variable
normal estandar es denotada por (z), y esta dada por
(z) = P(Z < z) =
_
z

2
exp
_

z
2
2
_
dz. (8.8)
Ejemplo 70: Suponga que la variable X tiene distribucion N(,
2
). Si se sabe que P(X < 3) = 0.2
y P(X < 4) = 0.3, calcule la media y la varianza.
Se puede calcular la media y la varianza de esta distribucion teniendo en cuenta que
P(X < 3) = P
_
Z <
3

_
= 0.2
P(X < 4) = P
_
Z <
4

_
= 0.3.
Dado que P(Z < 0.8416) = 0.2 y P(Z < 0.5244) = 0.3, se tiene que
3

= 0.8416 y
4

= 0.5244
de lo que nalmente se obtiene que = 5.6531 y
2
= 3.1524
2
.
78 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


8.3. Distribucion gamma
8.3.1. Introducci on
La distribucion gamma cumple un rol importante en el analisis de tiempos de espera
y tiempos de vida. Esta distribucion esta estrechamente relacionada con la distribucion de
Poisson y constituye el modelo general a partir del cual se desprenden otras distribuciones de
probabilidad como la exponencial, la ji-cuadrado y la distribucion de Erlang (Agner Krarup
Erlang fue un matematico y estadstico danes, quien desarrollo esta distribucion para modelar
el n umero de llamadas telefonicas que podan ser hechas al mismo tiempo a los operadores de
las centrales telefonicas).
8.3.2. Caractersticas de la distribucion gamma
La fdp de una variable aleatoria X con distribucion gamma es
f
X
(x) =
1
()

x
1
e
x/
I
(0,)
(x) > 0, > 0. (8.9)
En esta expresion, (.) representa la funcion gamma, que es denida por
() =
_

0
t
1
e
t
dt. (8.10)
Utilizando integracion por partes se puede demostrar que
() = ( 1)( 1).
Luego, para valores enteros se tiene que () = (1)!. Otra caracterstica bien conocida de
la funcion gamma es que (1/2) =

.
Notacion: X Gamma(, ) (Se lee X tiene distribucion gamma con parametros y ).
Si X tiene una distribucion gamma con parametros y , entonces
E(X) = V (X) =
2
. (8.11)
Con entero, la distribucion resultante es conocida como la distribucion de Erlang. En este
caso, la variable aleatoria X con distribucion gamma(, ) (o Erlang(, ) representa el tiem-
po que transcurre hasta la observacion del suceso n umero , considerando que el n umero de
sucesos de este tipo que ocurren por unidad de tiempo tiene una distribucion de Poisson con
media 1/. Con = 1, la distribucion resultante es conocida como la distribucion Exponen-
cial, que se tratara en la siguiente seccion. Con = k/2 y = 2, la distribucion resultante es
conocida como la distribucion ji-cuadrado con k grados de libertad, que tambien sera vista
mas adelante.
Se pueden calcular probabilidades para una variable con distribucion gamma en MINITAB
en el men u Calc/Probability Distributions/Gamma. . . .
Ejemplo 71: En una clnica los pacientes llegan a emergencia en cualquier momento del da siguiendo
una distribucion de Poisson con una tasa media de 1 paciente cada 20 minutos.
8.4. DISTRIBUCI

ON EXPONENCIAL 79
(a) Calcule la probabilidad de que pasen 10 minutos y no haya llegado ning un paciente.
El n umero de pacientes que llegan por minuto tendra una distribucion de Poisson con parametro
= 1/20. Luego, la variable X denida como el tiempo en minutos para la llegada de un paciente
tendra distribucion gamma con parametros = 1 y = 1/ = 20. Entonces, P(X > 10) =
1 0.3935 = 0.6065.
(b) Calcule la probabilidad de que se tenga que esperar mas de una hora para que llegue el cuarto
paciente.
El n umero de pacientes que llegan por minuto tendra una distribucion de Poisson con parametro
= 1/20. Luego, la variable X denida como el tiempo en minutos para la llegada del cuarto
paciente tendra distribucion gamma con parametros = 4 y = 1/ = 20. Entonces, P(X >
60) = 1 0.3528 = 0.6472.

8.4. Distribucion exponencial


8.4.1. Introducci on
La distribucion exponencial es utilizada principalmente para modelar tiempos de espe-
ra. Como ya se menciono, esta distribucion constituye un caso particular de la distribucion
gamma, y permite modelar el tiempo entre dos sucesos, donde el n umero de sucesos por
unidad de tiempo tiene una distribucion de Poisson.
8.4.2. Caractersticas de la distribucion exponencial
La fdp de una variable aleatoria X con distribucion exponencial es
f
X
(x) =
1

e
x/
I
(0,)
(x) > 0. (8.12)
Notacion: X Exp() (Se lee X tiene distribucion exponencial con parametro ).
Si X tiene una distribucion exponencial con parametro , entonces
E(X) = V (X) =
2
. (8.13)
Existe una conexion entre las distribuciones exponencial y de Poisson. As, si la variable
Y Poisson() representa el n umero de sucesos de cierto tipo que ocurren por unidad de
tiempo, entonces el tiempo entre dos sucesos consecutivos, medido en las mismas unidades
de tiempo, tiene distribucion Exp( = 1/). Otra caracterstica importante de la distribu-
cion exponencial es la de perdida de memoria. Seg un esta propiedad, si X tiene distribucion
exponencial, entonces se cumple que P(X > s +x|X > s) = P(X > x).
Se pueden calcular probabilidades para una variable con distribucion exponencial en MI-
NITAB en el men u Calc/Probability Distributions/Exponential. . .
Ejemplo 72: Se sabe que el tiempo de vida de cierto circuito tiene una distribucion exponencial con
una media de 1500 horas.
80 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


(a) Calcule la probabilidad de que dicho circuito dure menos de 1000 horas.
P(X < 1000) = 0.4866.
(b) Calcule la probabilidad de que un circuito que ya ha durado 500 horas, dure en total mas de
2500 mas.
Por la propiedad de perdida de memoria se tiene que
P(X > 2500|X > 500) = P(X > 2000) = 1 0.7364 = 0.2636.

8.5. Distribucion de Weibull


8.5.1. Introducci on
Esta distribucion es util para modelar variables como el tiempo de vida con una gran
exibilidad, dado que permite modelar situaciones en donde la tasa de fallas no es constante
sobre el tiempo. Esta distribucion recibe su nombre en merito al trabajo de Waloddi Weibull.
8.5.2. Caractersticas de la distribucion de Weibull
La fdp de una variable aleatoria X con distribucion de Weibull es
f
X
(x) =

x
1
e
(x/)

I
(0,)
(x), > 0, > 0. (8.14)
Notacion: X Weibull(, ) (Se lee X tiene distribucion de Weibull con parametros y
).
Si X tiene una distribucion de Weibull con parametros y , entonces
E(X) =
_
1 +
1

_
V (X) =
2
_

_
1 +
2

_
1 +
1

__
2
_
. (8.15)
El parametro permite modelar tiempos de vida con gran exibilidad como se indica a
continuacion:
Si < 1, entonces la tasa de fallas disminuye en el tiempo. Esta situacion sugiere una
alta mortalidad infantil, esto es, que las unidades con predisposicion a fallar lo hacen
pronto, de modo que al pasar el tiempo solo las resistentes van quedando, con lo que la
tasa de fallas disminuye.
Si = 1, entonces la tasa de fallas es constante, y la distribucion resultate es la expo-
nencial con parametro .
Si > 1, entonces la tasa de fallas aumenta en el tiempo. Esta situacion sugiere undes-
gaste en las unidades, de modo que conforme el tiempo pasa, aumenta la probabilidad
de fallar.
8.6. DISTRIBUCI

ON JI-CUADRADO 81
Se pueden calcular probabilidades para una variable con distribucion de Weibull en MINITAB
en el men u Calc/Probability Distributions/Weibull. . . .
Ejemplo 73: El tiempo de vida de una l ampara incandescente en miles de horas tiene una distribucion
de Weibull con parametros = 1.2 y = 6. Cual es la probabilidad de que una lampara cualquiera
funcione menos de 7000 horas?
P(X < 7) = 0.6998.

8.6. Distribucion ji-cuadrado


8.6.1. Introducci on
Esta distribucion cumple un rol importante en la inferencia estadstica como soporte para
muchas pruebas de hipotesis. Tal vez sus aplicaciones mas importantes sean la relacionada con
la inferencia estadstica para una varianza de una poblacion normal y las pruebas ji-cuadrado
de bondad de ajuste y de independencia. Esta distribucion constituye un caso particular de la
distribucion gamma(, ) con = k/2 y = 2. A la cantidad k se le conoce como los grados
de libertad de la distribucion.
8.6.2. Caractersticas de la distribucion ji-cuadrado
La fdp de una variable aleatoria X con distribucion ji-cuadrado con k grados de libertad
es
f
X
(x) =
1
(k/2)2
k/2
x
k/21
e
x/2
I
(0,)
(x), k > 0. (8.16)
Notacion: X
2
(k)
(Se lee X tiene distribucion ji-cuadrado con k grados de libertad).
Si X tiene una distribucion ji-cuadrado con k grados de libertad, entonces
E(X) = k V (X) = 2k. (8.17)
En la gura 8.5 se presenta la fdp de esta distribucion para distintos valores de los grados de
libertad. Se pueden calcular probabilidades para una variable con distribucion ji-cuadrado en
MINITAB en el men u Calc/Probability Distributions/Chi-Square. . . .
A continuacion se presentan algunos resultados importantes para la distribucion ji-cuadrado:
Si Z N(0, 1), entonces Z
2

2
(1)
.
Si X
1
, X
2
, . . . , X
n
es una muestra aleatoria extrada desde una poblacion normal con
media y varianza
2
, entonces
n

i=1
_
X
i

_
2

2
(n)
(8.18)
y
n

i=1
_
X
i

_
2
=

n
i=1
(X
i


X)
2

2
=
(n 1)S
2

2

2
(n1)
. (8.19)
82 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


0 5 10 15 20 25 30
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5

2
(1)
X
f
(
x
)
0 5 10 15 20 25 30
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5

2
(3)
X
f
(
x
)
0 5 10 15 20 25 30
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5

2
(10)
X
f
(
x
)
Figura 8.5: fdp ji-cuadrado para diferentes valores de los grados de libertad.
Para dos variables aleatorias independientes X
1

2
(n
1
)
y X
2

2
(n
2
)
, se tiene que
X
1
+X
2

2
(n
1
+n
2
)
.
Ejemplo 74:
1. Si Z N(0, 1), entonces P(Z
2
< 3) = 0.9167.
2. Si X
2
(25)
, entonces P(X < 30) = 0.7757.
3. Si X
2
(25)
y P(X > x
0
) = 0.05, entonces x
0
= 37.65.

8.7. Distribucion t de Student


8.7.1. Introducci on
El desarrollo de esta distribucion fue publicado en 1908 por William Sealy Gosset, en
tiempos en los que trabajaba para la cervecera Guinness en Dublin. Dado que la cervecera
Guinnes no permita que sus empleados publicaran trabajos de investigacion (en el pasado
otro empleado haba publicado un artculo cientco que contena informacion condencial de
la compa na), Gosset publico su trabajo con el seudonimo de Student, razon por la cual su
aporte mas importante a la estadstica es conocido como la distribucion t de Student. Esta
distribucion da origen a la famosa prueba t, util para realizar pruebas de hipotesis para una
media.
8.7.2. Caractersticas de la distribucion t de Student
La fdp de una variable aleatoria X con distribucion t de Student con k grados de libertad
es
f
X
(x) =
((k + 1)/2)
(k/2)
_
1

k
__
1 +
x
2
k
_

k+1
2
I
(,)
(x), k > 0. (8.20)
8.7. DISTRIBUCI

ON T DE STUDENT 83
6 4 2 0 2 4 6
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
t(1)
X
f
(
x
)
6 4 2 0 2 4 6
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
t(5)
X
f
(
x
)
6 4 2 0 2 4 6
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
t(50)
X
f
(
x
)
Figura 8.6: fdp t de Student para diferentes valores de los grados de libertad.
Notacion: X t
(k)
(Se lee X tiene distribucion t de Student con k grados de libertad).
Si X tiene una distribucion t de Student con k grados de libertad, entonces
E(X) = 0 con k > 1 V (X) =
k
k 2
con k > 2. (8.21)
La distribucion t con 1 grado de libertad es conocida como la distribucion de Cauchy, y ni
la media ni la desviacion estandar son denidas. En la gura 8.6 se presenta la fdp de esta
distribucion para distintos valores de los grados de libertad. Se pueden calcular probabilidades
para una variable con distribucion t de Student en MINITAB en el men u Calc/Probability
Distributions/t. . . .
A continuacion se mencionan algunas caractersticas importantes de esta distribucion:
La distribucion t de Student tiene forma acampanada y es simetrica con respecto a su
media.
La distribucion t de Student se aproxima a la distribucion normal estandar conforme
k .
Si las variables aleatorias Z N(0, 1) y U
2
(k)
son independientes, entonces la
variable aleatoria
Z
_
U
k
t
(k)
.
Ejemplo 75:
1. Si X t
(12)
, entonces P(X < 3) = 0.9945.
2. Si X t
(4)
, entonces P(X > 1) = 1 P(X < 1) = 1 0.1870 = 0.8130. Dado que la
distribucion t es simetrica en torno a cero, el resultado anterior se pudo calcular de la siguiente
manera:
P(X > 1) = P(X < 1) = 0.8130.
3. Si X t
(8)
y P(X < x
0
) = 0.32, entonces x
0
= 0.4860.

84 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


0 2 4 6 8 10
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
F(2,2)
X
f
(
x
)
0 2 4 6 8 10
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
F(4,2)
X
f
(
x
)
0 2 4 6 8 10
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
F(10,10)
X
f
(
x
)
Figura 8.7: fdp F para diferentes valores de los grados de libertad.
8.8. Distribucion F
8.8.1. Introducci on
Esta distribucion es tambien conocida como la distribucion F de Snedecor o F de Fisher y
Snedecor. Tal vez la aplicacion mas notable de esta distribucion esta en la tecnica estadstica
conocida como el analisis de varianza, de gran aplicacion en las ciencias experimentales (Hay
una enorme cantidad de textos sobre dise no y analisis de experimentos, tema en el que el ana-
lisis de varianza es fundamental. Una buena referencia con una orientacion hacia aplicaciones
industriales es Montgomery [2]). Los fundamentos del analisis de varianza fueron desarrolla-
dos por Ronald A. Fisher en las decadas de 1920 y 1930 mientras trabajaba en la estacion
experimental de Rothamsted en Inglaterra.
8.8.2. Caractersticas de la distribucion F
La fdp de una variable aleatoria X con distribucion F con m y n grados de libertad es
f
X
(x) =
((m+n)/2)
(m/2)(n/2)
_
m
n
_
m/2
x
(m2)/2
[1 + (m/n)x]
(m+n)/2
I
(0,)
(x), m > 0, n > 0. (8.22)
Notacion: X F
(m,n)
(Se lee X tiene distribucion F con m y n grados de libertad).
Si X tiene una distribucion F con m y n grados de libertad, entonces
E(X) =
n
n 2
con n > 2 V (X) =
2n
2
(m+n 2)
m(n 2)
2
(n 4)
con n > 4. (8.23)
En la gura 8.7 se presenta la fdp de esta distribucion para distintos valores de los grados de
libertad. Se pueden calcular probabilidades para una variable con distribucion F en MINITAB
en el men u Calc/Probability Distributions/F. . .
A continuacion se mencionan algunas caractersticas importantes de esta distribucion:
Si las variables aleatorias U
2
(m)
y V
2
(n)
son independientes, entonces la variable
aleatoria
U/m
V/n
F
(m,n)
. (8.24)
8.9. EJERCICIOS 85
Del resultado anterior se puede deducir que si X F
(m,n)
entonces Y = X
1
F
(n,m)
.
Si X t
(k)
, entonces X
2
F
(1,k)
.
Ejemplo 76:
1. Si X F
(3,4)
, entonces P(X < 2) = 0.7436.
2. Si X F
(7,7)
, entonces P(X > 3) = 1 P(X < 3) = 1 0.9148 = 0.0852.
3. Si X F
(8,4)
y P(X < x
0
) = 0.2, entonces x
0
= 0.52.

8.9. Ejercicios
1. El tiempo en minutos que tiene que esperar un cliente para ser atendido en una tienda
es una variable con distribucion uniforme en el intervalo (0, 8). Cual es la probabilidad
de que un cliente tenga que esperar mas de 5 minutos? (Rpta.: 0.375)
2. El sueldo de los nuevos empleados en una empresa es una variable aleatoria con distri-
bucion uniforme en el intervalo [1, 2] en miles de soles.
(a) Cual es la probabilidad de que un empleado ingrese con un sueldo de entre 1600
y 1800 soles? (Rpta.: 0.2)
(b) Cual es la probabilidad de que un empleado ingrese con un sueldo de mas de 1200
soles si se ha escuchado por ah que no ganara mas de 1500? (Rpta.: 0.6)
3. Sea la variable aleatoria X U(a, b). Demuestre que la varianza de X esta dada por
(ba)
2
12
.
4. En un programa concurso tienen una rueda dividida en varias secciones, cada una con
un premio diferente. Los concursantes giran la rueda y se llevan el premio que queda
indicado por la echa de la rueda una vez que esta se detiene. Si denimos como X al
angulo en grados formado por la echa y un radio de referencia, entonces podramos
asumir que X tiene una distribucion uniforme en el intervalo (0, 360).
(a) Si los organizadores del concurso colocan un premio fabuloso en la seccion com-
prendida entre los grados 10 y 30, cual es la probabilidad de que un concursante
se lleve dicho premio? (Rpta.: 0.05556)
(b) Suponga que los organizadores dividen la rueda en cuatro partes iguales de la
siguiente manera: El primer cuarto con un premio de 500 soles, el segundo cuarto
con un premio de 100 soles, el tercer cuarto con un premio de 20 soles y el cuarto
cuarto sin premio. Calcule el valor esperado del premio para un concursante. (Rpta.:
155 soles)
(c) Considere que un cuarto de la rueda no tiene premio y los otros 3 cuartos s. Si
en un programa dado participan 8 personas, cual es la probabilidad de que 2 se
queden sin premio? (Rpta.: 0.3115)
86 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


5. El tiempo empleado en minutos, en ir de un hotel al aeropuerto por la ruta A, se
distribuye normalmente con media 27 minutos y desviacion estandar 5 minutos; mientras
que por la ruta B, la distribucion es normal con media 30 minutos y desviacion estandar
igual a 2 minutos.
(a) Determine que ruta conviene utilizar si se dispone de 34 minutos. (Rpta.: Ruta B)
(b) Dos amigos salen al mismo tiempo del hotel rumbo al aeropuerto, uno por la ruta
A y el otro por la ruta B. Cual es la probabilidad de que el que siguio la ruta A
llegue primero? (Rpta.: 0.7113)
6. Se estima que, aproximadamente, la demanda semanal de gasolina en una estacion de
servicio esta normalmente distribuida, con una media de 1000 y una desviacion estandar
de 50 galones. La estacion se abastece de gasolina una vez a la semana. Cual debe ser la
capacidad de su tanque, si la probabilidad de que se termine la gasolina en una semana
dada no debe ser mayor de 0.01? (Rpta.: Al menos 1116.32 galones)
7. Suponga que X, la resistencia a la ruptura de una cuerda (en libras), tiene una distri-
bucion N(100, 16). Cada cuerda produce una utilidad de S/.40 si X > 95. Si X < 95
la cuerda puede utilizarse con un objetivo diferente y solo se obtiene una utilidad de
S/.25. Encuentre la utilidad esperada por cuerda. (Rpta.: 38.42 soles)
8. El bar Los Buenos Amigos instala una maquina automatica para la venta de cerveza.
La maquina puede regularse de modo que la cantidad media por vaso sea la que se desee.
Sin embargo, en cualquier caso, la cantidad por vaso tendra una distribucion normal
con desviacion estandar de 10 ml. A que nivel debe ajustarse la maquina para que el
85 % de los vasos de cerveza contengan menos de 300 ml? (Rpta.: 289.64 ml)
9. La longitud en centmetros de las piezas fabricadas por una maquina sigue una distri-
bucion N(9, 0.03
2
). La especicacion para la longitud de las piezas es 9 0.05cm.
(a) Que porcentaje de piezas seran defectuosas? (Rpta.: 9.558 %)
(b) Cual sera la desviacion estandar maxima permitida para que no haya mas del 1 %
de defectuosas? (Rpta.: 0.01941)
10. Los costos de mantenimiento semanal de cierta fabrica registrados durante un largo
periodo y ajustados por la inacion, tienen aproximadamente una distribucion normal
con una media de 1680 soles. Ademas, se conoce que la probabilidad de que el costo de
una semana supere los 2000 soles es 0.16.
(a) Hallar la probabilidad de que el costo de una semana se diferencie de la media en
no mas de 150 soles. (Rpta.: 0.3589)
(b) Cual sera el costo semanal maximo que se observara en una semana con probabi-
lidad 0.75? (Rpta.: 1897 soles)
11. Suponga que una fabrica produce bateras cuyo tiempo de vida es una variable con
distribucion normal con una media de 600 minutos y una desviacion estandar de 20
minutos.
(a) Cual es la probabilidad de que una batera dure mas de 610 minutos? (Rpta.:
0.3085)
8.9. EJERCICIOS 87
(b) Cual es la probabilidad de que una batera tenga un tiempo de vida que se dife-
rencie de la media en menos de 15 minutos. (Rpta.: 0.5467)
(c) Si se seleccionan 8 bateras al azar, cual es la probabilidad de que al menos 6
duren mas de 605 minutos? (Rpta.:0.0506)
12. El potasio es un mineral muy importante para el cuerpo humano. Suponga que en cierta
comunidad el nivel de potasio para una persona adulta tiene distribucion normal con
media 3.5 mEq/L y desviacion estandar 0.3 mEq/L.
(a) Si una persona se somete a una prueba preliminar la cual determina que su nivel
de potasio es a lo mas 4, cual es la probabilidad de que su nivel de potasio este
entre 3 y 3.5mEq/L? (Rpta.: 0.4749)
(b) Si una persona adulta tiene un nivel de potasio menor de 3mEq/L se dice que sufre
de hipopotasemia. Si se seleccionan al azar 8 adultos, cual es la probabilidad de
que exactamente uno sufra de hipopotasemia? (Rpta.: 0.2714)
(c) A las personas con el 10 % mas alto de nivel de potasio se las sometera a una dieta
para bajarles dicho nivel. Cual es el nivel de potasio mnimo en un adulto para
ser incluido en la dieta? (Rpta.: 3.884)
13. Una bombilla se considera de optima calidad si su duracion es superior a 140 horas.
Podemos suponer que la duracion de cada bombilla sigue una distribucion normal con
media 120 horas y varianza 45 horas
2
.
(a) Si una bombilla elegida al azar dura mas de 110 horas, cual es la probabilidad de
que dure a lo mas 128 horas?
(b) Cuantas bombillas debemos incluir en un lote para que la probabilidad de encon-
trar al menos una de optima calidad sea superior a 0.95?.
14. El tiempo de vida de una unidad de memoria tiene una distribucion exponencial con
una desviacion estandar de 10 mil horas.
(a) Si se selecciona una memoria al azar, cual es la probabilidad de que siga funcio-
nando despues de 15 mil horas? (Rpta.: 0.2231)
(b) Si se seleccionan 1000 memorias al azar, cuantas de ellas se espera que sigan
funcionando despues de 15 mil horas? (Rpta.: 223)
(c) Si se selecciona una memoria al azar, cual es la probabilidad de que dure entre 11
mil y 14 mil horas? (Rpta.: 0.08627)
15. Una fuente radioactiva emite partculas siguiendo una distribucion de Poisson con una
tasa media de 0.5 partculas por segundo.
(a) Cual es la probabilidad de que sean emitidas mas de 3 partculas en 10 segundos?
(Rpta.: 0.7350)
(b) Si se observan 10 intervalos de 10 segundos cada uno, cual es la probabilidad de
que exactamente en 4 de estos 10 intervalos sean emitidas mas de 3 partculas?
(Rpta.: 0.02123)
(c) Cual es la probabilidad de que pasen 2 segundos y no se observe ninguna partcula?
(Rpta.: 0.3679)
88 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


(d) Si ya pasaron dos segundos y no se observo partcula alguna, cual es la probabi-
lidad de que pase un segundo adicional y aun no se observe nada? (Rpta.: 0.6065)
(e) Cual es la probabilidad de que pasen mas de 10 segundos antes de observar la
cuarta partcula? (Rpta.: 0.2650)
16. Se sabe que en el centro de Lima ocurre, en promedio, un asalto cada dos minutos entre
las 18:00 y 20:00 horas seg un un proceso de Poisson.
(a) Mara sale de su trabajo a las 18:30 y debe caminar desde la Plaza San Martn
hasta la Av. Tacna. Si el trayecto le toma 4 minutos, cual es la probabilidad de
que Mara llegue a su paradero sin que haya ocurrido alg un asalto en la zona?
(Rpta.: 0.1353)
(b) Cual es la probabilidad de que tengan que pasar mas de 4 minutos para que
ocurran 8 asaltos? (Rpta.: 0.9989)
(c) Suponga que la municipalidad ha instalado camaras de seguridad que monitorean
toda la zona. Si el encargado de control lleva 5 minutos observando y aun no ha
visto ning un asalto, cual es la probabilidad de que tenga que esperar al menos dos
minutos adicionales para observar el primero?
(d) La municipalidad estima que por cada asalto se genera una perdida para la sociedad
equivalente a 500 soles. Calcule la perdida esperada para un da cualquiera entre
las 18:00 y las 20:00 horas. (Rpta.: 30000 soles)
17. Suponga que la variable aleatoria X tiene una distribucion exponencial con parametro
, esto es, f(x) =
1
exp(x/). Demuestre que E(X) = .
18. Un fabricante de motores estima que el tiempo de vida de sus motores, en miles de
horas, tiene una distribucion de Weibull con parametros = 1.5 y = 8.
(a) Calcule la media y la varianza de X. (Rpta.: E(X) = 7.222, V (X) = 24.044)
(b) Cual es la probabilidad de que un motor elegido al azar dure entre 5 y 6 mil horas?
(Rpta.: 0.08782)
(c) Cual es la probabilidad de que un motor elegido al azar dure mas de 7 mil horas?
(Rpta.: 0.4411)
(d) El fabricante quiere garantizar sus motores por k horas de modo tal que solo tenga
que responder con la garanta al 1 % de sus clientes. Calcule k. (Rpta.: 372.57
horas)
19. Un fabricante de electrodomesticos tiene tres proveedores de circuitos integrados. Se
sabe que el tiempo de vida de estos circuitos en miles de horas sigue una distribucion
de Weibull con parametros = 0.8 y = 15 para el proveedor A, = 1 y = 17 para
el proveedor B, y = 1.2 y = 16 para el proveedor C.
(a) Calcule la media y la varianza del tiempo de vida de los circuitos del proveedor B.
(Rpta.: E(X) = 17, V (X) = 289)
(b) Suponga que el 20 % de los circuitos provienen del proveedor A, el 30 % del pro-
veedor B y el 50 % restante del proveedor C. Si se escoge un circuito al azar, cual
es la probabilidad de que dure mas de 15 000 horas? (Rpta.: 0.3959)
8.9. EJERCICIOS 89
(c) Suponga que cierto componente electrico consta de dos circuitos, uno del tipo A
y uno del tipo B, y que para que el componente funcione correctamente ambos
circuitos deben estar operativos. Si el tiempo de vida de los dos circuitos es in-
dependiente el uno del otro, cual es la probabilidad de que el electrodomestico
funcione correctamente por mas de 14 000 horas? (Rpta.: 0.1704)
20. Suponga que la variable aleatoria X tiene distribucion N(3, 4).
(a) Encontrar el n umero c tal que P(X > c) = 2P(X < c). (Rpta.: 2.1386)
(b) Si se extrae una muestra aleatoria de tama no 6, calcule
P
_
6

i=1
(x
i
x)
2
5
< 9
_
(Rpta.: 0.9534)
21. Si de una poblacion normal con media y varianza 10 se extrae una muestra aleatoria
de 13 observaciones, hallar h tal que
P
_
13

i=1
(x
i
)
2
< h
_
= 0.7
(Rpta.: 151.19)
22. Dadas las variables aleatorias independientes X
2
(30)
, Y
2
(20)
y Z N(0, 1),
calcule lo siguiente:
(a) Los lmites del 90 % central de la distribucion de X. (Rpta.: 18.49 y 43.77)
(b) El valor de k tal que P(|Z| > k) = 0.08. (Rpta.: k = 1.751)
(c) P
_
0.45 <
Y/20
X/30
< 2.1
_
. (Rpta.: 0.9348)
(d) El valor de c tal que P(c < X +Y < 65) = 0.8715. (Rpta.: c = 35)
23. Sea la variable aleatoria X que tiene distribucion N(0, 25). Se extrae aleatoriamente una
muestra de tama no 2 cuyos valores seran denotados por X
1
y X
2
. Calcule P(X
2
1
+X
2
2
<
11). (Rpta.: 0.1975)
24. Si W
2
(18)
y X t
(6)
. Hallar:
(a) W
0
tal que P(14.44 < W < W
0
) = 0.68. (Rpta.: 32.35)
(b) k tal que P(X < 2k) = 0.9. (Rpta.: 0.7199)
25. Suponga que la variable aleatoria X tiene una distribucion ji-cuadrado con 3 grados de
libertad, la variable aleatoria Y tiene una distribucion t de Student con 7 grados de
libertad y que la variable aleatoria Z tiene una distribucion normal estandar. Suponga
tambien que X, Y y Z son variables independientes. Calcule lo siguiente:
(a) P(Y < 1). (Rpta.: 0.8247)
(b) P
_
Z
2
X
> 2
_
. (Rpta.: 0.09172)
90 CAP

ITULO 8. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS


(c) El valor k tal que P(X < k) = 0.6. (Rpta.: 2.946)
26. Se tienen dos distribuciones normales e independientes con medias desconocidas y va-
rianzas
2
A
= 9 y
2
B
= 5. Hallar para muestras de tama nos n
A
= 10 y n
B
= 11, k
1
y k
2
tal que
P
_
k
1
<
s
2
B
s
2
A
< k
2
_
= 0.94 y P
_
s
2
B
s
2
A
< k
1
_
= 0.01.
(Rpta.: k
1
= 0.1124, k
2
= 1.7429)
Bibliografa
[1] Barreno, E., Chue, J., Millones, R., Vasquez, F., Castillo, C. (2007). Estadstica Descrip-
tiva y Probabilidades. Universidad de Lima, fondo editorial.
[2] Montgomery, D.C. (2000). Design and Analysis of Experiments. Wiley.
[3] Montgomery, D.C., Runger, G.C. (2002). Probabilidad y Estadstica Aplicada a la Inge-
niera. Limusa-Wiley.
[4] R Development Core Team (2011). R: A language and environment for statistical com-
puting. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0,
URL http://www.R-project.org.
[5] Trosset, M. W. (2005). An Introduction to Statistical Inference and Its Applications with
R. Chapman and Hall.
[6] Tufte, E. R. (2001). The Visual Display of Quantitative Information, second edition.
Graphics Press, Cheshire, Conn.
91

Vous aimerez peut-être aussi