Vous êtes sur la page 1sur 105

U.N.A.

UNIVERSIDAD NACIONAL DE CAAGUAZÚ

INGENIERÍA

CORONEL OVIEDO - PARAGUAY


Estdı́stica y Probabilidades

ERNESTO SILVERO LAZAGA

CORONEL OVIEDO − PARAGUAY


Año 2017
Índice general

1. Introducción a la Estadı́stica 3
1.1. Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. Estadı́stica Descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Construcción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Representaciones gráficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2. Medidas de Tendencia Central 15


2.1. La Media Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4. Otras medidas de Centralización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.1. Media Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.2. Media Cuadrática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.3. Media Armónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5. Generalizaciones de la media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3. Medidas de posición no central (Cuantiles) 21

4. Medidias de Dispersión 22
4.1. Varianza y Desviación Tı́pica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2. Otras medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.3. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.4. Medidas de apuntamiento o curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.5. Otras medidas caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.6. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

5. Probabilidad 26
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.2. Espacio probabilı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.2.1. Experimentos y sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.3. Técnicas de Conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.1. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.2. Permutaciones con repeticiones . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.3. Pruebas ordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.4. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3.5. Diagramas de árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3.7. Definiciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4. Teoremas de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4.1. Regla de la Adición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4.2. Regla de la complementación . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.4.3. Regla de Diferenciación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.4.4. Reglas de Multiplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.4.5. Probabilidad condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.4.6. Teorema de las probabilidades totales . . . . . . . . . . . . . . . . . . . . . . . 32
5.4.7. Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.5. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

6. Variables aleatorias 36
6.1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6.2. Distribución de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.2.1. Propiedades de la función de probabilidad . . . . . . . . . . . . . . . . . . . . 37
6.2.2. Propiedades de la función de densidad de probabilidad . . . . . . . . . . . . . 39
6.2.3. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

1
ÍNDICE GENERAL U.N.A.

6.2.4. Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43


6.3. Esperanza, varianza y momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.3.1. Esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
6.3.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
6.3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
6.4. Función generadora de momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
6.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

7. Distribuciones de probabilidad 57
7.1. Distribuciones discretas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.1. Distribución Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.2. Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.1.3. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.1.4. Distribución geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.1.5. Distribución binomial negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.1.6. Construcción de una distribución binomial negativa . . . . . . . . . . . . . . . 63
7.1.7. Distribución hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2. Distribuciones continuas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.2.1. Distribución uniforme continua . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.2.2. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.2.3. Distribución ji−cuadrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
7.2.4. Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.2.5. Distribución exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


Capı́tulo 1

Introducción a la Estadı́stica

La palabra estadı́stica se origina, en las técnicas de recolección, organización, conservación,


y tratamiento de los datos propios de un estado, con que los antiguos gobernantes controlaban
sus súbditos y dominios económicos. Estas técnicas evolucionaron a la par con el desarrollo de las
matemáticas, utilizando sus herramientas en el proceso del an álisis e interpretación de la información.
Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin ma-
yores restricciones legales. El febril jugador De Méré consultó al famoso matemático y filosofo Blaise
Pascal (1623−1662) para que le revelara las leyes que controlan el juego de los dados, el cual, intere-
sado en el tema, sostuvo una correspondencia epistolar con el tı́mido Pierre de Fermat (1601−1665,
funcionario público apasionado por las matemáticas; célebre porque no publicaba sus hallazgos) dan-
do origen a la teorı́a de la probabilidad, la cual se ha venido desarrollando y constituyéndose en la
base primordial de la estadı́stica1 .
El papel de la Estadı́stica en la Ciencia y la Ingenierı́a hoy en dı́a es crucial, fundamen-
talmente porque al analizar datos recopilados en experimentos de cualquier tipo, se observa en la
mayorı́a de las ocasiones que dichos datos están sujetos a algún tipo de incertidumbre. El investigador
o el profesional debe tomar decisiones respecto de su objeto de análisis basándose en esos datos, para
lo cual debe dotarse de herramientas adecuadas.
Es transversal a una amplia variedad de disciplinas, desde la fı́sica hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas
de negocios o instituciones gubernamentales.
Algunos estadı́sticos famosos: Thomas Bayes, Pafnuti Chebyshov, David Cox, Gertrude
Cox, George Dantzig, René Descartes, W. Edwards Deming, Bruno de Finetti, Sir Ronald Fisher,
Sir Francis Galton, Carl Friedrich Gauss, William Sealy Gosset, Andréi Kolmogórov, Aleksandr Lya-
punov, Abraham De Moivre, Sir Isaac Newton, Jerzy Neyman, Florence Nightingale, Blaise Pascal,
George Box, Karl Pearson, Adolphe Quetelet, C. R. Rao, Ernst Georg Ravenstein, Walter Shewhart,
Charles Spearman, John Tukey, Milton Friedman y varios más 2 .

1.1. Estadı́stica

Es la ciencia que se ocupa de la ordenación y análisis de datos procedentes de muestras y


de la realización de inferencias acerca de las poblaciones de las que éstas proceden. Es la ciencia que
estudia los fenómenos aleatorios3 .
La Estadı́stica se divide en dos grandes áreas (descripción de datos y realización de inferen-
cias) que reflejan la propia historia del desarrollo de esta ciencia. La Estadı́stica actual es el producto
del encuentro de dos ramas distintas del saber, la antigua estadı́stica y el cálculo de probabilidades,
que se encontraron en el siglo XIX.

1.1.1. Estadı́stica Descriptiva

El objetivo de la Estadı́stica descriptiva es estudiar procedimientos para sintetizar la infor-


mación contenida en un conjunto de datos ofreciendo un resumen numérico o gráfico del estado de
las cosas. Precisamente, de este concepto viene el nombre de Estadı́stica que procede del latı́n status
1 Estadı́stica Aplicada (N. Guarı́n S.,2002)
2 Wikipedia
3 Estadı́stica y Probabilidad (Cesar Amarilla,2010)

3
1.1. ESTADÍSTICA U.N.A.

y parte de la necesidad de conocer el entorno en que nos movemos midiendo elementos individuales
para obtener conclusiones generales aplicables a todo el conjunto.
Esta sección velara por los procedimientos para resumir la información de una caracterı́stica
que se pueda observar en los elementos individuales (Estadı́stica descriptiva unidemensional).
Conceptos Básicos

Población : Conjunto de personas, objetos o acontecimientos sobre los que queremos obtener
una conclusión. Que portan información sobre el fenómeno que se estudia. Para inferir algo
acerca de una población, usualmente tomamos una muestra de ella.

Muestra: Subconjunto de la población de interés (que representa adecuadamente a la misma).

Variables
Son las caracterı́sticas (o atributos) que se pueden observar o estudiar en los individuos de
la población. Susceptibles de adoptar distintos valores o ser expresados en categorı́as, es un aspecto
especifico de la realidad referido a la unidad del análisis y puede ser medidos o cuantificados.
ejeas siguientes caracterı́sticas son ejemplos de variables:
L. • Estatura de las personas

• Edad de los niños

• El precio y la demanda de un producto

Según el tipo de caracterı́stica a medir se pueden clasificar en:

Cualitativas nominales: Miden caracterı́sticas que no toman valores numéricos. A estas


caracterı́sticas se les llama modalidades o atributos. es decir una caracterı́stica que no puede
ser medido sino solo catalogarse.
ejeas siguientes caracterı́sticas son ejemplos de variables cualitativas nominales:
L. • Lugar de nacimiento
• Religión
• Color de ojos

Cualitativas ordinales: Miden caracterı́sticas que no toman valores numéricos pero sı́ pre-
sentan entre sus posibles valores una relación de orden.
ejeas siguientes caracterı́sticas son ejemplos de variables cualitativas ordinales:
L. • Nivel de estudios: sin estudios, primaria, secundaria, etc.
• Calificaciones de exámenes: regular, bueno, exelente, etc
• Exposición a un contaminante: nulo, leve, moderado, etc.

Cuantitativas discretas: Las variables discretas pueden asumir solo ciertos valores, toman
un número discreto de valores (en el conjunto de números naturales) y hay usualmente huecos
entre los valores (valores puntuales).
ejeas siguientes caracterı́sticas son ejemplos de variables cuantitativas discretas:
L. • Número de hijos de una familia.
• Goles en un partido de fútbol.
• Número de estudiantes en la clase de estadı́sticas, etc.

Cuantitativas continuas: Toman valores numéricos dentro de un intervalo real (dentro de


un rango especı́fico).
ejeas siguientes caracterı́sticas son ejemplos de variables cuantitativas continuas:
L. • Altura
• Peso
• Concentración de un elemento, etc.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


1.1. ESTADÍSTICA U.N.A.

La estadı́stica no realiza sus funciones directamente sobre las modalidades observadas, sino
que éstas se representan por números, y la estadı́stica realiza sus funciones sobre esos números.
Se denomina medición al proceso de atribuir números a las caracterı́sticas. La medición estudia
las condiciones de construcción de representaciones numéricas, y los modelos desarrollados para la
medición se llaman escalas. Por lo tanto los datos se pueden clasificar de acuerdo con niveles de
medición. Hay cuatro escalas de medición que son: nominal, ordinal, de intervalo y de razón.
Escala Nominal
El término nivel nominal es normalmente usado para referirse a datos que solamente pueden
clasificarse en categorı́as. Es la escala de medición más bajo o más primitiva. Sin embargo, no hay
mediciones y no hay escalas involucradas, solo hay conteo. En este tipo de nivel de medición el orden
en que están acomodadas las categorı́as es totalmente arbitrario.
Escala Ordinal
Este tipo de nivel de medición tiene caracterı́sticas similares al nivel nominal con la dife-
rencia de que en el nivel ordinal las categorı́as indican que unas son más que las otras.
Escala cuantitativa intervalar
En este nivel de medición, las categorı́as están definidas por intervalos de valores, y están
acomodadas en orden a la magnitud de los valores. El tamaño de los intervalos es el mismo.
Propiedades de la escala de intervalos

a) Las categorı́as de datos son mutuamente excluyentes y exhaustivas.

b) Las categorı́as de datos están ordenadas de acuerdo con la cantidad de la caracterı́sticas que
poseen.

c) Diferencias iguales en la caracterı́stica están representadas por diferencias iguales en los números
asignados a las categorı́as.

Escala cuantitativa Racional


La escala de razón es el de nivel más alto. En este nivel al igual que en el nivel intervalar,
las categorı́as son del mismo tamaño. La diferencia es que este nivel tiene un punto cero significativo
y el valor de las categorı́as es en relación a ese punto, por lo que la relación entre dos números tiene
sentido.
Propiedades de la escala de Razón

a) Las categorı́as de datos son mutuamente excluyentes y exhaustivas.

b) Las categorı́as de datos están ordenadas de acuerdo con la cantidad de las caracterı́sticas que
poseen.

c) Diferencias iguales en la caracterı́stica están representadas por diferencias iguales en los números
asignados a las categorı́as.

d) El punto cero refleja la ausencia de estas caracterı́sticas.

Observación

Mutuamente excluyentes: Un individuo, objeto o medición pertenece únicamente a una categor


ia.

Exhaustivas: Cada individuo, objeto o medición debe pertenecer a una de las categorı́as.

La estadı́stica descriptiva hace énfasis en tres aspectos:

La forma de la distribución: Para describir como están distribuidos los datos utiliza una
herramienta llamada distribución de frecuencia y presenta la información por medio de tablas
y gráficas.

Las medidas de tendencia central: que resumen la información a una cifra que es repre-
sentativa de la serie de datos.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


1.2. CONSTRUCCIÓN U.N.A.

Frecuencia frecuencia Frecuencia


Variables frecuencia Acumulada relativa relativa acumulada
Xi fi Fa fr fra
X1 f1 f1 f1 /n f1 /n
X2 f2 f1 + f2 f2 /n ( f1 + f2 )/n
.. .. .. .. ..
. . . . .
Xi fi f1 + f2 + . . . + fi fi /n ( f1 + . . . + fi )/n
.. .. .. .. ..
. . . . .
Xm fm f1 + f2 + . . . + fm = n fm /n ( f1 + . . . + fm )/n = 1
n 1

Cuadro 1.1: Forma General de Representar Frecuencias

Las medidas de variabilidad: que nos indican que tan variables son los datos respecto a las
medidas de tendencia centra.

En este capı́tulo se presenta una manera de elaborar una distribución de frecuencia, en las
secciones siguientes se abordarán los temas de medidas de tendencia central y medidas de variabilidad.

1.2. Construcción

Una distribución de frecuencias es una serie de datos agrupados en categorı́as, en las cuales
se muestra el número de observaciones que contiene cada categorı́a. Los pasos para la construcción de
una distribución de frecuencias son mejor explicados con un ejemplo. Pero antes algunas definiciones
importantes.
Frecuencias
El primer método para resumir una muestra de tamaño n{x1 , ..., xn } de una variable esta-
dı́stica X, que presenta las modalidades c1 , ..., cm , es calcular la tabla de frecuencias. Como su nombre
indica es una tabla donde se presentan las modalidades observadas y sus frecuencias de aparición:
Frecuencia Absoluta: Número de veces que aparece la modalidad. Se denotará por

ni , donde 0 ≤ ni ≤ n

Frecuencia Absoluta Acumulada: Número de veces que aparece la modalidad o valores inferiores.
Se denotará por

Ni , donde 0 ≤ Ni ≤ n, y Ni−1 ≤ Ni , Nm = n

Frecuencia Relativa: Tanto por uno de las veces que aparece la modalidad.
ni
fi = , donde 0 ≤ fi ≤ 1
n
Frecuencia Relativa Acumulada: Tanto por uno de las veces que aparece la modalidad o valores
inferiores.
Ni
Fi = , donde 0 ≤ Fi ≤ 1, y Fi−1 ≤ Fi , Fm = 1
n

En muchos casos se hace necesario el agrupamiento en intervalos o clases que haga más
compacta, manejable y presentable la información.
El número de clases y la amplitud de los intervalos los fija el investigador de acuerdo con el
conocimiento que posea de la población, la necesidad de hacer comparación con otras investigaciones
y la presentación de la información. Sin embargo, se recomienda que la información no sea demasiado
compacta, lo cual le restarı́a precisión, ni demasiado dispersa, ya que no se tendrı́a claridad.
En términos generales, es usual que el número de intervalos no sea inferior a 5 ni superior
a 15. Struges propone que el número de clases o intervalos sea determinado por la expresión.

m∼
= 1 + 3, 322log10 N
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
1.2. CONSTRUCCIÓN U.N.A.

Intervalos Marca de Clase


[e1 . . . e2 ] x1 = (e1 +e
2
2)

[e3 . . . e4 ] x2 = (e3 +e
2
4)

.. ..
. .
(e j +e j+1 )
[e j . . . e j+1 ] xj = 2

Cuadro 1.2: Forma General de Representar Intervalos

La amplitud debe ser igual para todos los intervalos y, en lo posible, no se debe trabajar con clases
abiertas.
Reglas empı́ricas para la construcción de intervalos
Cuando no se tiene experiencia en el manejo de la información es aconsejable seguir los
pasos que se dan a continuación:
Determinar los datos de mayor y menor valor Xmax , Xmin .

Calcular el rango o recorrido R = Xmax − Xmin

Determinar el número de intervalos (m) y la amplitud de clase (A), m ∼


= 1 + 3, 322log10 N.
R
Debe tenerse presente que m es un número natural. Luego se busca la amplitud A : A > m

Calcular el rango ampliado Ra = m.A

Establecer la diferencia a = Ra − R , es decir la cantidad en que ha sido alterado el recorrido,


la cual no debe ser superior a la amplitud.

También puede ser definida como la cantidad positiva más pequeña que le hace falta al rango
o recorrido para ser divisible exactamente por la amplitud.

Distribuir adecuadamente la cantidad a de la siguiente manera.


Al valor Xmin se le resta aproximadamente a2 y la parte restante se le suma a Xmax , obteniendo
el lı́mite inferior del primer intervalo y el lı́mite superior del último, respectivamente.
a
Xmin − ∼
= = Lı́mite inferior del primer intervalo
2
a
Xmax + ∼
= = Lı́mite superior del último intervalo
2
Tener en cuenta que en el caso de agrupamiento de datos, Xi es la semisuma de lı́mite inferior
y lı́mite superior.

Con el fin de prever dobles conteos, quien clasifica deberá especificar si los intervalos son
abiertos a la derecha o abiertos a la izquierda, o cerradas ambas, en estas notas, trabajaremos
con intervalos cerrados; es decir, del tipo a ≤ X ≤ b , donde el lı́mite superior está incluido
dentro de la clase.

El conjunto de datos airquality dispone de medidas de calidad del aire en Nueva York con
las variables cuantitativas Ozone (ozono en ppb), Solar.R (radiación solar en langleys), Wind (viento
en mph), Temp (temperatura en F). En la tabla siguiente se muestra la tabla de frecuencias agrupada
en 10 clases para la variable Temp.

> temper <- (airquality$Temp)


> temper

[1] 67 72 74 62 56 66 65 59 61 69 74 69 66 68 58 64 66 57 68 62 59 73 61 61 57
[26] 58 57 67 81 79 76 78 74 67 84 85 79 82 87 90 87 93 92 82 80 79 77 72 65 73
[51] 76 77 76 76 76 75 78 73 80 77 83 84 85 81 84 83 83 88 92 92 89 82 73 81 91
[76] 80 81 82 84 87 85 74 81 82 86 85 82 86 88 86 83 81 81 81 82 86 85 87 89 90
[101] 90 92 86 86 82 80 79 77 79 76 78 78 77 72 75 79 81 86 88 97 94 96 94 91 92
[126] 93 93 87 84 80 78 75 73 81 76 77 71 71 78 67 76 68 82 64 71 81 69 63 70 77
[151] 75 76 68
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
1.2. CONSTRUCCIÓN U.N.A.

Marca Frecuencia frecuencia Frecuencia


Intervalos de clase frecuencia Acumulada relativa relativa acumulada
[e j . . . e j+1 ] Xi fi Fa fr fra
[56 . . . 60] 58 8 8 0.05 0.05
[61 . . . 65] 63 10 18 0.07 0.12
[66 . . . 70] 68 15 33 0.10 0.22
[71 . . . 75] 73 19 52 0.12 0.34
[76 . . . 80] 78 33 85 0.22 0.56
[81 . . . 85] 83 34 119 0.22 0.78
[86 . . . 90] 88 20 139 0.13 0.91
[91 . . . 95] 93 12 151 0.08 0.99
[96 . . . 100] 98 2 153 0.01 1
153 1

Cuadro 1.3: Ejemplo de Intervalos y Frecuencias

En primer lugar es bueno ordenar los datos como mejor convenga en este caso, de menor a
mayor.

> sort(temper)

[1] 56 57 57 57 58 58 59 59 61 61 61 62 62 63 64 64 65 65 66 66 66 67 67 67 67
[26] 68 68 68 68 69 69 69 70 71 71 71 72 72 72 73 73 73 73 73 74 74 74 74 75 75
[51] 75 75 76 76 76 76 76 76 76 76 76 77 77 77 77 77 77 77 78 78 78 78 78 78 79
[76] 79 79 79 79 79 80 80 80 80 80 81 81 81 81 81 81 81 81 81 81 81 82 82 82 82
[101] 82 82 82 82 82 83 83 83 83 84 84 84 84 84 85 85 85 85 85 86 86 86 86 86 86
[126] 86 87 87 87 87 87 88 88 88 89 89 90 90 90 91 91 92 92 92 92 92 93 93 93 94
[151] 94 96 97

Calculando las empı́ricas para la construcción de intervalos

Determinar los datos de mayor y menor valor Xmax = 97, Xmin = 56.

Calcular el rango o recorrido R = Xmax − Xmin = 97 − 56 = 41

El número de intervalos (m) y la amplitud de clase (A), m ∼


= 1 + 3, 322log10 (153) ∼
= 8.
R 41
Debe tenerse presente que m es un número natural. A : A > m = 8 =5

Calcular el rango ampliado Ra = m.A = 8 ∗ 6 = 48

Establecer la diferencia a = Ra − R = 48 − 41 = 7 , es decir la cantidad en que ha sido alterado


el recorrido, la cual no debe ser superior a la amplitud. Distribuir adecuadamente la
cantidad a de la siguiente manera. Al valor Xmin se le resta aproximadamente 2a y la parte
restante se le suma a Xmax , obteniendo el lı́mite inferior del primer intervalo y el lı́mite superior
del último, respectivamente.
a
Xmin − ∼
= = 56 − 3,5 = 52 Lı́mite inferior del primer intervalo
2
a
Xmax + ∼
= = 97 + 3,5 = 100 Lı́mite superior del último intervalo
2
Tener en cuenta que en el caso de agrupamiento de datos, Xi es la semisuma de lı́mite inferior
y lı́mite superior entonces x1 = (56 + 60)/2 = 58.

Construir los intervalos, calcular los puntos medios o marcas de clase y hacer el agrupamiento
de frecuencias. Por cuestiones de concordancia con el programa R vamos a ajustar el número
de intervalos en diez .

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


1.3. REPRESENTACIONES GRÁFICAS U.N.A.

1.3. Representaciones gráficas

Si la variable toma pocos valores diferentes o es cualitativa, entonces para representar la


distribución de frecuencias no acumuladas se utiliza:

Diagrama de barras: Consiste en un gráfico cartesiano en el que se dibuja xi en abscisas y


ni (o fi ) en ordenadas dibujando barras verticales en cada punto xi de longitud ni (o fi ).

> t1 <- read.table("/home/ernesto/Documentos/paraclase 2017/estadisticauncaoviedo/Te


> attach(t1)
> barplot(frec,mclas,xlab="Temperature", names.arg = paste("", mclas, sep = ""),main
>

Barchart
30
25
20
Frequency

15
10
5
0

58 63 68 73 78 83 88 93 98

Temperature

Polı́gono de frecuencias: Igual que el diagrama de barras pero lo que se unen son los puntos
(xi , ni ) consecutivos.

> plot(t1$frec,type = "o",ylab="Frequency",xlab="Temperature", main="Frequency polyg

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


1.3. REPRESENTACIONES GRÁFICAS U.N.A.

Frequency polygon
35
30
25
Frequency

20
15
10
5

2 4 6 8

Temperature

Diagrama acumulativo de frecuencias: Se usa para representar frecuencias acumulativas.


Es como el diagrama de barras pero representando la frecuencia acumulada Ni en vez de la
frecuencia absoluta.

> plot(t1$frerltacm,type = "o",ylab="Frequency",xlab="Temperature", main="Cumulative

Cumulative Frequency Plot


1.0
0.8
0.6
Frequency

0.4
0.2

2 4 6 8

Temperature

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


1.3. REPRESENTACIONES GRÁFICAS U.N.A.

Histograma: Es la representación gráfica utilizada para las variables continuas. Es básicamente


fi
un diagrama de barras donde la altura de la barra es hi = , siendo li la longitud del intervalo o
li
clase. La función en R para obtenerlos es hist y además de poder dibujar el histograma, calcula
las marcas de clase y las frecuencias.

> utils::str(hist(airquality$Temp, col="gray", ylim = c(0,37),xlab = "Temperature" ,

List of 6
$ breaks : int [1:10] 55 60 65 70 75 80 85 90 95 100
$ counts : int [1:9] 8 10 15 19 33 34 20 12 2
$ density : num [1:9] 0.0105 0.0131 0.0196 0.0248 0.0431 ...
$ mids : num [1:9] 57.5 62.5 67.5 72.5 77.5 82.5 87.5 92.5 97.5
$ xname : chr "airquality$Temp"
$ equidist: logi TRUE
- attr(*, "class")= chr "histogram"

Histogram of airquality$Temp

34
33
30
Frequency

20
20

19

15
12
10
10

2
0

60 70 80 90 100

Temperature

Diagrama de sectores (gráfico de tarta): Se representa la frecuencia de cada modalidad


proporcionalmente al ángulo del sector que lo representa.

> library(colorspace, pos=10)


> pie(table(t1$frerlat), labels=levels(t1$mclas), main="Pie Chart", col = rainbow_hc
>

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


1.3. REPRESENTACIONES GRÁFICAS U.N.A.

Pie Chart

3
2

6 8

Pictograma: Se representa cada modalidad asociando un dibujo cuyo volumen (anchura/altura)


es proporcional a la frecuencia.

Diagrama de tallo y hojas: Los datos se redondean a dos o tres cifras significativas, tomán-
dose como tallo la primera o dos primeras cifras y como hojas las ultimas cifras. El tallo se
separa de las hojas por una lı́nea vertical. Ası́, cada tallo se representa una sola vez y el número
de hojas representa la frecuencia. La impresión resultante es la de acostar un histograma.

> stem(airquality$Temp)

The decimal point is at the |

56 | 0000
58 | 0000
60 | 000
62 | 000
64 | 0000
66 | 0000000
68 | 0000000
70 | 0000
72 | 00000000
74 | 00000000
76 | 0000000000000000
78 | 000000000000
80 | 0000000000000000
82 | 0000000000000
84 | 0000000000
86 | 000000000000
88 | 00000
90 | 00000
92 | 00000000
94 | 00
96 | 00

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


1.3. REPRESENTACIONES GRÁFICAS U.N.A.

Diagramas de caja: El diagrama de caja consta de una caja central que está delimitada por la
posición de los cuartiles Q3 y Q1 . Dentro de esa caja se dibuja la lı́nea que representa la mediana.
También ocasionalmente se puede representar la media dentro de la caja. De los extremos de
la caja salen unas lı́neas que se extienden hasta los puntos LI = máx{mı́n(xi ), Q1 − 1, 5(RI)} y
LS = mı́n{máx(xi ), Q3 + 1, 5(RI)} que representarı́an el rango razonable hasta el cual se pueden
encontrar datos. Los datos que caen fuera del intervalo (LI, LS) se consideran datos atı́picos
y se representan individualmente. La informacioń obtenida a partir de las medidas de
centralización, dispersión y forma se puede usar para realizar diagramas de caja (boxplots) que
visualmente nos proporcionen la información de cómo están distribuidos los datos. Damos como
ejemplo este grafico y después pasamos a explicar las medidas de tendencia central.

> boxplot(airquality$Temp, main = "Box Plot",col = 37 )


> points(mean(airquality$Temp))
> text(rep(1,5),boxplot.stats(airquality$Temp)$stats,c("LI","Q1","Med","Q3","LS"))
>

Box Plot

LS
90

Q3
80

Med

Q1
70
60

LI

Ejercicio1:
Una empresa de informática dedicada al análisis de virus en ordenadores, contabiliza los vi-
rus detectados con su producto en 20 ordenadores de domicilios particulares. Los resultados obtenidos
son los siguientes:
46 29 35 61 54 37 53
57 52 51 43 67 66 31
53 51 48 59 55 47

Construir una tabla con las frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas del conjunto de datos.

Dibujar un polı́gono de frecuencias y un histograma del número de virus.

Ejercicio2: Los datos siguientes corresponden al tiempo necesario para procesar 25 trabajos
en una CPU.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


1.3. REPRESENTACIONES GRÁFICAS U.N.A.

1.17 1.61 1.16 1.38 3.53 1.23 3.76


1.94 0.96 4.75 0.15 2.41 0.71 0.02
1.59 0.19 0.82 0.47 2.16 2.01 0.92
0.75 2.59 3.07 1.4

Construir una tabla con las frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas del conjunto de datos.

Dibujar un polı́gono de frecuencias y un histograma del número de virus.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


Capı́tulo 2

Medidas de Tendencia Central

A las medidas de tendencia central con frecuencia se les llama promedios. El propósito de
una medida de tendencia central es indicar con toda precisión el centro de un conjunto de observa-
ciones.

2.1. La Media Aritmética

Es la medida de tendencia central mas ampliamente usada y usualmente abreviada como


media.
La media aritmética de un conjunto de n valores (observaciones) es el resultado de la suma
de todos ellos dividido entre n.

1 n
x̄ = ∑ xi (2.1.1)
n i=1
Donde la expresión corresponde a tener todos los datos cuantitativos.

1 n
x̄ = ∑ fixi (2.1.2)
n i=1

Corresponde a datos agrupados donde:

x̄ : simboliza la media de la muestra.

xi : es el valor puntual y en caso de grupos la marca de clase del intervalo i−ésimo

∑ xi : es la suma de todos los valores de la muestra.


fi : es la frecuencia de clase del intervalo i−ésimo

∑ fi xi : es la suma de los productos de fi por xi .


n : es el número de elementos de la muestra.

∑ f = n : es la suma de las frecuencias de clase.

La media de la población Las medidas caracterı́sticas de una muestra son llamadas


estadı́sticos y las medidas caracterı́sticas de una población se denominan parámetros. La media de
la población se calcula de la misma manera que la media de la muestra, que calculamos arriba, pero
tiene diferente notación:

1 N
µ= ∑ Xi (2.1.3)
N i=1
Muy semejante 2.1.1
Donde :

µ : simboliza la media de la población.

∑ Xi : es la suma de todos los valores de la población.


N : es el número de elementos de la población.

15
2.2. MEDIANA U.N.A.

Propiedades de la media aritmética


Puede ser calculada en distribuciones con escala relativa e intervalar.
Todos los valores son incluidos en el cómputo de la media.
Una serie de datos solo tiene una media mı́n(xi ) ≤ x̄ ≤ máx(xi ) y tiene las mismas unidades que
los datos originales.
Es una medida muy útil para comparar dos o más poblaciones.
Es la única medida de tendencia central donde la suma de las desviaciones de cada valor
respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el
punto de balance de una serie de datos. También llamado el centro de gravedad de los datos.
n n n
∑ (xi − x̄) = 0; ∑ (xi − x̄)2 = mı́na∈R ∑ (xi − a)2
i=1 i=1 i=1

Desventajas de la media aritmética


Si alguno de los valores es extremadamente grande o extremadamente pequeño, la media no es
el promedio apropiado para representar la serie de datos.
No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.

Media truncada o recortada


Un inconveniente de la media aritmética es que un dato anómalo puede hacerla variar
mucho. La contribución de cada dato a la media es xi /n. Si yo me equivoco al medir o anotar el
dato xi y le sumo 1000 unidades más, el efecto que se produce en la media es que se desplaza 1000/n
unidades.
Para evitar este efecto se utiliza la media truncada que consiste en calcular la media
aritmética de un porcentaje central de los datos (esto es, eliminando un porcentaje de los datos más
bajos y de los más altos). Ası́ una media truncada al 10 % calcuları́a la media aritmética del 90 % de
los valores centrales despreciando el 5 % de los valores más bajos y el 5 % de los más altos.
La media recortada es un concepto parecido al anterior salvo que en vez de despreciar un
porcentaje de los valores más bajos y más altos lo que se hace es modificar estos valores. Se sustituyen
los valores más bajos por el más bajo de los valores centrales y los valores más altos por el más alto
de los valores centrales. Si en la muestra que hemos recogido no hay datos anómalos, la diferencia
entre la media truncada (o recortada) y la media aritmética debe ser pequeña. Estas medidas no
suelen utilizarse con valores agrupados.

2.2. Mediana

Se define la mediana (Me ) como aquel valor que, teniendo los datos ordenados de menor a
mayor, deja igual número de valores a su izquierda que a su derecha. Si el número de datos es par
se calcula como la media de los dos valores centrales. Si el número de datos es impar se toma como
mediana el valor central.
Si los datos se han agrupado se determina primero el intervalo mediano (aquel intervalo
donde la frecuencia relativa acumulada es menor o igual que 0,5 en su extremo inferior y mayor
que 0,5 en su extremo superior) para a continuación elegir un representante de este intervalo como
mediana (la marca de clase, LIi + li (0,5 − Fi−1 )/ fi , etc.).
Cuando los datos se encuentran agrupados en una distribución de frecuencia no conocemos
los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos :
Calcular el valor n/2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo
mediano).
Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es
igual o mayor que n/2.
Aplicando la siguiente fórmula con los valores del intervalo mediano:
 n −F 
2 aa
X̃ = LRI + A (2.2.4)
F
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
2.3. MODA U.N.A.

Donde:

X̃ : mediana de la muestra.

LRI : Limite real inferior del intervalo mediano.

Faa : frecuencia acumulada anterior a la frecuencia del intervalo mediano.

A : tamaño de los intervalos de clase.

F : frecuencia del intervalo mediano.

La mediana serı́a la medida de posición central más robusta (i.e. más insensible a datos
anómalos) y coincidirı́a con la media truncada al 100 %.
n n
Además la mediana verifica que ∑ |xi − Me| = mı́na∈R ∑ |xi − a|.
i=1 i=1

Propiedades de la mediana

Hay solo una mediana en una serie de datos.

No es afectada por los valores extremos ( altos o bajos )

Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se encuentra


en el intervalo abierto.

Puede ser calculada en distribuciones con escala relativa, intervalar, y ordinal.

2.3. Moda

La moda de una variable cuantitativa discreta o cualitativa de tipo ordinal y nominal, es


el valor más frecuente. En el caso de variables cuantitativas agrupadas se define el intervalo modal
como aquel con mayor frecuencia relativa. La moda puede no ser única si tenemos varios intervalos
con la misma frecuencia relativa máxima.
Para datos agrupados en una distribución de frecuencia, la moda puede ser estimada si-
guiendo los siguientes pasos:

Localizar la clase del intervalo que contenga la frecuencia de clase más grande.

Aplicando la siguiente fórmula con los valores del intervalo de la moda:

 ∆1 
X̂ = LRI + A (2.3.5)
∆1 + ∆2
Donde:

X̂ : la moda de los datos de la muestra.

LRI : Limite real inferior de la clase modal

∆1 : diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.

∆2 : diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior.

A : tamaño de los intervalos de clase.

Si hay dos intervalos contiguos con frecuencia máxima la moda será la media aritmética de
las dos marcas de clases. Si hay dos o más intervalos no contiguos con frecuencia de clase máxima
habrá dos o más modas que serán las marcas de clases de dichos intervalos.
Propiedades de la moda

La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar, y
relativa).

La moda tiene la ventaja de no ser afectada por valores extremos.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


. U.N.A.
2.4. OTRAS MEDIDAS DE CENTRALIZACIÓN

Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.

Desventajas de la moda

En muchas series de datos no hay moda porque ningún valor aparece más de una vez.

En algunas series de datos hay más de una moda, en este caso uno podrı́a preguntarse. Cual
es el valor representativo de la serie de datos?

Comparacón entre media, mediana y moda


Si no hay ningún argumento de peso en contra, se preferirá siempre la media. Hay dos
razones para apoyar esta norma general. La primera es que en ella se basan otros estadı́sticos y la
segunda es que es mejor estimador de su parámetro que la mediana y la moda.
Hay al menos tres situaciones en las que se preferirá la mediana a la media:
Cuando la variable esté medida en escala ordinal.

Cuando haya valores extremos que distorsionen la interpretación de la media.

Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de lı́mite
superior, el intervalo inferior carece de lı́mite inferior o ambos.

La media es extremadamente sensible a las puntuaciones y un cambio en sólo una de ellas


supone un cambio en la media aritmética, mientras que la mediana sólo se verı́a alterada por cambios
en los valores centrales.
La mediana será la segunda candidata para representar la tendencia central y se preferirá
la mediana a la moda, a menos de que:
1. Se trate de una variable medida en escala nominal.

2. Haya intervalos abiertos y la mediana pertenezca a uno de ellos.

Relación entre las medidas de tendencia central

Para una distribución simétrica los valores de la media, la mediana y la moda coinciden es
decir: X̄ = X̃ = X̂, con lo cual la distribución de datos no presenta sesgo.

Observación : Esta igualdad no es exacta, sino que se cumple con mayor o menor
aproximación en función del grado de simetrı́a de la curva que represente gráficamente la
distribución.

Para una distribución asimétrica negativa se tiene que: X̄ < X̃ < X̂, con lo cual la distribución
de datos presenta un sesgo negativo.

Para una distribución asimétrica positiva se tiene que: X̂ < X̃ < X̄, con lo cual la distribución
de datos presenta un sesgo positivo.

Observación: La regla empı́rica se acepta como válida siempre que el grado de curva no
sea muy acentuado.

2.4. Otras medidas de Centralización


2.4.1. Media Geométrica

La media geométrica es útil para encontrar el promedio de porcentajes, proporciones,


ı́ndices, o tasas de crecimiento. Tiene mucha aplicación en el comercio y la economı́a porque nos
interesa encontrar el porcentaje de cambio en ventas, salarios o datos económicos como el producto
nacional bruto. La media geométrica de un conjunto de ”n”números enteros positivo se define como
la n−ésima raı́z del producto de los n valores es decir:
s
p n
G = n X1 , X2 , . . . , Xn = n ∏ Xi (2.4.6)
i=1

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


2.5. GENERALIZACIONES DE LA MEDIA U.N.A.

eje0.3cm Suponga que usted recibe un 5 % de aumento en su salario este año y un 15 % de


aumento el año próximo y quiere saber cual es el incremento porcentual promedio. Si tiene
un aumento del 5 % entonces su salario es 1,05 y si tiene un aumento del 15 % su salario es de 1,15
entonces calculando la media geométrica se obtiene
p
(1, 05)(1, 15) = 1, 09886

, por lo que el aumento promedio anual es del 9, 886 %.

ejeas ganancias obtenidas por Atkins Construction Company en cuatro proyectos recientes fueron
3 %, 2 %, 4 % y 6 %. Cuál es la media de las ganancias? Por lo que la media de ganancias
obtenidas por Atkins Construction Company en los cuatro proyectos esta dada por
p4
(0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464

o sea 3,464 %

2.4.2. Media Cuadrática

A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los
errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los
efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en
elevar al cuadrado todas las observaciones (ası́ los signos negativos desaparecen), en obtener después
su media aritmética y en extraer, finalmente, la raı́z cuadrada de dicha media para volver a la unidad
de medida original.
s s
X12 + X22 + · · · + Xn2 1 n 2
C= = ∑ Xi (2.4.7)
N N i=1

2.4.3. Media Armónica

La media arónica es un promedio muy útil en conjuntos de números que se definen en


relación con alguna unidad, por ejemplo la velocidad (distancia por unidad de tiempo).
!−1
1 n 1
H= ∑ Xi (2.4.8)
N i=1

2.5. Generalizaciones de la media

Existen diversas generalizaciones de las medias anteriores.


Media generalizada
Las medias generalizadas, también conocidas como medias de Hölder, son una abstracción
de las medias cuadráticas, aritméticas, geométricas y armónicas. Se definen y agrupan a través de la
siguiente expresión:
!1
m
1 n m
x̄(m) = ∑ xi (2.5.9)
n i=1

Eligiendo un valor apropiado del parámetro m, se tiene:

m → ∞ máximo.

m = 2 media cuadrática , comparar con la expresión 2.4.7 .

m = 1 media aritmética, comparar con la expresión 2.1.1 .

m → 0 media geométrica, comparar con la expresión 2.4.6.

m = −1 media armónica, comparar con la expresión 2.4.8.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


2.5. GENERALIZACIONES DE LA MEDIA U.N.A.

m → −∞ mı́nimo.

Media−f generalizada
Esta media puede generalizarse para una función monótona como la media−f generalizada:
!
n
1
x̄ = f −1 · ∑ f (xi ) (2.5.10)
n i=1
donde f : I → I sea una función inyectiva e I ⊂ R un intervalo. Escogiendo formas particulares
para f se obtienen algunas de las medias más conocidas:

f (x) = x media aritm etica, I = R, comparar con la expresión 2.1.1.


1
f (x) = x media armónica, I = (0, ∞), comparar con la expresión 2.4.8.

f (x) = xm media generalizada, I = (0, ∞), comparar con la expresión 2.5.9.

f (x) = ln x media geométrica, I = (0, ∞), comparar con la expresión 2.4.6.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


Capı́tulo 3

Medidas de posición no central


(Cuantiles)

Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen
a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de
frecuencias.
Los cuantiles más conocidos son: cuartiles, deciles y percentiles.
Cuartiles ( Qi ) Son valores de la variable que dividen a la distribución en 4 partes, cada
una de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 es el primer
cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que deja a su izquierda
el 50 % de los datos, y Q3 es el tercer cuartil que deja a su izquierda el 75 % de los datos. (Q2 = Me)
Deciles ( Di ) Son los valores de la variable que dividen a la distribución en las partes
iguales, cada una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 = Me
)
Centiles o Percentiles ( Pi ) Son los valores que dividen a la distribución en 100 partes
iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habrá 99 percentiles.
(Q2 = D5 = Me = P50 )
Cálculo de los cuantiles en distribuciones no agrupadas en intervalos
kN
Se calculan a través de la siguiente expresión: q siendo :

k : el orden del cuantil correspondiente.

q : el número de intervalos con iguales frecuencias u observaciones (q = 4, 10, . . . , 100).

N : número total de observaciones.

Cálculo de los cuantiles en distribuciones agrupadas en intervalos


kn
!
q − f a(i−1)
Qk = LI + A (3.0.1)
fi

k : Orden del cuantil k = 1, 2, ...

q : el número de intervalos con iguales frecuencias u observaciones (q = 4, 10, . . . , 100).

LI : Limite inferior del intervalo que contiene el cuantil.

f a(i−1) : Frecuencia acumulada hasta el intervalo anterior al que contiene el cuantil.

fi : Frecuencia del intervalo que contiene el cuantil.

n : Número de observaciones.

A : Amplitud de los intervalos.

21
Capı́tulo 4

Medidias de Dispersión

Tratan de medir la concentración o dispersión de las observaciones muestrales o poblacio-


nales.
Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar
una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una medida
de variabilidad pequeña indica que los datos están agrupados muy cerca, digamos, de la media. La
media, por lo tanto es considerada bastante representativa de la serie de datos. Inversamente, una
gran medida de variabilidad indica que la media no es muy representativa de los datos.
Una segunda razón para estudiar la variabilidad de una serie de datos es para comparar
como están esparcidos los datos en dos o más distribuciones. Por ejemplo, la calificación promedio
de dos estudiantes, A = {90; 80; 75; 75} y B = {90; 55; 85; 90}, es de 80. Basados en esto podrı́amos
pensar que sus calificaciones son idénticas. Pero si revisamos el detalle de sus calificaciones vemos
que esta conclusión no es correcta.

4.1. Varianza y Desviación Tı́pica

Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto
a la media (s2 : caso muestral σ2 : caso poblacional). Se define la desviación tı́pica como la raı́z
positiva de la varianza (s : caso muestral σ : caso poblacional). Se suele utilizar más la desviación
tı́pica porque presenta las mismas unidades que la variable original. Al estar definidas como promedio
de cuadrados son siempre no negativas.
Las fórmulas de la varianza de una población y de una muestra son ligeramente diferentes.
Las fórmulas son:
N N
2
∑ (Xi − µ) ∑ Xi2
i=1 i=1
σ2 = = − µ2 (4.1.1)
N N
para la varianza de una población y
n n
∑ (Xi − X)2 ∑ Xi2
i=1 i=1 2
S2 = = −X (4.1.2)
n n
para la varianza de una muestra.
Las desviaciones estándar de la población y muestra se calculan simplemente sacando la
raı́z cuadrada a la respectiva varianza.
p
σ = σ2 (4.1.3)
desviación estándar de una población y

S= S2 (4.1.4)
desviación estándar de una muestra
Usos frecuentes de la desviación estándar Enfatizando, la desviación estándar es útil
para describir un conjunto de datos midiendo el grado de dispersión de las observaciones individuales
alrededor de su media. Existen dos aplicaciones adicionales para la stándar:

22
4.2. OTRAS MEDIDAS DE DISPERSIÓN U.N.A.

Teorema de Chebyshev establece que para todo conjunto de datos, por lo menos 1 − k12 % de
las observaciones están dentro de k desviaciones estándar de la media en donde k es cualquier
número mayor que 1.

4.2. Otras medidas de dispersión


Desviación absoluta respecto a la media: Dx̄ = 1n ∑ni=1 |xi − x̄|.

Desviación absoluta respecto a la mediana: DQ2 = 1n ∑ni=1 |xi − Q2 |.

Mediana de las desviaciones absolutas: MEDA = Q2 {|xi − Q2 (x)| : i = 1, ..., n}.

Recorrido o rango: R = máx(xi ) − mı́n(xi ).

Rango intercuartı́lico: RI = Q3 (x) − Q1 (x).


(máx(xi )−mı́n(xi ))
Recorrido relativo: RR = x̄ .

Coeficiente de variación: CV = x̄s .

Las medidas relativas como el recorrido relativo o el coeficiente de variación sólo tienen
sentido cuando la media de la variable es mayor que cero.

4.3. Medidas de forma

Las medidas de forma tratan de medir el grado de simetrı́a y apuntamiento en los datos.
Medidas de asimetrı́a
(x̄ − Q2 )
Coeficiente de asimetrı́a de Pearson: AsP = .
s
∑ni=1 (xi − x̄)3
Coeficiente de asimetrı́a de Fisher: AsF = .
ns3

La interpretación de estos coeficientes es la siguiente: Si son prácticamente cero se dice que


los datos son simétricos. Si toman valores significativamente mayores que cero diremos que los datos
son asimétricos a la derecha y si toman valores significativamente menores que cero diremos que son
asimétricos a la izquierda.

4.4. Medidas de apuntamiento o curtosis

Miden el grado de concentración de una variable respecto a su medida de centralización


usual (media). El más usual es el coeficiente de apuntamiento de Fisher que se define como:

∑ni=1 (xi − x̄)4


SkF =
ns4
.
Puesto que en Estadı́stica el modelo de distribución habitual de referencia es el gausiano o
normal y este presenta teóricamente un coeficiente de apuntamiento de 3, se suele tomar este valor
como referencia. Ası́, si este coeficiente es menor que 3 diremos que los datos presentan una forma
platicúrtica, si es mayor que 3 diremos que son leptocúrticos y si son aproximadamente 3 diremos
que son mesocúrticos.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


4.5. OTRAS MEDIDAS CARACTERÍSTICAS U.N.A.

4.5. Otras medidas caracterı́sticas

Varias de las medidas vistas anteriormente utilizan desviaciones de los datos respecto a la
media elevadas a distintos órdenes. Este tipo de coeficientes se denominan momentos.

1 n r
Se define el momento respecto al origen de orden r(r ≥ 0) como: ar = ∑ xi .
n i=1

1 n
Se define el momento central de orden r(r ≥ 0) como: mr = ∑ (xi − x̄)r .
n i=1

La relación entre los dos tipos de momentos viene dada a partir del binomio de Newton:
r  
k k
mr = ∑ (−1) ( )ar−k ak1
k=0 r

Casos particulares de los momentos son:

a1 = x̄, m2 = s2 , m3 = s3 AsF y m4 = s4 SkF

4.6. Ejercicios Propuestos


1. El departamento de agricultura, tiene los siguientes datos que representan el crecimiento men-
sual (en pulgadas) de muestras de maı́z recien plantados

0,4 1,9 1,5 0,9 0,3 1,6 0,4 1,5 1,2 0,8
0,9 0,7 0,9 0,7 0,7 1,5 0,5 1,5 1,7 1,8

a) Organice los datos en un ordenamiento ascendente.


b) calcula las medidas de tendencia central y las variaciones considerando los a datos como
simples.

2. Un fabricante de neumáticos quiere determinar el diámetro interior de cierto grado de los


neumáticos. Idealmente el diámetro serı́a 570mm. Los datos son los siguientes:
572 572 573 568 569 575 565 570
Encuentre las medidas de tendencia central, las variaciones y analice la relación entre ellas
3. A continuación presentamos los datos de una muestra de la tasa de producción diaria de de
botes de fibra de vidrio de la Hidrosport Lt. Un fabricante de Miami.
17 21 18 27 17 21 20 22 18 23

a) Calcule las mediadas de tendencia central, las variaciones e interprete los resultados
b) Compare.

4. Dada la distribución de frecuencia de rentas mensuales de 200 departamentos (en miles de


pesos)
Renta mensual (en miles de pesos) Números de departamentos
350-379 3
380-409 8
410-439 10
440-469 13
470-499 33
500-529 40
530-559 35
560-589 30
590-619 16
620-649 12
Total 200

Determine las medidas de tendencia central, variaciones y analice la relación entre ellas
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
4.6. EJERCICIOS PROPUESTOS U.N.A.

5. las edades de 60 personas que trabajan en una fábrica textil se han tabulado dando la siguiente
tabla de frecuencias:
Edades Número de personas
13-17 2
18-22 6
23-27 10
28-32 13
33-37 18
38-42 6
43-47 2
48-52 2
53-57 16
Total 60

a) Hallar las mediadas de tendencia central y las variaciones.


b) Interpretar los resultados de la parte a)
c) Comparar las mediadas.

6. Se conduce un estudio de los efectos de fumar sobre los patrones de sueños. La medición que
se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene estos datos:

Fumadores 69,3 56,0 22,1 47,6 53,2 48,1 52,7 34,4 60,2 43,8
No fumadores 28,6 25,1 26,4 34,9 29,8 38,5 30,2 30,6 31,8 41,6

a) Encuentre las medidas de tendencia central para cada grupo


b) Encuentre la varianza y desviación estándar de cada grupo
c) Diga cual de los dos grupos de datos está más concentrada

7. La compañı́a National Tire tiene fondos de reserva en valores negociable a corto plazo. El saldo
diario de cierre (en millones de dólares) de la cuenta de valores negociables en lapso de dos
semanas es el que mostramos a continuación.

Semana 1 1973 1970 1972 1975 1976


Semana 2 1969 1892 1893 1887 1895

a) Calcula las mediadas de tendencia central para cada grupo e interprete los resultados
obtenidos.
b) Calcula la desviación media, la varianza, la desviación tı́pica y el coeficiente de variación
de cada grupo.
c) Diga cual de los grupos tiene mejor concentración

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


Capı́tulo 5

Probabilidad

5.1. Introducción

El concepto de probabilidad indica la posibilidad de ocurrencia de un suceso futuro, por


ello está asociado a experimentos donde existe incertidumbre sobre el resultado final. Esta es la
razón de que la Teorı́a de la Probabilidad sea importante por los muchos problemas prácticos que
permite resolver. Además, supone un soporte teórico para la Estadı́stica, más concretamente para la
Inferencia Estadı́stica, que es la que nos permite conocer (inferir) la distribución de una población a
partir del conocimiento de una parte de ella (muestra).
La Teorı́a de la Probabilidad surgió de los estudios realizados sobre los juegos de azar, y
estos se remontan miles de años atrás. Como primeros trabajos con cierto formalismo cabe destacar
los realizados por Cardano y Galilei (siglo XVI), aunque las bases de esta teorı́a fueron desarrolladas
por Pascal y Fermat en el siglo XVII. De ahı́ en adelante grandes cientı́ficos han contribuido al
desarrollo de la Probabilidad, como Bernouilli, Bayes, Euler, Gauss,... en los siglos XVIII y XIX. Será
a finales del siglo XIX y principios del XX cuando la Probabilidad adquiera una mayor formalización
matemática, debida en gran medida a la llamada Escuela de San Petesburgo en la que cabe destacar
los estudios de Tchebychev, Markov y Liapunov1 .

5.2. Espacio probabilı́stico


5.2.1. Experimentos y sucesos

Consideraremos que un experimento es un proceso por medio del cual se obtiene una
observación. Bajo este enfoque podemos distinguir entre experimentos deterministas y aleatorios.
Los primeros son aquellos que siempre que se repitan bajo condiciones análogas llevan al mismo
resultado, por tanto éste se puede predecir. Por el contrario, un experimento aleatorio es el que
puede dar lugar a varios resultados, conocidos previamente, sin que sea posible saber de antemano
cuál de ellos se va a producir.
Estos últimos son los que interesan a la Teorı́a de la Probabilidad. Como ejemplo de los
mismos tenemos el observar qué número sale al lanzar un dado al aire. Muchos experimentos de la
vida real entran en el campo de los experimentos aleatorios, ya que son muchas las situaciones en las
que no se puede tener un control total sobre las variables de las que depende que se llegue a una u
otra realización.
A continuación, describimos los principales conceptos necesarios para el estudio de un
experimento aleatorio:

Suceso elemental: Es cada uno de los posibles resultados del experimento aleatorio. Se de-
notan con la letra griega ω.

Espacio Muestral: Conjunto formado por todos los sucesos elementales. Se denota por Ω =
{ω/ωes un suceso elemental}.

Suceso: Se llama suceso a cualquier subconjunto del espacio muestral. Se denota por 0/ al
suceso imposible y Ω se corresponde con el suceso seguro.
1 Estadı́sticaIngenierı́a Técnica en Informática de Sistemas (Manuel Febrero Bande, Pedro Galeano San Miguel,
Julio González Dı́az, Beatriz Pateiro López

26
5.3. TÉCNICAS DE CONTEO U.N.A.

ejexperimento aleatorio: Lanzamiento de un dado.


Suceso elemental: el 3.
Espacio Muestral : Ω = {1, 2, 3, 4, 5, 6}.
Suceso: Salir par = {2, 4, 6}.

Denotaremos por Ac al complementario del suceso A, es decir, Ac = Ω − A.

5.3. Técnicas de Conteo

Métodos para determinar (sin tener que enumerar en forma directa) el número de resultados
posibles de un experimento o el número de elementos de un conjunto particular. Estas técnicas son
usualmente conocidas como Técnicas de Conteo o análisis combinatorio.
Principio fundamental del conteo: Si un evento puede realizarse de n1 maneras diferen-
tes, y si, continuando el procedimiento, un segundo evento puede realizarse de n2 maneras diferentes,
y si, después de efectuados, un tercer evento puede realizarse de n3 maneras diferentes, y ası́ sucesi-
vamente, entonces el número de maneras en que los eventos pueden realizarse en el orden indicado
es el producto n1 · n2 · n3 . . . .
ejeupongamos que queremos determinar el número de placas de automóviles que pueden grabarse
utilizando 2 letras distintas y 3 dı́gitos de los cuales el primero no es 0. Entonces si asumimos un
alfabeto de 26 letras tendremos: 26 · 25 · 9 · 10 · 10 = 585000 placas.

Notación factorial
El producto de los enteros positivos desde 1 hasta n (inclusive), lo denotamos por el sı́mbolo
n! (el cual llamamos n factorial): n! = n · (n − 1) · (n − 2) . . . 3 · 2 · 1 : Para el caso n = 0 defı́nimos 0! = 1.
Por ejemplo, 4! = 4 · 3 · 2 · 1 = 24, 8! = 6! = (8 · 7 · 6!) = 6! = 8 · 7 = 56.

5.3.1. Permutaciones

Cualquier secuencia ordenada de k objetos tomada de un conjunto de n objetos distintos


se llama permutación de tamaño k de los objetos. El número de permutaciones de tamaño k que se
puede construir a partir de n objetos se indica por Pk;n :

n(n − 1)(n − 2) . . . (n − (k − 1))(n − k)! n!


Pk;n = n(n − 1)(n − 2) . . . (n − (k − 1)) = =
(n − k)! (n − k)!

ejeay 10 asistentes de enseñanza disponibles para clasificar los exámenes de un determinado curso.
El primer examen del curso consta de 4 preguntas. El jefe de cátedra desea elegir un asistente distinto
para calificar cada pregunta (un único asistente por pregunta). De cuántas maneras se puede elegir
a los asistentes para calificar el examen? En esta situación n = 10 (número de asistentes) y k = 4
(número de preguntas) y las maneras posibles son P4;10 = 10 · 9 · 8 · 7 = 5040.

5.3.2. Permutaciones con repeticiones

Para el caso en el cual deseamos conocer el número de permutaciones de objetos, de los


cuales algunos son iguales, tenemos el siguiente resultado:
El número de permutaciones de n objetos de los cuales n1 son iguales, n2 son iguales,. . . , nk son
iguales es
n!
n1 !n2 ! . . . nk !
ejeeseamos formar todas las posibles palabras de 3 letras usando las palabras TAT. Tenemos
3! = 9 permutaciones de los objetos T1 AT2 , sin embargo, T1 AT2 , T2 AT1 , T1 T2 A, T2 T1 A, AT1 T2 , AT2 T1
forman la misma palabra si quitamos los subı́ndices. Por lo tanto tenemos 3! 2! = 3 palabras diferentes
de 3 letras que se forman con la palabra TAT.

5.3.3. Pruebas ordenadas

Cuando seleccionamos k elementos de un conjunto de n elementos, estamos realizando una


prueba ordenada de tamaño k. Podemos considerar para esta prueba 2 casos.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


5.3. TÉCNICAS DE CONTEO U.N.A.

Pruebas con sustitución: en este caso se regresa el elemento al conjunto antes de seleccio-
nar uno nuevo y según el principio fundamental del conteo tenemos nk pruebas ordenadas diferentes
de tamaño k con sustitución entonces.
Pk;n = nk

Pruebas sin sustitución: en este caso no se regresa el elemento al conjunto antes de


seleccionar uno nuevo. Ası́ no hay repeticiones en la prueba ordenada. Por lo que, una prueba orde-
nada de tamaño k sin sustitución es simplemente una permutación de k objetos/elementos. Tenemos
n!
entonces Pk;n = (n−k)! pruebas ordenadas diferentes de tamaño k sin sustitución.

5.3.4. Combinaciones

Dado un conjunto de n objetos distintos, cualquier subconjunto no ordenado de tamaño k


de los objetos se llama combinación. El número de combinaciones de tamaño k que se puede formar
n
a partir de n objetos distintos se denota mediante Ck;n o k
ejeeterminemos el número de combinaciones de las cuatro letras a; b; c; d tomadas de 3 en 3, en
la siguiente tabla vemos que cada combinación que tenga 3 letras produce 3! = 6 permutaciones:
Combinaciones Permutaciones
abc abc; acb; bac; bca; cab; cba
D. abd abd; adb; bad; bda; dab; dba
acd acd; adc; cad; cda; dac; dca
bcd bcd; bdc; cbd; cdb; dbc; dcb

P
3;4
Es decir C3;4 · 3! = P3;4 o C3;4 = 3! . Y en general para cada combinación de n objetos
tomados de a k tenemos que,  
n Pk;n n!
Ck;n = = =
k k! k!(n − k)!
.

5.3.5. Diagramas de árbol


Un diagrama de árbol es una representación que se usa para enumerar todos los resultados posibles
de una serie de experimentos en donde cada experimento puede suceder en un número finito de
maneras.
ejena familia requiere los servicios de un obstetra y de un pediatra. En la ciudad existen 2 clı́nicas
en cada una de las cuales trabajan 2 obstetras y 3 pediatras. Si la obra social les exige que elijan
ambos profesionales de una misma clı́nica, De cuantas formas pueden seleccionar los profesionales?
Si denotamos por Oi a los obstetras y por Pi a los pediatras podemos construir el siguiente diagrama
de árbol:

Algebra de sucesos: Es un subconjunto del conjunto de todos los sucesos asociados a un experi-
mento aleatorio, se denota por A = σ − algebra y ha de cumplir las siguientes condiciones:
ω, 0/ ∈ A
A ∈ A → Ac ∈ A
A, B ∈ A → A ∪ B; A ∩ B ∈ A

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


5.4. TEOREMAS DE PROBABILIDAD
S. U.N.A.

Leyes del álgebra de conjuntos


Operación Union Operación Intersección
Idempotencia
A∪A = A A∩A = A
Asociatividad
(A ∪ B) ∪C = A ∪ (B ∪C) (A ∩ B) ∩C = A ∩ (B ∩C)
Conmutativas
A∪B = B∪A A∩B = B∩A
Distrubutivas
A ∪ (B ∩C) = (A ∪ B) ∩ (A ∪C) A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C)
Identidad
A ∪ 0/ = A A∩Ω = A
A∪Ω = Ω A ∩ 0/ = 0/
complemento
A ∪ Ac = Ω A ∩ Ac = 0/
(Ac )c = A Ωc = 0/ 0/ c = Ω
Leyes De Morgan
(A ∪ B) = A ∩ Bc
c c (A ∩ B)c = Ac ∪ Bc

5.3.7. Definiciones de probabilidad

El principal objetivo de un experimento aleatorio suele ser determinar con qué probabi-
lidad ocurre cada uno de los sucesos elementales. A continuación citamos las tres definiciones más
manejadas para asignar probabilidades a los sucesos:

Definición frecuentista: Dadas n repeticiones de un experimento aleatorio, si denotamos


por nA el número de veces que se ha obtenido el suceso A, se define la frecuencia de dicho
nA
suceso como f r(A) = donde 0 ≤ f r(A) ≤ 1. Cuando n es grande la frecuencia de un suceso
n
se estabiliza en torno a un valor al que se llama probabilidad del suceso A.

Definición clásica o de Laplace: En el caso de que el espacio muestral sea finito y de


que todos los sucesos elementales tengan la misma probabilidad, se define la probabilidad de
|A| casos favorables
un suceso A como: P(A) = = , donde |A| denota el número de sucesos
|Ω| casos posibles
elementales que componen el suceso A.

Definición axiomática (Kolmogorov 1933): Dado el espacio probabilizable (Ω, A), diremos
que P es una probabilidad sobre dicho espacio si cumple:

• P(Ω) = 1.
• Si A ∩ B = 0,
/ entonces P(A ∪ B) = P(A) + P(B).
• 0 ≤ P(A) ≤ 1.

El espacio probabilizable (Ω, A), junto con la medida de probabilidad P, se denomina


espacio de probabilidad y se representa como (Ω, A, P). Se denomina a A como σ − algebra

5.4. Teoremas de Probabilidad

5.4.1. Regla de la Adición


La probabilidad de que alguno de dos eventos pertenecientes a un mismo espacio muestral ocurra
se determina mediante la siguiente ecuación:

P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


5.4. TEOREMAS DE PROBABILIDAD U.N.A.

ejei el experimento es lanzar un dado una vez, el espacio muestral es:

S = {1, 2, 3, 4, 5, 6}

Si el evento A es el resultado es un número par entonces

A = {2, 4, 6}

Si el evento B es el resultado es un número menor de 3

B = {1, 2}

Cuál será la probabilidad de que suceda alguno de estos dos eventos?


La probabilidad de que ocurra A y la probabilidad de que ocurra B son respectivamente:
3 1 2 1
P(A) = = y P(B) = =
6 2 6 3
Para aplicar este teorema es necesario conocer la probabilidad de la intersección de estos dos
eventos, para ası́ poder conocer la probabilidad de la unión, o de manera inversa, conociendo la
probabilidad de la unión se puede calcular la probabilidad de la intersección.
En este caso queremos saber la probabilidad de la unión conociendo la probabilidad de la in-
tersección, entonces es necesario conocer la intersección de estos dos eventos, que es ñúmero par y
menor de 3’, con lo cual
A ∩ B = {2}
1
por lo que P(A ∩ B) =
6
Si aplicamos la regla de adición:

P(A ∪ B) = P(A) + P(B) − P(A ∩ B)


1 1 1 2
P(A ∪ B) = + − =
2 3 6 3

5.4.2. Regla de la complementación


La probabilidad de que el complemento de un evento A ocurra está dada por la siguiente ecuación:

P(A) = 1 − P(A)

ejei A es cae cara en el experimento consistente en lanzar un moneda, entonces la probabilidad


de que no caiga cara es:
1 1
P(A) = 1 − P(A) = 1 − =
2 2

5.4.3. Regla de Diferenciación


La probabilidad de que un evento dado A ocurra pero no ocurra otro evento dado B pertenecientes
al mismo espacio muestral está dada por

P(A − B) = P(A) − P(A ∩ B)

ejei el evento A es cae un número par y si el evento B es cae un número menor de 3, ambos perte-
necientes al espacio muestral Ω = {1, 2, 3, 4, 5, 6} que resulta del experimento aleatorio consistente en
el lanzamiento de un dado, entonces la probabilidad de que caiga un número par pero no es menor
que tres es:
3 1
P(A − B) = P(A) − P(A ∩ B) = − = 0, 3333
6 6
Y la probabilidad de que caiga un número menor que tres pero no sea par es:
2 1
P(B − A) = P(B) − P(AB) = − = 0,167
6 6

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


5.4. TEOREMAS DE PROBABILIDAD U.N.A.

5.4.4. Reglas de Multiplicación

Regla del producto para eventos independientes


Tn−1
Dados los sucesos A1 , A2 , . . . , An , tales que P( i=1 Ai ) > 0. Entonces:
n−1
\ n−1
\
P( Ai ) = P(A1 ) · P(A2 /A1 ) · P(A3 /(A1 ∩ A2 ) · . . . · P(An / Ai )
i=1 i=1

Dos sucesos A y B son independientes si el hecho de que se produzca o no uno de ellos no


afecta a la posible ocurrencia del otro. Formalmente, A y B son independientes si

P(A ∩ B) = P(A).P(B)

o equivalentemente P(B/A) = P(B) si P(A) > 0 (y también P(A/B) = P(A) si P(B) > 0).

ejena maquina empaca vegetales en una bolsa de plástico. Experiencias anteriores revelan que en
ocasiones los paquetes tienen menos del peso correcto, y en otras más, pero la mayorı́a de las veces
tiene el peso satisfactorio. Como muestra la siguiente tabla:

Peso Probabilidad
debajo del correcto 0,025
correcto 0,900
arriba del correcto 0,075

Supongamos que queremos saber la probabilidad de que al inspeccionar tres paquetes, los tres pesen
correctamente. Establezcamos los siguientes eventos:

A = {el primer paquete pesa correctamente}

B = {el segundo paquete pesa correctamente}


C = {el tercer paquete pesa correctamente}
La probabilidad de cada uno de estos eventos independientes es:

P(A) = 0, 900

P(B) = 0, 900
P(C) = 0, 900
Según el teorema de multiplicación la probabilidad de que los tres eventos ocurran es:

P(A ∩ B ∩C) = P(A) · P(B) · P(C) = (0, 900) · (0, 900) · (0, 900) = 0, 729

5.4.5. Probabilidad condicionada

Es posible que, al realizar un experimento aleatorio, se disponga de cierta información


que permite reducir el espacio muestral. Para esto se introduce la probabilidad condicionada; P(A/B)
denota la probabilidad de que se produzca el suceso A sabiendo que se va a producir el B. Por ejemplo,
si sabemos que al lanzar un dado ha salido un número par y queremos saber la probabilidad de que
{4}
este sea el 4, habrı́a que calcular P( {2,4,6} ). De este modo, dado un suceso B tal que P(B) > 0 se define
la probabilidad del suceso A condicionada al suceso B como:

P(A ∩ B)
P(A/B) =
P(B)
.
Es importante destacar que dado un suceso B, la función PB , que a cada suceso A le asigna
la probabilidad de A condicionada a B, es una función de probabilidad que satisface las propiedades
de la definición axiomática de Kolmogorov. Es decir, PB (A) = P(A/B).

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


5.4. TEOREMAS DE PROBABILIDAD U.N.A.

5.4.6. Teorema de las probabilidades totales


Sn
Dados los sucesos A1 , A2 , . . . , An , tales que Ω = i=1 Ai y además Ai ∩ A j = 0/ si i 6= j. Entonces,
dado un suceso B se tiene que:
n
P(B) = ∑ P(B/Ai ) · P(Ai )
i=1

A1 A2 ... An

Lo que nos dice este teorema es que dado un conjunto de sucesos mutuamente excluyentes tales
que su unión sea el suceso seguro Ω, entonces la probabilida de un suceso cualquiera B se puede
descomponer como la suma de las probabilidades de B dentro de cada uno de los sucesos (rectángulos
del dibujo) por la probabilidad de caer en dicho suceso. Con otras palabras, la probabilidad del suceso
B se reparte entre los sucesos en los que hemos particionado Ω.

5.4.7. Regla de Bayes


Sn
Dado los sucesos A1 , A2 , . . . , An , tales que Ω = i=1 Ai y además Ai ∩ A j = 0/ si i 6= j. Entonces, dado
un suceso B se tiene que:

P(B/A j ) · P(A j )
P(A j /B) = n
∑i=1 P(B/Ai ) · P(Ai )
Esta fórmula sale de combinar las fórmulas de la probabilidad condicionada con el teorema de las
probabilidades totales. La utilidad de la misma radica en que conociendo como son las probabilidades
de B condicionadas a los sucesos en los que hemos descompuesto el espacio muestral, podemos calcular
también cuánto valen las probabilidades cuando quien condiciona es el propio suceso B.

ejen un hospital se realiza una prueba para detectar una enfermedad. Se sabe que la pa-
decen 1 de cada 10.000 personas. Asimismo, también se sabe que cuando un paciente tiene la
enfermedad la prueba da positivo el 90 % de las veces y que cuando está sano el test da positivo
un 10 % de las veces.
E. Cuál es la probabilidad de que el test dé positivo?

Hasta qué punto es fiable el test? Es decir, si una persona da positivo, qué probabilidad hay de
que tenga la enfermedad?

Solución:

Aquı́ se usa el teorema de las probabilidades totales. Denotemos por A el suceso ’tener la
enfermedad’y por B él test da positivo’, de modo que sabemos que:

P(A) = 0, 0001, P(B/A) = 0, 9, P(B/AC) = 0, 1

. Entonces:

P(B) = P(B/A)P(A) + P(B/AC)P(AC) = 0, 9 × 0, 0001 + 0, 1 × 0, 9999 = 0, 10008

Ahora utilizamos el teorema de Bayes, se nos pide P(A/B).

P(B/A)P(A) 0, 00009
P(A/B) = C C
= = 0, 000899
P(B/A)P(A) + P(B/A )P(A ) 0, 10008

. De modo que aunque alguien dé positivo en el test, la probabilidad de que tenga la enfermedad
es todavı́a muy pequeña. Harı́a falta una prueba más fiable.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


5.5. EJERCICIOS PROPUESTOS U.N.A.

5.5. Ejercicios Propuestos

1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fuman, que
350 consumen bebidas alcohólicas y que 250 tienen estos dos hábitos nocivos para la salud.
Cuál es la probabilidad de que un estudiante seleccionado aleatoriamente

a) tenga alguno de estos dos malos hábitos?


b) no tenga ninguno de estos dos pésimos hábitos?
c) fume pero no tome?
d) tome pero no fume?
e) No fume?
f) Fume dado que toma?
g) Toma dado que fuma?
h) No tenga alguno de estos nefastos hábitos?

2. La probabilidad de que una compañı́a norteamericana ubique una de sus plantas en Juárez es
0, 7, la probabilidad de que instale una planta en Chihuahua es 0, 4, la probabilidad de que no
se ubique ni en Juárez ni en Chihuahua es 0, 20. Cuál es la probabilidad de que

a) Se ubique en alguna de estas dos ciudades?


b) Se ubique en ambas ciudades?
c) No se ubique en alguna de estas dos ciudades?
d) Se ubique en Chihuahua pero no en Juárez?
e) Se ubique en Juárez pero no en Chihuahua?
f) Ubique una planta en Juárez dado que ya se ubicó en Chihuahua?
g) Ubique una planta en Chihuahua dado que ya se ubicó en Juárez?

3. En cierta escuela de 45 estudiantes que reprobaron Estadı́sticas I, 32 dijeron que reprobaron


por no estudiar, 18 porque no le entienden al maestro, 9 por causas diferentes a estas dos.
Encuentre la probabilidad de los siguientes eventos:

a) Reprobó porque no estudió o porque no le entiende al maestro


b) Reprobó porque no estudió y porque no le entiende al maestro
c) Reprobó porque no estudió y no porque no le entiende al maestro
d) Reprobó porque no le entiende al maestro y no porque no estudió

4. Se realizó una encuesta sobre preferencias en materia de periódicos, de 350 personas entre-
vistadas, 200 leen el Heraldo, 140 leen el Diario y 105 leen los dos periódicos. Encontrar la
probabilidad de los siguientes eventos:

a) Lee alguno de estos dos periódicos


b) No lee ninguno de estos dos periódicos
c) Lee el Diario pero el Heraldo no
d) Lee el Heraldo pero el Diario no
e) Lee el Heraldo dado que lee el Diario
f) Lee el Diario dado que lee el Heraldo
g) No lee alguno de estos dos Periódicos

5. La probabilidad de que en un matrimonio, el esposo vea cierto programa de TV es 0,4, la


probabilidad de que la esposa lo haga es de 0,5. La probabilidad de que el esposo vea el
programa de TV dado que la esposa lo hace es de 0,7. Encuentre la probabilidad de que:

a) Ambos vean el programa de TV


b) Alguno de los dos vea el programa de TV
c) Ninguno vea el programa de TV
d) El esposo vea el programa pero la esposa no
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
5.5. EJERCICIOS PROPUESTOS U.N.A.

e) La esposa vea el programa pero el esposo no


f) La esposa vea el programa dado que el esposo lo hace
g) Alguno de los dos no ve el programa

6. Don Pepe tiene una tienda, en el trabajan tres cajeras, Andrea, Bianca, y Consuelo. Andrea
realiza el 50 % de los cobros, Bianca el 30 % y Consuelo el 20 %. Cuando cobra Andrea hay un
1 % de probabilidad de que lo haga mal, cuando lo hace Bianca hay un 2 % de que cobre mal,
y si cobra Consuelo hay un 3 % de probabilidad de que se equivoque.

Un cliente se queó con Don Pepe porque le cobraron mal. Cuál es la probabilidad de que el mal
cobro lo haya hecho Andrea?.

7. El profesor Ramos tiene muchos años impartiendo la clase de matemáticas, por experiencia
sabe que el 80 % de los estudiantes contestan los problemas que les encarga de tarea. También
sabe que el 90 % de los estudiantes que hacen la tarea aprueban el curso y que el 60 % de los
estudiantes que no hacen la tarea reprueban. Manuel aprobó el curso, cual es la probabilidad
de que hizo la tarea?

8. Un equipo de béisbol juega el 70 % de las veces de noche y el 30 % de dı́a. Ellos ganan el 50 %


de los juegos nocturnos y el 90 % de los juegos diurnos. El dı́a de ayer ganaron, cual es la
probabilidad de que el juego fue en la noche?

9. El 30 % de las ventas de una tienda departamental son en efectivo, el 30 % son pagadas con
cheque en el momento de la compra y el 40 % son a crédito. El 20 % de las compras en efectivo,
90 % de las compras con cheque y el 60 % de las compras a crédito son mayores a $500. En
este momento se está realizando una compra por $1000, cual es la probabilidad de que sea en
efectivo?

10. Cierta población de 1500 habitantes, fue clasificado, según su nacionalidad, resultando: 950
paraguayos, 200 españoles, 300 italianos y 50 franceses. Si se elige un habitante al azar, calcular
la probabilidad de que:

a) resulte de habla castellana Respuesta: 0,77


b) resulte extranjero Respuesta: 0,77

11. Supóngase que el Señor Gómez planea salir la noche del sábado próximo. Las probabilidades
de que baya a un juego de baloncesto, al cine o a una carrera de caballo son 0,35; 0,30 y 0,20
respectivamente. Determinar la probabilidad de que:

a) haga cual quiera de estas tres cosas Respuesta: 0,85


b) que no haga ninguna de estas tres cosas Respuesta: 0,15

12. Suponga que la probabilidad de que llegue a asistir a una universidad es 0,60, la probabilidad de
que trabaje tiempo completo es 0,70, la probabilidad de que llegue a asistir a una universidad
y trabaje tiempo completo es 0,50. Cuál es la probabilidad de que asista a una universidad o
trabaje tiempo completo? Respuesta: 0,80

13. Se tiene un grupo de 12 tornillos, de los cuales 4 son defectuosos. Se recogen 2 tornillos al azar.
Cuál es la probabilidad de que:

a) los 2 sean defectuosos Respuesta: 0,091


b) ninguno de los 2 sean defectuosos Respuesta: 0,4242

14. De 100 individuos que presenten su solicitud para ocupar puestos de analista de sistemas en
una gran empresa en el ultimo año. 40 contaban con experiencia laboral previa y 30 tenı́an
titulo profesional. Sin embargo 20 de los solicitantes tenı́an tanto experiencia laboral como
titulo profesional, de modo que han sido incluidos en ambos conteos.

a) Cuál es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea expe-


riencia laboral o titulo profesional o ambos? Respuesta: 0,50
b) Cuál es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea expe-
riencia laboral o titulo profesional pero no ambos? Respuesta: 0,30

15. Una caja contiene 20 unidades de cierto producto electrónico, 4 de ellos son defectuosos y 16 son
buenas. Se seleccionarán aleatoriamente 4 unidades y se venderán. Obténgase la probabilidad
de que:
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
5.5. EJERCICIOS PROPUESTOS U.N.A.

1
a) las cuatro unidades vendidas sean defectuosos Respuesta: 4845
48
b) entre las cuatro unidades vendidas 2 sean buenas Respuesta: 323
13
c) se vendan al menos tres unidades defectuosas Respuesta: 969

16. El 80 % de la población es morena y el 70 % es de ojos oscuro. Si se selecciona una persona al


azar, calcular la probabilidad de:

a) no ser de piel morena o tener los ojos oscuros Respuesta: 0,76


b) ser de piel morena y tener los ojos oscuros Respuesta: 0,56

17. La probabilidad de que cierto componente electrónico funcione es de 0,90. Un aparato contiene
dos de estos componentes. El aparato funciona si por lo menos uno de los componentes funciona.

Sin importar cual de los componentes funcione o no. Cuáles son los posibles resultados? (
Puede suponer independencia en la operación de los componentes).
Cuál es la probabilidad de que el aparato no funcione Respuesta: 0,99

18. La suma de las probabilidades de que tres hombres H1 , H2 y H3 peguen en el blanco es 0,95.
Además la posibilidad de que H1 de en el blanco es el doble de que lo haga H2 y H2 tiene la
misma posibilidad de dar en el blanco que H3 , cada uno dispara una vez al blanco.

Hallar la probabilidad de que exactamente uno de ellos pegue en el blanco.


Si solo un pega en el blanco. Cuál es la probabilidad de que sea el primer hombre?

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


Capı́tulo 6

Variables aleatorias

6.1. Definiciones y ejemplos


defina variable aleatoria es aquella que toma un conjunto de valores numéricos asociados a los
resultados de nuestro interés que produce un experimento aleatorio, es decir una función que asocia
a cada evento del espacio muestral un número real.
La definición anterior nos dice que dado un experimento aleatorio cualquiera, y el espacio muestral
Ω asociado a dicho experimento, una variable aleatoria es una transformación X del espacio de
resultados (espacio muestral) al conjunto de números reales, esto es, asigna a cada elemento ω ∈ Ω,
un número real X(ω). La expresión matemática está dada por:

X : Ω −→ R

Figura 6.1: Representación gráfica de la definición de una variable aleatoria

defina variable aleatoria es discreta cuando el conjunto de valores que ésta toma es un conjunto
discreto, es decir, un conjunto finito o numerable. Por ejemplo, el conjunto {0, 1, 2, . . . , n} es un
conjunto discreto porque es finito, lo mismo N pues aunque es infinito, es numerable y por lo tanto
discreto.
ejen experimento aleatorio consiste en escoger a una persona ω al azar. La variable aleatoria X
evaluada en ω corresponde a conocer la siguiente caracterı́stica, o una codificación de esta caracte-
rı́stica, de la persona escogida. En cada caso se trata de una variable aleatoria discreta: a) Edad en
ños. b) Número de hijos. c) Peso. d) Estatura. e) Sueldo. f) Nivel
escolar. g) Estado civil. h) Lugar de nacimiento.
defina variable aleatoria es continua cuando toma todos los valores dentro de un intervalo (a, b) ⊆
R.
ejen el ejemplo del lanzamiento de un dardo en un tablero circular de radio uno, el espacio muestral
Ω (Figura 6.1) es infinito no numerable, las variables X,Y, Z,V y W definidas allı́ son todas variables
aleatorias continuas. Si se dibujan cı́rculos concéntricos alrededor del origen y si se asignan premios
asociados a cada una de las regiones resultantes, puede obtenerse un ejemplo de una variable aleatoria
discreta sobre este espacio muestral.
La clasificación anterior de variables aleatorias no es completa pues existen variables que no son
de ninguno de los dos tipos mencionados. Por simplicidad en este curso estudiaremos únicamente
variables aleatorias que son discretas o continuas.
Usaremos también la siguiente notación importante: Si A es un subconjunto de R, entonces la
expresión (X ∈ A), incluyendo el paréntesis, denota el conjunto {ω ∈ Ω : X(ω) ∈ A}, es decir, (X ∈
A) = {ω ∈ Ω : X(ω) ∈ A}. En palabras, la expresión (X ∈ A) denota aquel conjunto de elementos ω de
Ω tales que bajo la aplicación de la función X toman un valor dentro del conjunto A. A este conjunto
se le llama la imagen inversa de A, y se le denota por X −1 A.
ejeonsideremos el experimento de lanzar una moneda al aire y la variable aleatoria X que
lleva el resultado Cara al valor 0 y el resultado Cruz al valor 1. Tenemos por ejemplo que
(X ∈ [1, ∞)) = {Cruz} pues el conjunto de elementos de Ω tales que bajo la función X toman un
valor mayor o igual a uno, es decir caen dentro del intervalo [1, ∞), es únicamente el elemento
Cruz. Por lo tanto P(X ∈ [1, ∞)) = P{Cruz} = 21 . Del mismo modo puede verificarse que
C. a) P(X ∈ [1, 2)) = P({Cruz}) = 21 .
36
6.2. DISTRIBUCIÓN DE PROBABILIDAD
C. U.N.A.

b) P(X ∈ [0, 1)) = P({Cara}) = 12 .

c) P(X ∈ [2, 4]) = P(0)


/ = 0.

d) P(X = 1) = P({Cruz}) = 21 .

e) P(X ≤ −1) = P(0)


/ = 0.

f) P(X ≥ 0) = P(Ω) = 1.

Usaremos con mucha frecuencia la notación arriba explicada. El lector debe asegurarse de com-
prender bien que si x es un número real entonces (X ≤ x) es un subconjunto de Ω y por lo tanto
un evento. Lo mismo sucede con el complemento de este conjunto que es (X > x). Podemos escribir
entonces la igualdad de conjuntos (X ≤ x) ∪ (X > x) = Ω. Y aplicando probabilidad se obtiene:

P(X ≤ x) + P(X > x) = 1

Nota importante. A través de una variable aleatoria se puede considerar que los posibles re-
sultados de un experimento aleatorio no son elementos ω en Ω sino números reales que la variable
aleatoria puede tomar. Esta es una consideración radical pues ya no consideraremos experimentos
aleatorios particulares, ni espacios muestrales arbitrarios Ω, ni eventos (subconjuntos) de Ω, en lu-
gar de ello consideraremos que una cierta variable aleatoria de interés toma valores en un cierto
subconjunto de números reales. La probabilidad definida antes para subconjuntos de Ω se traslada,
como explicamos antes, a probabilidades para subconjuntos de R. Esta perspectiva permite estudiar
modelos generales y después aplicarlos a cualquier situación particular. A partir de ahora y en lo que
resta del curso el término variable aleatoria constituirá un elemento frecuente en los enunciados.

6.2. Distribución de probabilidad


En esta sección vamos a estudiar a las dos funciones que se asocian a cada variable aleatoria y que
además nos provean de información acerca de las caracterı́sticas de dicha variable aleatoria. Una de
estas funciones es llamada función de distribución y se asocia a una variable continua o discreta, la
otra depende del tipo de variable estudiada, en el caso continuo se denomina función de densidad
de probabilidad y en caso discreto simplemente función de probabilidad. Estas funciones nos
permiten representar a un mismo tiempo tanto los valores que pueden tomar la variable aleatoria
como las probabilidades de los distintos eventos involucrados. Entonces en primer término defininamos
primero la función de probabilidad para una variable aleatoria discreta, después la función de densidad
para una variable continua, y finalmente definamos la función de distribución para ambos tipos de
variables aleatorias.
defiSea X una variable aleatoria discreta que toma los valores x1 , x2 , . . . con probabilidades respec-
tivas P(X = x1 ), P(X = x2 ), . . . . Esta lista de valores numéricos y sus probabilidades puede ser finita
o bien infinita, pero numerable. La función de probabilidad de la variable aleatoria X denotada por
f (x) : R −→ [0, ∞) se define como sigue

P(X = x) si x = x1 , x2 , . . .
f (x) = (6.2.1)
0 en otro caso

En palabras, la función de probabilidad es simplemente aquella función que indica los valores de
la probabilidad en los distintos valores que toma la variable aleatoria discreta. Recordemos que es
importante poder distinguir entre X y x, pues conceptualmente son cosas muy distintas. Denotaremos
generalmente a una función de probabilidad con la letra f minúscula. A veces escribiremos fX (x) y
el subı́ndice nos ayudará a especificar que tal función es la función de probabilidad de la variable
aleatoria X. Esta notación será particularmente útil cuando consideremos varias variables aleatorias
a la vez.

6.2.1. Propiedades de la función de probabilidad


Si toda función de la forma (6.2.1) cumple las siguientes dos propiedades la llamaremos función
de probabilidad.

1) f (x) ≥ 0 para todo x ∈ R

2) ∑ f (x) = 1
x

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.2. DISTRIBUCIÓN DE PROBABILIDAD U.N.A.

ejeonsidere la variable aleatoria discreta X que toma los valores 1, 2 y 3, con probabilidades 0,3;
0,5 y 0,2 respectivamente. Entonces la función de probabilidad de X es

 0, 3 si x = 1
f (x) = 0, 5 si x = 2
0, 2 si x = 3

Esta función se muestra gáficamente en la Figura 6.2. Alternativamente podemos también expresar
esta función mediante la tabla mostrada más abajo. En esta representación se entiende de manera
implı́cita que f (x) es cero para cualquier valor de x distinto de 1, 2 y 3. En particular, compruebe
que las siguientes probabilidades son correctas:
P(X ≤ 2) = 0, 7 P(|X| = 1) = 0, 3 y P(X < 1) = 0
0.7

f(x)
0.6
0.5
0.4
0.3
0.2
0.1
0.0

0 1 2 3 4

Figura 6.2: Representación gráfica de la función del ejemplo 6.2.1

x 1 2 3
p(x) 0,3 0,5 0,2
ejencontremos el valor de la constante c que hace que la siguiente función sea de probabilidad.

cx si x = 0, 1, 2, 3
f (x) =
0 en otro caso
Los posibles valores de la variable aleatoria discreta, no especificada, son 0, 1, 2 y 3, con probabi-
lidades 0, c, 2c y 3c, respectivamente. Como la suma de estas probabilidades debe ser uno, obtenemos
la ecuación c + 2c + 3c = 1. De aqui obtenemos c = 16 . Este es el valor de c que hace que f (x) sea no
negativa y sume uno, es decir, una función de probabilidad.
defiSea X una variable aleatoria continua. Decimos que la función integrable y no negativa f (x) :
R −→ [0, ∞) es la función de densidad de X si para cualquier intervalo (a, b) de R se cumple la igualdad
Z b
P(X ∈ (a, b)) = f (x)dx
a
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
6.2. DISTRIBUCIÓN DE PROBABILIDAD

Es decir, la probabilidad de que la variable tome un valor dentro del intervalo (a, b) se puede
calcular o expresar como el área bajo la función de densidad en el intervalo (a, b). De esta forma el
cálculo de una probabilidad se reduce al cálculo de una integral. Véase la Figura 6.3. No es difı́cil
comprobar que toda función de densidad f (x) de una variable aleatoria continua X cumple las dos
propiedades que mencionamos a continuación análogas al caso discreto.
4

b
f(x) = ⌠ f(x)dx
3

⌡a
2
1
0

a b

0 1 2 3 4

Rb
Figura 6.3: Representación gráfica de la función f (x) = a f (x)dx x ∈ (a, b)

6.2.2. Propiedades de la función de densidad de probabilidad


Si toda función de la forma f (x) : R −→ [0, ∞) cumple las siguientes dos propiedades la llamaremos
función de densidad de probabilidad.

1) f (x) ≥ 0 para todo x ∈ R


Z +∞
2) f (x)dx = 1
−∞

Toda función f (x) : R −→ [0, ∞) que satisfaga estas dos propiedades, sin necesidad de tener una
variable aleatoria de por medio, se llamará función de densidad.
ejea función f (x) dada por:
1


 si x ∈ (1, 3)
f (x) = 2


0 en otro caso
es una función de densidad de una variable aleatoria continua que toma valores en el intervalo
(1, 3), y cuya gráfica aparece en la Figura 6.4. Observe que se trata de una función no negativa y
cuya integral vale uno.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.2. DISTRIBUCIÓN DE PROBABILIDAD
C. U.N.A.

2.0

f(x) = (1 2)
1.5
1.0
0.5
0.0

a b
−0.5

0 1 2 3 4

1
Figura 6.4: Representación gráfica de la función f (x) = 2 x ∈ (1, 3)

ejencontrar el valor de la constante c que hace que la siguiente función sea de densidad.

 c|x| si x ∈ [−1, 1]
f (x) =
0 en otro caso

Se trata de una variable aleatoria continua que toma valores en el intervalo [−1, 1]. Como esta
función debe integrar uno tenemos que:
Z ∞ Z 1 Z 1  x2 1
1= f (x)dx = c|x|dx = 2c xdx = 2c =c
−∞ −1 0 2 0
Por lo tanto, cuando tomamos c = 1 la función anterior resulta ser una función de densidad pues
ahora cumple con ser no negativa e integrar uno.
defi. Sea X una variable aleatoria discreta o continua. La función de distribución de X, denotada
por F(x) : R −→ [0, 1], se define como
F(x) = P(X ≤ x)
Esto es, la función de distribución evaluada en un número x cualquiera es simplemente la proba-
bilidad de que la variable aleatoria tome un valor menor o igual a x, o en otras palabras, que tome
un valor en el intervalo (−∞, x]. Siendo F(x) una probabilidad, sus valores están siempre entre 0 y
1. Esta función resulta ser importante y se le conoce también, por razones evidentes, con el nombre
de función de acumulación de probabilidad. Con un par de ejemplo mostraremos la forma de
calcular esta función a partir de la función de probabilidad o de la función de densidad.
ejeonsideremos la variable aleatoria discreta X del ejemplo 6.2.1. Tenemos que la correspondiente
función de distribución evaluada en x se calcula sumando las probabilidades P(X = u) para valores
de u menores o iguales a x, es decir,

0 si x<1
0, 3 si 1≤x<2
F(x) = P(X ≤ x) = ∑ P(X = u) = .
u≤x
0, 8 si 2≤x<3
1 si x≥3
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
6.2. DISTRIBUCIÓN DE PROBABILIDAD

cuya gráfica aparece en la Figura 6.5. Este es el comportamiento tı́pico de una función de
distribución de una v.a. discreta, es no decreciente, constante por pedazos, y si la función tiene una
discontinuidad en x, entonces el tamaño de tal discontinuidad es exactamente la probabilidad de
que la variable aleatoria tome ese valor.
2.0

F(x) = P(X<x)
1.5
1.0
0.5
0.0
−0.5

0 1 2 3 4 5

Figura 6.5: Representación gráfica de F(x) = P(X ≤ x) = ∑ P(X = u)


u≤x

ejeonsideremos ahora la variable aleatoria continua X del ejemplo 6.2.3. La correspondiente función
de distribución se obtiene calculando la siguiente integral:

si x ≤ 1
 


0 
 0 si x ≤ 1

 

Z x 
 Z x 
1 x−1

F(x) = P(X ≤ x) = f (u)du = du si 1 < x < 3 = si 1 < x < 3
−∞ 
 1 2 
 2

 

 
si x ≥ 3
 
1 si x ≥ 3 1

cuya gráfica aparece en la Figura 6.7. Observe que esta función es continua y no decreciente.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.2. DISTRIBUCIÓN DE PROBABILIDAD U.N.A.

2.0

F(x) = P(X < x)


1.5
1.0
0.5
0.0

x
−0.5

0 1 2 3 4 5

Figura 6.6: Representación gráfica de F(x) del ejemplo 6.2.6

En los dos ejemplos anteriores se ha mostrado la forma de obtener F(x) a partir de f (x). Ahora
explicaremos el proceso contrario. En el caso continuo tenemos que para toda x en R,
Z x
F(x) = P(X ≤ x) = f (u)du
−∞

d
de modo que por el teorema fundamental del cálculo, y cuando F(x) es diferenciable, (F(x)) = f (x).
dx
De este modo podemos encontrar f (x) a partir de F(x). En el caso discreto, f (x) = P(X = x) =
F(x) − F(x− ), en donde F(x− ) es el lı́mite por la izquierda de la función F en el punto x, en sı́mbolos,
F(x− ) = lı́m F(x − h), con h > 0. Análogamente, la expresión F(x+ ) significa el lı́mite por la derecha
h−→0
de la función F en el punto x, es decir, F(x+ ) = lı́m F(x + h), con h > 0.
h−→0
proToda función de distribución F(x) satisface las siguientes propiedades:
.. 1. 0 ≤ F(x) ≤ 1
2. lı́m F(x) = 1
x−→∞

3. lı́m F(x) = 0
x−→−∞

4. Si x1 ≤ x2 , entonces F(x1 ) ≤ F(x2 )


5. Si x1 ≤ x2 , entonces P(x1 < X ≤ x2 ) = F(x2 ) − F(x1 )
6. F(x) = F(x+ )
Demostración
1. Como F(x) es una probabilidad pues, por definición, F(x) = P(X ≤ x). Por lo tanto se cumple
la primera propiedad.
2. Cuando x tiende a infinito el conjunto (X ≤ x) se aproxima al conjunto (X ≤ ∞) que es idéntico
a Ω = R, por lo tanto, cuando x −→ ∞,
F(x) −→ P(X ≤ ∞) = P(R) = 1
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.3. ESPERANZA, VARIANZA Y MOMENTOS U.N.A.

3. Análogamente el conjunto (X ≤ x) se aproxima al conjunto (X ≤ −∞) = 0/ cuando x tiende a


menos infinito. Por lo tanto, cuando x −→ ∞,

F(x) −→ P(X ≤ −∞) = P(0)


/ =0

4. Es suficiente observar que si x1 ≤ x2 , entonces (X ≤ x1 ) ⊆ (X ≤ x2 ). Aplicando probabilidad


obtenemos P(X ≤ x1 ) ≤ P(X ≤ x2 ).

5. Por teoria elemental de conjuntos el evento (x1 < X ≤ x2 ) puede descomponerse en la diferencia
(X ≤ x2 ) − (X ≤ x1 ), en donde (X ≤ x1 ) ⊆ (X ≤ x2 ). Por lo tanto

P(x1 < X ≤ x2 ) = P(X ≤ x2 ) ≤ P(X ≤ x1 ) = F(x2 ) − F(x1 )

6. Para h > 0 tenemos que F(x + h) = P(X ≤ x + h) = P(X ≤ x) + P(x < X ≤ x + h), de modo que
cuando h tiende a cero, el conjunto (x < X ≤ x+h) tiende al conjunto vacı́o. Concluimos entonces
que, cuando h −→ 0 con h > 0,

F(x + h) −→ F(x) + P(0)


/ = F(x)

La propiedad 4) significa que F(x) es una función monótona no decreciente. Mientras que la
propiedad 6) establece que F(x) es una función continua por la derecha.

6.2.3. Distribuciones discretas


Las distribuciones de variables aleatorias discretas más importantes son las siguientes:

a) Distribución binomial

b) Distribución binomial negativa

c) Distribución Poisson

d) Distribución geométrica

e) Distribución hipergeométrica

6.2.4. Distribuciones continuas


Las distribuciones de variable continua más importantes son las siguientes:

a) Distribución ji cuadrado

b) Distribución exponencial

c) Distribución t-student

d) Distribución normal

e) Distribución Gamma

f) Distribución Beta

Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con curvas.

6.3. Esperanza, varianza y momentos


Todos los seres humanos tenemos caracterı́sticas numéricas que nos identifican y nos distinguen de
otras personas, por ejemplo, la edad, estatura, talla, peso, etc. Si pudiéramos considerar la totalidad de
todos estos números para una persona en particular, la identificarı́amos de manera única. Algo similar
sucede con las variables aleatorias. En esta sección estudiaremos algunas caracterı́sticas numéricas
asociadas a las variables aleatorias.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.3. ESPERANZA, VARIANZA Y MOMENTOS
S. U.N.A.

6.3.1. Esperanza
defiLa esperanza de una variable aleatoria X es un número real denotado por E(X) y que
se calcula como sigue:
Esperanza . 1. Si X es una variable aleatoria discreta con función de probabilidad f (x), entonces:

E(X) = ∑ x f (x)
x

en donde la suma se efectúa sobre todos los posibles valores que pueda tomar la variable
aleatoria X, y se define cuando esta suma sea absolutamente convergente, es decir,

E(X) = ∑ |x| f (x)


x

El número de sumandos puede ser finito o infinito dependiendo del conjunto de valores de la
variable aleatoria.

2. Si X es una variable aleatoria continua con función de densidad de probabilidad f (x), entonces
la esperanza es Z ∞
E(X) = x f (x)dx
−∞
suponiendo que esta integral es absolutamente convergente, es decir,
Z ∞
E(X) = |x f (x)|dx
−∞

Si la suma o la integral anteriores no cumplen la condición de convergencia absoluta, entonces


se dice que la esperanza no existe. La esperanza de una variable aleatoria es entonces un número
que indica el promedio ponderado de los diferentes valores que puede tomar la variable aleatoria. A
la esperanza se le conoce también con los nombre de: media, valor esperado o valor promedio. En
general se usa la letra griega µ (mu) para denotarla. La integral o suma arriba mencionados pueden no
ser convergentes y en ese caso se dice que la variable aleatoria no tiene esperanza finita. La situación
anterior se ilustra en los ejercicios 126 y 127. La esperanza es uno de los conceptos más importantes
en probabilidad y tiene un amplio uso en las aplicaciones y otras ramas de la ciencia. Ilustraremos a
continuación la forma de calcular la esperanza.
ejeea X una variable aleatoria discreta con función de densidad dada por la siguiente tabla.

x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8

La esperanza de X es el número
3
1 4 1 2 1
E(X) = ∑ x f (x) = −1 · + 0 · + 1 · + 2 · =
x=−1 8 8 8 8 2

Observe que la suma su efectúa para todos los valores de x indicados en la tabla, es decir : -1, 0, 1 y
2. También es instructivo observar que la esperanza no es necesariamente uno de los valores tomados
por la variable aleatoria. En este ejemplo el valor 12 nunca es tomado por la variable aleatoria, pero
es su valor esperado.
ejeonsidere la variable aleatoria continua X con función de densidad:

 2x si 0 < x < 1
f (x) =
0 en otro caso

La esperanza de X es 1
Z 1
2 2 2
Z ∞
E(X) = x f (x)dx = x · 2x = x =
−∞ 0 3 3
0

Observe que la integral sólo es relevante en el intervalo (0, 1), pues fuera de dicho intervalo la
función de densidad se anula.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.3. ESPERANZA, VARIANZA Y MOMENTOS U.N.A.

Esperanza de una función de una variable aleatoria


En algunos casos es necesario saber calcular la esperanza de una función de una variable aleatoria.
Por ejemplo, si X es una variable aleatoria, entonces es claro que Y = X 2 es una función de X y es
también una variable aleatoria. Si quisiéramos calcular la esperanza de Y = X 2 según la definición
Z ∞
tendrı́amos que calcular y fY (y)dy, para lo cual se necesita encontrar primero la función de den-
−∞
sidad de Y , y ello en general no es fácil. El siguiente resultado es muy útil y nos dice cómo calcular
esta esperanza conociendo únicamente la función de densidad de X. A veces se le refiere como el
teorema del estadı́stico inconsciente.
proea X una variable aleatoria y sea g : R −→ R una función tal que g(X) es una variable
aleatoria con esperanza finita. Entonces:
Si X es una variable aleatoria discreta; con función de probabilidad fX (x), se define la esperanza
de la variable aleatoria discreta g(x) esta dada por la siguiente:

E[g(X)] = ∑ g(x) fX (x) (6.3.2)


X

2.
1. Si X es una variable aleatoria continua; con función de densidad de probabilidad fX (x); entonces
la esperanza de la variable aleatoria continua g(x) está dada por la siguiente ecuación:
Z ∞
E[g(X)] = g(x) fX (x)dx (6.3.3)
−∞

En general, la demostración de este resultado es complicada, asi es que la omitiremos y nos


concentraremos en su uso y aplicación.
ejealcularemos E(Y ) en donde Y = X 2 , y X es la variable aleatoria continua del ejemplo anterior,
es decir, con función de densidad

 2x si 0 < x < 1
f (x) =
0 en otro caso

Por la proposición anterior tenemos que:


1
Z 1
2 4 1
Z ∞
E(Y ) = E(X 2 ) = g(x) f (x)dx = 2
x · 2x = x =
−∞ 0 4 2
0

ejeea X una variable aleatoria con función de probabilidad dada por la tabla que aparece abajo.
Encuentre la función de probabilidad de Y = X 2 usando la ecuación(6.3.2).

x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8

Por la ecuación (6.3.2) la esperanza de Y = X 2 es


1 4 1 2 5
E(Y ) = ∑ g(x) f (x) = ∑ x2 f (x) = (−1)2 · + 02 · + 12 · + 22 · =
X X 8 8 8 8 4

Propiedades de la esperanza
proean X y Y variables aleatorias con esperanzas finitas y sea c una constante. Entonces
S. a) E(c) = c
b) E(cX) = cE(X)
c) Si X ≥ 0, entonces E(X) ≥ 0
d) E(X +Y ) = E(X) + E(Y )
Demostración
a) Si X es una v.a. discreta por definición de esperanza para caso discreto tenemos que:

E(c) = ∑ cP(X = x) = c ∑ P(X = x) = c


x x

Si X es una v.a. continua por definición de esperanza para caso continuo tenemos que:
Z ∞ Z ∞
E(c) = c f (x)dx = c f (x)dx = c
−∞ −∞
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.3. ESPERANZA, VARIANZA Y MOMENTOS U.N.A.

b) Si X es una v.a. discreta por definición de esperanza para caso discreto tenemos que:

E(cX) = ∑(cx)P(X = x) = c ∑ xP(X = x) = cE(X)


x x

Si X es una v.a. continua por definición de esperanza para caso continuo tenemos que:
Z ∞ Z ∞
E(cX) = (cx) f (x)dx = c x f (x)dx = cE(X)
−∞ −∞

c) Este inciso es muy evidente pues cuando se cumple la hipótesis (E(X) ≥ 0), en la integral o
suma correspondiente solo aparecerán términos que son no negativos.
d) Esta última propiedad, en cambio, no es sencilla de demostrar y aún en el caso discreto requiere
de detalles técnicos que preferimos omitir.
Oservaciones:
Observe que la segunda y la cuarta propiedad establecen que la esperanza es lineal, es decir,
separa sumas y también separa multiplicaciones por constantes; esto es

E(c1 X + c2Y ) = c1 E(X) + c2 E(Y )

Además si X1 , X2 , . . . , Xn son v.a. y c1 , c2 , . . . , cn son constantes arbitrarias se tiene que:


 n  n
E ∑ ci Xi = ∑ ci E(Xi )
k=1 k=1

Si X e Y son v.a. independientes entonces E(XY ) = E(X)E(Y ). Esto mismo se extiende para
 n  n
una sucesión X1 , X2 , . . . , Xn de v.a. independientes, esto es E ∑ Xi = ∏ E(Xi ). Esta última
i=1 i=1
propiedad no la detallaremos pero la utilizaremos en algunas demostraciones.

6.3.2. Varianza
defiLa varianza de una variable aleatoria X, denotada por Var(X), se define como la siguiente
esperanza, si ésta existe,


 ∑[x − E(X)]2 f (x) si X es una v.a. discreta
x


Var(X) = E[X − E(X)]2 =
 Z ∞
[x − E(X)]2 f (x)dx si X es una v.a. continua



−∞

La varianza es una medida del grado de dispersión de los diferentes valores tomados por la variable
aleatoria. Se le denota regularmente por la letra σ2 (sigma cuadrada). A la raı́z cuadrada positiva de
la varianza, esto es σ, se le llama desviación estándar. Nuevamente la anterior suma o integral puede
no existir y en ese caso decimos que la variable aleatoria no tiene varianza finita. Observemos que
para calcular Var(X) necesitamos conocer primero E(X). Veamos algunos ejemplos sencillos.
ejealcularemos la varianza de la variable aleatoria discreta X con función de probabilidad dada
por la siguiente tabla.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
1
Recordemos primeramente que por cálculos previos, E(X) = . Aplicando la definición de varianza
2
para v.a. discreta Var(X) = ∑[x − E(X)]2 f (x), tenemos que:
x
 1 2 1  1 2 4  1 2 1  1 2 2
Var(X) = − 1 − · + 0− · + 1− · + 2− · =1
2 8 2 8 2 8 2 8
ejealcularemos la varianza de la variable aleatoria continua X con función de densidad f (x) = 2x
2
para x ∈ (0, 1) y cero en otro caso. En un cálculo previo habı́amos encontrado que E(X) = . Aplicando
Z ∞ 3
2
la definición de varianza para una v.a. continua Var(X) = [x − E(X)] f (x)dx, tenemos que
−∞
Z 1
2 2
Z 1
8 8   x4 8 4  1 1
Var(X) = x− 2xdx = 2x3 − x2 + x dx = − x3 + x2 =
0 3 0 3 9 2 9 9 0 18
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.3. ESPERANZA, VARIANZA Y MOMENTOS
(Momentos) . U.N.A.

Propiedades de la varianza
Ahora enunciamos algunas propiedades de la varianza.
proean X y Y dos variables aleatorias, y sea c una constante. Entonces
S. a) Var(X) ≥ 0

b) Var(c) = 0

c) Var(cX) = c2Var(X)

d) Var(X + c) = Var(X)

e) Var(X) = E(X 2 ) − (E(X))2

f) Var(X +Y ) 6= V (X) +V (Y )

Demostración

a) Este inciso es evidente a partir de la definición de varianza pues en ella aparece una suma o
integral de términos no negativos.

b) Para este inciso la constante c es una v.a. con un único valor, de modo que E(c) = c, entonces
Var(X) = E(c − c)2 = E(0)2 = E(0) = 0

c) Para este inciso tenemos que:


Var(cX) = E[cX − E(cX)]2 = E[cX − cE(X)]2 = E[c2 (X − E(X))2 ]

= c2 E[X − E(X)]2 = c2Var(X)

d) La demostración de este inciso tiene un procedimiento análogo al anterior, esto es,

Var(X + c) = E[(X + c) − E(X + c)]2 = E[X + c − (E(X) + E(c))]2

= E[X + c − E(X) − c)]2 = E[X − E(X)]2 = Var(X)

e) Para demostrar esta propiedad se desarrolla el cuadrado en la definición de varianza, y se usa


la propiedad de linealidad de la esperanza, esto es,

Var(X) = E[X − E(X)]2 = E[X 2 − 2XE(X) + (E(X))2 ]

= E(X 2 ) − 2E[XE(X)] + E[E(X)]2 = E(X 2 ) − 2[E(X)]2 + [E(X)]2

= E(X 2 ) − [E(X)]2

f) Finalmente para demostrar la propiedad (f) es suficiente dar un ejemplo. Puede tomarse el caso
Y = X, en general y por lo demostrado antes, se tiene que

Var(X +Y ) = Var(2X) = 22Var(X) = 4Var(X) 6= 2Var(X) = Var(X) +Var(Y )

Observación:

Si X e Y son v.a. independientes y c1 , c2 son constantes arbitrarias entonces

Var(c1 X + c2Y ) = c21Var(X) + c22Var(Y )

Además si X1 , X2 , . . . , Xn son v.a. independientes todas entre si y c1 , c2 , . . . , cn son constantes


arbitrarias se tiene que:
 n  n
Var ∑ ci Xi = ∑ c2i Var(Xi )
k=1 k=1

Nota: En este curso no entraremos en detalles con respecto a las v.a. independientes por eso no
demostraremos las propiedades que este hecho implica en la esperanza y la varianza de la suma de
v.a. de este tipo mencionadas anteriormente.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.3. ESPERANZA, VARIANZA Y MOMENTOS U.N.A.

6.3.3. Momentos
Los momentos de una variable aleatoria son números que representan algunas caracterı́sticas de la
distribución de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
de manera única a la distribución de probabilidad. A continuación definiremos los momentos si existen
de una variable aleatoria alrededor del origen y alrededor de la media también llamada momento
central.
defiSe define el n−ésimo momento de una variable aleatoria X alrededor del origen, cuando existe,
como el número E(X n ), para cualquier valor natural de n. El n−ésimo momento central de X, cuando
existe, es el número E[(X − µ]n , en donde µ = E(X).
Observe que el primer momento de X alrededor del origen es simplemente la esperanza, y el
segundo momento central es la varianza. Tenemos entonces que si X es una variable aleatoria con
función de probabilidad f (x) si es discreta o función de densidad de probabilidad f (x) si es continua,
entonces el n−ésimo momento de X, si existe, se calcula como sigue:


 ∑ xn f (x) si X es una v.a. discreta
x


E(X n ) = Z ∞

xn f (x)dx si X es una v.a. continua



−∞

El n−ésimo momento central de X se calcula, para variables aleatorias discretas y continuas


respectivamente, como indican las siguientes fórmulas:


 ∑ (x − µ)n f (x) si X es una v.a. discreta
x


E[X − µ]n = Z ∞

(x − µ)n f (x)dx si X es una v.a. continua



−∞

ejeea la variable aleatoria discreta X con función de probabilidad dada por la siguiente tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
S. a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer, segundo y tercer momento alrededor de la media
Desarrollo de los incisos
a) Por definición de momentos alrededor del origen tenemos que
2
1 2 1
E(X) = ∑ x f (x) = 0 · 4 + 1 · 4 + 2 · 4 = 1
x=0

2
1 2 1 3
E(X 2 ) = ∑ x2 f (x) = 02 · 4 + 12 · 4 + 22 · 4 = 2
x=0
2
1 2 1 5
E(X 3 ) = ∑ x3 f (x) = 03 · 4 + 13 · 4 + 23 · 4 = 2
x=0

b) Por definición de momentos alrededor de la media cuyo valor es 1 tenemos que


2
1 2 1
E(X − µ) = ∑ (x − 1) f (x) = (0 − 1) · 4 + (1 − 1) · 4 + (2 − 1) · 4 = 0
x=0

2
1 2 1 1
E[(X − µ)2 ] = ∑ (x − 1)2 f (x) = (0 − 1)2 · 4 + (1 − 1)2 · 4 + (2 − 1)2 · 4 = 2
x=0
2
1 2 1
E[(X − 1)3 ] = ∑ (x − 1)3 f (x) = (0 − 1)3 · 4 + (1 − 1)3 · 4 + (2 − 1)3 · 4 = 0
x=0

ejena variable aleatoria X tiene función de densidad de probabilidad dada por:


x
 2 si 0 < x < 2


f (x) = .


0 en otro caso
U. a) Hallar el primer, segundo y tercer momento alrededor del origen
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.4. FUNCIÓN GENERADORA DE MOMENTOS
S. U.N.A.

b) Calcular el primer y segundo momento alrededor de la media


Desarrollo de los incisos

a) Por definición de momentos alrededor del origen tenemos que

x3 2 4
Z 2
x
E(X) = x dx = =
0 2 6 0 3

x4 2
Z 2
2 2x
E(X ) = x dx = = 2
0 2 8 0
Z 2 5
x 2 16
3 3x
E(X ) = x dx = =
0 2 10 0 5
b) Por definición de momentos alrededor de la media tenemos que
 4 4 4 4
E(X − µ) = E X − = E(X) − E = − =0
3 3 3 3
Z 2
4 2 i 4 2 x 1 2  3 8 2 16 
h Z
2
E[(X − µ) ] = E X − = x− dx = x − x + x dx
3 0 3 2 2 0 3 9
1 x4 8 3 8 2 2 2
 
= − x + x =
2 4 9 9 0 9

6.4. Función generadora de momentos


A continuación definiremos una función especial denominada función generadora de momentos.
defiSea X una variable aleatoria con función de probabilidad f (x) en el caso de que sea discreta
o función de densidad f (x) en el caso de que sea continua. Se define a la función generadora de
momentos de la variable aleatoria X como la siguiente esperanza,

MX (t) = E(etX )

La función generadora de momentos de X se calcula, para variables aleatorias discretas y continuas


respectivamente, como indican las siguientes fórmulas:


 ∑ etx f (x) si X es una v.a. discreta
x

MX (t) = Z .
 ∞
etx f (x)dx si X es una v.a. continua



−∞

ejeea X la variable aleatoria discreta del ejemplo 6.3.7, es decir, con función de probabilidad dada
por la tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
Obtener su función generadora de momentos. Por la definición de función generadora de momentos
tenemos
2
0 1 1t 2 2t 1 e2t + 2et + 1
MX (t) = E(etX ) = ∑ etx
f (x) = e · + e · + e · =
x=0 4 4 4 4

ejena variable aleatoria X tiene función de densidad de probabilidad dada por:



−2x si x ≥ 0
2e

f (x) = .

0 en otro caso

Obtener su función generadora de momentos. Por la definición de función generadora de momentos


tenemos Z ∞ Z ∞ Z ∞
−2x
tX
MX (t) = E(e ) = tx
e f (x)dx = tx
e 2e dx = 2 e−(2−t)x dx
−∞ 0 0
2 ∞
−(2−t)x 2
= e =
−(2 − t) 0 2−t
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.4. FUNCIÓN GENERADORA DE MOMENTOS U.N.A.

Propiedades de la función generadora de momentos


proea X una variable aleatoria con los primeros n momentos alrededor del origen finitos, estos es,
E(X k ) < ∞; ∀k ∈ {0, 1, 2, . . . , n} y función generadora de momentos MX (t) , entonces se tiene que:
dn  
M X (0) = E(X n )
dt n
Demostración Por definición de función generadora de momentos, MX (t) = E(eXt ) y por serie de

(tX)k
Taylor, e(Xt) = ∑ . Por lo tanto
k=0 k!
 ∞
(tX)k  ∞ k
t
MX (t) = E ∑ k! = ∑ k! E(X k )
k=0 k=0

Derivando n veces a MX (t) obtenemos la siguiente secuencia

d  ∞
t k−1 k

t k−1
MX (t) = ∑ E(X ) = ∑ E(X k−1 X) = E(XetX )
dt k=1 (k − 1)! k=1 (k − 1)!

d2   ∞
t k−2 ∞
t k−2
dt 2
M X (t) = ∑ (k − 2)! E(X k
) = ∑ (k − 2)! E(X k−2X 2) = E(X 2etX )
k=2 k=2
..
.
dn   ∞
t k−n k

t k−n
n
M X (t) = ∑ E(X ) = ∑ E(X k−n X n ) = E(X n etX )
dt k=n (k − n)! k=n (k − n)!
Por lo que finalmente
dn  
n
MX (0) = E(X n )
dt
ejeomemos nuevamente a la variable aleatoria discreta X del ejemplo 6.4.1 junto con su función
generadora de momentos y calculemos los cuatro primeros momentos de la variable alrededor del
origen. Entonces
et + et + 1
MX (t) =
2
d   2t
e + et 1+1
E(X) = Mx (t) = = =1

dx t=0 2 t=0 2
d2   2e2t + et 2+1 3
E(X 2 ) = 2 Mx (t) = = =

dx t=0 2 t=0 2 2
d 3   2t
4e + e t 4+1 5
E(X) = 3 Mx (t) = = =

dx t=0 2 t=0 2 2
d 4   2t
8e + e t 8+1 9
E(X) = 4 Mx (t) = = =

dx t=0 2 t=0 2 2
ejeomemos ahora la variable aleatoria continua X del ejemplo 6.4.2 junto con su función generadora
de momentos y calculemos los cuatro primeros momentos de la variable alrededor del origen. Entonces
2
MX (t) =
2−t
d  2 2 1
E(X) = Mx (t) = = =

(2 − t)2 t=0 22 2

dx t=0

2 d2   4 4 1
E(X ) = 2 Mx (t) = = 3=

dx t=0 3
(2 − t) t=0 2 2
d3   12 12 3
E(X) = 3 Mx (t) = = 4 =

dx t=0 4
(2 − t) t=0 2 4
d4   48 48 3
E(X) = 4 Mx (t) = = 5 =

dx t=0 5
(2 − t) t=0 2 2
proi X1 , X2 , . . . , Xn son v.a. independientes entonces
n
M n (t) = ∏ MXi (t)
∑ Xi i=1
i=1

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.5. PROBLEMAS U.N.A.

Demostración
Por definición de función generadora de momentos se tiene que
n
 ∑ Xit   n  n n
M n (t) = E ei=1 = E ∏ eXit = ∏ E(eXit ) = ∏ MXi (t)
∑ Xi i=1 i=1 i=1
i=1
Notese que para esta demostración utilizamos la propiedad de la esperanza para v.a. indepen-
dientes.

6.5. Problemas

Variables Aleatorias

1. Determine en cada caso si la variable aleatoria en cuestión es discreta o continua. Cuáles son
sus posible valores?

a) Tiempo de vida de una persona escogida al azar.


b) Número de errores tipográficos en una página escogida al azar de un libro.
c) Tiempo de servicio en una transacción escogida al azar realizada por una persona en un
cajero automático.
d) Monto de una reclamación por accidente automovilı́stico escogida al azar del conjunto de
reclamaciones efectuadas a una compañı́a aseguradora.

Funciones de probabilidad, de densidad y de distribución

2. Grafique y compruebe que las siguientes funciones son de probabilidad


 2
x

 si x = −2, −1, 0, 1, 2
10

a) f (x) = .


0 en otro caso

(2x − 5)2


 si x = 1, 2, 3, 4, 5
70

b) f (x) = .


0 en otro caso

3. Grafique y compruebe que las siguientes funciones son de densidad


x+1



 2 si x ∈ (−1, 1)
a) f (x) = .


0 en otro caso

(
e−x si x > 0
b) f (x) = .
0 si x ≤ 0

4. Encuentre el valor de la constante c para que f (x) sea una función de probabilidad. Grafique
esta función y calcule P(X ∈ 2, 3, 4) y P(X < 3) en cada caso.

cx si x = 1, 2, . . . , 10

a) f (x) = .

0 en otro caso


2
cx si x = 1, 2, . . . , 10

b) f (x) = .

0 en otro caso

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.5. PROBLEMAS U.N.A.

5. Determine si la siguiente función es de probabilidad. Grafique la función y justifique su res-


puesta. 
1

 si x = 0, 1
6







f (x) = 2 si x = 2 .



 3




0 otro caso

6. Determine si la siguiente función es de probabilidad. Grafique la función y justifique su res-


puesta.  4  3 x  1 4−x

 x!(4 − x)! 4
 si x = 0, 1, 2, 3, 4
4
f (x) = .



0 otro caso

7. Encuentre el valor de la constante c para que la siguiente función sea de densidad. Grafique
f (x) y calcule P(X ≥ π) y P(X ∈ [π, 2π]).

c(1 + senx) si x ∈ [0, 2π]

f (x) = .

0 en otro caso

8. Encuentre el valor de la constante c para que la siguiente función sea de densidad. Grafique
f (x) y calcule P(X ∈ (1, ∞)).

f (x) = ce−|x| para − ∞ < x < ∞

9. Determine si cada una de las siguientes funciones es de densidad. Grafique la función en cada
caso y justifique su respuesta.
4x



5 si x ∈ [0, 2]
a) f (x) = .


0 otro caso

 2
2x 4

 − 2x + si x ∈ [0, 3]
3 3

b) f (x) = .


0 en otro caso

10. Explique porqué no es posible encontrar un valor de la constante c para que la siguiente función
sea de probabilidad o de densidad.

cx
 si x = −2, −1, 0, 1, 2
a) f (x) = .

0 otro caso


c senx
 si x ∈ [−π, π]
b) f (x) = .

0 en otro caso

11. Sea X una v.a. discreta con función de probabilidad dada por la siguiente tabla. Grafique f (x)
y calcule P(X ≥ 0), P(X < 0) y P(X 2 = 1).

x -1 0 1
f(x) 0,2 0,3 0,5

12. Dadas las variables aleatorias con funciones de probabilidad dada por las tablas
x 0 1 2 3 4
f(x) 1/210 4/35 3/7 8/21 1/14

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.5. PROBLEMAS U.N.A.

x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36

a) Grafique en ambos casos


b) Calcule P(X ≤ 2), P(X ≥ 3) y P(1 ≤ X ≤ 3) en ambos casos

13. Sea X una v.a. discreta con función de probabilidad dada por la tabla que aparece abajo.
Grafique f (x). Calcule la función de probabilidad de las siguientes variables aleatorias Y =
X 2 , Z = |X| y W = 2X − 5. Grafique en cada caso.
x -2 -1 0 2 3 5
f(x) 0,1 0,15 0,4 0,1 0,15 0,1

14. Sea X discreta con función de probabilidad dada por la tabla que aparece abajo. Encuentre el
valor de c y grafique f (x). Calcule y grafique la función de probabilidad de la variable Y = X 2 .
x -2 0 2
f(x) 0,1 c 0,1

15. Sea X una variable aleatoria con la siguiente función de distribución. Encuentre y grafique f (x).
Calcule P(0 ≤ X < 10).
  1 x+1

 1 − si x = 0, 1, 2, 3, . . .
 2
F(x) = .


0 otro caso

16. Sea X una v.a. continua con función de densidad


1



 10 si − k ≤ x ≤ 4k
f (x) = .


0 otro caso

a) Determine el valor de la constante k y grafique f (x)


b) Calcule y grafique F(x)
c) Calcule P(−1 ≤ X ≤ 3), P(X ≥ 2) y P(X ≤ 0)
1
d) Encuentre m tal que P(|X − 1| ≥ m) =
2
17. Sea X una variable aleatoria continua con la función de densidad que aparece abajo. Encuentre
el valor de la constante c y grafique la función f (x). Encuentre y grafique además la función de
distribución F(x).
2x

 9 si 0 < x < c


f (x) = .


0 si en otro caso

(
ce−3x si x > 0
18. Dada la siguiente función f (x) = .
0 si x ≤ 0

a) Obtenga el valor de c que haga que esta función sea de densidad para X
b) Calcule y grafique F(x)
c) Calcule P(X ≤ 10), P(X ≥ 5) y P(5 ≤ X ≤ 10)

19. El tiempo en minutos que una persona espera un autobús es una v.a. con función de densidad
dada por 
1
2 si 0 < t < 1







f (t) = 14 si 2 < t < 4 .






0 para otro valor de t

Hallar la probabilidad de que el tiempo en que la persona que espera el autobús sea de
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.5. PROBLEMAS U.N.A.

a) mayor de 3 minutos
b) entre 1 y 2 minutos
c) menor de 3 minutos

20. Una v.a. tiene función de densidad



2 si 1 ≤ t ≤ 2
cx

f (t) = cx si 2 ≤ t ≤ 3 .

0 para otro valor de x

Hallar:

a) la constante c
b) la función de distribución
1 3
c) P(X > 2) y P <X <
2 2
21. Sea X una variable aleatoria con la función de distribución que aparece abajo. Es X discreta
o continua? Grafique F(x). Encuentre y grafique la correspondiente función de densidad f (x).
Calcule además P(X = 2) y P(1 < X < 2).


 0 para x < 1





1

F(x) = si 1 ≤ x < 2 .


 3




1 para x ≥ 2

22. Sea X una variable aleatoria con la función de distribución que aparece abajo. Es X discreta
o continua? Grafique F(x). Encuentre y grafique la correspondiente función de densidad f (x).
1 1
Calcule además P(X = ) y P(X > ).
2 2

0√ para x < 0

F(x) = x si 0 ≤ x < 1 .

1 para x ≥ 1

23. Una urna contiene cuatro bolas numeradas 1, 2, 3 y 4. Se extraen dos bolas al azar, una a la
vez y sin reemplazo. Sea X la variable aleatoria que denota la suma de los números de las dos
bolas seleccionadas.

a) Determine Ω
b) Calcule y grafique f (x)
c) Calcule y grafique F(x)
d) Calcule P(X ≥ 6), P(3 < X ≤ 5) y P(X = 6)

Esperanza, varianza, momentos y función generadora de momentos

1. Sea a un número fijo. Construya una variable aleatoria X tal que E(X) = a.

2. Calcule la esperanza de la variable aleatoria discreta X cuya función de probabilidad es



1

 si x = 0, 1
3







a) f (x) = 1 si x = 2, 3 .



 6




0 otro caso

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


6.5. PROBLEMAS U.N.A.

1

 si x = −1, 1
4







b) f (x) = 1 si x = 0 .



 2




0 otro caso

3. Calcule la esperanza de la variable aleatoria continua X cuya función de densidad es

a) f (x) = e−x , para x > 0


b) f (x) = 6x(1 − x), para 0 < x < 1

4. Sea X una variable aleatoria discreta con la función de probabilidad que aparece abajo. De-
muestre que f (x) es efectivamente una función de probabilidad y que la esperanza de X no
existe. Este es un ejemplo de una variable aleatoria discreta que no tiene esperanza finita.
 1
 x(x + 1) para x = 1, 2, 3, . . .


f (x) = .



0 para otros casos

5. Sea X una variable aleatoria continua con la función de densidad que aparece abajo. Demuestre
que esta función es efectivamente una función de densidad. Compruebe además que la esperanza
de X no existe. Este es un ejemplo de una variable aleatoria continua que no tiene esperanza
finita. Es un caso particular de la distribución Cauchy.
1
f (x) = , para − ∞ < x < ∞
π(x2 + 1)

6. Demuestre que no existe la esperanza de la v.a X cuando su función de densidad es


1

 x2 para x > 1


f (x) = .


0 para x ≤ 1

7. Encuentre la esperanza y luego demuestre que la varianza de una variable aleatoria con la
siguiente función de densidad no existe.
2

 x3 para x > 1


f (x) = .


0 para x ≤ 1

8. Diga falso o verdadero. Justifique en cada caso.

a) La esperanza de una v.a. puede ser cero.


b) No hay dos v.a.s distintas con la misma esperanza.
c) La esperanza de una v.a. nunca es negativa.
d) La varianza de una v.a. puede ser cero.
e) La varianza de una v.a. nunca es negativa.
f) No hay dos v.a.s distintas con la misma varianza.

9. Demuestre que

a) E(E(X)) = E(X)
b) Var(Var(X)) = 0

10. Sea X la variable aleatoria constante c. Compruebe que

a) E(X) = c
b) E(X n ) = cn
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.5. PROBLEMAS U.N.A.

c) Var(X) = 0

11. Calcule la media y varianza de la variable aleatoria X con función de probabilidad



1

 si x = 0, 1, 2
9







f (x) = 2 si x = 3, 4, 5 .



 9




0 otro caso

12. Calcule la media y varianza de la variable aleatoria X cuya función de probabilidad es


 x+1
1

 si x = 0, 1, 2, 3, . . .
 2
f (x) = .


0 otro caso

13. Diga falso o verdadero. Justifique en cada caso.

a) Var(E(X)) = 0
b) E(Var(X)) = E(X)

14. Sea X una variable aleatoria continua con función de densidad f (x) = 12e−|x| , para −∞ < x < ∞.
Demuestre que f (x) es efectivamente una función de densidad y compruebe que

a) E(X) = 0
b) E(X 2 ) = 2
c) Var(X) = 2
d) E(X n ) = n! para n par

15. Diga falso o verdadero. Justifique en cada caso.

a) E(−X) = −E(X)
b) Var(−X) = −Var(X)
c) E(Var(X)) = Var(E(X))

16. Encuentre el error en la siguiente demostración de la afirmación de que la varianza de cualquier


variable aleatoria es cero.
0 = Var(0)

= Var(X + (−X))
= Var(X) +Var(−X)
= Var(X) +Var(X)
= 2Var(X)

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


Capı́tulo 7

Distribuciones de probabilidad

Estudiaremos a continuación algunas distribuciones de probabilidad de variables aleatorias im-


portantes. Estas distribuciones son modelos particulares para asignar probabilidades a subconjuntos
de números reales. Empezaremos con las distribuciones de tipo discreto y continuaremos después
con las de tipo continuo. Es importante señalar que ésta es sólamente una lista parcial de algunas
distribuciones de probabilidad de mayor uso.

7.1. Distribuciones discretas de probabilidad


7.1.1. Distribución Bernoulli
Un ensayo Bernoulli se define como aquel experimento aleatorio con únicamente dos posibles
resultados, llamados genéricamente éxito y f racaso , con probabilidades respectivas P(Éxito) = p y
P(Fracaso) = 1 − p.

Construcción de una distribución de Bernoulli


Sea un experimento aleatorio que arroja únicamente dos posibles resultados, denominados éxito
y fracaso. Si se define la variable aleatoria X como aquella función que lleva el resultado éxito al
número 1 y el resultado fracaso al número 0, entonces decimos que X tiene una distribución Bernoulli
con parámetro p ∈ (0, 1), y escribimos X ∼ Ber(p). La función de probabilidad es
p (1 − p)1−x si x = 0, 1
 x
f (x) =
0 para otro caso
proea X ∼ Ber(p), entonces tenemos que E(X) = p Var(X) = p(1− p) MX (t) = 1− p+ pet
Demostración
S .a)b)c)
a) A partir de la definición de esperanza se tiene que

E(X) = ∑ x f (x) = 0 · (1 − p) + 1 · p = p
x

b) Según la definición de varianza, Var(X) = ∑[x − E(X)]2 f (x), entonces tenemos que
x

Var(X) = (0 − p)2 (1 − p) + (1 − p)2 p = p2 (1 − p) + p(1 − p)2 = p(1 − p)


c) Recordando que la función generadora de momentos se define como MX (t) = E(etX ), entonces

MX (t) = ∑ etx f (x) = e0 (1 − p) + et p = 1 − p + pet


x
ejeonsidere el experimento aleatorio de lanzar una moneda al aire. Calcula la esperanza, la varianza
y la función generadora de momentos. Suponga que ω1 = cara y ω2 = cruz son los dos resultados
1 1
posibles, con probabilidades p = y 1 − p = , respectivamente. Sea X la variable aleatoria dada por
2 2 1
X(ω1 ) = 1, y X(ω2 ) = 0. Entonces X tiene distribución Ber , por lo tanto
2
1
E(X) = p =
2
1 1 1
Var(X) = p(1 − p) = (1 − ) =
2 2 4
1 1 t 1
MX (t) = 1 − + e = (1 + et )
2 2 2
57
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD U.N.A.

7.1.2. Distribución binomial


La distribución binomial fue desarrollada por suizo Jakob Bernoulli (1654−1705), es la principal
distribución de probabilidad discreta. La variable aleatoria binomial y su distribución están basadas
en un experimento que satisface las condiciones citadas a continuación.

Construcción de la distribución binomial


Suponga que se realizan n ensayos idénticos independientes de Bernoulli en donde la probabilidad
de éxito y de fracaso en cada uno de ellos es la misma, siendo la probabilidad de éxito igual a p y
la del fracaso igual a 1 − p, con p ∈ (0, 1). El espacio muestral de este experimento consiste de todas
las posibles sucesiones de longitud n de éxitos y de fracasos, esto es

Ω = {(EEE . . . E), (FEE . . . E), (FFE . . . E), . . . , (FFF . . . FE), (FFF . . . F)}

Usando el principio multiplicativo, es fácil ver que este conjunto tiene 2n elementos. Si ahora se
define la variable aleatoria X como el número de éxitos en cada una de estas sucesiones, esto es

X(EEE . . . E) = n, X(FEE . . . E) = n − 1, . . . , X(FFF . . . EF) = 1, X(FFF . . . F) = 0

entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribución binomial con parámetros
n y p. Se escribe X ∼ bin(n, p), y su función de probabilidad es

n!

 px (n − p)1−x si x = 0, 1, . . . , n
x!(n − x)!

f (x) =


 0 para otro caso

proea X ∼ bin(n, p), entonces tenemos que E(X) = np Var(X) = n(1 − p) MX (t) = (1 −
p + pet )n

Demostración

S .a)b)c)
a) Como la variable aleatoria X constituye el número de éxitos obtenidos en cada uno
n
de los posibles resultados en el experimento (posibles sucesiones de Ω). Entonces X = ∑ X j,
j=1
donde X j ∼ Ber(p), ∀ j = {1, 2, . . . , n}, por lo que la esperanza, varianza y función generadora de
momentos de cada X j son E(X j ) = p, Var(X j ) = p(1 − p) y MX j (t) = pet + p − 1 respectivamente.
Aplicando la propiedad de linealidad de la esperanza se tiene
 n  n n
E(X) = E ∑ Xj = ∑ E(X j ) = ∑ p = np
j=1 j=1 j=1

b) Tomando en cuenta la propiedad de varianza que establece que si tenemos n variables aleatorias
independientes, todas con varianzas finitas, entonces la varianza de las suma de las n v.a. es
idéntica a la suma de las varianzas de las variables, por lo tanto la varianza de X es:
n n n
Var(X) = Var( ∑ X j ) = ∑ Var(X j ) = ∑ p(1 − p) = np(1 − p)
j=1 j=1 j=1

c) Una de las propiedades de la función generadora de momentos establece que si tenemos n


variables aleatorias independientes, entonces la función generadora de momentos de la suma
de las n v.a. es idéntico al producto de la función generadora de momentos de las variables,
entonces
n n
MX (t) = M n (t) = ∏ MX j (t) = ∏ (pet + p − 1) = (pet + p − 1)n
∑ Xj j=1 j=1
j=1

ejel experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro interés es el
número de caras obtenidas en los cuatro lanzamientos. Como es evidente, la probabilidad de
obtener un éxito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la de obtener un
fracaso es también 0,50.
E. a) Cuál es la probabilidad de no obtener caras en los cuatro lanzamientos?

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD U.N.A.

b) Cuál es la probabilidad de obtener dos caras en los cuatro lanzamientos?

c) Haga una distribución de probabilidad binomial

d) Calcular la media, la desviación estándar y la función generadora de momentos de esta distri-


bución binomial
Esta distribución binomial tiene por función de probabilidad a la siguiente función
  1 x  1 4−x
4!
si x = 0, 1, 2, 3, 4


x!(4 − x)! 2 2

f (x) =


 0 para otro caso
  1 4
4!
si x = 0, 1, 2, 3, 4


x!(4 − x)! 2

=


 0 para otro caso

a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es,

4!  1 4 1
P(X = 0) = =
0!(4 − 0)! 2 16

b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es,

4!  1 4 6 3
P(X = 2) = = =
2!(4 − 2)! 2 16 8

c) La distribución de probabilidad está dada por la siguiente tabla

x 0 1 2 3 4
p(x) 1/16 4/16 3/8 1/4 1/16

c) Teniendo en cuenta la proposición

7.1.3. Distribución Poisson


Esta distribución fue descubierta por Simeón Denis Poisson (1781−1840) en 1837 como lı́mite
de la distribución binomial. En 1838 en su trabajo Recherches sur la probabilité des jugements en
matiéres criminelles et matiére civile (Investigación sobre la probabilidad de los juicios en materias
criminales y civiles). El trabajo estaba enfocado en ciertas variables aleatorias N que cuentan, entre
otras cosas, un número de ocurrencias discretas (muchas veces llamadas arribos) que tienen lugar
durante un intervalo de tiempo de duración determinada.
La distribución de Poisson tiene conexión con los procesos de Poisson. Se aplica a varios fenómenos
discretos de la naturaleza (esto es, aquellos fenómenos que ocurren 0, 1, 2, 3, . . . veces durante un
periodo definido de tiempo o en una área determinada) cuando la probabilidad de ocurrencia del
fenómeno es constante en el tiempo o el espacio.

Ejemplos de eventos que pueden ser modelados por la distribución de Poisson


a) El número de autos que pasan a través de un cierto punto en una ruta (suficientemente distantes
de los semáforos) durante un periodo definido de tiempo.

b) El número de errores de ortografı́a que uno comete al escribir una única página.

c) El número de llamadas telefónicas en una central telefónica por minuto.

d) El número de servidores web accedidos por minuto.

e) El número de animales muertos encontrados por unidad de longitud de ruta.

f) El número de mutaciones de determinada cadena de ADN después de cierta cantidad de radia-


ción.

g) El número de núcleos atómicos inestables que decayeron en un determinado periodo de tiempo


en una porción de sustancia radiactiva.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
U. a) U.N.A.

h) La radiactividad de la sustancia se debilitará con el tiempo, por lo tanto el tiempo total del
intervalo usado en el modelo debe ser significativamente menor que la vida media de la sustancia.

i) El número de estrellas en un determinado volumen de espacio.

j) La distribución de receptores visuales en la retina del ojo humano.

k) La inventiva de un inventor a través de su carrera

La distribución de Poisson surge cuando estamos interesados en medir el números de sucesos


aleatorios que suceden en un intervalo de tiempo fijo. La variable aleatoria se distribuye a lo largo
del tiempo o del espacio. Las condiciones para que se trate de una distribución de Poisson son:

Los eventos de interés deben ocurrir independientemente unos de otros

La probabilidad de que suceda un evento en un intervalo depende de la longitud del intervalo


y no de su posición.

Construcción de una distribución de Poisson


Supongamos que deseamos observar el número de ocurrencias de un cierto evento dentro de un
intervalo de tiempo dado, por ejemplo, el número de clientes que llegan a un cajero automático
durante la noche, o tal vez deseamos registrar el número de accidentes que ocurren en cierta avenida
durante todo un dı́a. Para modelar este tipo de situaciones podemos definir la variable aleatoria X
como el número de ocurrencia de este evento en el intervalo de tiempo dado. Es claro entonces que
X puede tomar los valores 0, 1, 2, . . . , y en principio no ponemos una cota superior para el número de
observaciones del evento. Adicionalmente supongamos que conocemos la tasa media de ocurrencia del
evento de interés, que denotamos por la letra λ (lambda). El parámetro λ es positivo y se interpreta
como el número promedio de ocurrencias del evento, por unidad de tiempo. La probabilidad de que
la variable aleatoria X tome un valor entero x ≥ 0 se definirá a continuación. Decimos que X tiene
una distribución Poisson con parámetro λ > 0, y escribimos X ∼ Poisson(λ) cuando:

 e−λ λx

 si x = 0, 1, 2, . . .
f (x) = x!


 0 para otro caso
t
proea X ∼ Poisson(λ), entonces tenemos que E(X) = λ Var(X) = λ MX (t) = eλ(e −1)

Demostración

S .a)b)c)
a) A partir de la definición de esperanza se tiene que

e−λ λx ∞
e−λ λx ∞ −λ x−1
e λ
E(X) = ∑x =∑ =λ∑ =λ
x=0 x! x=1 (x − 1)! x=1 (x − 1)!

b) Según una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) − [E(X)]2 , entonces
calculemos primero E(X 2 )

e−λ λx ∞
e−λ λx ∞
e−λ λx
E(X 2 ) = ∑ x2 = ∑x = ∑ (x − 1 + 1)
x=0 x! x=1 (x − 1)! x=1 (x − 1)!


e−λ λx ∞
e−λ λx ∞
e−λ λx ∞ −λ x−1
e λ
= ∑ (x − 1) +∑ =∑ +λ ∑
x=1 (x − 1)! x=1 (x − 1)! x=2 (x − 2)! x=1 (x − 1)!


e−λ λx−2 ∞ −λ x−1
e λ
= λ2 ∑ +λ ∑ = λ2 + λ
x=2 (x − 2)! x=1 (x − 1)!

Entonces:
Var(X) = λ2 + λ − λ2 = λ

c) Por la definición de función generadora de momentos, se tiene que



e−λ λx ∞
(et λ)x t t
MX (t) = ∑ etx = e−λ ∑ = e−λ · ee λ = eλ(e −1)
x=0 x! x=0 x!

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD U.N.A.

ejena distribución de Poisson está dada por

e−1,8 (1, 8)x


P(X = x) =
x!
Hallar
P(X = 1), P(X ≤ 2) y P(X ≥ 3)
b) E(X),Var(X) y MX (t)
Desarrollo

a) Tomando la función de probabilidad tenemos que

e−1,8 (1, 8)1


P(X = 1) = = 1, 8e−1,8 = 0, 2975
1!
P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)

e−1,8 (1, 8)0 e−1,8 (1, 8)1 e−1,8 (1, 8)2


= + + = 0, 7306
0! 1! 2!
P(X ≥ 3) = 1 − P(x < 3) = 1 − [P(X = 0) + P(X = 1) + P(X = 2)]

= 1 − 0, 7306 = 0, 2694
b) A partir de la proposición
t
E(X) = Var(X) = λ = 1, 8 y MX (t) = e1,8(e −1)

Relación con la distribución binomial

La distribución de Poisson puede ser vista como un caso lı́mite de la distribución binomial,
es decir, una distribución binomial en la que n → ∞ y p → 0 se puede aproximar por una
distribución de Poisson de parámetro λ = np.
ejen una central telefónica automática la probabilidad de que una llamada sea conectada
erróneamente es 10−3 .
E. a) Para un dı́a donde son conectadas 2000 llamadas independientes, hallar el valor apro-
ximado de la probabilidad que se efectúen 4 conexiones erróneas.
b) Cuál es el número mı́nimo de llamadas independientes que se requieren para asegurar con
probabilidad 0,9 que por lo menos una de las llamadas sea conectada erróneamente?
Desarrollo

a) Sea X la v.a que represente el número de llamadas telefónicas conectadas erróneamente


en un dı́a determinado. Entonces la función de probabilidad de X está dada por:

e−np (np)x
P(X = x) =
x!
donde p = 10−3 y n = 2000 según las condiciones de este problema. Entonces np = 2 y

e−2 (2)4
P(X = 4) = = 0, 09
4!

b) Si X es nuevamente el número de llamadas conectadas erróneamente en un dı́a determinado


entonces X ∼ Poisson(np). Según la información P(X ≥ 1) ≥ 0, 9 y considerando que P(X ≥
1) = 1 − P(X < 1) = 1 − P(X = 0) entonces:

e−np (np)0
1− ≥ 0, 9
0!
0, 1 ≥ e−np
ln|0, 1| ≥ −np
n ≤ 2303 llamadas

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD U.N.A.

7.1.4. Distribución geométrica


En la teorı́a de probabilidad y estadı́stica, la distribución geométrica es cualquiera de las dos
distribuciones de probabilidad discretas siguientes:

La distribución de probabilidad del número X de ensayos de Bernoulli necesaria para obtener


un éxito, contenido en el conjunto {1, 2, 3, . . . } o

la distribución de probabilidad del número Y = X − 1 de fallos antes del primer éxito, contenido
en el conjunto {0, 1, 2, 3, . . . }

A cualquiera de éstas dos distribuciones se la denomina distribución geométrica, es una cues-


tión de convención y conveniencia.

Construcción de una distribución geométrica


Supongamos que tenemos ahora una sucesión infinita de ensayos independientes Bernoulli, en
cada uno de los cuales la probabilidad de éxito es p. Para cada una de estas sucesiones definimos
la variable aleatoria X como el número de fracasos antes de obtener el primer éxito. Por ejemplo,
X(FEFEFF . . . ) = 1, X(EFFEEE . . . ) = 0, X(FFFEFE . . . ) = 3. Observamos que X puede tomar los
valores 0, 1, 2, . . . . La probabilidad de que X tome el valor entero x ≥ 0 es p(1 − p)x . Decimos entonces
que X tiene una distribución geométrica con parámetro p, y escribimos X ∼ geo(p) cuando

 p(1 − p)x si x = 0, 1, 2, . . .
P(X = x) =
0 para otro caso

El nombre de esta distribución proviene del hecho de que cuando escribimos la suma de todas las
probabilidades, obtenemos una suma geométrica. La inspección sucesiva de artı́culos hasta encontrar
una defectuoso, posiblemente en un proceso de control de calidad, puede modelarse usando una
distribución geométrica.
proi X es la v.a. que muestra el número de fracasos antes del primer éxito esto es; X ∼ geo(p)
entonces:
(1 − p)
S. a) E(X) =
p
(1 − p)
b) Var(X) =
p2
p 1
c) MX (t) = , con t < ln

t
1 − e (1 − p) 1− p

Demostración

a) A partir de la definición de esperanza se tiene que


∞ ∞ ∞
E(X) = ∑ xp(1 − p)x = p ∑ x(1 − p)x = p(1 − p) ∑ x(1 − p)x−1
x=0 x=0 x=0


d x d h ∞ x
i
= −p(1 − p) ∑ [(1 − p) ] = −p(1 − p) ∑ (1 − p)
x=1 d p d p x=1

d 1  (−1) 1 − p
= −p(1 − p) − 1 = −p(1 − p) 2 =
dp p p p
b) Según una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) − [E(X)]2 , entonces
calculemos primero E(X 2 )
∞ ∞ ∞
E(X 2 ) = ∑ x2 p(1 − p)x = p ∑ x2(1 − p)x = p(1 − p) ∑ x2(1 − p)x−1
x=0 x=1 x=1


d x d h ∞ x
i
= −p(1 − p) ∑ [x(1 − p) ] = −p(1 − p) ∑ x(1 − p)
x=1 d p d p x=1

d h1 ∞ x
i d h1 − pi
= −p(1 − p) ∑ px(1 − p) = −p(1 − p)
d p p x=1 d p p2

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD U.N.A.

h −p2 − (1 − p)2p i  p − 2  (1 − p)(2 − p)


= −p(1 − p) = −p(1 − p) =
p4 p3 p2

Entonces:
(1 − p)(2 − p) (1 − p)2 1 − p
Var(X) = − = 2
p2 p2 p
c) Por la definición de función generadora de momentos, se tiene que
∞ ∞ 1
tx x t x p
MX (t) = ∑ e p(1 − p) = p ∑ [e (1 − p)] = con t < ln

t
1 − e (1 − p) 1− p

x=0 x=0

1
Observación: Recordar que una serie geométrica es de la forma ∑ rx−1 y converge a
1−r
si su
x=1
radio r cumple con la condición |r| < 1
ejeupongamos que un dado ordinario (equilibrado) es lanzado repetidas veces hasta que
aparece el resultado 1 por primera vez. Calcular
S. a) obtener la distribución de probabilidad de la v.a. que se ajuste a este experimento y calcular
la probabilidad de obtener el 1 en el cuarto lanzamiento

b) la esperanza, la varianza y la función generadora de momentos


Desarrollo

a) Sea X la v.a que represente el número de lanzamientos necesarios del dado para obtener por
primera vez el resultado 1. Entonces X ∼ geo(P = 16 ), con lo cual
  x
 16 56
 si x = 0, 1, 2, . . .
P(X = x) =

0 para otro caso

Por lo que
1 5 3 125
P(X = 3) = 1− =
6 6 1296
b) Según la proposición

7.1.5. Distribución binomial negativa


Si en una sucesión infinita de ensayos de Bernoulli (el resultado en cada experimento es un
éxito o fracaso) cada uno con parámetro p ∈ (0, 1); la variable aleatoria X cuenta el número
de fracasos antes de obtener el r−ésimo éxito, entonces decimos que X tiene una distribución
binomial negativa con parámetros r y p, y escribimos X ∼ bin neg(r, p).

7.1.6. Construcción de una distribución binomial negativa


Para construir una distribución binomial negativa es necesario conocer el número de pruebas
que se repiten, el r-ésimo éxito en el número de pruebas que se repiten y la probabilidad de que
suceda un éxito en cada una de las pruebas.

Para n = r, r + 1, . . . se define An como el suceso que establece que el número total de pruebas
requeridas para obtener exactamente r éxitos es n. Como el suceso An ocurre si y solo si ocurren
exactamente r − 1 éxitos en las primeras n − 1 pruebas y el r−ésimo éxito se da en la n−ésimo
prueba. Puesto que todas las pruebas son de Bernoulli entonces son todas independientes entre
si y áplicando el principio de análisis combinatorio, se obtiene que:
 
n−1
P(An ) = pr−1 (1 − p)(n−1)−(r−1) p
r−1

con lo cual  
n−1
P(An ) = pr (1 − p)n−r (7.1.1)
r−1

Si decimos que X es la v.a. que cuenta el número de fracasos antes de obtener el r−ésimo éxito,
entonces X puede tomar los valores del conjunto {0, 1, 2, . . . }. Además recordemos que n por
definición de An es número de fracasos (x) más número de éxitos (r), esto es n = x + r. Entonces
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD U.N.A.

se entiende la v.a. X podrı́a caracterizar numéricamente al suceso An como X(An ) = x, por lo


que tendremos;
P(An ) = P(Ax+r ) = P(X = x) (7.1.2)
Tomando en cuenta las ecuaciones

Aparece el término pr pues la sucesión de ensayos Bernoulli no concluye sino hasta obtener r
éxitos. Podemos

tener

un número variable de fracasos, de ahı́ el término (1 − p)x , y finalmente
r+x−1
el factor   que nos dice las diferentes formas en que los r éxitos pueden aparecer en
x
los r + x − 1 ensayos realizados antes del último que necesariamente fue un éxito.

Es claro que esta distribución es una generalización de la distribución geométrica, la cual se


obtiene tomando r = 1.
proi X es la v.a. que muestra el número de fracasos antes del r éxito esto es; X ∼ bin neg(r, p)
entonces:
r(1 − p)
S . a) E(X) =
p
r(1 − p)
b) Var(X) =
p2
h p ir 1
c) MX (t) = , con t < ln

t
1 − e (1 − p)

1− p

Demostración

Si X es la v.a que cuenta el número de fracasos antes del r−ésimo éxito en sucesión de pruebas
r
de Bernoulli; entonces X = ∑ Xi, donde todas las v.a. Xi son independientes entre si y cada
i=1
1− p 1− p p
Xi ∼ geo(p), ∀ i = 1, 2, . . . , r; con lo cual E(Xi ) = ,Var(Xi ) = 2 y MXi (t) = .
p p 1 − et (1 − p)
Esto resulta del hecho de que para cada éxito se tubo que haber tenido un cierto número de
fracasos, que es la caracterı́stica de la distribución geométrica. Entonces
a) la esperanza de X es
r r r
  1 − p r(1 − p)
E(X) = E ∑ Xi = ∑ E(Xi ) = ∑ =
i=1 i=1 i=1 p p
b) la varianza de X es
r r r
  1 − p r(1 − p)
Var(X) = Var ∑ Xi = ∑ Var(Xi ) = ∑ p2 = p2
i=1 i=1 i=1

c) y la función generadora de momentos de X es


r r ir
p h p
MX (t) = M r (t) = ∏ MXi (t) = ∏ t
=
i=1 1 − e (1 − p) 1 − et (1 − p)
∑ Xi i=1
i=1

ejee lanza repetidas veces una moneda honesta, cuyos dos resultados son cara y cruz.
S . a) Cuál es la probabilidad de obtener la tercera cruz en el quinto lanzamiento?
b) Obtener la esperanza, varianza y la función generadora de momentos para esta distribu-
ción.
Desarrollo
a) Sea X la v.a. que represente el número de caras (fracasos) necesarias astes de obtener por
tercera vez cruz. Entonces X ∼ bin neg(3, 12 ), con lo cual
     
2+x 3 x
1 1
si x = 0, 1, 2, . . .



x
2 2
P(X = x) =


0 para otro caso

Por lo que     
2+2 1 3 1 2  1 5 6
P(X = 2) = =6 = = 0, 1875
2 2 2 2 32
b) Según la proposición
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

7.1.7. Distribución hipergeométrica


Como la mayorı́a de los muestreos se hacen sin remplazamiento. Ası́, si la población es pe-
queña la probabilidad de obtener el artı́culo del tipo requerido cambia en cada observación.
En estadı́stica la distribución hipergeométrica es una distribución de probabilidad discreta
con tres parámetros discretos N, r y n. Además es apropiada para muestreos sin reemplaza-
miento de poblaciones pequeñas. Esta distribución se refiere a un espacio muestral donde
hay elementos que tienen dos tipos de caracterı́sticas posibles. Indica la probabilidad de
obtener un número de objetos x de uno de estos tipos, al sacar una muestra de tamaño n,
de un total de N objetos, de los cuales k son del tipo requerido.

Construcción de una distribución hipergeométrica

Supongamos que tenemos un conjunto de N objetos de los cuales k son de una primera
clase y N − k son de una segunda clase. Supongamos que de este conjunto tomamos una
muestra aleatoria de tamaño n (n ≤ N), la muestra es sin reemplazo y el orden de los
objetos seleccionados no importa. El espacio muestral de este experimento consiste de
todas las posibles muestras de tamaño n que se pueden
  obtener del conjunto mayor de
N
tamaño N. La cardinalidad del espacio muestral es . Si para cada muestra definimos
n
la variable aleatoria X como el número de objetos de la primera clase contenidos en la
muestra seleccionada, entonces X puede tomar los valores 0, 1, 2, . . . , n; suponiendo n ≤ k.
La probabilidad de que X tome un valor x estará dada por la fórmula que enunciamos a
continuación. Decimos que X tiene una distribución hipergeométrica con parámetros N, k
y n, y escribimos X ∼ hipergeo(N, k, n) si

N −k
! !
k



 x n−x
si x = 0, 1, 2, . . . , n

 !
 N
P(X = x) =

 n




0 para otro caso

 
k
El término nos dice las diferentes formas en que de los k objetos de la primera clase
x
 
N −k
se pueden escoger x de ellos, y el término es nuevamente las diferentes formas
n−x
de escoger n − x objetos de la totalidad de N − k objetos de la segunda clase. Usamos el
principio multiplicativo para obtener el número total de muestras diferentes en donde x
objetos son de la primera clase y n − x objetos son de la segunda clase.
proada una población finita de tamaño N con dos clases posibles de objetos. Si X es la
v.a. que muestra el número de objetos de la primera clase contenidos en una muestra
de tamaño n seleccionada de dicha población entonces X ∼ hipergeo(N, k, n) y presenta
las siguientes caracteristicas:
nk
D . a) E(X) =
N
nk  k  N − n 
b) Var(X) = 1−
N N N −1
Demostración

Como primer paso seleccionemos n objetos de la población de tamaño N que contiene k


n
objetos de una primera clase y N − k objetos de la segunda clase. Definamos a X = ∑ Xi
i=1
como la v.a aleatoria que cuenta el número de objetos de la primera clase en la muestra
seleccionada; en donde cada Xi , ∀ i = 1, 2, . . . , n es una v.a que presenta las siguientes
caracterı́sticas:
◦ Xi = 1 si se selecciona un objeto de la primera clase en la i−ésima extracción
◦ Xi = 0 si se selecciona un objeto de la segunda clase en la i−ésima extracción
Debido a la aleatoriedad, la probabilidad de que la i−ésima bola extraida sea de la primera
k
clase es simplemente . Por lo tanto:
N
k N −k
◦ P(Xi = 1) = y P(Xi = 0) =
N N
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

k
◦ E(Xi ) = P(Xi = 1) =
N
k  k 2 k  k
◦ Var(Xi ) = E(Xi2 ) − [E(Xi )]2 = − = 1−
N N N N
Entonces tenemos que:
a) la esperanza de X es
n n n
  k nk
E(X) = E X =
∑ i ∑ i ∑N = NE(X ) =
i=1 i=1 i=1

b) la varianza de X es
 n 
Var(X) = Var ∑ Xi = E(X 2 ) − E(X)
i=1

calculemos entonces:
     
k N −k k−1 N −k
2
n x x
2 x n−x nk n x−1 n−x
E(X ) = ∑  
N
= ∑ 
N − 1

x=0 N x=1
n n−1
  
k−1 N −k
(x − 1 + 1)
nk n x−1 n−x
= ∑ 
N −1

N x=1
n−1
     
k−2 N −k k−1 N −k
" #
nk (k − 1)(n − 1) n x−2 n−x
n
x−1 n−x
= ∑   +∑  
N N −1 x=2
N −2
x=1
N −1

" "n − 2
# #n − 1
nk (k − 1)(n − 1) nk (k − 1)(n − 1) + N − 1
= +1 =
N N −1 N N −1

Por lo tanto
" # " #
nk (k − 1)(n − 1) + N − 1  nk 2 nk N 2 − (k + n)N + nk
Var(X) = − =
N N −1 N N N(N − 1)
nk  N − k  N − n 
=
N N N
ejeupóngase que una urna contiene cinco bolas rojas y diez azules. Si se seleccionan
bolas de la urna sin reemplazamiento; sea X la v.a que cuenta el número de bolas
rojas extraidas. Si se extraen al azar sin reemplazamiento siete bolas
S . a) Cuál es la probabilidad de seleccionar exactamente cuatro bolas rojas?
b) Cuál es la probabilidad de seleccionar almenos tres bolas rojas?
c) Calcular la esperanza y la varianza de esta distribución
Desarrollo

Como X es la v.a que cuenta el número de bolas rojas extraidas en un muestreo sin
reemplazmiento; se tiene que X ∼ hipergeo(15, 5, 7). Por lo tanto
 ! !
5 10



 x 7−x
si x = 0, 1, 2, 3, 4, 5

 !
 15
P(X = x) =

 7




0 para otro caso

a) Para contestar la pregunta de este item basta calcular P(X = 4), esto es;
  
5 10

4 3 5 · 120 40
P(X = 4) = 
15
 = =
6435 429
7

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
S . a) U.N.A.

b) Para contestar esta parte debemos calcular P(X ≥ 3); que equivale a decir,
P(X ≥ 3) = P(X = 3) + P(X = 4) + P(X = 5)
Por lo tanto
        
5 10 5 10 5 10

3 4 4 3 5 2 140 40 1 61
P(X ≥ 3) = 
15
 + 
15
 + 
15
 = + + =
429 429 143 143
7 7 7

c) Según la proposición

7.2. Distribuciones continuas de probabilidad


7.2.1. Distribución uniforme continua
Las distribuciones uniformes corresponden al experimento de elegir puntos al azar
entre dos puntos fijos a y b. Como la probabilidad de elegir cualquier punto es la
misma, la función de densidad tendrá la misma altura en todos los puntos entre a y
1
b, es decir se trata de una función constante desde a y b, de altura .
b−a
defiecimos que una variable aleatoria X tiene una distribución uniforme continua en
el intervalo (a, b), y escribimos X ∼ uni f (a, b) cuando su función de densidad es
1

 si a < x < b
b−a

f (x) =


0 en otro caso
La gráfica general de esta función se muestra en la Figura 7.1, y es evidente que se
trata de una función de densidad pues es no negativa e integra uno. Los parámetros
de esta distribución son los números a y b.
2.5

f(x)
2.0
1.5
1.0

1
b−a
0.5
0.0

x
a b
−0.5

0 1 2 3 4

Figura 7.1: Representación gráfica de la función de la distribución uniforme

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

proea X la v.a. continua con distribución uniforme en el intervalo (a, b), entonces
X tiene las siguientes caracterı́sticas
a+b
E(X) =
2
(b − a)2
b) Var(X) =
12
e − eat
bt
c) MX (t) =
(b − a)t


 0 si x > a



 x
d) F(x) = si a ≤ x < b

 b−a



1 si x ≥ b

Demostración
Como X es una v.a. continua con distribución uniforme en el intervalo (a, b) entonces
su función de densidad de probabilidad es
1

 si a < x < b
b−a

f (x) =


0 en otro caso

con lo cual
a) por definición de esperanza para v.a. continua
Z b
1 1 b 1 a+b
Z ∞
E(X) = x f (x)dx = x dx = x2 = (b2 − a2 ) =

−∞ a b−a 2(b − a) a 2(b − a) 2

b) por definición de varianza para v.a continua


a + b 2 1 1 a + b 3 b
Z ∞ 
Var(X) = x− dx = x−
2 b−a 3(b − a) 2

−∞ a
1 h a+b 3  a+b  3 i 1 h b − a 3  a − b 3 i
= b− − a− = −
3(b − a) 2 2 3(b − a) 2 2
1 (b − a)2 (b − a)2
= =
3 4 12
c) por defincición de función generadora de momentos
Z ∞
1 1
Z b
1 b ebt − eat
tx
MX (t) = e dx = etx dx = etx =

−∞ b−a b−a a t(b − a) a (b − a)t

d) por definición de función de distribución


 
 0 si x < a  0 si x < a

 


 

 Z x 1  x
F(x) = P(X ≤ x) = du si a ≤ x < b = si a ≤ x < b

 0 b−a 
 b−a

 

 
1 si x ≥ b
 
1 si x > b

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

2.0

F(x) = P(X < x)


1.5
1.0
0.5
0.0

x
−0.5

0 1 2 3 4 5

x
Figura 7.2: Representación gráfica de F(x) = b−a

ejeeje721 Supongase que tenemos una cuerda de 2m de longitud que queremos


cortar por un punto al azar a una cierta distancia de uno de los extremos. Sea X
la v.a. que represente el punto elegido; entonces
. a) Expresar y gráficar la función de densidad?
b) Calcular P(X ≤ 0, 7), P(X ≥ 1) y P(0, 5 ≤ X ≤ 1, 25)
c) Obtener E(X),Var(X) y MX (t), además a partir de la función de densidad obtener
y graficar la función de distribución
Desarrollo
Como X es la v.a que represente el punto elegido entre 0 y 2; entonces X ∼ uni f (0, 2)
a) Como el área debe ser 1, la altura del rectángulo será 12 , entonces la función de
densidad es:
1
si 0 < x < 2
f (x) = 2 .
0 en otro caso

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

2.5

1
f(x) =
2.0

2−0
1.5
1.0
0.5
0.0

x
a b
−0.5

0 1 2 3 4

Figura 7.3: Gráfica X ∼ uni f (0, 2) del ejemplo ??

b) Calculemos ahora P(X ≤ 0, 7), P(X ≥ 1) y P(0, 5 ≤ X ≤ 1, 25)


Z 0,7
1 1 0,7 1
P(X ≤ 0, 7) = dx = x = (0, 7 − 0) = 0, 35
0 2 2 0 2
Z 2
1 1 2 1 1
P(X ≥ 1) = dx = x = (2 − 1) =
1 2 2 1 2 2
Z 1,25
1 1 1,25 1

P(0, 5 ≤ X ≤ 1, 25) = dx = x = (1, 25 − 0, 5) = 0, 375
0,5 2 2 0,5 2
c) Por la proposición 7.2.1

0+2 (2 − 0)2 1 e2t − e0t e2t − 1


E(X) = =1 Var(X) = = MX (t) = =
2 12 3 (2 − 0)t 2t


 0 si x < 0



 x
F(x) = si 0 ≤ x < 2

 2



1 si x ≥ 2

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

2.0

x
F(x) =
1.5

2
1.0
0.5
0.0

x
−0.5

−1 0 1 2 3 4

Figura 7.4: Representación gráfica de F(x) del ejemplo ??

7.2.2. Distribución Normal


La distribución normal fue reconocida por primera vez por el francés Abraham de Moi-
vre (1667−1754). Posteriormente, Carl Friedrich Gauss (1777−1855) elaboró desarro-
llos más profundos y formuló la ecuación de la curva; de ahı́ que también se la conozca,
más comúnmente, como la campana de Gauss. La distribución de una variable nor-
mal está completamente determinada por dos parámetros, su media sı́mbolizada por
µ y su desviación estándar simbolizada por σ.
La distribución continua de probabilidad más importante de toda la estadı́stica es la
distribución de probabilidad normal.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

1 ∞ (x−u)2
f(x) = ⌠ e(−2( ))
1
σ2 dx
2 ⌡−∞
2πσ

Figura 7.5: Representación gráfica de f (x) de una variable aleatoria normal

defiecimos que una v.a. X tiene distribución de probabilidad normal si su función de


densidad de probabilidad está definida por la siguiente ecuación:
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) , para −∞ < x < ∞
2πσ2
en donde µ ∈ R y σ > 0 son los parámetros. Escribimos entonces X ∼ N(µ, σ2 ). La
gráfica de esta función de densidad tiene forma de campana como se puede apreciar
en la Figura No es inmediato pero es posible demostrar que E(X) = µ, y ello significa
que la campana esta centrada en este valor, el cual puede ser negativo, positivo o
cero. También puede demostrarse que Var(X) = σ2 , y que la distancia del punto µ a
cualquiera de los dos puntos en donde la función tiene puntos de inflexión es σ, por
lo tanto la campana se abre o se cierra de acuerdo a la magnitud de este parametro.
Caracterı́sticas de la distribución de probabilidad normal
La distribución de probabilidad normal con su curva tiene las siguientes caracte-
rı́sticas:
D . 1. La curva normal tiene forma de campana. La media, la moda y la mediana
de la distribución son iguales y se localizan en el centro de la distribución.
2. La distribución de probabilidad normal es simétrica alrededor de su media. Por o
tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad
después. El área total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se
aleja de la media en cualquier dirección. Esto significa que la curva se acerca al
eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.

La familia de la distribución de probabilidad normal


La forma de la campana de Gauss depende de los parámetros µ y σ. La media µ
indica la posición de la campana, de modo que para diferentes valores de µ la gráfica
es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar σ
determina el grado de apuntalamiento de la curva. Cuanto mayor sea el valor de σ,
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

más se dispersarán los datos en torno a la media y la curva será más plana. Un valor
pequeño de este parámetro indica, por lo tanto, una gran probabilidad de obtener
datos cercanos al valor medio de la distribución.
Como se deduce, no existe una única distribución normal, sino una familia de dis-
tribuciones con una forma común, diferenciadas por los valores de sus medias y sus
varianzas.
Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas es-
tarán centradas en la misma posición y tendrán diferentes formas; tal como lo muestra
la Figura 7.6.
Probability density

Deviates

Figura 7.6: Curvas normales que tienen medias iguales y desviaciones estándar diferentes

Si las curvas tienen desviaciones estándar iguales y medias diferentes, las curvas serán
idénticas pero centradas en diferentes posiciones sobre el eje horizontal, ası́ como lo
muestra la Figura 7.7.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
Probability density

Deviates

Figura 7.7: Curvas normales que tienen medias diferentes y desviaciones estándar iguales

Si las curvas tienen medias diferentes y también sus desviaciones estándar son diferen-
tes entonces aparte de estar centradas en diferentes lugares del eje x, tendrá formas
diferentes; ası́ como lo muestra la Figura 7.8.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
Probability density

Deviates

Figura 7.8: Curvas normales que tienen medias diferentes y desviaciones estándar diferentes

La distribución normal estándar


En particular, decimos que la variable aleatoria X tiene una distribución normal están-
dar si tiene una distribución normal con parámetros E(X) = µ = 0 y Var(X) = σ2 = 1.
En este caso la función de densidad se reduce a la siguiente expresión
1 x2
f (x) = √ e− 2

Para facilitar los cálculos se decidiá tabular las diferentes probabilidades para variable
aleatoria que sigue una distribución normal. Pero, puesto que serı́a imposible tener
una tabla para cada posible distribución normal, se elaboró solamente una, la tabla
de la distribución normal estándar.
De esta manera solo se tiene que transformar o estandarizar una distribución normal
especı́fica, se revisa la tabla, y se conoce la probabilidad. Para la estandarización se
debe realizar la siguiente operación.
proea X una variable aleatoria con distribución normal con parámetros µ y σ2 . En-
tonces la siguiente variable aleatoria tiene una distribución normal estándar
x−µ
Z= (7.2.3)
σ
Demostración
Para probar que Z sigue una distribución normal estandar debemos mostrar que
E(Z) = 0 y Var(Z) = 1. Recordemos además que si X ∼ N(µ, σ2 ) entonces E(X) = µ
y Var(X) = σ2 . Para realizar la demostración de esta proposición recordemos además
las propiedades de la esperanza y la varianza de una v.a. Por lo tanto
x − µ 1 1 1
E(Z) = E = E(X − µ) = [E(X) − µ] = [µ − µ] = 0
σ σ σ σ
x − µ 1 1 1
Var(Z) = Var = 2 Var(X − µ) = 2 Var(X) = 2 σ2 = 1
σ σ σ σ
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

A la operación anterior se le conoce con el nombre de estandarización, y bajo tal


transformación se dice que la variable X ha sido estandarizada. Es común usar la letra
Z para denotar una variable aleatoria con distribución normal estándar, y seguiremos
nosotros también esa costumbre.
La proposición anterior parece muy modesta pero tiene una gran importancia ope-
racional pues establece que el cálculo de las probabilidades de una variable aleatoria
normal cualquiera se reduce al cálculo de las probabilidades para la normal estándar.
Explicaremos esta situación con más detalles. Suponga que X es una variable aleatoria
con distribución N(µ, σ2 ), y que deseamos calcular, por ejemplo, P(a < X < b), para
a < b números dados. Tenemos entonces que
a − µ X − µ b − µ
P(a < X < b) = P(a − µ < X − µ < b − µ) = P < <
σ σ σ
por lotanto
a − µ b − µ
P(a < X < b) = P <Z<
σ σ
La igualdad de estas probabilidades es consecuencia de la igualdad de los eventos.
De esta forma una probabilidad que involucra a la variable X se ha reducido a una
probabilidad que involucra a una variable Z.

Áreas bajo la curva normal


Una caracterı́stica que tiene cualquier distribución normal es que el área bajo la curva,
que representa la probabilidad de que la variable aleatoria tome ciertos valores X ≤ x,
se distribuye siempre en la misma proporción.
En la tabla de la distribución normal estándar, están registradas las áreas bajo la curva
normal que se encuentran a la derecha de los valores Z positivos, de esta forma solo
se necesita transformar la distribución normal de interés en una distribución normal
estándar mediante la fórmula, y el área a la derecha del valor z será el mismo que el
área a la derecha de x, esto es P(X ≤ x) = P(Z ≤ z).
ejeos coeficientes intelectuales de 600 aspirantes de cierta universidad se distribu-
yen aproximadamente de forma normal con una media de 115 y una desviación
estándar de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de
que:
L . a) tenga un coeficiente mayor de 120
b) tenga un coeficiente menor de 100
c) tenga un coeficiente menor de 122
d) tenga un coeficiente entre 115 y 125
e) tenga un coeficiente entre 90 y 105
Desarrollo
Según las condiciones del problema la v.a. X representa el coeficiente intelectual del
estudiante elegido y además X ∼ N(115, 144)
Para calcular las probabilidades de los distintos itens debemos transformar esta dis-
tribución normal en una distribución normal estándar (con media cero y desviación
estándar 1), para lo cual hay que cambiar el valor de x por un valor z con la fórmula
x − 115
z= . Entonces la probabilidad de que:
12
 120 − 115 
a) tenga un coeficiente mayor de 120 es: P(X > 120) = P Z > = P(Z > 0, 41)
12
La distribución ya transformada queda ası́:

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
probability density

P(Z > 0.41)

115 120

u=115

Figura 7.9: Área para P(Z > 0,41)

Se busca el valor del área para 0 ≤ Z ≤ 0, 41 en la tabla de áreas bajo la curva normal
estandar, que es el valor 0,1591 . Y como el área a la derecha del valor z = 0, 41 es el
área que buscamos, entonces este es el resultado, es decir, la probabilidad de que un
aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es

P(X > 120) = P(Z > 0, 41) = 0, 5 − 0, 1591 = 0, 3409

b) tenga un coeficiente menor de 100 es:


 100 − 115 
P(X < 100) = Z < = P(Z < −1, 25)
12
La distribución ya transformada queda ası́:

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
probability density

P(Z < − 1.25)

100 115

u=115

Figura 7.10: Área para P(Z < −1,25)

En la tabla de áreas bajo la curva normal estandar no se tabularon valores z negativos,


pero como la curva normal es simétrica, el área entre cero y el valor z = −1, 25 sı́mboli-
zado por A(−1, 25); es del mismo tamaño que el área entre cero y el valor z = 1, 25 dada
por A(1, 25), por lo que solo se necesita buscar en la tabla el área correspondiente al
valor positivo de z. Como el área que se busca esta a la izquierda de z = −1, 25, se tiene
que:
P(X < 100) = P(Z < −1, 25) = 0, 5 − A(1, 25) = 0, 5 − 0, 3944 = 0, 1056
c) tenga un coeficiente menor de 122 es:
 122 − 115 
P(X < 122) = Z < = P(Z < 0, 58)
12
La distribución ya transformada queda ası́:

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
probability density

P(Z < 0.58)

122 115

u=115

Figura 7.11: Área para P(Z < 0,58)

Se busca el valor del área para 0 ≤ Z ≤ 0, 58 en la tabla de áreas bajo la curva normal
estándar, que es el valor 0,2190. Y como el área a la izquierda del valor z = 0, 58 es el
área que buscamos, entonces el resultado a buscar es:

P(X < 122) = P(Z < 0, 58) = 0, 5 + 0, 2190 = 0, 7190

d) tenga un coeficiente entre de 115 y 125 es:


 115 − 115 125 − 115 
P(115 < X < 125) = <Z< = P(0 < Z < 0, 83)
12 12

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

0.4
0.3
probability density

P(0< Z < 0.83)


0.2
0.1
0.0

115 125

u=115

Figura 7.12: Área para P(0 < Z < 0,83)

Se busca el valor del área para 0 ≤ Z ≤ 0, 83 en la tabla de áreas bajo la curva normal
estándar, que es el valor 0,2967. Y como el área a buscar es el área entre z = 0 y z = 0, 83,
entonces el resultado a buscar es:

P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967

e) tenga un coeficiente entre de 90 y 105 es:


 90 − 115 105 − 115 
P(90 < X < 105) = <Z< = P(−2, 08 < Z < −0, 83)
12 12

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

0.4
0.3
probability density

P(−2.08< Z < −0.83)


0.2
0.1
0.0

90−105 115

u=115

Figura 7.13: Área para P(−2,08 < Z < −0,83)

Se busca el valor del área para −2, 08 ≤ Z ≤ −0, 83 en la tabla de áreas bajo la curva
normal estandar, que es el valor 0,2967. Y como el área a buscar es el área entre z = 0
y z = 0, 83, entonces el resultado a buscar es:

P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967

7.2.3. Distribución ji−cuadrada


Si X1 , X2 , . . . , Xk son variables aleatorias normales e independientes. La suma de X12 , X22 , . . . , Xk2
se dice que es una variable aleatoria ji−cuadrada (χ2 ) con k > 0 grados de libertad,
es decir
χ2k = X12 + X22 + · · · + Xk2
Hay un número infinito de distribuciones ji−cuadrada, una correspondiente a cada
entero positivo k.
defiecimos que la variable aleatoria continua X tiene una distribución ji−cuadrada con
k grados de libertad (k entero positivo), si su función de densidad está dada por la
siguiente expresión:
 k
1 −1 − x
 √2k Γ( k ) x 2 e 2
 si 0 < x < ∞
2
f (x) =

0 si x ≤ 0

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

chi−squared

k=1
k=2
0.15

k=3
k=4
k=5
0.10
p(x)

0.05
0.00

0 10 20 30 40

Figura 7.14: Gráfica de f (x) cuando el parámetro k toma los valores 1,2,3,4 y 5

Por la definición anterior; ji−cuadrada es una variable aleatoria continua con posibles
valores en el intervalo (0, ∞). Esta distribución tiene un solo parámetro denotado aqui
por la letra k, y al cual se le llama grados de libertad. También al parémetro
de ji−cuadrado se denota por la letra griega ν. A pesar de la aparente expresión
complicada de f (x), no es difı́cil comprobar que es efectivamente una función de
densidad de probabilidad. La gráfica de esta función para varios valores del parámetro
k aparece en la Figura 7.14.
Escribiremos simplemente X ∼ χ2 (k), en donde la letra griega χ se pronuncia ji o tam-
bién chi. Puede demostrarse que E(X) = k y Var(X) = 2k. La distribución ji−cuadrada
puede obtenerse como indican los siguientes resultados que dejaremos sin demostrar.
proi X es una v. a. que sigue una distribución normal tipificada (X ∼ N(0, 1)), entonces
la v.a. X 2 sigue una distribución ji−cuadrada con un grado de libertad (X 2 ∼ χ2 (1)).
Es decir, el cuadrado de una variable aleatoria con distribución normal estándar tiene
distribución ji−cuadrada con un grado de libertad. Por otro lado, el siguiente resulta-
do establece que la suma de dos variables aleatorias independientes con distribución
ji−cuadrada tiene distribución nuevamente ji−cuadrada con grado de libertad igual
a la suma de los grados de libertad de los sumandos.
proi X ∼ χ2 (n) y Y ∼ χ2 (m) son dos variables aleatorias independientes, entonces X +Y
tiene distribución χ2 (n + m).
En general si las v.a. X1 , X2 , . . . , Xn son independientes y si Xi ; ∀i = 1, 2, . . . , n tiene
una distribución χ2 con n j grados de libertad para j = 1, 2, . . . , k entonces la suma
X1 + X2 + · · · + Xn tiene una distribución χ2 con n1 + n2 + · · · + nk grados de libertad.
proean X1 , X2 , . . . , Xn una muestra aleatoria de una distribución normal con media µ y
n 
Xi − µ 2
varianza σ2 . La distribución de la v.a. Y = ∑ es del tipo ji−cuadrado con
i=1 σ
n grados de libertad.

Caracterı́sticas de la distribución ji−cuadrada


 La distribución ji−cuadrada es un caso particular de la distribución gamma.
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

 Las distribuciones ji−cuadradas son positivamente asimétricas.


 Está distribución esta estrechamente ligada con muestras aleatorias de una distri-
bución normal.
 En la práctica, las probabilidades ji−cuadradas, cuando k ≥ 30, pueden calcularse
empleando aproximaciones normales en la forma usual.
 La distribución ji−cuadrado tiene muchas aplicaciones en inferencia estadı́stica,
por ejemplo en el test ji−cuadrado que consiste en una prueba de independencia
y bondad de ajuste, además en la estimación de varianzas.
 También está involucrada en el problema de estimar la media de una población
normalmente distribuida y en el problema de estimar la pendiente de una recta de
regresión lineal, a través de su papel en la distribución t de Student que veremos
más adelante, y participa en todos los problemas de análisis de varianza, por su
papel en la distribución F de Snedecor, que es la distribución del cociente de dos
variables aleatorias de distribución ji−cuadrada e independientes.

7.2.4. Distribución t de Student


Esta distribución fue desarrollada por William Sealy Gossett, que trabajaba en el
departamento de fermentación de la cervecerı́a Guinness en Irlanda. Las circunstancias
en las que se llevan a cabo los procesos de fermentación en la producción de cerveza
demostraron a Gosset las limitaciones de la teorı́a de muestras grandes y le enfatizaron
la necesidad de un método correcto para el tratamiento de muestras pequeñas. Estas
circunstancias de su trabajo dirigieron a Gosset al descubrimiento de la distribución t,
quién publicó sus estudios sobre esta distribución en 1908 con el seudónimo Student.
Gossett se interesó en el comportamiento del valor de una v.a. Y ∼ N(0, 1) cuando se
utilizaba S en vez de σ, y particularmente en la discrepancia entre S y σ cuando S se
calcula de muestras muy pequeñas.
La distribución t está renacionada con muestras aleatorias de una distribución nor-
mal. Esta distribución, ası́ como la χ2 , han sido ampliamente aplicadas en problemas
importantes de inferencia estadı́stica. La distribución t es conocida también como
distribución de Student en honor de W.S. Gosset. La distribución t se define como
sigue:
Considerense dos variables aleatorias independientes Y y W , tales que Y tenga una
distribución normal tipificada y W tenga una distribución χ2 con n grados de libertad.
Sea X la variable aleatoria definida como:
Y
X=r
W
n
entonces, la distribución de X se denomina la distribución t con n grados de
libertad.
defiecimos que la variable aleatoria continua X tiene una distribución t con n grados
de libertad si su función de densidad está dada por cuya gráfica vemos en la figura
7.15:  
Γ n+1
2
 x2 − n+1
2
f (x) = √ 1 + para − ∞ < x < ∞
nπ Γ( n2 ) n
en tal caso se escribe X ∼ t(n)
n
Es posible demostrar que E(X) = 0, y Var(X) = para n > 2.
(n − 2)

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

t−student
0.35
0.30
0.25
0.20
f(x)

0.15
0.10
0.05
0.00

−4 −2 0 2 4

Figura 7.15: Gráfica de f (x) t−student

Relación con muestras de una distribución normal


Supongamos que las variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra aleato-
ria de una distribución normal con media µ y varianza σ2 . Como es usual, se define a
1 n 1 n
la media muestral como X = ∑ Xi y a la varianza muestral como S2 = ∑ (Xi − X)2 .
n i=1 n i=1
Si se definen las variables aleatorias Y y W mediante las relaciones
n

(X − µ) n
∑ (Xi − X)2 nS2
i=1
Y= y W= =
σ σ2 σ2
Vemos que Y ∼ N(0, 1) y W ∼ χ2 (n − 1). Además se sabe que si X y S2 son variables
aleatorias que resultan de muestras aleatorias normales entonces son independientes.
Y
Por lo que la v.a. T definida por la relación T = q tiene distribución t con n − 1
W
n−1
grados de libertad. Entonces
√ √
(X − µ) n (X − µ) n √
σ σ (X − µ) n − 1
T= s = √ =
nS2 nS S
σ2 √
n − 1σ
n−1
Un aspecto importamte es que ni el valor de T ni la distribución de T dependen del
valor de la varianza σ2 . Por lo tanto podemos utilizar la distribución t en situaciones de
muestreo sobre poblaciones normales que cumplan con las siguientes caracteristicas:
 las muestras extraidas son pequeñas (n < 30) y
 la varinza σ2 es desconocida.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

Las caracterı́sticas de la distribución t


1. Es una distribución continua.
2. Tiene forma de campana y es simétrica.
3. Es una familia de curvas.
4. Todas tienen la misma media de cero, pero sus desviaciones estándar difieren de
acuerdo al tamaño de la muestra.
5. La distribución t es más baja y dispersa que la distribución normal. Cuando el
tamaño de la muestra se incrementa, la distribución t se aproxima a la normal.
En resumen la distribución t se puede encontrar en los siguientes contextos:
proi las variables aleatorias Y ∼ N(0, 1) y W ∼ χ2 (n) son independientes, entonces la
v.a.
Y
X = q ∼ t(n)
W
n

proean X1 , X2 , . . . , Xn variables aleatorias independientes cada una de ellas con distri-


bución N(µ, σ2 ). Entonces la v.a.

(X − µ) n − 1
T= ∼ t(n − 1)
S
1 n 2= 1
n
donde X = ∑
n i=1
Xi y S ∑ (Xi − X)2.
n i=1

7.2.5. Distribución exponencial


El modelo de probabilidad de la exponencial tiene su origen en el proceso de Poisson.
Una probabilidad de Poisson se relaciona con la probabilidad de ocurrencia de un
número especı́fico de éxitos en intervalos de tiempos finitos, donde el número de éxitos
es la variable aleatoria.
Invirtiendo los papeles de una variable aleatoria de Poisson se tiene lo que se llama un
modelo exponencial. Una variable aleatoria exponencial X es el intervalo de tiempo,
o espacio requerido para obtener un número especifico de éxitos.
La distribución exponencial se utiliza a menudo en problemas prácticos para repre-
sentar la distribución del tiempo que transcurre antes de la ocurrencia de un suceso.
La distribución exponencial se usa para modelar intervalos de tiempos entre sucesos.
Es muy usada para simular el tiempo entre llegadas cuando las llegadas son comple-
tamente aleatorias y para modelar tiempo de servicio, en los sistemas de colas.
defiecimos que una variable aleatoria continua X tiene una distribución exponencial
con parámetro λ > 0, y escribimos X ∼ exp(λ), cuando su función de densidad de
probabilidad es
λe−λx si x > 0
f (x) = .
0 si x ≤ 0
La gráfica de esta función cuando el parámetro λ toma los valores particulares 0,5;
1,0 y 1,5 se muestra en la Figura 7.16.
La correspondiente función de distribución de esta v.a. está dada por

0 si x ≤ 0
F(x) = P(X ≤ x) = .
1 − e−λx si x > 0

La gráfica de esta función cuando el parámetro λ toma los valores particulares 0,5;
1,0 y 1,5 se muestra en la Figura 7.17.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

distribucion exponencial
0.5

λ = 0.5
λ=1
λ = 1.5
0.4
0.3
f(x)

0.2
0.1
0.0

0 1 2 3 4 5 6 7

Figura 7.16: Gráfica de f (x) de la exponencial

distribucion exponencial
1.0
0.8
0.6
f(x)

λ = 0.5
λ=1
λ = 1.5
0.4
0.2
0.0

0 1 2 3 4 5 6 7

Figura 7.17: Gráfica de F(x) de la exponencial

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.3. PROBLEMAS

proea X la v.a. continua con distribución exponencial, entonces X tiene las siguien-
tes caracterı́sticas
1
S . a) E(X) =
λ
1
b) Var(X) = 2
λ
λ
c) MX (t) =
λ−t
Demostración
Por definición de esperanza se tiene que
1  ∞ 1
Z ∞ Z ∞ 
E(X) = x f (x)dx = λ xe−λx dx = −e−λx x + =
−∞ 0 λ 0 λ
2x 2  ∞ 2
Z ∞ Z ∞ 
E(X 2 ) = x2 f (x)dx = λ x2 e−λx dx = −e−λx x2 + + 2 = 2
−∞ 0 λ λ 0 λ
Entonces la varianza está dada por
2  1 2 1
Var(X) = 2 − = 2
λ λ λ
Finalmente por definición de función generadora de momentos se tiene que

λe−(λ−t)x ∞
Z ∞ Z ∞ Z ∞
λ
MX (t) = ext f (x)dx = λ ext e−λx dx = λ e−(λ−t)x dx = =
−∞ 0 0 −(λ − t) 0 λ−t
ejeuponga que el tiempo en minutos que un usuario cualquiera permanece revisan-
1
do su correo electrónico sigue una distribución exponencial de parámetro λ = .
5
Calcule la probabilidad de que un usuario cualquiera permanezca conectado al
servidor de correo
S . a) menos de un minuto
b) más de un ahora
c) Calcula la esperanza, varianza y la función generadora de momentos
Solución
a) Para este primer inciso tenemos que
Z 1
1 1 1 1
1
1
P(X < 1) = e− 5 x dx = − 5e− 5 x = 1 − e− 5 = 0, 1813
0 5 5 0

b) Siguiendo el mismo razonamiento del inciso anterior y teniendo en cuenta que una
hora equivale a 60 minutos se tiene que
1 −1x 1
Z ∞
1 ∞

P(X > 60) = e 5 dx = − 5e− 5 x = e−12 = 6, 14 · 10−6
60 5 5 60

c) Tomando en cuenta la proposición

7.3. Problemas
Distribución binomial
1. Sea X una variable aleatoria con distribución bin(n, p) tal que E(X) = 4 y
Var(X) = 2. Cuáles son los valores de n y p?
2. Sea X una variable aleatoria con distribución bin(n, p). Demuestre que la va-
riable Y = n − X tiene distribución bin(n, 1 − p). Proporcione una explicación
probabilı́sta de este resultado.
3. Sea X con distribución bin(n, p). Demuestre que para x = 0, 1, . . . , n−1, se cumple
la siguiente fórmula. Esta expresión permite calcular las probabilidades de esta
distribución de una forma iterativa.
p(n − x)
P(X = x + 1) = P(X = x)
(1 − p)(x + 1)
4. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada
cara caiga exactamente 3 veces.
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

5. Se lanza una moneda equilibrada 2n veces. Calcule la probabilidad de que ambas


caras caigan el mismo número de veces.
6. Sea X una variable aleatoria con distribución bin(n, p). Demuestre que

0 ≤ Var(X) ≤ E(X)

7. Suponiendo que es igualmente probable que nazca un hombre (H) o una mujer
(M), y considerando la observación de 6 nacimientos. Cuál de los siguientes
eventos es más probable que ocurra?
a) MHHMHM
b) MMMMHM
c) HMHMHM
8. La probabilidad de que un paciente se recupere de una extraña enfermedad es
0, 4. Si se sabe que 15 personas contraen esa enfermedad,
a) Haga un histograma donde represente la distribución binomial para este caso.
b) Cuál es la probabilidad de que sobrevivan al menos 10?
c) Cuál es la probabilidad de que sobrevivan de 3 a 8?
d) Calcule la media y la varianza de esta distribución binomial.
9. En la ciudad la necesidad de dinero para comprar drogas se establece como la
razón del 75 % de los robos. Encuentre la probabilidad de que entre los siguientes
cinco casos de robo:
a) dos resulten de la necesidad de dinero para comprar drogas
b) al menos tres resulten de la necesidad de dinero para comprar drogas
c) Represente esta distribución binomial en un histograma
d) Calcule la media y la varianza de esta distribución binomial
10. Un prominente médico afirma que 70 % de las personas con cáncer de pulmón
son fumadores empedernidos. Si su aseveración es correcta:
a) encuentre la probabilidad de que de 10 de tales pacientes menos de la mitad
sean fumadores empedernidos
b) encuentre la probabilidad de que de 10 de los pacientes con cáncer de pulmón
ninguno sea fumador empedernido
c) Represente esta distribución binomial en un histograma
d) Calcule la media y la varianza de esta distribución binomial
11. De acuerdo con un estudio publicado por un grupo de sociólogos de la Universi-
dad de Massachussets aproximadamente el 60 % de los consumidores de Valium
en el estado de Massachussets tomaron Valium por primera vez debido a pro-
blemas psicológicos. Encuentre la probabilidad de que entre los siguientes ocho
consumidores entrevistados en este estado:
a) tres comenzaron a tomar Valium por problemas psicológicos.
b) al menos cinco comenzaron a consumir Valium por problemas que no fueron
psicológicos
c) Represente esta distribución binomial en un histograma
d) Calcule la media y la varianza de esta distribución binomial
12. De acuerdo a una encuesta a nivel nacional en Estados Unidos de la universidad
de Michigan a estudiantes universitarios de último año revela que el 70 % de
los estudiantes desaprueba el consumo diario de la mariguana. Si se seleccionan
doce estudiantes al azar y se les pide su opinión, encuentre la probabilidad de
que el número de los que desaprueban fumar mariguana todos los dı́as sea:
a) entre siete y nueve
b) a lo más cinco
c) no memos de ocho
d) Represente esta distribución binomial en un histograma
e) Calcule la media y la varianza de esta distribución binomial.
13. Un estudio examinó las actitudes hacia los antidepresivos. El estudio reveló que
aproximadamente el 70 % cree que los antidepresivos en realidad no curan nada,
sólo encubren el problema real. De acuerdo con este estudio
a) cuál es la probabilidad de que al menos tres de las siguientes cinco personas
seleccionadas al azar sean de esta opinión?
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

b) Represente esta distribución binomial en un histograma


c) Calcule la media y la varianza de esta distribución binomial.
14. El departamento de mercadotecnia de Kellogg Company planea realizar una
investigación para determinar si los consumidores de cereal en hojuelas pueden
distinguir su cereal favorito de otros. Para probar el cuestionario y el procedi-
miento a ser usado se invitó a ocho personas a participar en un experimento. Se
les colocó frente a cinco pequeños tazones de cereal en hojuelas marcados con
las letras A, B,C, D, y E para que identificaran su cereal favorito. A las personas
se les informó que solo uno de los tazones contenı́a su cereal favorito.
a) Si una persona no pudo identificar su cereal favorito y supuso que estaba en
el tazón C. Cuál es la probabilidad de que la persona haya adivinado correcta-
mente?
b) Cuál es la variable aleatoria en este problema?
c) Es la variable aleatoria discreta o continua? Por qué?
d) Suponga que a las ocho personas les fue imposible identificar su cereal favorito
y trataron de adivinar en cual tazón estaba. Cuál es la probabilidad de que
ninguno de los ocho haya adivinado correctamente?
e) Desarrolle una distribución binomial para este experimento
f) Calcule la media, varianza, y desviación estándar de la distribución.
g) Represente la distribución de probabilidad en una gráfica.
h) Suponga que siete de las ocho personas identifican el cereal que más les gusta.
Es razonable decir que ellos adivinaron? Explique. Cuál es tu conclusión?
i) Por qué es la distribución binomial apropiada para este problema?
15. Al determinar la concentración letal de una sustancia presente en agua conta-
minada, se encuentra que una cierta concentración mata el 20 % de los peces
que se exponen a ella durante 24 horas. Se colocan 20 peces en un tanque con
esta concentración de la sustancia. Calcular la probabilidad de que a las 24 hs.
a) sobrevivan exactamente 14
b) sobrevivan por lo menos 10
c) sobrevivan cuando mucho 16
d) sobrevivan entre 5 y 10
16. Harley Davidson, director de control de calidad de la compañı́a de automóvi-
les Kyoto Motor, se encuentra realizando su revisión mensual de trasmisiones
automáticas . En el procedimiento, se retiran 10 trasmisiones de la pila de com-
ponentes y se les revisa en busca de defectos de fabricación. A lo largo del tiempo
solo, el 2 % de las trasmisiones tienen defectos de fabricación (suponga que los
defectos se presentan de manera independiente en diferentes trasmisiones).
a) Cual es la probabilidad de que la muestra de Harlley contenga mas de dos
trasmisiones con defectos de fabrica?
b) Cual es la probabilidad de que ninguna de las trasmisiones elegidas tengan
defectos de fabrica?
17. Harry Ohme esta a cargo de la sección de electrónica de una gran tienda de-
partamental. Se has dado cuenta de que la probabilidad de que un cliente que
solamente se encuentra curioseando compre algo es de 0,3. Suponga que 15
clientes visitan la sección de electrónica cada hora.
a) Cual es la probabilidad de que almenos una de las personas que curiosea compré
algo durante una hora dada?
b) Cual es la probabilidad de que almenos cuatro personas que curiosean compre
algo durante una hora dada?
c) Cual es la probabilidad de que ninguna de las personas que curiosean compre
algo durante una hora dada?
d) Cual es la probabilidad de que no más de cuatro personas que curiosean compre
algo durante una hora dada?
18. Un aparato de radio que no funciona se agrupa accidentalmente con 5 radios
que funcionan. Cual es la probabilidad de que se escoja un conjunto de tres
radios, el aparato que no funciona este entre los tres escogidos?
19. Una abogada especializada en litigios por drogas estima que gana el 70 % de
sus casos que van a la corte. Acaba de leer Drogas : Uncasoparalegalizacin en
el número del 3 de octubre de 1989 y quiere usar parte de los argumentos del
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

artı’culo en su próximo juicio. Considere su probabilidad de éxito estimado, si


actualmente representa a 5 acusados en distintos casos. Cuál es la probabilidad
de qué:
a) gane por lo menos tres casos?
b) por lo menos un caso?
20. En el pasado, Phin Anderson ha cometido errores en el 5 % de las declaraciones
de impuestos que prepara. Cual es la probabilidad de que no cometa errores en
las primeras 7 declaraciones que prepara para esta año fiscal?
21. Un jefe de proyectos ha comprobado que un subcontratista falla en entregar
a tiempo las ordenes corrientes, en aproximadamente el 20 % de las ocasiones.
El jefe de proyectos tiene 6 ordenes que este subcontratista se comprometió a
entregar. Calcule la probabilidad de que:
a) el subcontratista entregue todas las ordenes
b) el subcontratista entregue almenos cuatro ordenes
c) el subcontratista entregue exactamente 5 ordenes
22. Un complejo sistema electrónico esta construido con cierto número de compo-
nentes de apoyo en sus subsistema. Un subsistema contiene cuatro componentes
idénticos, cada uno con una probabilidad de 0,2 de fallar en menos de 1000 hs. El
subsistema funciona si dos componentes cualesquiera de los cuatro trabajan en
forma adecuada. Se suponen que los componentes operan independientemente.
a) Encuentre la probabilidad de que exactamente dos de cuatro componentes re-
sistan mas de 1000hs.
b) Encuentre la probabilidad de que el subsistema funcione por mas de 1000hs.
23. Sobre una mesa se derraman 20 monedas. Calcular la probabilidad de caigan:
a) por lo menos 5 caras
b) más de 15 caras
c) entre 12 y 17 caras
d) a lo sumo tres caras
e) como mı́nimo dos caras
f) cuando mucho cuatro caras
24. Un examen de opción múltiple esta compuesto de 15 preguntas, con cinco res-
puestas posibles cada una, de las cuales solamente una es la correcta. Supóngase
que uno de los estudiantes que realiza el examen contesta las preguntas al azar.
Cual es la probabilidad de que conteste al menos 10 preguntas correctamente?
25. Un sistema para detectar incendios utiliza tres celdas sensibles a la temperatura
que actúan independientemente, talque una o más pueden activar la alarma.
Cada celda tiene una probabilidad p = 0, 8 de activar la alarma al alcanzar la
temperatura de 100 grados Celsius o más. Sea Y el número de celdas que activan
la alarma cuando la temperatura alcanza 100 grados. Encuentre la probabilidad
de que la alarma funcione cuando la temperatura alcanza los 100 grados.
26. Suponga que un lote de producción de 40000 hornos de microondas incluye
32000 sin ningún defecto, que no requieren en absoluto ningún ajuste. Sin em-
bargo el departamento de control de calidad, sin conocer el dato referente al
lote de producción, toma una muestra aleatoria de 10 hornos para calcular la
calidad global.
a) Cuál es la probabilidad de que la muestra sea dividida equitativamente es decir
5 hornos defectuosos y 5 no defectuosos?
b) Cuál es la probabilidad de que se encuentre a lo sumo 3 defectuosos?
c) Cuál es la probabilidad de que se encuentre por lo menos un horno no defec-
tuoso?
d) Cuál es la probabilidad de que a lo mas 6 sean no defectuosos?
27. A la larga, el 20 % de los gerentes que reciben capacitación obtienen la califi-
cación de sobresaliente, el 50 % la de aceptable y el 30 % la de insatisfactorio.
En una muestra de 20 gerentes seleccionados al azar, encuentre las siguientes
probabilidades:
a) exactamente 4 gerentes son calificados con sobresaliente
b) al menos 4 gerentes son calificados con sobresaliente
c) exactamente 15 gerentes son calificados con sobresaliente o aceptable

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.3. PROBLEMAS

d) al menos 15 gerentes son calificados con sobresaliente o aceptable


28. Una cadena de moteles ha adoptado la polı́tica de hacer un descuento del 3 %
a los clientes que paguen en efectivo en vez de hacerlo con tarjeta de crédito.
Su experiencia indica que el 30 % de los clientes aceptan el descuento. Sea Y el
número de personas que aceptan el descuento entre los próximos 20 clientes.
a) Suponiendo que las probabilidades binomiales sean aplicables, encuentre la pro-
babilidad de que exactamente 5 entre los próximos 20 clientes acepten el des-
cuento.
b) Encuentre P(5o menos clientes acepten el descuento)
c) Cuál es el valor esperado y la desviación estándar del número de personas que
aceptarán el descuento?
29. Un fabricante de medicamentos afirma que solo el 10 % que resultan efectivas
en las pruebas con animales pasan el resto de las que se le exige para su comer-
cialización. Actualmente, el fabricante tiene 8 nuevos medicamentos de probada
efectividad en experimentos con animales y que esperan pasar en las siguientes
pruebas.
a) Encuentre la probabilidad de que ninguno de los 8 medicamentos sea comercia-
lizado.
b) Encuentre la probabilidad de que al menos 2 de ellos sean comercializados.
c) Encuentre el número esperado de medicamentos comercializados entre los 8
nuevos medicamentos
30. Una compañı́a pequeña utiliza un servicio de paqueterı́a para enviar los pedidos
de quesos especiales que son para obsequios. La compañı́a ha encontrado que
el 90 % de los paquetes se entregan a tiempo. Se envı́a un embarque de 20
paquetes. Sea Y = número de paquetes embarcados a tiempo. Suponiendo que
las hipótesis binomiales se cumplen calcular:
a) la probabilidad de que de al menos un paquete se entregue a tiempo
b) la probabilidad de que a lo sumo 6 paquetes no se entreguen a tiempo
c) la probabilidad de que por lo menos 7 paquetes se entreguen a tiempo
d) el valor esperado y la varianza del número de paquetes embarcados a tiempo
31. La revista Statistical Adstrac (U.S) informa que la mediana del ingreso familiar
en Estados Unidos durante 1985 fue 27755 dólares. En cuatro familias seleccio-
nadas al azar, calcular la probabilidad de que:
a) las cuatro tuvieron ingresos mayores que 27755 dólares en 1985
b) una de las cuatro haya tenido ingresos menores 27755 dólares en 1985
32. Entre personas que donan sangre en una clı́nica, 80 % tienen RH+, es decir
el factor Rhesus en su sangre. Cinco personas donan sangre en al clı́nica en
determinado dı́a.
a) Calcular la probabilidad de que al menos una de las cinco no tenga el factor
RH+.
b) Calcular la probabilidad de que cuando mucho 4 de las 5 tenga sangre del tipo
RH+.
Distribución Geométrica
1. Considere una urna con 3 bolas negras y 5 bolas blancas. Se escoge una bola al
azar, se registra su color, y después se regresa a la urna. Cuántas extracciones
en promedio se necesitan realizar hasta obtener una bola negra por primera
vez?
2. Sea X una variable aleatoria con distribución geo(p). Demuestre que para cua-
lesquiera a, b = 0, 1, 2, . . . se cumple la siguiente propiedad llamada de pérdida
de memoria: P(X ≤ a + b|X ≤ a) = P(X ≤ b).
Distribución Poisson
1. Sea X una variable aleatoria con distribución Poisson(λ). Demuestre que para
todo x = 0, 1, 2, . . . se cumple la siguiente fórmula. Esta expresión permite
calcular las probabilidades Poisson de una forma iterativa.
λ
P(X = x + 1) = P(X = x)
(x + 1)
2. Sea X una variable aleatoria con distribución Poisson(λ). Demuestre que la
(1 + e−2λ )
probabilidad de que X tome un valor par es .
2
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

3. El número de computadoras que fallan por mes en un laboratorio de cómputo


tiene una distribución Poisson con un promedio mensual de λ = 2 máquinas
descompuestas. El laboratorio tiene capacidad para reparar hasta dos máqui-
nas por mes. Cuando se descomponen más de dos máquinas, las restantes se
envı́an fuera del laboratorio para su reparación.
a) Cuál es la probabilidad de que en un mes cualquiera sea necesario enviar
máquinas fuera del laboratorio para su reparación?
b) Responda al inciso anterior cuando se reduce la capacidad de reparación del
laboratorio a una computadora por mes.
c) Cuál es el nḿero de computadoras con falla más probable en un mes?
4. Sea Y una variable aleatoria que tiene una distribución de Poisson cuyo pro-
medio es de 2. Calcular:
a) P(Y = 4)
b) P(Y ≥ 4)
c) P(Y ≤ 4)
5. Si la probabilidad de que un tornillo sea defectuosa es 0,008. Cuál es la proba-
bilidad de que en una caja con 100 tornillos contenga uno o más defectuosos?
6. Supongamos que la probabilidad de que una persona reciba una inyección de
penicilina y sufra una reacción desfavorable es de 0,0002. Si 3000 personas
reciben aplicaciones de este medicamento. Cuál es la probabilidad de que
0,1,2,3,4 o 5 personas reaccionen mal?
7. El número de llamadas telefónicas que entra en una central de edificio de
oficinas es de 4 minutos en promedio.
a) Calcular la probabilidad de que no lleguen llamadas en un determinado pe-
riodo de un minuto.
b) Calcular la probabilidad de que por lo menos lleguen 4 llamadas en un periodo
de un minuto.
c) Calcular la probabilidad de que por lo menos lleguen dos llamadas en un
periodo determinado de dos minutos.
8. Se certifica la calidad de los discos para computadora pasándolos por un cer-
tificador que cuenta el número de pulsos faltantes. Una determinada marca
de discos para computadora tiene en promedio 0,1 pulsos faltantes por discos.
a) Calcular la probabilidad de que el siguiente disco que se inspeccione no le falte
pulso.
b) Calcular la probabilidad de que al siguiente disco que se inspeccione le falte
mas de un pulso.
c) Calcular la probabilidad de que a ninguno de dos discos inspeccionados le
falten pulsos.
9. En Estados Unidos se ha establecido el limite máximo nacional de velocidad
de 50 millas por hora, desde 1974. Kamerud que ha estudiado los efectos
de esta ley, informa que las frecuencia de accidentes fatales en las carreteras
interestatales en 1975, estando vigente el limite, es aproximadamente 19 · 109
millas−vehı́culo.
a) Calcular la probabilidad de que se tengan cuando mucho 15 accidentes fatales
en 109 millas−vehı́culo.
b) Calcular la probabilidad de que por lo menos se tengan 20 accidentes fatales
en 109 millas−vehı́culo.
10. En un sistema de computo de tiempo compartido, el número de peticiones de
telepuerto es 0,20 por milisegundo, en promedio y sigue una distribución de
Poisson.
a) Calcular la probabilidad de que no lleguen peticiones durante el siguiente
milisegundo.
b) Calcular la probabilidad de que no lleguen peticiones durante los siguiente
tres milisegundo.
11. Los grandes almacenes Bon han determinado que la demanda de cierto modelo
de cámara fotográfica tiene una distribución de Poisson con una media de 2 por
semana. La directora del departamento de cámara quiere estudiar la demanda
actual para ver si se justifica ofrecer clases de fotografı́a. Acaba de leer un
articulo sobre el paisaje en el American Photographer y piensa que ese tipo
de clases seria efectivo.
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

a) Determinar la distribución de probabilidad de la demanda semanal


b) Si la tienda guarda 4 camaras de estas en una semana dada. Cuál es la pro-
babilidad exceda al inventario?
12. Los autos llegan al lavadero 22 con una tasa promedio de 9 por hora. Si la
llegada por hora sigue una distribución de Poisson, averigue la probabilidad
de que lleguen 15 o más autos durante una hora dada de operación.
13. Se estima que el número de taxis que esperan recoger un pasajero delante de
la terminal de ómnibus de Asunción tiene una distribución de Poisson con una
media de 5,5 taxis.
a) Averigue la probabilidad de, en una observación aleatoria haya exactamente
6 taxis esperando.
b) Averigue la probabilidad de, en una observación aleatoria haya más de 10 taxis
esperando.
c) Averigue la probabilidad de, en una observación aleatoria no haya taxis espe-
rando.
14. La concertista de piano Donna Prima se preocupa cada vez más por el número
de tosidos que se presentan en la audiencia justo antes que empiece a tocar.
Durante su ultima gira, Donna estimo un promedio de 8 tosidos justo antes
de empezar su concierto. La señora prima le ha prometido a su director que si
escucha más de 5 tosidos en el concierto esa noche, se rehusará a tocar. Cuál
es la probabilidad de que la artista toque esa noche?
15. En promedio cinco pájaros chocan contra el monumento en Washington y
mueren por este motivo cada semana. Bill Garey, un oficial del Servicio del
Parque Nacional de Estados Unidos, ha solicitado que el congreso estadouni-
dense asigne fondos para adquirir equipos que alejen a los pájaros de dicho
monumento. Un subcomité del congreso le ha respondido que pueden asig-
narle fondos para tal fin a menos que la probabilidad de que mueran más de
tres pájaros cada semana sea mayor que 0,70. Se destinaran los fondos para
la compra de los equipos que alejen a los pájaros del monumento?
16. El número de nudos en un tipo particular de madera tiene una distribución de
Poisson con una media de 1,5 nudos de 10 pies cúbicos de madera. Encuentre
la probabilidad de que un bloque de esta madera de 10 pies cúbico tenga a lo
más un nudo.
17. El 3 % de las calculadoras de bolsillo de un modelo en particular fallan durante
el primer mes de operación. F − Mart acaba de recibir un lote de 100 de estas
calculadoras.
a) Averigue la probabilidad de que ninguna calculadora falle
b) Averigue la probabilidad de que fallen más de tres calculadoras
c) Averigue la probabilidad de que menos de 2 calculadoras fallen
18. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por
cobrar sean correctas. Se seleccionó una muestra aleatoria de 200 cuentas para
auditarlas.
a) Cuál es la probabilidad de que ninguna de las cuentas tenga errores ?
b) Cuál es la probabilidad de que 5 de las cuentas tenga errores ?
c) Cuál es la probabilidad de que más de 5 cuentas tenga errores ?
19. En los últimos 20 años, solo el 2 % en promedio de los cheques endosados a la
American Herat Association fueron rechazados. Este mes, la asociación recibió
200 cheques. Cuál es la probabilidad de que:
a) exactamente 10 de ellos sean rechazadas
b) exactamente 5 de ellos sean rechazadas
20. El centro contencioso del condado de Orange, en California maneja varios
tipos de litigios, pero casi todos ellos son del tipo conyugal. De hecho 96 % de
los pleitos que atiende el centro son de esta naturaleza. Cuál es la probabilidad
de que de 80 litigios atendidos por el centro exactamente 7 no sean del tipo
conyugal?
Distribución Uniforme
1. Sea X una variable aleatoria con distribución uniforme en el intervalo (1, 4).
a) Obtener la función de densidad para esta distribución uniforme
b) Calcular la probabilidad de que X este entre 1 y 3
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

c) Calcular la probabilidad de que X sea mayor que 2


d) Obtener la esperanza y la varianza de esta distribución
2. Se escoge al azar un número del intervalo (0, 2)
a) Obtener la función de densidad para esta distribución uniforme
b) Calcular la probabilidad de que el número elegido este entre 1 y 1,5
c) Calcular la probabilidad de que el número elegido sea mayor que 0,5
d) Obtener la esperanza y la varianza de esta distribución
3. Se escogen al azar dos números del intervalo (0, 3). Sea X la variable aleatoria
que indica la suma de los dos números elegidos. Si X sigue una distribución
uniforme
a) Obtener la función de densidad para X
b) Calcular la probabilidad de que X este entre 2 y 4
c) Calcular la probabilidad de que el número elegido sea menor que 4
d) Obtener la esperanza y la varianza de X
Distribución Normal
1. Sea X con distribución N(10, 25). Calcule
a) P(X ≥ 10)
b) P(X < 0)
c) P(0 < X ≤ 10)
d) P(X ≥ 20)
e) P(−20 < X ≤ 10)
2. Sea X con distribución N(0, 100). Calcule
a) P(X ≤ 10)
b) P(X > 0)
c) P(0 < X ≤ 40)
d) P(X ≥ 30)
e) P(−10 < X ≤ 10)
3. Encuentre x tal que
a) F(x) = 0, 8666
b) 1 − F(x) = 0, 9154
4. Un investigador reporta que unos ratones vivirán un promedio de 40 meses
cuando sus dietas se restringen drásticamente y después se enriquecen con
vitaminas y proteı́nas. Suponga que la vida de tales ratones se distribuye nor-
malmente con una desviación estándar de 6,3 meses, encuentre la probabilidad
de que un ratón viva:
a) Más de 32 meses
b) Menos de 28 meses
c) Entre 37 y 49 meses
d) Entre 45 y 50 meses
e) Entre 40 y 43 meses
f) Cuál es la probabilidad de que de seis ratones 4 vivan más de 30 meses?
5. Las barras de centeno que cierta panaderı́a distribuye a las tiendas locales
tienen una longitud promedio de 30 centı́metros y una desviación estándar de
2 centı́metros. Suponga que las longitudes se distribuyen normalmente, qué
porcentaje de las barras son
a) Más largas de 31,7 cm?
b) Entre 29,3 cm. y 33,5 cm de longitud?
c) Entre 32 cm y 35 cm?
d) Más cortas de 38 cm?
e) Entre 27,5 cm. y 30 cm?
f) Cuál es la probabilidad de que de 4 barras, tres midan más de 35 cm?
6. Un abogado va todos los dı́as de su casa a su oficina en el centro de la ciudad.
El tiempo promedio del viaje es 24 minutos, con una desviación estándar de
3,8 minutos. Si las duraciones de los viajes están distribuidas normalmente:
a) Cuál es la probabilidad de que un viaje tome al menos 12 hora?

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.3. PROBLEMAS

b) Si la oficina abre a las 9:00 a.m. y él sale de su casa diariamente a las 8:45
a.m., qué porcentaje de las veces llega tarde al trabajo?
c) Si sale de su casa a las 8:35 a.m. y el café se sirve en la oficina de las 8:50 a.m.
a las 9:00 a.m., cuál es la probabilidad de que llegue a la hora del café?
d) Encuentre cual es el tiempo a partir del cual que duran el 15 % de los viajes
más lentos?
e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como
máximo 21 hora.
7. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de
174,5 cm y una desviación estándar de 6,9 cm., cuántos de estos estudiantes
se esperarı́a que tuvieran alturas
a) Menores de 160 cm?
b) Entre 171,5 cm y 182 cm?
c) Mayores a 165 cm?
d) Entre 174,5 cm y 180 cm?
e) Entre 180 cm y 195 cm?
f) Menores de 185 cm?
g) Cuál es la probabilidad de que de cinco estudiantes, al menos 3 midan más de
180 cm?
h) Cuál es la probabilidad de que de 3 estudiantes, ninguno mida menos de 160
cm?
8. Una estación de radio encontró que el tiempo promedio que una persona sinto-
niza esa estación es de 15 minutos con una desviación estándar de 3,5 minutos.
Cuál es la probabilidad de que un radioescucha sintonice la estación por:
a) más de 20 minutos?
b) entre 15 y 18 minutos?
c) entre 10 y 12 minutos?
d) Cuantos minutos como máximo sintonizan la estación el 70 % de los radioes-
cuchas?
e) Cuál es la probabilidad de que de 8 radioescuchas, al menos 7 sintonicen la
estación por más de 5 minutos?
9. Un analista financiero señala que (conforme a su probabilidad subjetiva) el
precio Y de los bonos de gobierno a largo plazo, con un valor de 1000 dólares,
tendrá al cabo de un año una distribución normal con un valor esperado de
980 dólares y desviación tı́pica de 40 dólares.
a) Encuentre P(Y ≥ 1000)
b) Encuentre P(Y ≤ 940)
c) Encuentre P(960 ≤ Y ≤ 1060)
10. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que
se basa en un sistema de pago a destajo) tiene una distribución normal con
un valor esperado de 5,10 dólares y una desviación estándar de 0,40 dólares.
a) Encuentre la probabilidad de que el salario por hora de un trabajador sea
superior a 5,40 dólares
b) Encuentre la probabilidad de que el salario por hora de un trabajador se
encuentre entre 4,70 y 5,50 dólares
c) Encuentre la probabilidad de que el salario por hora sea superior al salario
mı́nimo de 3,90 dólares
11. Se ha determinado que la vida útil de cierta marca de llantas radiales tiene
una distribución normal con media 38000 kilómetros y desviación estándar
3000 kilómetros.
a) Cuál es la probabilidad de que una llanta elegida al azar tenga vida útil de
cuando menos 35000 km.?
b) Cuál es la probabilidad de que dure mas de 45000 km.?
12. Si un distribuidor hace un pedido de 500 llantas de las especificadas en el
problema anterior . Aproximadamente, cuantas llantas duraran:
a) entre 40000 y 45000 kilómetros?
b) 40000 kilómetros o más?
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

13. Una operación de maquinado produce ejes de aceros cuyos diámetros están
distribuidos normalmente con un promedio de 1,005 pulgadas y desviación
estándar de 0,01 pulgadas. Las especificaciones piden diámetros que queden
en el intervalo 1, 00 ± 0, 02 pulgadas. Qué porcentaje de la producción no
cumplirá las especificaciones?
14. Las ausencias por enfermedad de los empleados de una empresa en un mes
tiene una distribución normal aproximada con promedios de 200 horas y una
varianza de 400 horas.
a) Calcular la probabilidad de que el mes próximo el ausentismo total por enfer-
medad sea menar que 150 horas.
b) Para plantear el programa del mes próximo. Cuánto tiempo debe suponer
darse el ausentismo por enfermedad, si aquella cantidad solo se debe superar
con una probabilidad de tan solo 0,10.
15. Una empresa eléctrica fabrica focos que tienen una duración, antes de fun-
dirse, que se distribuye normalmente con una media igual a 800 horas y una
desviación estándar de 40 horas.
a) Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas
b) Sabiendo que el porcentaje de los focos de mayor duración es de 35, 5 %, en-
cuentre el tiempo de duración.
16. Las calificaciones de un examen se distribuyen normalmente con valor espe-
rado igual a 74 y desviación estándar igual a 7. Si 12 % de la clase obtiene
Calificación A . Cuál es la A más baja posible y la B más alta posible?.
17. Si los ingresos mensuales de médicos Norteamericanos están distribuidos nor-
malmente, con media 15000 dólares y con un desvı́o estándar de 3500 dólares
. Cuál es la probabilidad de que un medico elegido al azar tenga un ingreso
anual de :
a) superior a 16260 dólares
b) entre 16260 y 18500 dólares
c) entre 11500 y 18500 dólares
d) entre 8000 y 11500 dólares
18. Los puntos logrados por los candidatos en una prueba de actitud están dis-
tribuidos normalmente con una media de 500 y una desviación 100. Qué por-
centaje de los candidatos reciben puntajes
a) superiores a 700
b) entre 400 y 600
19. Si la estatura de los estudiantes de una universidad están normalmente distri-
buidos con media de 70 pulgadas, con un desvı́o estándar de 3 pulgadas.
a) Si la estatura mı́nima para ser probado en el equipo de baloncesto es de
72 pulgadas. Que proporción de los estudiantes estarı́an en condiciones de
someterse a la prueba?
b) Si para ocupar la posición de centro hay que tener una estatura de 76 pulgadas.
Que proporción de los estudiantes aptos para jugar baloncesto podrı́an ocupar
dicho lugar?
20. El examen dado por un grupo de estudiantes arroja una media de 65 con una
desviación tı́pica de 10. Si quisiéramos dar al 15 % superior una calificación A
, al 20 % siguiente B, al 30 % del medio C, al siguiente 25 % D y al 10 % más
bajo F. Qué calificaciones numéricas siguen el trazado de la curva?.
21. Las distribución de los salarios de 2000 trabajadores tiene una media de 70
dólares y una varianza de 36 dólares. Suponga que la distribución es normal
aproximada. Calcular la probabilidad que ganen:
a) entre 65 y 77 dólares
b) 82 dólares y mas
c) Cuantos trabajadores ganan 60 dólares o menos?
22. Un especialista en ictiologı́a tropical esta interesado en estimar cuanto tiempo
puede sobrevivir cierto tipo de pez en agua con determinado porcentaje de
toxicidad. Luego de una serie de experimentos llega a estimar que la vida
media de este tipo de pez alcanza 100 dı́as con un desvió estándar de 20 dı́as.
a) Cuál es la probabilidad de un pez sobreviva más de 110 dı́as?

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.3. PROBLEMAS

b) Cuál es la probabilidad de un pez sobreviva entre 95 y 105 dı́as?


23. Dos estudiantes fueron informados de que habı́an recibido referencias tipifica-
das de 0, 8 y −0, 4 respectivamente, en un examen de inglés. Si sus puntuacio-
nes fueron de 88 y 64 respectivamente. Hallar la media y la desviación tı́pica
de las puntuaciones.
24. La media de los pesos de 500 estudiantes de un cierto colegio es 151 libras y la
desviación tı́pica 15 libras. Suponiendo que los pesos se distribuyen normal-
mente, hallar
a) el número de estudiantes que pesan entre 120 y 155 libras
b) la probabilidad de que un estudiante pese más de 185 libras
25. Una fabrica de productos para televisores vende transistores de vida media de
1000 horas y desviación estándar de 100 horas. Suponiendo que la distribución
de vida en horas de los transistores es normal, calcular:
a) la probabilidad de que un transistor elegido al azar tenga una duración de
vida comprendida entre 875 y 1075 horas
b) la probabilidad de que un transistor elegido al azar tenga una duración de
vida mayor a 1020 horas
26. La cantidad semanal que una compañı́a gasta en mantenimiento y reparaciones
tiene una distribución normal aproximada cuyo promedio es de 400 dólares y
su desviación estándar 20 dólares. Si el presupuesto para cubrir los gastos de
reparación para la semana siguiente es de 450 dólares.
a) Cuál es la probabilidad de que los costos reales sean mayores que la cantidad
supuesta?
b) De cuanto debe ser el presupuesto semanal para mantenimientos y reparacio-
nes para que tan solo se rebase con una probabilidad de 0,1?.
27. Los conductores que se fabrican para utilizar en determinado sistema de
computo necesitan tener resistencias que varı́en entre 0,12 y 0,14 ohm. Las
resistencias reales medidas de los conductores que producen la compañı́a A
tiene una distribución normal con un promedio de 0,13 ohm y una desviación
estándar de 0,005 ohm.
a) Cuál es la probabilidad de que un conductor seleccionado al azar de la pro-
ducción de la compañı́a A cumpla con las especificaciones?
b) Si se usan cuatro de estos conductores en el sistema y son de la compañı́a
A . Cuál es la probabilidad de que los cuatro conductor cumplan con las
especificaciones?
28. A una temperatura de 25gradosC, las resistencias de un termistor de deter-
minado tipo tiene una distribución normal con un promedio de 10000 ohm y
una desviación tı́pica de 4000 ohm. Los termistores se clasificaran para enviar
a un cliente, los que tengan resistencias entre 8000 y 15000 ohm. Qué fracción
de los termistores se debe enviar?
29. Los tiempos de las primera averı́a de una unidad de cierta marca de impresoras
de chorro de tinta tienen aproximadamente una distribución normal con un
promedio de 1500 horas y una desviación estándar de 200 horas.
a) Qué fracción de esas impresoras fallarán antes de 1000 horas?
b) Cuál debe ser el tiempo de garantı́a para estas impresoras si el fabricante
desea que solo presente averı́as el 5 % de las impresoras dentro del tiempo de
garantı́a?
30. Una encuesta entre los habitantes de cierta ciudad, indicó que el ingreso pro-
medio era de 45000 guaranı́es, con una desviación estándar de 5000 guaranı́es.
Admitiendo una distribución normal para la variable ingreso, calcular
a) porcentaje de habitantes con renta superior a 55000 guaranı́es
b) porcentaje de habitantes con rentas comprendidas entre 50000 y 52000 gua-
ranı́es
31. Se acepta que la vida de las bombillas producidas por una compañı́a eléctrica
tiene una distribución normal, con una media igual a 1000 hs. y una desviación
tı́pica de 50 hs. Determinar la probabilidad de que una bombilla tomada al
azar se queme:
a) en memos de 900 hs.
b) entre 900 y 1100 hs.
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

32. El peso medio de 500 bacas es de 151 kilogramos, con una dispersión de
15 kilogramos. Suponiendo que la variable peso se encuentre normalmente
distribuida, determinar:
a) Cuántas vacas pesan entre 120 y 155 kilogramos?
b) Cuántas vacas pesan 185 kilos o más?
c) Cuántas vacas pesan menos de 128 kilogramos?
33. En un examen de matemáticas, el puntaje promedio es de 42 puntos, con una
desviación estándar de 9 puntos. Hay un 10 % de compañeros que por tener
mayor puntaje reciben un premio. Se pide determinar el puntaje mı́nimo para
lograr dicho premio, suponiendo normal la distribución de las calificaciones.
34. Los resultados obtenidos por los aspirantes que rindieron examen de ingreso
en una Facultad, indicaron una distribución aproximadamente normal de la
variable punta je con un valor medio de 60 puntos y una dispersión de 8 puntos.
Calcular el porcentaje de aspirante que obtuvieron puntajes:
a) mayores a 70 puntos
b) inferiores a 56 puntos
c) entre 65 y 75 puntos
Distribución Exponencial
1. Suponga que el tiempo que un usuario cualquiera permanece conectado a un
servidor en una red de cómputo se puede modelar como una variable aleatoria
con distribución exponencial con media igual a 10 minutos. De mil usuarios,
Cuántos tienen un conexión superior a una hora?. Calcule además la proba-
bilidad de que un usuario cualquiera
a) no permanezca conectado más de 10 minutos.
b) permanezca conectado más de 10 minutos pero menos de una hora
2. Sabemos que la duración del tipo de bombillas que usamos sigue una distri-
bución exponencial de media 6 horas.
a) Si una persona entra a la habitación con la luz encendida dispuesta a perma-
necer siete horas. Podrá hacerlo sin que se funda la bombilla?.
b) Encuentre el tiempo promedio de duración de las bobillas.
3. Si la cantidad de dinero pagado por cada póliza en una compañı́a de seguros
se distribuye exponencialmente con media 2000.
a) Si una persona en este momento está pagando una poliza de seguros a la
compañı́a, cuál es la probabilidad de que sea un monto superior a 2500?.
b) Encuentre la cantidad promedio de pago de dinero por un seguro a la compa-
ñı́a.
4. Una máquina de servicio tiene una unidad de reserva para sustituirla de in-
mediato cuando falle. El Tiempo a la falla (tiempo entre fallas) de la máquina
(o de su unidad de reserva) es exponencial, y sucede cada 40 minutos en pro-
medio.
a) El operador de la máquina dice que ésta tiene la costumbre de descomponerse
cada noche a eso de las 8:30 P.M. Analizar lo que dice el operador.
b) La cantidad promedio de fallas en una semana, suponiendo que el servicio se
ofrece 24 horas por dı́a y 7 dı́as por semana.
c) La probabilidad de que haya al menos una falla en un perı́odo de 2 horas.
d) La probabilidad de que la próxima falla no suceda en menos de 3 horas.
e) Si no ha sucedido falla en 3 horas después de la última falla, cuál es la proba-
bilidad de que el tiempo entre fallas sea de 4 horas cuando mucho?.
5. El tiempo entre llegadas en una dependencia del Banco Mercan es exponencial
con valor medio de 0,05 hora. La oficina abre a las 8:00 A.M.
a) Escriba la distribución exponencial que describa el tiempo entre llegadas.
b) Determine la probabilidad de que no lleguen clientes a la oficina hasta las 8:15
A.M.
c) Son las 8:35 A.M. El último cliente entró a las 8:26, Cuál es la probabilidad
de que el siguiente cliente llegue antes de las 8:38 A.M.?, Y de que no llegue
hasta las 8:40?.
d) Cuál es la cantidad promedio de clientes que llegan entre las 8:10 y las 8:45
A.M.?
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS

6. Suponga que el tiempo entre descomposturas de una máquina es exponencial,


con promedio de 6 horas. Si la máquina ha trabajado sin fallar durante las
últimas tres horas, cuál es la probabilidad de que continue sin fallar durante
la próxima hora?, De que se descomponga durante la siguiente 0,5 hora?.
7. El tiempo entre llegadas a una sala de juego en la sociedad de alumnos es
exponencial, con una media de 10 minutos.
a) Cuál es la frecuencia de llegadas por hora?
b) Cuál es la probabilidad de que no lleguen alumnos a esa sala durante los 15
minutos siguientes?.
c) Cuál es la probabilidad de que al menos un alumno visite la sala de juegos
durante los próximos 20 minutos?
8. El gerente de un nuevo restaurante de comida rápida desea cuantificar el
proceso de llegadas de clientes, estimando la fracción del intervalo de tiempo
entre llegadas que sea:
a) menor que 2 minutos,
b) entre 2 y 3 minutos y
c) más de 3 minutos.
Las llegadas en restaurantes parecidos tienen una frecuencia de 35 clientes por
hora. El tiempo entre llegadas tiene distribución exponencial.
9. Ana y Pedro, dos empleados de un restaurante de comida rápida, juegan lo
siguiente mientras esperan la llegada de clientes. Pedro le paga 2 dólares a
Ana si el próximo cliente no llega en menos de 1 minuto; en caso contrario,
Ana le paga a Pedro 2 dólares. Calcule la recompensa promedio de Pedro en
un perı́odo de 8 horas. El tiempo entre llegadas es exponencial, con una media
de 1,5 minutos.
10. Si un cliente llega a McDonalds en menos de 4 minutos después del cliente
inmediato anterior, recibirá un descuento del 10 %. Si el tiempo entre llegadas
es entre 4 y 5 minutos, el descuento, es del 6 %. Si el tiempo entre llegadas
es mayor que 5 minutos, el cliente tiene 2 % de descuento. El tiempo entre
llegadas es exponencial, con media de 6 minutos.
a) Determine la probabilidad de que un cliente que llegue reciba el máximo des-
cuento.
b) Determine el descuento promedio a cada cliente que llega
11. Se sabe que el tiempo entre fallas de un refrigerador Kencore es exponencial,
con una media de 9000 horas (más o menos 1 año de funcionamiento), y la em-
presa otorga una garantı́a de 1 año con el refrigerador. Cuál es la probabilidad
de que la garantı́a cubra una reparación por descompostura?.
12. Los niños nacen en un estado poco poblado, con una frecuencia de un naci-
miento cada 12 minutos. El tiempo entre nacimientos sigue una distribución
exponencial. Determinar
a) La cantidad promedio de nacimientos por año
b) La probabilidad de que no haya nacimientos en cualquier dı́a
c) La probabilidad de emitir 50 certificados de nacimientos en 3 horas, cuando se
emitieron 40 certificados durante las primeras 2 horas del perı́odo de 3 horas.
d) Suponga que el empleado que pasa la información de los certificados de na-
cimiento a la computadora suele esperar hasta que se hayan acumulado 5
certificados. Calcule la probabilidad de que el empleado capture un nuevo lote
en cada hora.
13. Un coleccionista de arte viaja una vez al mes, en promedio, para asistir a
subastas. En cada viaje se garantiza una compra. El tiempo entre los viajes
tiene distribución exponencial. Determine lo siguiente:
a) La probabilidad de que el coleccionista no compre obras de arte en un perı́odo
de 3 meses.
b) La probabilidad de que el coleccionista no compre más de 8 obras de arte por
año.
c) La probabilidad de que el tiempo entre viajes sucesivos sea mayor que 1 mes.
14. En un banco, la frecuencia de llegadas es de 2 clientes por minuto. Determine
lo siguiente:

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.3. PROBLEMAS

a) La cantidad promedio de llegadas durante 5 minutos.


b) La probabilidad de que no haya llegadas durante el próximo 0,5 minuto.
c) La probabilidad de que haya al menos una llegada durante el siguiente 0,5
minuto.
d) La probabilidad de que el tiempo entre dos llegadas sucesivas sea de 3 minutos,
cuando menos.
15. El tiempo entre llegadas al restaurante Juan Arepa es exponencial con media
de 5 minutos. El restaurante abre a las 11:00 A.M. Determine:
a) La probabilidad de tener 10 llegadas al restaurante hasta las 11:12 A.M. si
hubo 8 llegadas hasta las 11:05.
b) La probabilidad de que un cliente llegue entre las 11:28 y las 11:33 A.M. si el
último cliente llegó a las 11:25 A.M.

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.3. PROBLEMAS

REGLAS BASICAS DE INTEGRACION


Z Z
1) du = u + c 11) sec udu = ln | sec u + tan u| + c

un+1
Z Z
2) un du = +c 12) csc udu = − ln | csc u + cot u| +
n+1
Z Z Z
3) k f (u)du = k f (u)du 13) sec2 udu = tan u + c

Z Z Z Z
4) [ f (u) + g(u)]du = f (u)du + g(u)du 14) csc2 udu = − cot u + c

du
Z Z
5) = ln u + c 15) sec u tan udu = − csc u + c
u
Z Z
u u
6) e du = e + c 16) csc u. cot udu = − csc u + c

du u
Z Z
7) sin udu = − cos u + c 17) √ = sinh + c
2
a −u 2 a

du 1 u
Z Z
8) cos udu = sin u + c 18) = tanh +c
a2 + u2 a a

du 1 u
Z Z
9) tan udu = − ln | cos u| + c 19) p = sec + c
u (u2 − a2 ) a a

Z
10) cot udu = ln | sin u| + c

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.3. PROBLEMAS

REGLAS BASICAS DE DERIVADAS


d d
1) [c] = 0 12) [cos u] = −(sin u)u0
dx dx

d d
2) [x] = 1 13) [tan u] = (sec2 u)u0
dx dx

d d
3) cu = cu0 14) [cot u] = −(csc2 u)u0
dx dx

d n d
4) [u ] = nu(n−1) 15) [sec u] = (sec u. tan u)u0
dx dx

d d
5) [u ± v] = u0 ± v0 16) [csc u] = −(csc u. cot u)u0
dx dx

d d u0
6) u.v = u.v0 + v.u0 17) [sinh u] = p
dx dx (1 − u2 )

d u u.v0 − v.u0 d u0
7) [ ]= talquev 6= 0 18) [cosh u] = p
dx v v2 dx (1 + u2 )

d u d u0
8) [|x|] = u0 talqueu 6= 0 19) [tanh u] =
dx |u| dx (1 + u2 )

d u0 d u0
9) [ln u] = talqueu 6= 0 20) [coth u] =
dx u dx (1 − u2 )

d u d u0
10) [e ] = eu u0 21) [csc u] = √ 2
dx dx |u| u − 1

d d −u0
11) [sin u] = (cos u)u0 22) [csc u] = √ 2
dx dx |u| u − 1

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla


U.N.A.
7.3. PROBLEMAS

Documento8distNormal.pdf

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla