2017 Est Unc A Ing Civil

U.N.A.
UNIVERSIDAD NACIONAL DE CAAGUAZÚ
INGENIERÍA
CORONEL OVIEDO - PARAGUAY

Estdı́stica y Probabilidades
ERNESTO SILVERO LAZAGA
CORONEL OVIEDO − PARAGUAY

Año 2017
Índice general
1. Introducción a la Estadı́stica 3
1.1. Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. Estadı́stica Descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Construcción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Representaciones gráficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2. Medidas de Tendencia Central 15

2.1. La Media Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4. Otras medidas de Centralización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.1. Media Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.2. Media Cuadrática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.3. Media Armónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5. Generalizaciones de la media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3. Medidas de posición no central (Cuantiles) 21
4. Medidias de Dispersión 22
4.1. Varianza y Desviación Tı́pica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2. Otras medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.3. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.4. Medidas de apuntamiento o curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.5. Otras medidas caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.6. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5. Probabilidad 26
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.2. Espacio probabilı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.2.1. Experimentos y sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.3. Técnicas de Conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.1. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.2. Permutaciones con repeticiones . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.3. Pruebas ordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.4. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3.5. Diagramas de árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3.7. Definiciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4. Teoremas de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4.1. Regla de la Adición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4.2. Regla de la complementación . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.4.3. Regla de Diferenciación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.4.4. Reglas de Multiplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.4.5. Probabilidad condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.4.6. Teorema de las probabilidades totales . . . . . . . . . . . . . . . . . . . . . . . 32
5.4.7. Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.5. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6. Variables aleatorias 36
6.1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6.2. Distribución de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.2.1. Propiedades de la función de probabilidad . . . . . . . . . . . . . . . . . . . . 37
6.2.2. Propiedades de la función de densidad de probabilidad . . . . . . . . . . . . . 39
6.2.3. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1
ÍNDICE GENERAL U.N.A.
6.2.4. Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

6.3. Esperanza, varianza y momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.3.1. Esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
6.3.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
6.3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
6.4. Función generadora de momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
6.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7. Distribuciones de probabilidad 57
7.1. Distribuciones discretas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.1. Distribución Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.2. Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.1.3. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.1.4. Distribución geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.1.5. Distribución binomial negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.1.6. Construcción de una distribución binomial negativa . . . . . . . . . . . . . . . 63
7.1.7. Distribución hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2. Distribuciones continuas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.2.1. Distribución uniforme continua . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.2.2. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.2.3. Distribución ji−cuadrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
7.2.4. Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.2.5. Distribución exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla

Capı́tulo 1
Introducción a la Estadı́stica
La palabra estadı́stica se origina, en las técnicas de recolección, organización, conservación,

y tratamiento de los datos propios de un estado, con que los antiguos gobernantes controlaban
sus súbditos y dominios económicos. Estas técnicas evolucionaron a la par con el desarrollo de las
matemáticas, utilizando sus herramientas en el proceso del an álisis e interpretación de la información.
Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin ma-
yores restricciones legales. El febril jugador De Méré consultó al famoso matemático y filosofo Blaise
Pascal (1623−1662) para que le revelara las leyes que controlan el juego de los dados, el cual, intere-
sado en el tema, sostuvo una correspondencia epistolar con el tı́mido Pierre de Fermat (1601−1665,
funcionario público apasionado por las matemáticas; célebre porque no publicaba sus hallazgos) dan-
do origen a la teorı́a de la probabilidad, la cual se ha venido desarrollando y constituyéndose en la
base primordial de la estadı́stica1 .
El papel de la Estadı́stica en la Ciencia y la Ingenierı́a hoy en dı́a es crucial, fundamen-
talmente porque al analizar datos recopilados en experimentos de cualquier tipo, se observa en la
mayorı́a de las ocasiones que dichos datos están sujetos a algún tipo de incertidumbre. El investigador
o el profesional debe tomar decisiones respecto de su objeto de análisis basándose en esos datos, para
lo cual debe dotarse de herramientas adecuadas.
Es transversal a una amplia variedad de disciplinas, desde la fı́sica hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas
de negocios o instituciones gubernamentales.
Algunos estadı́sticos famosos: Thomas Bayes, Pafnuti Chebyshov, David Cox, Gertrude
Cox, George Dantzig, René Descartes, W. Edwards Deming, Bruno de Finetti, Sir Ronald Fisher,
Sir Francis Galton, Carl Friedrich Gauss, William Sealy Gosset, Andréi Kolmogórov, Aleksandr Lya-
punov, Abraham De Moivre, Sir Isaac Newton, Jerzy Neyman, Florence Nightingale, Blaise Pascal,
George Box, Karl Pearson, Adolphe Quetelet, C. R. Rao, Ernst Georg Ravenstein, Walter Shewhart,
Charles Spearman, John Tukey, Milton Friedman y varios más 2 .
1.1. Estadı́stica
Es la ciencia que se ocupa de la ordenación y análisis de datos procedentes de muestras y

de la realización de inferencias acerca de las poblaciones de las que éstas proceden. Es la ciencia que
estudia los fenómenos aleatorios3 .
La Estadı́stica se divide en dos grandes áreas (descripción de datos y realización de inferen-
cias) que reflejan la propia historia del desarrollo de esta ciencia. La Estadı́stica actual es el producto
del encuentro de dos ramas distintas del saber, la antigua estadı́stica y el cálculo de probabilidades,
que se encontraron en el siglo XIX.
1.1.1. Estadı́stica Descriptiva
El objetivo de la Estadı́stica descriptiva es estudiar procedimientos para sintetizar la infor-

mación contenida en un conjunto de datos ofreciendo un resumen numérico o gráfico del estado de
las cosas. Precisamente, de este concepto viene el nombre de Estadı́stica que procede del latı́n status
1 Estadı́stica Aplicada (N. Guarı́n S.,2002)
2 Wikipedia
3 Estadı́stica y Probabilidad (Cesar Amarilla,2010)
3
1.1. ESTADÍSTICA U.N.A.
y parte de la necesidad de conocer el entorno en que nos movemos midiendo elementos individuales
para obtener conclusiones generales aplicables a todo el conjunto.
Esta sección velara por los procedimientos para resumir la información de una caracterı́stica
que se pueda observar en los elementos individuales (Estadı́stica descriptiva unidemensional).
Conceptos Básicos
Población : Conjunto de personas, objetos o acontecimientos sobre los que queremos obtener
una conclusión. Que portan información sobre el fenómeno que se estudia. Para inferir algo
acerca de una población, usualmente tomamos una muestra de ella.
Muestra: Subconjunto de la población de interés (que representa adecuadamente a la misma).
Variables
Son las caracterı́sticas (o atributos) que se pueden observar o estudiar en los individuos de
la población. Susceptibles de adoptar distintos valores o ser expresados en categorı́as, es un aspecto
especifico de la realidad referido a la unidad del análisis y puede ser medidos o cuantificados.
ejeas siguientes caracterı́sticas son ejemplos de variables:
L. • Estatura de las personas
• Edad de los niños
• El precio y la demanda de un producto
Según el tipo de caracterı́stica a medir se pueden clasificar en:
Cualitativas nominales: Miden caracterı́sticas que no toman valores numéricos. A estas

caracterı́sticas se les llama modalidades o atributos. es decir una caracterı́stica que no puede
ser medido sino solo catalogarse.
ejeas siguientes caracterı́sticas son ejemplos de variables cualitativas nominales:
L. • Lugar de nacimiento
• Religión
• Color de ojos
Cualitativas ordinales: Miden caracterı́sticas que no toman valores numéricos pero sı́ pre-
sentan entre sus posibles valores una relación de orden.
ejeas siguientes caracterı́sticas son ejemplos de variables cualitativas ordinales:
L. • Nivel de estudios: sin estudios, primaria, secundaria, etc.
• Calificaciones de exámenes: regular, bueno, exelente, etc
• Exposición a un contaminante: nulo, leve, moderado, etc.
Cuantitativas discretas: Las variables discretas pueden asumir solo ciertos valores, toman
un número discreto de valores (en el conjunto de números naturales) y hay usualmente huecos
entre los valores (valores puntuales).
ejeas siguientes caracterı́sticas son ejemplos de variables cuantitativas discretas:
L. • Número de hijos de una familia.
• Goles en un partido de fútbol.
• Número de estudiantes en la clase de estadı́sticas, etc.
Cuantitativas continuas: Toman valores numéricos dentro de un intervalo real (dentro de

un rango especı́fico).
ejeas siguientes caracterı́sticas son ejemplos de variables cuantitativas continuas:
L. • Altura
• Peso
• Concentración de un elemento, etc.

1.1. ESTADÍSTICA U.N.A.
La estadı́stica no realiza sus funciones directamente sobre las modalidades observadas, sino
que éstas se representan por números, y la estadı́stica realiza sus funciones sobre esos números.
Se denomina medición al proceso de atribuir números a las caracterı́sticas. La medición estudia
las condiciones de construcción de representaciones numéricas, y los modelos desarrollados para la
medición se llaman escalas. Por lo tanto los datos se pueden clasificar de acuerdo con niveles de
medición. Hay cuatro escalas de medición que son: nominal, ordinal, de intervalo y de razón.
Escala Nominal
El término nivel nominal es normalmente usado para referirse a datos que solamente pueden
clasificarse en categorı́as. Es la escala de medición más bajo o más primitiva. Sin embargo, no hay
mediciones y no hay escalas involucradas, solo hay conteo. En este tipo de nivel de medición el orden
en que están acomodadas las categorı́as es totalmente arbitrario.
Escala Ordinal
Este tipo de nivel de medición tiene caracterı́sticas similares al nivel nominal con la dife-
rencia de que en el nivel ordinal las categorı́as indican que unas son más que las otras.
Escala cuantitativa intervalar
En este nivel de medición, las categorı́as están definidas por intervalos de valores, y están
acomodadas en orden a la magnitud de los valores. El tamaño de los intervalos es el mismo.
Propiedades de la escala de intervalos
a) Las categorı́as de datos son mutuamente excluyentes y exhaustivas.
b) Las categorı́as de datos están ordenadas de acuerdo con la cantidad de la caracterı́sticas que
poseen.
c) Diferencias iguales en la caracterı́stica están representadas por diferencias iguales en los números
asignados a las categorı́as.
Escala cuantitativa Racional

La escala de razón es el de nivel más alto. En este nivel al igual que en el nivel intervalar,
las categorı́as son del mismo tamaño. La diferencia es que este nivel tiene un punto cero significativo
y el valor de las categorı́as es en relación a ese punto, por lo que la relación entre dos números tiene
sentido.
Propiedades de la escala de Razón
a) Las categorı́as de datos son mutuamente excluyentes y exhaustivas.
b) Las categorı́as de datos están ordenadas de acuerdo con la cantidad de las caracterı́sticas que
poseen.
c) Diferencias iguales en la caracterı́stica están representadas por diferencias iguales en los números
asignados a las categorı́as.
d) El punto cero refleja la ausencia de estas caracterı́sticas.
Observación
Mutuamente excluyentes: Un individuo, objeto o medición pertenece únicamente a una categor

ia.
Exhaustivas: Cada individuo, objeto o medición debe pertenecer a una de las categorı́as.
La estadı́stica descriptiva hace énfasis en tres aspectos:
La forma de la distribución: Para describir como están distribuidos los datos utiliza una
herramienta llamada distribución de frecuencia y presenta la información por medio de tablas
y gráficas.
Las medidas de tendencia central: que resumen la información a una cifra que es repre-
sentativa de la serie de datos.

1.2. CONSTRUCCIÓN U.N.A.
Frecuencia frecuencia Frecuencia

Variables frecuencia Acumulada relativa relativa acumulada
Xi fi Fa fr fra
X1 f1 f1 f1 /n f1 /n
X2 f2 f1 + f2 f2 /n ( f1 + f2 )/n
.. .. .. .. ..
. . . . .
Xi fi f1 + f2 + . . . + fi fi /n ( f1 + . . . + fi )/n
.. .. .. .. ..
. . . . .
Xm fm f1 + f2 + . . . + fm = n fm /n ( f1 + . . . + fm )/n = 1
n 1
Cuadro 1.1: Forma General de Representar Frecuencias
Las medidas de variabilidad: que nos indican que tan variables son los datos respecto a las
medidas de tendencia centra.
En este capı́tulo se presenta una manera de elaborar una distribución de frecuencia, en las
secciones siguientes se abordarán los temas de medidas de tendencia central y medidas de variabilidad.
1.2. Construcción
Una distribución de frecuencias es una serie de datos agrupados en categorı́as, en las cuales
se muestra el número de observaciones que contiene cada categorı́a. Los pasos para la construcción de
una distribución de frecuencias son mejor explicados con un ejemplo. Pero antes algunas definiciones
importantes.
Frecuencias
El primer método para resumir una muestra de tamaño n{x1 , ..., xn } de una variable esta-
dı́stica X, que presenta las modalidades c1 , ..., cm , es calcular la tabla de frecuencias. Como su nombre
indica es una tabla donde se presentan las modalidades observadas y sus frecuencias de aparición:
Frecuencia Absoluta: Número de veces que aparece la modalidad. Se denotará por
ni , donde 0 ≤ ni ≤ n
Frecuencia Absoluta Acumulada: Número de veces que aparece la modalidad o valores inferiores.
Se denotará por
Ni , donde 0 ≤ Ni ≤ n, y Ni−1 ≤ Ni , Nm = n
Frecuencia Relativa: Tanto por uno de las veces que aparece la modalidad.
ni
fi = , donde 0 ≤ fi ≤ 1
n
Frecuencia Relativa Acumulada: Tanto por uno de las veces que aparece la modalidad o valores
inferiores.
Ni
Fi = , donde 0 ≤ Fi ≤ 1, y Fi−1 ≤ Fi , Fm = 1
n
En muchos casos se hace necesario el agrupamiento en intervalos o clases que haga más
compacta, manejable y presentable la información.
El número de clases y la amplitud de los intervalos los fija el investigador de acuerdo con el
conocimiento que posea de la población, la necesidad de hacer comparación con otras investigaciones
y la presentación de la información. Sin embargo, se recomienda que la información no sea demasiado
compacta, lo cual le restarı́a precisión, ni demasiado dispersa, ya que no se tendrı́a claridad.
En términos generales, es usual que el número de intervalos no sea inferior a 5 ni superior
a 15. Struges propone que el número de clases o intervalos sea determinado por la expresión.
m∼
= 1 + 3, 322log10 N
Intervalos Marca de Clase

[e1 . . . e2 ] x1 = (e1 +e
2
2)
[e3 . . . e4 ] x2 = (e3 +e
2
4)
.. ..
. .
(e j +e j+1 )
[e j . . . e j+1 ] xj = 2
Cuadro 1.2: Forma General de Representar Intervalos
La amplitud debe ser igual para todos los intervalos y, en lo posible, no se debe trabajar con clases
abiertas.
Reglas empı́ricas para la construcción de intervalos
Cuando no se tiene experiencia en el manejo de la información es aconsejable seguir los
pasos que se dan a continuación:
Determinar los datos de mayor y menor valor Xmax , Xmin .
Calcular el rango o recorrido R = Xmax − Xmin
Determinar el número de intervalos (m) y la amplitud de clase (A), m ∼

= 1 + 3, 322log10 N.
R
Debe tenerse presente que m es un número natural. Luego se busca la amplitud A : A > m
Calcular el rango ampliado Ra = m.A
Establecer la diferencia a = Ra − R , es decir la cantidad en que ha sido alterado el recorrido,

la cual no debe ser superior a la amplitud.
También puede ser definida como la cantidad positiva más pequeña que le hace falta al rango
o recorrido para ser divisible exactamente por la amplitud.
Distribuir adecuadamente la cantidad a de la siguiente manera.

Al valor Xmin se le resta aproximadamente a2 y la parte restante se le suma a Xmax , obteniendo
el lı́mite inferior del primer intervalo y el lı́mite superior del último, respectivamente.
a
Xmin − ∼
= = Lı́mite inferior del primer intervalo
2
a
Xmax + ∼
= = Lı́mite superior del último intervalo
2
Tener en cuenta que en el caso de agrupamiento de datos, Xi es la semisuma de lı́mite inferior
y lı́mite superior.
Con el fin de prever dobles conteos, quien clasifica deberá especificar si los intervalos son
abiertos a la derecha o abiertos a la izquierda, o cerradas ambas, en estas notas, trabajaremos
con intervalos cerrados; es decir, del tipo a ≤ X ≤ b , donde el lı́mite superior está incluido
dentro de la clase.
El conjunto de datos airquality dispone de medidas de calidad del aire en Nueva York con
las variables cuantitativas Ozone (ozono en ppb), Solar.R (radiación solar en langleys), Wind (viento
en mph), Temp (temperatura en F). En la tabla siguiente se muestra la tabla de frecuencias agrupada
en 10 clases para la variable Temp.
> temper <- (airquality$Temp)

> temper
[1] 67 72 74 62 56 66 65 59 61 69 74 69 66 68 58 64 66 57 68 62 59 73 61 61 57
[26] 58 57 67 81 79 76 78 74 67 84 85 79 82 87 90 87 93 92 82 80 79 77 72 65 73
[51] 76 77 76 76 76 75 78 73 80 77 83 84 85 81 84 83 83 88 92 92 89 82 73 81 91
[76] 80 81 82 84 87 85 74 81 82 86 85 82 86 88 86 83 81 81 81 82 86 85 87 89 90
[101] 90 92 86 86 82 80 79 77 79 76 78 78 77 72 75 79 81 86 88 97 94 96 94 91 92
[126] 93 93 87 84 80 78 75 73 81 76 77 71 71 78 67 76 68 82 64 71 81 69 63 70 77
[151] 75 76 68
Marca Frecuencia frecuencia Frecuencia

Intervalos de clase frecuencia Acumulada relativa relativa acumulada
[e j . . . e j+1 ] Xi fi Fa fr fra
[56 . . . 60] 58 8 8 0.05 0.05
[61 . . . 65] 63 10 18 0.07 0.12
[66 . . . 70] 68 15 33 0.10 0.22
[71 . . . 75] 73 19 52 0.12 0.34
[76 . . . 80] 78 33 85 0.22 0.56
[81 . . . 85] 83 34 119 0.22 0.78
[86 . . . 90] 88 20 139 0.13 0.91
[91 . . . 95] 93 12 151 0.08 0.99
[96 . . . 100] 98 2 153 0.01 1
153 1
Cuadro 1.3: Ejemplo de Intervalos y Frecuencias
En primer lugar es bueno ordenar los datos como mejor convenga en este caso, de menor a
mayor.
> sort(temper)
[1] 56 57 57 57 58 58 59 59 61 61 61 62 62 63 64 64 65 65 66 66 66 67 67 67 67
[26] 68 68 68 68 69 69 69 70 71 71 71 72 72 72 73 73 73 73 73 74 74 74 74 75 75
[51] 75 75 76 76 76 76 76 76 76 76 76 77 77 77 77 77 77 77 78 78 78 78 78 78 79
[76] 79 79 79 79 79 80 80 80 80 80 81 81 81 81 81 81 81 81 81 81 81 82 82 82 82
[101] 82 82 82 82 82 83 83 83 83 84 84 84 84 84 85 85 85 85 85 86 86 86 86 86 86
[126] 86 87 87 87 87 87 88 88 88 89 89 90 90 90 91 91 92 92 92 92 92 93 93 93 94
[151] 94 96 97
Calculando las empı́ricas para la construcción de intervalos
Determinar los datos de mayor y menor valor Xmax = 97, Xmin = 56.
Calcular el rango o recorrido R = Xmax − Xmin = 97 − 56 = 41
El número de intervalos (m) y la amplitud de clase (A), m ∼

= 1 + 3, 322log10 (153) ∼
= 8.
R 41
Debe tenerse presente que m es un número natural. A : A > m = 8 =5
Calcular el rango ampliado Ra = m.A = 8 ∗ 6 = 48
Establecer la diferencia a = Ra − R = 48 − 41 = 7 , es decir la cantidad en que ha sido alterado

el recorrido, la cual no debe ser superior a la amplitud. Distribuir adecuadamente la
cantidad a de la siguiente manera. Al valor Xmin se le resta aproximadamente 2a y la parte
restante se le suma a Xmax , obteniendo el lı́mite inferior del primer intervalo y el lı́mite superior
del último, respectivamente.
a
Xmin − ∼
= = 56 − 3,5 = 52 Lı́mite inferior del primer intervalo
2
a
Xmax + ∼
= = 97 + 3,5 = 100 Lı́mite superior del último intervalo
2
Tener en cuenta que en el caso de agrupamiento de datos, Xi es la semisuma de lı́mite inferior
y lı́mite superior entonces x1 = (56 + 60)/2 = 58.
Construir los intervalos, calcular los puntos medios o marcas de clase y hacer el agrupamiento
de frecuencias. Por cuestiones de concordancia con el programa R vamos a ajustar el número
de intervalos en diez .

1.3. REPRESENTACIONES GRÁFICAS U.N.A.
1.3. Representaciones gráficas
Si la variable toma pocos valores diferentes o es cualitativa, entonces para representar la

distribución de frecuencias no acumuladas se utiliza:
Diagrama de barras: Consiste en un gráfico cartesiano en el que se dibuja xi en abscisas y

ni (o fi ) en ordenadas dibujando barras verticales en cada punto xi de longitud ni (o fi ).
> t1 <- read.table("/home/ernesto/Documentos/paraclase 2017/estadisticauncaoviedo/Te

> attach(t1)
> barplot(frec,mclas,xlab="Temperature", names.arg = paste("", mclas, sep = ""),main
>
Barchart
30
25
20
Frequency
15
10
5
0
58 63 68 73 78 83 88 93 98
Temperature
Polı́gono de frecuencias: Igual que el diagrama de barras pero lo que se unen son los puntos
(xi , ni ) consecutivos.
> plot(t1$frec,type = "o",ylab="Frequency",xlab="Temperature", main="Frequency polyg

Frequency polygon
35
30
25
Frequency
20
15
10
5
2 4 6 8
Temperature
Diagrama acumulativo de frecuencias: Se usa para representar frecuencias acumulativas.

Es como el diagrama de barras pero representando la frecuencia acumulada Ni en vez de la
frecuencia absoluta.
> plot(t1$frerltacm,type = "o",ylab="Frequency",xlab="Temperature", main="Cumulative
Cumulative Frequency Plot

1.0
0.8
0.6
Frequency
0.4
0.2
2 4 6 8
Temperature

Histograma: Es la representación gráfica utilizada para las variables continuas. Es básicamente

fi
un diagrama de barras donde la altura de la barra es hi = , siendo li la longitud del intervalo o
li
clase. La función en R para obtenerlos es hist y además de poder dibujar el histograma, calcula
las marcas de clase y las frecuencias.
> utils::str(hist(airquality$Temp, col="gray", ylim = c(0,37),xlab = "Temperature" ,
List of 6
$ breaks : int [1:10] 55 60 65 70 75 80 85 90 95 100
$ counts : int [1:9] 8 10 15 19 33 34 20 12 2
$ density : num [1:9] 0.0105 0.0131 0.0196 0.0248 0.0431 ...
$ mids : num [1:9] 57.5 62.5 67.5 72.5 77.5 82.5 87.5 92.5 97.5
$ xname : chr "airquality$Temp"
$ equidist: logi TRUE
- attr(*, "class")= chr "histogram"
Histogram of airquality$Temp
34
33
30
Frequency
20
20
19
15
12
10
10
2
0
60 70 80 90 100
Temperature
Diagrama de sectores (gráfico de tarta): Se representa la frecuencia de cada modalidad

proporcionalmente al ángulo del sector que lo representa.
> library(colorspace, pos=10)

> pie(table(t1$frerlat), labels=levels(t1$mclas), main="Pie Chart", col = rainbow_hc
>

Pie Chart
3
2
6 8
Pictograma: Se representa cada modalidad asociando un dibujo cuyo volumen (anchura/altura)

es proporcional a la frecuencia.
Diagrama de tallo y hojas: Los datos se redondean a dos o tres cifras significativas, tomán-
dose como tallo la primera o dos primeras cifras y como hojas las ultimas cifras. El tallo se
separa de las hojas por una lı́nea vertical. Ası́, cada tallo se representa una sola vez y el número
de hojas representa la frecuencia. La impresión resultante es la de acostar un histograma.
> stem(airquality$Temp)
The decimal point is at the |
56 | 0000
58 | 0000
60 | 000
62 | 000
64 | 0000
66 | 0000000
68 | 0000000
70 | 0000
72 | 00000000
74 | 00000000
76 | 0000000000000000
78 | 000000000000
80 | 0000000000000000
82 | 0000000000000
84 | 0000000000
86 | 000000000000
88 | 00000
90 | 00000
92 | 00000000
94 | 00
96 | 00

Diagramas de caja: El diagrama de caja consta de una caja central que está delimitada por la
posición de los cuartiles Q3 y Q1 . Dentro de esa caja se dibuja la lı́nea que representa la mediana.
También ocasionalmente se puede representar la media dentro de la caja. De los extremos de
la caja salen unas lı́neas que se extienden hasta los puntos LI = máx{mı́n(xi ), Q1 − 1, 5(RI)} y
LS = mı́n{máx(xi ), Q3 + 1, 5(RI)} que representarı́an el rango razonable hasta el cual se pueden
encontrar datos. Los datos que caen fuera del intervalo (LI, LS) se consideran datos atı́picos
y se representan individualmente. La informacioń obtenida a partir de las medidas de
centralización, dispersión y forma se puede usar para realizar diagramas de caja (boxplots) que
visualmente nos proporcionen la información de cómo están distribuidos los datos. Damos como
ejemplo este grafico y después pasamos a explicar las medidas de tendencia central.
> boxplot(airquality$Temp, main = "Box Plot",col = 37 )

> points(mean(airquality$Temp))
> text(rep(1,5),boxplot.stats(airquality$Temp)$stats,c("LI","Q1","Med","Q3","LS"))
>
Box Plot
LS
90
Q3
80
Med
Q1
70
60
LI
Ejercicio1:
Una empresa de informática dedicada al análisis de virus en ordenadores, contabiliza los vi-
rus detectados con su producto en 20 ordenadores de domicilios particulares. Los resultados obtenidos
son los siguientes:
46 29 35 61 54 37 53
57 52 51 43 67 66 31
53 51 48 59 55 47
Construir una tabla con las frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas del conjunto de datos.
Dibujar un polı́gono de frecuencias y un histograma del número de virus.
Ejercicio2: Los datos siguientes corresponden al tiempo necesario para procesar 25 trabajos
en una CPU.

1.17 1.61 1.16 1.38 3.53 1.23 3.76

1.94 0.96 4.75 0.15 2.41 0.71 0.02
1.59 0.19 0.82 0.47 2.16 2.01 0.92
0.75 2.59 3.07 1.4
Construir una tabla con las frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas del conjunto de datos.
Dibujar un polı́gono de frecuencias y un histograma del número de virus.

Capı́tulo 2
Medidas de Tendencia Central
A las medidas de tendencia central con frecuencia se les llama promedios. El propósito de
una medida de tendencia central es indicar con toda precisión el centro de un conjunto de observa-
ciones.
2.1. La Media Aritmética
Es la medida de tendencia central mas ampliamente usada y usualmente abreviada como

media.
La media aritmética de un conjunto de n valores (observaciones) es el resultado de la suma
de todos ellos dividido entre n.
1 n
x̄ = ∑ xi (2.1.1)
n i=1
Donde la expresión corresponde a tener todos los datos cuantitativos.
1 n
x̄ = ∑ fixi (2.1.2)
n i=1
Corresponde a datos agrupados donde:
x̄ : simboliza la media de la muestra.
xi : es el valor puntual y en caso de grupos la marca de clase del intervalo i−ésimo
∑ xi : es la suma de todos los valores de la muestra.

fi : es la frecuencia de clase del intervalo i−ésimo
∑ fi xi : es la suma de los productos de fi por xi .

n : es el número de elementos de la muestra.
∑ f = n : es la suma de las frecuencias de clase.
La media de la población Las medidas caracterı́sticas de una muestra son llamadas

estadı́sticos y las medidas caracterı́sticas de una población se denominan parámetros. La media de
la población se calcula de la misma manera que la media de la muestra, que calculamos arriba, pero
tiene diferente notación:
1 N
µ= ∑ Xi (2.1.3)
N i=1
Muy semejante 2.1.1
Donde :
µ : simboliza la media de la población.
∑ Xi : es la suma de todos los valores de la población.

N : es el número de elementos de la población.
15
2.2. MEDIANA U.N.A.
Propiedades de la media aritmética

Puede ser calculada en distribuciones con escala relativa e intervalar.
Todos los valores son incluidos en el cómputo de la media.
Una serie de datos solo tiene una media mı́n(xi ) ≤ x̄ ≤ máx(xi ) y tiene las mismas unidades que
los datos originales.
Es una medida muy útil para comparar dos o más poblaciones.
Es la única medida de tendencia central donde la suma de las desviaciones de cada valor
respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el
punto de balance de una serie de datos. También llamado el centro de gravedad de los datos.
n n n
∑ (xi − x̄) = 0; ∑ (xi − x̄)2 = mı́na∈R ∑ (xi − a)2
i=1 i=1 i=1
Desventajas de la media aritmética

Si alguno de los valores es extremadamente grande o extremadamente pequeño, la media no es
el promedio apropiado para representar la serie de datos.
No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.
Media truncada o recortada

Un inconveniente de la media aritmética es que un dato anómalo puede hacerla variar
mucho. La contribución de cada dato a la media es xi /n. Si yo me equivoco al medir o anotar el
dato xi y le sumo 1000 unidades más, el efecto que se produce en la media es que se desplaza 1000/n
unidades.
Para evitar este efecto se utiliza la media truncada que consiste en calcular la media
aritmética de un porcentaje central de los datos (esto es, eliminando un porcentaje de los datos más
bajos y de los más altos). Ası́ una media truncada al 10 % calcuları́a la media aritmética del 90 % de
los valores centrales despreciando el 5 % de los valores más bajos y el 5 % de los más altos.
La media recortada es un concepto parecido al anterior salvo que en vez de despreciar un
porcentaje de los valores más bajos y más altos lo que se hace es modificar estos valores. Se sustituyen
los valores más bajos por el más bajo de los valores centrales y los valores más altos por el más alto
de los valores centrales. Si en la muestra que hemos recogido no hay datos anómalos, la diferencia
entre la media truncada (o recortada) y la media aritmética debe ser pequeña. Estas medidas no
suelen utilizarse con valores agrupados.
2.2. Mediana
Se define la mediana (Me ) como aquel valor que, teniendo los datos ordenados de menor a
mayor, deja igual número de valores a su izquierda que a su derecha. Si el número de datos es par
se calcula como la media de los dos valores centrales. Si el número de datos es impar se toma como
mediana el valor central.
Si los datos se han agrupado se determina primero el intervalo mediano (aquel intervalo
donde la frecuencia relativa acumulada es menor o igual que 0,5 en su extremo inferior y mayor
que 0,5 en su extremo superior) para a continuación elegir un representante de este intervalo como
mediana (la marca de clase, LIi + li (0,5 − Fi−1 )/ fi , etc.).
Cuando los datos se encuentran agrupados en una distribución de frecuencia no conocemos
los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos :
Calcular el valor n/2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo
mediano).
Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es
igual o mayor que n/2.
Aplicando la siguiente fórmula con los valores del intervalo mediano:
n −F
2 aa
X̃ = LRI + A (2.2.4)
F
2.3. MODA U.N.A.
Donde:
X̃ : mediana de la muestra.
LRI : Limite real inferior del intervalo mediano.
Faa : frecuencia acumulada anterior a la frecuencia del intervalo mediano.
A : tamaño de los intervalos de clase.
F : frecuencia del intervalo mediano.
La mediana serı́a la medida de posición central más robusta (i.e. más insensible a datos
anómalos) y coincidirı́a con la media truncada al 100 %.
n n
Además la mediana verifica que ∑ |xi − Me| = mı́na∈R ∑ |xi − a|.
i=1 i=1
Propiedades de la mediana
Hay solo una mediana en una serie de datos.
No es afectada por los valores extremos ( altos o bajos )
Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se encuentra

en el intervalo abierto.
Puede ser calculada en distribuciones con escala relativa, intervalar, y ordinal.
2.3. Moda
La moda de una variable cuantitativa discreta o cualitativa de tipo ordinal y nominal, es

el valor más frecuente. En el caso de variables cuantitativas agrupadas se define el intervalo modal
como aquel con mayor frecuencia relativa. La moda puede no ser única si tenemos varios intervalos
con la misma frecuencia relativa máxima.
Para datos agrupados en una distribución de frecuencia, la moda puede ser estimada si-
guiendo los siguientes pasos:
Localizar la clase del intervalo que contenga la frecuencia de clase más grande.
Aplicando la siguiente fórmula con los valores del intervalo de la moda:
∆1
X̂ = LRI + A (2.3.5)
∆1 + ∆2
Donde:
X̂ : la moda de los datos de la muestra.
LRI : Limite real inferior de la clase modal
∆1 : diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
∆2 : diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior.
A : tamaño de los intervalos de clase.
Si hay dos intervalos contiguos con frecuencia máxima la moda será la media aritmética de
las dos marcas de clases. Si hay dos o más intervalos no contiguos con frecuencia de clase máxima
habrá dos o más modas que serán las marcas de clases de dichos intervalos.
Propiedades de la moda
La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar, y
relativa).
La moda tiene la ventaja de no ser afectada por valores extremos.

. U.N.A.
2.4. OTRAS MEDIDAS DE CENTRALIZACIÓN
Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
Desventajas de la moda
En muchas series de datos no hay moda porque ningún valor aparece más de una vez.
En algunas series de datos hay más de una moda, en este caso uno podrı́a preguntarse. Cual
es el valor representativo de la serie de datos?
Comparacón entre media, mediana y moda

Si no hay ningún argumento de peso en contra, se preferirá siempre la media. Hay dos
razones para apoyar esta norma general. La primera es que en ella se basan otros estadı́sticos y la
segunda es que es mejor estimador de su parámetro que la mediana y la moda.
Hay al menos tres situaciones en las que se preferirá la mediana a la media:
Cuando la variable esté medida en escala ordinal.
Cuando haya valores extremos que distorsionen la interpretación de la media.
Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de lı́mite
superior, el intervalo inferior carece de lı́mite inferior o ambos.
La media es extremadamente sensible a las puntuaciones y un cambio en sólo una de ellas

supone un cambio en la media aritmética, mientras que la mediana sólo se verı́a alterada por cambios
en los valores centrales.
La mediana será la segunda candidata para representar la tendencia central y se preferirá
la mediana a la moda, a menos de que:
1. Se trate de una variable medida en escala nominal.
2. Haya intervalos abiertos y la mediana pertenezca a uno de ellos.
Relación entre las medidas de tendencia central
Para una distribución simétrica los valores de la media, la mediana y la moda coinciden es
decir: X̄ = X̃ = X̂, con lo cual la distribución de datos no presenta sesgo.
Observación : Esta igualdad no es exacta, sino que se cumple con mayor o menor
aproximación en función del grado de simetrı́a de la curva que represente gráficamente la
distribución.
Para una distribución asimétrica negativa se tiene que: X̄ < X̃ < X̂, con lo cual la distribución
de datos presenta un sesgo negativo.
Para una distribución asimétrica positiva se tiene que: X̂ < X̃ < X̄, con lo cual la distribución
de datos presenta un sesgo positivo.
Observación: La regla empı́rica se acepta como válida siempre que el grado de curva no
sea muy acentuado.
2.4. Otras medidas de Centralización

2.4.1. Media Geométrica
La media geométrica es útil para encontrar el promedio de porcentajes, proporciones,

ı́ndices, o tasas de crecimiento. Tiene mucha aplicación en el comercio y la economı́a porque nos
interesa encontrar el porcentaje de cambio en ventas, salarios o datos económicos como el producto
nacional bruto. La media geométrica de un conjunto de ”n”números enteros positivo se define como
la n−ésima raı́z del producto de los n valores es decir:
s
p n
G = n X1 , X2 , . . . , Xn = n ∏ Xi (2.4.6)
i=1

2.5. GENERALIZACIONES DE LA MEDIA U.N.A.
eje0.3cm Suponga que usted recibe un 5 % de aumento en su salario este año y un 15 % de

aumento el año próximo y quiere saber cual es el incremento porcentual promedio. Si tiene
un aumento del 5 % entonces su salario es 1,05 y si tiene un aumento del 15 % su salario es de 1,15
entonces calculando la media geométrica se obtiene
p
(1, 05)(1, 15) = 1, 09886
, por lo que el aumento promedio anual es del 9, 886 %.
ejeas ganancias obtenidas por Atkins Construction Company en cuatro proyectos recientes fueron
3 %, 2 %, 4 % y 6 %. Cuál es la media de las ganancias? Por lo que la media de ganancias
obtenidas por Atkins Construction Company en los cuatro proyectos esta dada por
p4
(0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464
o sea 3,464 %
2.4.2. Media Cuadrática
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los
errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los
efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en
elevar al cuadrado todas las observaciones (ası́ los signos negativos desaparecen), en obtener después
su media aritmética y en extraer, finalmente, la raı́z cuadrada de dicha media para volver a la unidad
de medida original.
s s
X12 + X22 + · · · + Xn2 1 n 2
C= = ∑ Xi (2.4.7)
N N i=1
2.4.3. Media Armónica
La media arónica es un promedio muy útil en conjuntos de números que se definen en

relación con alguna unidad, por ejemplo la velocidad (distancia por unidad de tiempo).
!−1
1 n 1
H= ∑ Xi (2.4.8)
N i=1
2.5. Generalizaciones de la media
Existen diversas generalizaciones de las medias anteriores.

Media generalizada
Las medias generalizadas, también conocidas como medias de Hölder, son una abstracción
de las medias cuadráticas, aritméticas, geométricas y armónicas. Se definen y agrupan a través de la
siguiente expresión:
!1
m
1 n m
x̄(m) = ∑ xi (2.5.9)
n i=1
Eligiendo un valor apropiado del parámetro m, se tiene:
m → ∞ máximo.
m = 2 media cuadrática , comparar con la expresión 2.4.7 .
m = 1 media aritmética, comparar con la expresión 2.1.1 .
m → 0 media geométrica, comparar con la expresión 2.4.6.
m = −1 media armónica, comparar con la expresión 2.4.8.

2.5. GENERALIZACIONES DE LA MEDIA U.N.A.
m → −∞ mı́nimo.
Media−f generalizada
Esta media puede generalizarse para una función monótona como la media−f generalizada:
!
n
1
x̄ = f −1 · ∑ f (xi ) (2.5.10)
n i=1
donde f : I → I sea una función inyectiva e I ⊂ R un intervalo. Escogiendo formas particulares
para f se obtienen algunas de las medias más conocidas:
f (x) = x media aritm etica, I = R, comparar con la expresión 2.1.1.

1
f (x) = x media armónica, I = (0, ∞), comparar con la expresión 2.4.8.
f (x) = xm media generalizada, I = (0, ∞), comparar con la expresión 2.5.9.
f (x) = ln x media geométrica, I = (0, ∞), comparar con la expresión 2.4.6.

Capı́tulo 3
Medidas de posición no central

(Cuantiles)
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen
a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de
frecuencias.
Los cuantiles más conocidos son: cuartiles, deciles y percentiles.
Cuartiles ( Qi ) Son valores de la variable que dividen a la distribución en 4 partes, cada
una de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 es el primer
cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que deja a su izquierda
el 50 % de los datos, y Q3 es el tercer cuartil que deja a su izquierda el 75 % de los datos. (Q2 = Me)
Deciles ( Di ) Son los valores de la variable que dividen a la distribución en las partes
iguales, cada una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 = Me
)
Centiles o Percentiles ( Pi ) Son los valores que dividen a la distribución en 100 partes
iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habrá 99 percentiles.
(Q2 = D5 = Me = P50 )
Cálculo de los cuantiles en distribuciones no agrupadas en intervalos
kN
Se calculan a través de la siguiente expresión: q siendo :
k : el orden del cuantil correspondiente.
q : el número de intervalos con iguales frecuencias u observaciones (q = 4, 10, . . . , 100).
N : número total de observaciones.
Cálculo de los cuantiles en distribuciones agrupadas en intervalos

kn
!
q − f a(i−1)
Qk = LI + A (3.0.1)
fi
k : Orden del cuantil k = 1, 2, ...
q : el número de intervalos con iguales frecuencias u observaciones (q = 4, 10, . . . , 100).
LI : Limite inferior del intervalo que contiene el cuantil.
f a(i−1) : Frecuencia acumulada hasta el intervalo anterior al que contiene el cuantil.
fi : Frecuencia del intervalo que contiene el cuantil.
n : Número de observaciones.
A : Amplitud de los intervalos.
21
Capı́tulo 4
Medidias de Dispersión
Tratan de medir la concentración o dispersión de las observaciones muestrales o poblacio-

nales.
Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar
una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una medida
de variabilidad pequeña indica que los datos están agrupados muy cerca, digamos, de la media. La
media, por lo tanto es considerada bastante representativa de la serie de datos. Inversamente, una
gran medida de variabilidad indica que la media no es muy representativa de los datos.
Una segunda razón para estudiar la variabilidad de una serie de datos es para comparar
como están esparcidos los datos en dos o más distribuciones. Por ejemplo, la calificación promedio
de dos estudiantes, A = {90; 80; 75; 75} y B = {90; 55; 85; 90}, es de 80. Basados en esto podrı́amos
pensar que sus calificaciones son idénticas. Pero si revisamos el detalle de sus calificaciones vemos
que esta conclusión no es correcta.
4.1. Varianza y Desviación Tı́pica
Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto
a la media (s2 : caso muestral σ2 : caso poblacional). Se define la desviación tı́pica como la raı́z
positiva de la varianza (s : caso muestral σ : caso poblacional). Se suele utilizar más la desviación
tı́pica porque presenta las mismas unidades que la variable original. Al estar definidas como promedio
de cuadrados son siempre no negativas.
Las fórmulas de la varianza de una población y de una muestra son ligeramente diferentes.
Las fórmulas son:
N N
2
∑ (Xi − µ) ∑ Xi2
i=1 i=1
σ2 = = − µ2 (4.1.1)
N N
para la varianza de una población y
n n
∑ (Xi − X)2 ∑ Xi2
i=1 i=1 2
S2 = = −X (4.1.2)
n n
para la varianza de una muestra.
Las desviaciones estándar de la población y muestra se calculan simplemente sacando la
raı́z cuadrada a la respectiva varianza.
p
σ = σ2 (4.1.3)
desviación estándar de una población y
√
S= S2 (4.1.4)
desviación estándar de una muestra
Usos frecuentes de la desviación estándar Enfatizando, la desviación estándar es útil
para describir un conjunto de datos midiendo el grado de dispersión de las observaciones individuales
alrededor de su media. Existen dos aplicaciones adicionales para la stándar:
22
4.2. OTRAS MEDIDAS DE DISPERSIÓN U.N.A.
Teorema de Chebyshev establece que para todo conjunto de datos, por lo menos 1 − k12 % de
las observaciones están dentro de k desviaciones estándar de la media en donde k es cualquier
número mayor que 1.
4.2. Otras medidas de dispersión

Desviación absoluta respecto a la media: Dx̄ = 1n ∑ni=1 |xi − x̄|.
Desviación absoluta respecto a la mediana: DQ2 = 1n ∑ni=1 |xi − Q2 |.
Mediana de las desviaciones absolutas: MEDA = Q2 {|xi − Q2 (x)| : i = 1, ..., n}.
Recorrido o rango: R = máx(xi ) − mı́n(xi ).
Rango intercuartı́lico: RI = Q3 (x) − Q1 (x).

(máx(xi )−mı́n(xi ))
Recorrido relativo: RR = x̄ .
Coeficiente de variación: CV = x̄s .
Las medidas relativas como el recorrido relativo o el coeficiente de variación sólo tienen
sentido cuando la media de la variable es mayor que cero.
4.3. Medidas de forma
Las medidas de forma tratan de medir el grado de simetrı́a y apuntamiento en los datos.
Medidas de asimetrı́a
(x̄ − Q2 )
Coeficiente de asimetrı́a de Pearson: AsP = .
s
∑ni=1 (xi − x̄)3
Coeficiente de asimetrı́a de Fisher: AsF = .
ns3
La interpretación de estos coeficientes es la siguiente: Si son prácticamente cero se dice que

los datos son simétricos. Si toman valores significativamente mayores que cero diremos que los datos
son asimétricos a la derecha y si toman valores significativamente menores que cero diremos que son
asimétricos a la izquierda.
4.4. Medidas de apuntamiento o curtosis
Miden el grado de concentración de una variable respecto a su medida de centralización

usual (media). El más usual es el coeficiente de apuntamiento de Fisher que se define como:
∑ni=1 (xi − x̄)4

SkF =
ns4
.
Puesto que en Estadı́stica el modelo de distribución habitual de referencia es el gausiano o
normal y este presenta teóricamente un coeficiente de apuntamiento de 3, se suele tomar este valor
como referencia. Ası́, si este coeficiente es menor que 3 diremos que los datos presentan una forma
platicúrtica, si es mayor que 3 diremos que son leptocúrticos y si son aproximadamente 3 diremos
que son mesocúrticos.

4.5. OTRAS MEDIDAS CARACTERÍSTICAS U.N.A.
4.5. Otras medidas caracterı́sticas
Varias de las medidas vistas anteriormente utilizan desviaciones de los datos respecto a la
media elevadas a distintos órdenes. Este tipo de coeficientes se denominan momentos.
1 n r
Se define el momento respecto al origen de orden r(r ≥ 0) como: ar = ∑ xi .
n i=1
1 n
Se define el momento central de orden r(r ≥ 0) como: mr = ∑ (xi − x̄)r .
n i=1
La relación entre los dos tipos de momentos viene dada a partir del binomio de Newton:
r
k k
mr = ∑ (−1) ( )ar−k ak1
k=0 r
Casos particulares de los momentos son:
a1 = x̄, m2 = s2 , m3 = s3 AsF y m4 = s4 SkF
4.6. Ejercicios Propuestos

1. El departamento de agricultura, tiene los siguientes datos que representan el crecimiento men-
sual (en pulgadas) de muestras de maı́z recien plantados
0,4 1,9 1,5 0,9 0,3 1,6 0,4 1,5 1,2 0,8
0,9 0,7 0,9 0,7 0,7 1,5 0,5 1,5 1,7 1,8
a) Organice los datos en un ordenamiento ascendente.

b) calcula las medidas de tendencia central y las variaciones considerando los a datos como
simples.
2. Un fabricante de neumáticos quiere determinar el diámetro interior de cierto grado de los

neumáticos. Idealmente el diámetro serı́a 570mm. Los datos son los siguientes:
572 572 573 568 569 575 565 570
Encuentre las medidas de tendencia central, las variaciones y analice la relación entre ellas
3. A continuación presentamos los datos de una muestra de la tasa de producción diaria de de
botes de fibra de vidrio de la Hidrosport Lt. Un fabricante de Miami.
17 21 18 27 17 21 20 22 18 23
a) Calcule las mediadas de tendencia central, las variaciones e interprete los resultados
b) Compare.
4. Dada la distribución de frecuencia de rentas mensuales de 200 departamentos (en miles de

pesos)
Renta mensual (en miles de pesos) Números de departamentos
350-379 3
380-409 8
410-439 10
440-469 13
470-499 33
500-529 40
530-559 35
560-589 30
590-619 16
620-649 12
Total 200
Determine las medidas de tendencia central, variaciones y analice la relación entre ellas
4.6. EJERCICIOS PROPUESTOS U.N.A.
5. las edades de 60 personas que trabajan en una fábrica textil se han tabulado dando la siguiente
tabla de frecuencias:
Edades Número de personas
13-17 2
18-22 6
23-27 10
28-32 13
33-37 18
38-42 6
43-47 2
48-52 2
53-57 16
Total 60
a) Hallar las mediadas de tendencia central y las variaciones.

b) Interpretar los resultados de la parte a)
c) Comparar las mediadas.
6. Se conduce un estudio de los efectos de fumar sobre los patrones de sueños. La medición que
se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene estos datos:
Fumadores 69,3 56,0 22,1 47,6 53,2 48,1 52,7 34,4 60,2 43,8
No fumadores 28,6 25,1 26,4 34,9 29,8 38,5 30,2 30,6 31,8 41,6
a) Encuentre las medidas de tendencia central para cada grupo

b) Encuentre la varianza y desviación estándar de cada grupo
c) Diga cual de los dos grupos de datos está más concentrada
7. La compañı́a National Tire tiene fondos de reserva en valores negociable a corto plazo. El saldo
diario de cierre (en millones de dólares) de la cuenta de valores negociables en lapso de dos
semanas es el que mostramos a continuación.
Semana 1 1973 1970 1972 1975 1976

Semana 2 1969 1892 1893 1887 1895
a) Calcula las mediadas de tendencia central para cada grupo e interprete los resultados
obtenidos.
b) Calcula la desviación media, la varianza, la desviación tı́pica y el coeficiente de variación
de cada grupo.
c) Diga cual de los grupos tiene mejor concentración

Capı́tulo 5
Probabilidad
5.1. Introducción
El concepto de probabilidad indica la posibilidad de ocurrencia de un suceso futuro, por

ello está asociado a experimentos donde existe incertidumbre sobre el resultado final. Esta es la
razón de que la Teorı́a de la Probabilidad sea importante por los muchos problemas prácticos que
permite resolver. Además, supone un soporte teórico para la Estadı́stica, más concretamente para la
Inferencia Estadı́stica, que es la que nos permite conocer (inferir) la distribución de una población a
partir del conocimiento de una parte de ella (muestra).
La Teorı́a de la Probabilidad surgió de los estudios realizados sobre los juegos de azar, y
estos se remontan miles de años atrás. Como primeros trabajos con cierto formalismo cabe destacar
los realizados por Cardano y Galilei (siglo XVI), aunque las bases de esta teorı́a fueron desarrolladas
por Pascal y Fermat en el siglo XVII. De ahı́ en adelante grandes cientı́ficos han contribuido al
desarrollo de la Probabilidad, como Bernouilli, Bayes, Euler, Gauss,... en los siglos XVIII y XIX. Será
a finales del siglo XIX y principios del XX cuando la Probabilidad adquiera una mayor formalización
matemática, debida en gran medida a la llamada Escuela de San Petesburgo en la que cabe destacar
los estudios de Tchebychev, Markov y Liapunov1 .
5.2. Espacio probabilı́stico

5.2.1. Experimentos y sucesos
Consideraremos que un experimento es un proceso por medio del cual se obtiene una
observación. Bajo este enfoque podemos distinguir entre experimentos deterministas y aleatorios.
Los primeros son aquellos que siempre que se repitan bajo condiciones análogas llevan al mismo
resultado, por tanto éste se puede predecir. Por el contrario, un experimento aleatorio es el que
puede dar lugar a varios resultados, conocidos previamente, sin que sea posible saber de antemano
cuál de ellos se va a producir.
Estos últimos son los que interesan a la Teorı́a de la Probabilidad. Como ejemplo de los
mismos tenemos el observar qué número sale al lanzar un dado al aire. Muchos experimentos de la
vida real entran en el campo de los experimentos aleatorios, ya que son muchas las situaciones en las
que no se puede tener un control total sobre las variables de las que depende que se llegue a una u
otra realización.
A continuación, describimos los principales conceptos necesarios para el estudio de un
experimento aleatorio:
Suceso elemental: Es cada uno de los posibles resultados del experimento aleatorio. Se de-
notan con la letra griega ω.
Espacio Muestral: Conjunto formado por todos los sucesos elementales. Se denota por Ω =
{ω/ωes un suceso elemental}.
Suceso: Se llama suceso a cualquier subconjunto del espacio muestral. Se denota por 0/ al
suceso imposible y Ω se corresponde con el suceso seguro.
1 Estadı́sticaIngenierı́a Técnica en Informática de Sistemas (Manuel Febrero Bande, Pedro Galeano San Miguel,
Julio González Dı́az, Beatriz Pateiro López
26
5.3. TÉCNICAS DE CONTEO U.N.A.
ejexperimento aleatorio: Lanzamiento de un dado.

Suceso elemental: el 3.
Espacio Muestral : Ω = {1, 2, 3, 4, 5, 6}.
Suceso: Salir par = {2, 4, 6}.
Denotaremos por Ac al complementario del suceso A, es decir, Ac = Ω − A.
5.3. Técnicas de Conteo
Métodos para determinar (sin tener que enumerar en forma directa) el número de resultados
posibles de un experimento o el número de elementos de un conjunto particular. Estas técnicas son
usualmente conocidas como Técnicas de Conteo o análisis combinatorio.
Principio fundamental del conteo: Si un evento puede realizarse de n1 maneras diferen-
tes, y si, continuando el procedimiento, un segundo evento puede realizarse de n2 maneras diferentes,
y si, después de efectuados, un tercer evento puede realizarse de n3 maneras diferentes, y ası́ sucesi-
vamente, entonces el número de maneras en que los eventos pueden realizarse en el orden indicado
es el producto n1 · n2 · n3 . . . .
ejeupongamos que queremos determinar el número de placas de automóviles que pueden grabarse
utilizando 2 letras distintas y 3 dı́gitos de los cuales el primero no es 0. Entonces si asumimos un
alfabeto de 26 letras tendremos: 26 · 25 · 9 · 10 · 10 = 585000 placas.
Notación factorial
El producto de los enteros positivos desde 1 hasta n (inclusive), lo denotamos por el sı́mbolo
n! (el cual llamamos n factorial): n! = n · (n − 1) · (n − 2) . . . 3 · 2 · 1 : Para el caso n = 0 defı́nimos 0! = 1.
Por ejemplo, 4! = 4 · 3 · 2 · 1 = 24, 8! = 6! = (8 · 7 · 6!) = 6! = 8 · 7 = 56.
5.3.1. Permutaciones
Cualquier secuencia ordenada de k objetos tomada de un conjunto de n objetos distintos

se llama permutación de tamaño k de los objetos. El número de permutaciones de tamaño k que se
puede construir a partir de n objetos se indica por Pk;n :
n(n − 1)(n − 2) . . . (n − (k − 1))(n − k)! n!

Pk;n = n(n − 1)(n − 2) . . . (n − (k − 1)) = =
(n − k)! (n − k)!
ejeay 10 asistentes de enseñanza disponibles para clasificar los exámenes de un determinado curso.
El primer examen del curso consta de 4 preguntas. El jefe de cátedra desea elegir un asistente distinto
para calificar cada pregunta (un único asistente por pregunta). De cuántas maneras se puede elegir
a los asistentes para calificar el examen? En esta situación n = 10 (número de asistentes) y k = 4
(número de preguntas) y las maneras posibles son P4;10 = 10 · 9 · 8 · 7 = 5040.
5.3.2. Permutaciones con repeticiones
Para el caso en el cual deseamos conocer el número de permutaciones de objetos, de los

cuales algunos son iguales, tenemos el siguiente resultado:
El número de permutaciones de n objetos de los cuales n1 son iguales, n2 son iguales,. . . , nk son
iguales es
n!
n1 !n2 ! . . . nk !
ejeeseamos formar todas las posibles palabras de 3 letras usando las palabras TAT. Tenemos
3! = 9 permutaciones de los objetos T1 AT2 , sin embargo, T1 AT2 , T2 AT1 , T1 T2 A, T2 T1 A, AT1 T2 , AT2 T1
forman la misma palabra si quitamos los subı́ndices. Por lo tanto tenemos 3! 2! = 3 palabras diferentes
de 3 letras que se forman con la palabra TAT.
5.3.3. Pruebas ordenadas
Cuando seleccionamos k elementos de un conjunto de n elementos, estamos realizando una

prueba ordenada de tamaño k. Podemos considerar para esta prueba 2 casos.

5.3. TÉCNICAS DE CONTEO U.N.A.
Pruebas con sustitución: en este caso se regresa el elemento al conjunto antes de seleccio-
nar uno nuevo y según el principio fundamental del conteo tenemos nk pruebas ordenadas diferentes
de tamaño k con sustitución entonces.
Pk;n = nk
Pruebas sin sustitución: en este caso no se regresa el elemento al conjunto antes de

seleccionar uno nuevo. Ası́ no hay repeticiones en la prueba ordenada. Por lo que, una prueba orde-
nada de tamaño k sin sustitución es simplemente una permutación de k objetos/elementos. Tenemos
n!
entonces Pk;n = (n−k)! pruebas ordenadas diferentes de tamaño k sin sustitución.
5.3.4. Combinaciones
Dado un conjunto de n objetos distintos, cualquier subconjunto no ordenado de tamaño k

de los objetos se llama combinación. El número de combinaciones de tamaño k que se puede formar
n
a partir de n objetos distintos se denota mediante Ck;n o k
ejeeterminemos el número de combinaciones de las cuatro letras a; b; c; d tomadas de 3 en 3, en
la siguiente tabla vemos que cada combinación que tenga 3 letras produce 3! = 6 permutaciones:
Combinaciones Permutaciones
abc abc; acb; bac; bca; cab; cba
D. abd abd; adb; bad; bda; dab; dba
acd acd; adc; cad; cda; dac; dca
bcd bcd; bdc; cbd; cdb; dbc; dcb
P
3;4
Es decir C3;4 · 3! = P3;4 o C3;4 = 3! . Y en general para cada combinación de n objetos
tomados de a k tenemos que,
n Pk;n n!
Ck;n = = =
k k! k!(n − k)!
.
5.3.5. Diagramas de árbol

Un diagrama de árbol es una representación que se usa para enumerar todos los resultados posibles
de una serie de experimentos en donde cada experimento puede suceder en un número finito de
maneras.
ejena familia requiere los servicios de un obstetra y de un pediatra. En la ciudad existen 2 clı́nicas
en cada una de las cuales trabajan 2 obstetras y 3 pediatras. Si la obra social les exige que elijan
ambos profesionales de una misma clı́nica, De cuantas formas pueden seleccionar los profesionales?
Si denotamos por Oi a los obstetras y por Pi a los pediatras podemos construir el siguiente diagrama
de árbol:
Algebra de sucesos: Es un subconjunto del conjunto de todos los sucesos asociados a un experi-
mento aleatorio, se denota por A = σ − algebra y ha de cumplir las siguientes condiciones:
ω, 0/ ∈ A
A ∈ A → Ac ∈ A
A, B ∈ A → A ∪ B; A ∩ B ∈ A

5.4. TEOREMAS DE PROBABILIDAD
S. U.N.A.
Leyes del álgebra de conjuntos

Operación Union Operación Intersección
Idempotencia
A∪A = A A∩A = A
Asociatividad
(A ∪ B) ∪C = A ∪ (B ∪C) (A ∩ B) ∩C = A ∩ (B ∩C)
Conmutativas
A∪B = B∪A A∩B = B∩A
Distrubutivas
A ∪ (B ∩C) = (A ∪ B) ∩ (A ∪C) A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C)
Identidad
A ∪ 0/ = A A∩Ω = A
A∪Ω = Ω A ∩ 0/ = 0/
complemento
A ∪ Ac = Ω A ∩ Ac = 0/
(Ac )c = A Ωc = 0/ 0/ c = Ω
Leyes De Morgan
(A ∪ B) = A ∩ Bc
c c (A ∩ B)c = Ac ∪ Bc
5.3.7. Definiciones de probabilidad
El principal objetivo de un experimento aleatorio suele ser determinar con qué probabi-
lidad ocurre cada uno de los sucesos elementales. A continuación citamos las tres definiciones más
manejadas para asignar probabilidades a los sucesos:
Definición frecuentista: Dadas n repeticiones de un experimento aleatorio, si denotamos

por nA el número de veces que se ha obtenido el suceso A, se define la frecuencia de dicho
nA
suceso como f r(A) = donde 0 ≤ f r(A) ≤ 1. Cuando n es grande la frecuencia de un suceso
n
se estabiliza en torno a un valor al que se llama probabilidad del suceso A.
Definición clásica o de Laplace: En el caso de que el espacio muestral sea finito y de

que todos los sucesos elementales tengan la misma probabilidad, se define la probabilidad de
|A| casos favorables
un suceso A como: P(A) = = , donde |A| denota el número de sucesos
|Ω| casos posibles
elementales que componen el suceso A.
Definición axiomática (Kolmogorov 1933): Dado el espacio probabilizable (Ω, A), diremos
que P es una probabilidad sobre dicho espacio si cumple:
• P(Ω) = 1.
• Si A ∩ B = 0,
/ entonces P(A ∪ B) = P(A) + P(B).
• 0 ≤ P(A) ≤ 1.
El espacio probabilizable (Ω, A), junto con la medida de probabilidad P, se denomina

espacio de probabilidad y se representa como (Ω, A, P). Se denomina a A como σ − algebra
5.4. Teoremas de Probabilidad
5.4.1. Regla de la Adición

La probabilidad de que alguno de dos eventos pertenecientes a un mismo espacio muestral ocurra
se determina mediante la siguiente ecuación:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

5.4. TEOREMAS DE PROBABILIDAD U.N.A.
ejei el experimento es lanzar un dado una vez, el espacio muestral es:
S = {1, 2, 3, 4, 5, 6}
Si el evento A es el resultado es un número par entonces
A = {2, 4, 6}
Si el evento B es el resultado es un número menor de 3
B = {1, 2}
Cuál será la probabilidad de que suceda alguno de estos dos eventos?

La probabilidad de que ocurra A y la probabilidad de que ocurra B son respectivamente:
3 1 2 1
P(A) = = y P(B) = =
6 2 6 3
Para aplicar este teorema es necesario conocer la probabilidad de la intersección de estos dos
eventos, para ası́ poder conocer la probabilidad de la unión, o de manera inversa, conociendo la
probabilidad de la unión se puede calcular la probabilidad de la intersección.
En este caso queremos saber la probabilidad de la unión conociendo la probabilidad de la in-
tersección, entonces es necesario conocer la intersección de estos dos eventos, que es ñúmero par y
menor de 3’, con lo cual
A ∩ B = {2}
1
por lo que P(A ∩ B) =
6
Si aplicamos la regla de adición:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

1 1 1 2
P(A ∪ B) = + − =
2 3 6 3
5.4.2. Regla de la complementación

La probabilidad de que el complemento de un evento A ocurra está dada por la siguiente ecuación:
P(A) = 1 − P(A)
ejei A es cae cara en el experimento consistente en lanzar un moneda, entonces la probabilidad

de que no caiga cara es:
1 1
P(A) = 1 − P(A) = 1 − =
2 2
5.4.3. Regla de Diferenciación

La probabilidad de que un evento dado A ocurra pero no ocurra otro evento dado B pertenecientes
al mismo espacio muestral está dada por
P(A − B) = P(A) − P(A ∩ B)
ejei el evento A es cae un número par y si el evento B es cae un número menor de 3, ambos perte-
necientes al espacio muestral Ω = {1, 2, 3, 4, 5, 6} que resulta del experimento aleatorio consistente en
el lanzamiento de un dado, entonces la probabilidad de que caiga un número par pero no es menor
que tres es:
3 1
P(A − B) = P(A) − P(A ∩ B) = − = 0, 3333
6 6
Y la probabilidad de que caiga un número menor que tres pero no sea par es:
2 1
P(B − A) = P(B) − P(AB) = − = 0,167
6 6

5.4.4. Reglas de Multiplicación
Regla del producto para eventos independientes

Tn−1
Dados los sucesos A1 , A2 , . . . , An , tales que P( i=1 Ai ) > 0. Entonces:
n−1
\ n−1
\
P( Ai ) = P(A1 ) · P(A2 /A1 ) · P(A3 /(A1 ∩ A2 ) · . . . · P(An / Ai )
i=1 i=1
Dos sucesos A y B son independientes si el hecho de que se produzca o no uno de ellos no

afecta a la posible ocurrencia del otro. Formalmente, A y B son independientes si
P(A ∩ B) = P(A).P(B)
o equivalentemente P(B/A) = P(B) si P(A) > 0 (y también P(A/B) = P(A) si P(B) > 0).
ejena maquina empaca vegetales en una bolsa de plástico. Experiencias anteriores revelan que en
ocasiones los paquetes tienen menos del peso correcto, y en otras más, pero la mayorı́a de las veces
tiene el peso satisfactorio. Como muestra la siguiente tabla:
Peso Probabilidad
debajo del correcto 0,025
correcto 0,900
arriba del correcto 0,075
Supongamos que queremos saber la probabilidad de que al inspeccionar tres paquetes, los tres pesen
correctamente. Establezcamos los siguientes eventos:
A = {el primer paquete pesa correctamente}
B = {el segundo paquete pesa correctamente}

C = {el tercer paquete pesa correctamente}
La probabilidad de cada uno de estos eventos independientes es:
P(A) = 0, 900
P(B) = 0, 900
P(C) = 0, 900
Según el teorema de multiplicación la probabilidad de que los tres eventos ocurran es:
P(A ∩ B ∩C) = P(A) · P(B) · P(C) = (0, 900) · (0, 900) · (0, 900) = 0, 729
5.4.5. Probabilidad condicionada
Es posible que, al realizar un experimento aleatorio, se disponga de cierta información

que permite reducir el espacio muestral. Para esto se introduce la probabilidad condicionada; P(A/B)
denota la probabilidad de que se produzca el suceso A sabiendo que se va a producir el B. Por ejemplo,
si sabemos que al lanzar un dado ha salido un número par y queremos saber la probabilidad de que
{4}
este sea el 4, habrı́a que calcular P( {2,4,6} ). De este modo, dado un suceso B tal que P(B) > 0 se define
la probabilidad del suceso A condicionada al suceso B como:
P(A ∩ B)
P(A/B) =
P(B)
.
Es importante destacar que dado un suceso B, la función PB , que a cada suceso A le asigna
la probabilidad de A condicionada a B, es una función de probabilidad que satisface las propiedades
de la definición axiomática de Kolmogorov. Es decir, PB (A) = P(A/B).

5.4.6. Teorema de las probabilidades totales

Sn
Dados los sucesos A1 , A2 , . . . , An , tales que Ω = i=1 Ai y además Ai ∩ A j = 0/ si i 6= j. Entonces,
dado un suceso B se tiene que:
n
P(B) = ∑ P(B/Ai ) · P(Ai )
i=1
A1 A2 ... An
Lo que nos dice este teorema es que dado un conjunto de sucesos mutuamente excluyentes tales
que su unión sea el suceso seguro Ω, entonces la probabilida de un suceso cualquiera B se puede
descomponer como la suma de las probabilidades de B dentro de cada uno de los sucesos (rectángulos
del dibujo) por la probabilidad de caer en dicho suceso. Con otras palabras, la probabilidad del suceso
B se reparte entre los sucesos en los que hemos particionado Ω.
5.4.7. Regla de Bayes

Sn
Dado los sucesos A1 , A2 , . . . , An , tales que Ω = i=1 Ai y además Ai ∩ A j = 0/ si i 6= j. Entonces, dado
un suceso B se tiene que:
P(B/A j ) · P(A j )
P(A j /B) = n
∑i=1 P(B/Ai ) · P(Ai )
Esta fórmula sale de combinar las fórmulas de la probabilidad condicionada con el teorema de las
probabilidades totales. La utilidad de la misma radica en que conociendo como son las probabilidades
de B condicionadas a los sucesos en los que hemos descompuesto el espacio muestral, podemos calcular
también cuánto valen las probabilidades cuando quien condiciona es el propio suceso B.
ejen un hospital se realiza una prueba para detectar una enfermedad. Se sabe que la pa-
decen 1 de cada 10.000 personas. Asimismo, también se sabe que cuando un paciente tiene la
enfermedad la prueba da positivo el 90 % de las veces y que cuando está sano el test da positivo
un 10 % de las veces.
E. Cuál es la probabilidad de que el test dé positivo?
Hasta qué punto es fiable el test? Es decir, si una persona da positivo, qué probabilidad hay de
que tenga la enfermedad?
Solución:
Aquı́ se usa el teorema de las probabilidades totales. Denotemos por A el suceso ’tener la
enfermedad’y por B él test da positivo’, de modo que sabemos que:
P(A) = 0, 0001, P(B/A) = 0, 9, P(B/AC) = 0, 1
. Entonces:
P(B) = P(B/A)P(A) + P(B/AC)P(AC) = 0, 9 × 0, 0001 + 0, 1 × 0, 9999 = 0, 10008
Ahora utilizamos el teorema de Bayes, se nos pide P(A/B).
P(B/A)P(A) 0, 00009
P(A/B) = C C
= = 0, 000899
P(B/A)P(A) + P(B/A )P(A ) 0, 10008
. De modo que aunque alguien dé positivo en el test, la probabilidad de que tenga la enfermedad
es todavı́a muy pequeña. Harı́a falta una prueba más fiable.

5.5. Ejercicios Propuestos
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fuman, que
350 consumen bebidas alcohólicas y que 250 tienen estos dos hábitos nocivos para la salud.
Cuál es la probabilidad de que un estudiante seleccionado aleatoriamente
a) tenga alguno de estos dos malos hábitos?

b) no tenga ninguno de estos dos pésimos hábitos?
c) fume pero no tome?
d) tome pero no fume?
e) No fume?
f) Fume dado que toma?
g) Toma dado que fuma?
h) No tenga alguno de estos nefastos hábitos?
2. La probabilidad de que una compañı́a norteamericana ubique una de sus plantas en Juárez es
0, 7, la probabilidad de que instale una planta en Chihuahua es 0, 4, la probabilidad de que no
se ubique ni en Juárez ni en Chihuahua es 0, 20. Cuál es la probabilidad de que
a) Se ubique en alguna de estas dos ciudades?

b) Se ubique en ambas ciudades?
c) No se ubique en alguna de estas dos ciudades?
d) Se ubique en Chihuahua pero no en Juárez?
e) Se ubique en Juárez pero no en Chihuahua?
f) Ubique una planta en Juárez dado que ya se ubicó en Chihuahua?
g) Ubique una planta en Chihuahua dado que ya se ubicó en Juárez?
3. En cierta escuela de 45 estudiantes que reprobaron Estadı́sticas I, 32 dijeron que reprobaron

por no estudiar, 18 porque no le entienden al maestro, 9 por causas diferentes a estas dos.
Encuentre la probabilidad de los siguientes eventos:
a) Reprobó porque no estudió o porque no le entiende al maestro

b) Reprobó porque no estudió y porque no le entiende al maestro
c) Reprobó porque no estudió y no porque no le entiende al maestro
d) Reprobó porque no le entiende al maestro y no porque no estudió
4. Se realizó una encuesta sobre preferencias en materia de periódicos, de 350 personas entre-
vistadas, 200 leen el Heraldo, 140 leen el Diario y 105 leen los dos periódicos. Encontrar la
probabilidad de los siguientes eventos:
a) Lee alguno de estos dos periódicos

b) No lee ninguno de estos dos periódicos
c) Lee el Diario pero el Heraldo no
d) Lee el Heraldo pero el Diario no
e) Lee el Heraldo dado que lee el Diario
f) Lee el Diario dado que lee el Heraldo
g) No lee alguno de estos dos Periódicos
5. La probabilidad de que en un matrimonio, el esposo vea cierto programa de TV es 0,4, la

probabilidad de que la esposa lo haga es de 0,5. La probabilidad de que el esposo vea el
programa de TV dado que la esposa lo hace es de 0,7. Encuentre la probabilidad de que:
a) Ambos vean el programa de TV

b) Alguno de los dos vea el programa de TV
c) Ninguno vea el programa de TV
d) El esposo vea el programa pero la esposa no
e) La esposa vea el programa pero el esposo no

f) La esposa vea el programa dado que el esposo lo hace
g) Alguno de los dos no ve el programa
6. Don Pepe tiene una tienda, en el trabajan tres cajeras, Andrea, Bianca, y Consuelo. Andrea
realiza el 50 % de los cobros, Bianca el 30 % y Consuelo el 20 %. Cuando cobra Andrea hay un
1 % de probabilidad de que lo haga mal, cuando lo hace Bianca hay un 2 % de que cobre mal,
y si cobra Consuelo hay un 3 % de probabilidad de que se equivoque.
Un cliente se queó con Don Pepe porque le cobraron mal. Cuál es la probabilidad de que el mal
cobro lo haya hecho Andrea?.
7. El profesor Ramos tiene muchos años impartiendo la clase de matemáticas, por experiencia
sabe que el 80 % de los estudiantes contestan los problemas que les encarga de tarea. También
sabe que el 90 % de los estudiantes que hacen la tarea aprueban el curso y que el 60 % de los
estudiantes que no hacen la tarea reprueban. Manuel aprobó el curso, cual es la probabilidad
de que hizo la tarea?
8. Un equipo de béisbol juega el 70 % de las veces de noche y el 30 % de dı́a. Ellos ganan el 50 %

de los juegos nocturnos y el 90 % de los juegos diurnos. El dı́a de ayer ganaron, cual es la
probabilidad de que el juego fue en la noche?
9. El 30 % de las ventas de una tienda departamental son en efectivo, el 30 % son pagadas con
cheque en el momento de la compra y el 40 % son a crédito. El 20 % de las compras en efectivo,
90 % de las compras con cheque y el 60 % de las compras a crédito son mayores a $500. En
este momento se está realizando una compra por $1000, cual es la probabilidad de que sea en
efectivo?
10. Cierta población de 1500 habitantes, fue clasificado, según su nacionalidad, resultando: 950
paraguayos, 200 españoles, 300 italianos y 50 franceses. Si se elige un habitante al azar, calcular
la probabilidad de que:
a) resulte de habla castellana Respuesta: 0,77

b) resulte extranjero Respuesta: 0,77
11. Supóngase que el Señor Gómez planea salir la noche del sábado próximo. Las probabilidades
de que baya a un juego de baloncesto, al cine o a una carrera de caballo son 0,35; 0,30 y 0,20
respectivamente. Determinar la probabilidad de que:
a) haga cual quiera de estas tres cosas Respuesta: 0,85

b) que no haga ninguna de estas tres cosas Respuesta: 0,15
12. Suponga que la probabilidad de que llegue a asistir a una universidad es 0,60, la probabilidad de
que trabaje tiempo completo es 0,70, la probabilidad de que llegue a asistir a una universidad
y trabaje tiempo completo es 0,50. Cuál es la probabilidad de que asista a una universidad o
trabaje tiempo completo? Respuesta: 0,80
13. Se tiene un grupo de 12 tornillos, de los cuales 4 son defectuosos. Se recogen 2 tornillos al azar.
Cuál es la probabilidad de que:
a) los 2 sean defectuosos Respuesta: 0,091

b) ninguno de los 2 sean defectuosos Respuesta: 0,4242
14. De 100 individuos que presenten su solicitud para ocupar puestos de analista de sistemas en
una gran empresa en el ultimo año. 40 contaban con experiencia laboral previa y 30 tenı́an
titulo profesional. Sin embargo 20 de los solicitantes tenı́an tanto experiencia laboral como
titulo profesional, de modo que han sido incluidos en ambos conteos.
a) Cuál es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea expe-

riencia laboral o titulo profesional o ambos? Respuesta: 0,50
b) Cuál es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea expe-
riencia laboral o titulo profesional pero no ambos? Respuesta: 0,30
15. Una caja contiene 20 unidades de cierto producto electrónico, 4 de ellos son defectuosos y 16 son
buenas. Se seleccionarán aleatoriamente 4 unidades y se venderán. Obténgase la probabilidad
de que:
1
a) las cuatro unidades vendidas sean defectuosos Respuesta: 4845
48
b) entre las cuatro unidades vendidas 2 sean buenas Respuesta: 323
13
c) se vendan al menos tres unidades defectuosas Respuesta: 969
16. El 80 % de la población es morena y el 70 % es de ojos oscuro. Si se selecciona una persona al

azar, calcular la probabilidad de:
a) no ser de piel morena o tener los ojos oscuros Respuesta: 0,76

b) ser de piel morena y tener los ojos oscuros Respuesta: 0,56
17. La probabilidad de que cierto componente electrónico funcione es de 0,90. Un aparato contiene
dos de estos componentes. El aparato funciona si por lo menos uno de los componentes funciona.
Sin importar cual de los componentes funcione o no. Cuáles son los posibles resultados? (
Puede suponer independencia en la operación de los componentes).
Cuál es la probabilidad de que el aparato no funcione Respuesta: 0,99
18. La suma de las probabilidades de que tres hombres H1 , H2 y H3 peguen en el blanco es 0,95.
Además la posibilidad de que H1 de en el blanco es el doble de que lo haga H2 y H2 tiene la
misma posibilidad de dar en el blanco que H3 , cada uno dispara una vez al blanco.
Hallar la probabilidad de que exactamente uno de ellos pegue en el blanco.

Si solo un pega en el blanco. Cuál es la probabilidad de que sea el primer hombre?

Capı́tulo 6
Variables aleatorias
6.1. Definiciones y ejemplos

defina variable aleatoria es aquella que toma un conjunto de valores numéricos asociados a los
resultados de nuestro interés que produce un experimento aleatorio, es decir una función que asocia
a cada evento del espacio muestral un número real.
La definición anterior nos dice que dado un experimento aleatorio cualquiera, y el espacio muestral
Ω asociado a dicho experimento, una variable aleatoria es una transformación X del espacio de
resultados (espacio muestral) al conjunto de números reales, esto es, asigna a cada elemento ω ∈ Ω,
un número real X(ω). La expresión matemática está dada por:
X : Ω −→ R
Figura 6.1: Representación gráfica de la definición de una variable aleatoria
defina variable aleatoria es discreta cuando el conjunto de valores que ésta toma es un conjunto
discreto, es decir, un conjunto finito o numerable. Por ejemplo, el conjunto {0, 1, 2, . . . , n} es un
conjunto discreto porque es finito, lo mismo N pues aunque es infinito, es numerable y por lo tanto
discreto.
ejen experimento aleatorio consiste en escoger a una persona ω al azar. La variable aleatoria X
evaluada en ω corresponde a conocer la siguiente caracterı́stica, o una codificación de esta caracte-
rı́stica, de la persona escogida. En cada caso se trata de una variable aleatoria discreta: a) Edad en
ños. b) Número de hijos. c) Peso. d) Estatura. e) Sueldo. f) Nivel
escolar. g) Estado civil. h) Lugar de nacimiento.
defina variable aleatoria es continua cuando toma todos los valores dentro de un intervalo (a, b) ⊆
R.
ejen el ejemplo del lanzamiento de un dardo en un tablero circular de radio uno, el espacio muestral
Ω (Figura 6.1) es infinito no numerable, las variables X,Y, Z,V y W definidas allı́ son todas variables
aleatorias continuas. Si se dibujan cı́rculos concéntricos alrededor del origen y si se asignan premios
asociados a cada una de las regiones resultantes, puede obtenerse un ejemplo de una variable aleatoria
discreta sobre este espacio muestral.
La clasificación anterior de variables aleatorias no es completa pues existen variables que no son
de ninguno de los dos tipos mencionados. Por simplicidad en este curso estudiaremos únicamente
variables aleatorias que son discretas o continuas.
Usaremos también la siguiente notación importante: Si A es un subconjunto de R, entonces la
expresión (X ∈ A), incluyendo el paréntesis, denota el conjunto {ω ∈ Ω : X(ω) ∈ A}, es decir, (X ∈
A) = {ω ∈ Ω : X(ω) ∈ A}. En palabras, la expresión (X ∈ A) denota aquel conjunto de elementos ω de
Ω tales que bajo la aplicación de la función X toman un valor dentro del conjunto A. A este conjunto
se le llama la imagen inversa de A, y se le denota por X −1 A.
ejeonsideremos el experimento de lanzar una moneda al aire y la variable aleatoria X que
lleva el resultado Cara al valor 0 y el resultado Cruz al valor 1. Tenemos por ejemplo que
(X ∈ [1, ∞)) = {Cruz} pues el conjunto de elementos de Ω tales que bajo la función X toman un
valor mayor o igual a uno, es decir caen dentro del intervalo [1, ∞), es únicamente el elemento
Cruz. Por lo tanto P(X ∈ [1, ∞)) = P{Cruz} = 21 . Del mismo modo puede verificarse que
C. a) P(X ∈ [1, 2)) = P({Cruz}) = 21 .
36
6.2. DISTRIBUCIÓN DE PROBABILIDAD
C. U.N.A.
b) P(X ∈ [0, 1)) = P({Cara}) = 12 .
c) P(X ∈ [2, 4]) = P(0)

/ = 0.
d) P(X = 1) = P({Cruz}) = 21 .
e) P(X ≤ −1) = P(0)

/ = 0.
f) P(X ≥ 0) = P(Ω) = 1.
Usaremos con mucha frecuencia la notación arriba explicada. El lector debe asegurarse de com-
prender bien que si x es un número real entonces (X ≤ x) es un subconjunto de Ω y por lo tanto
un evento. Lo mismo sucede con el complemento de este conjunto que es (X > x). Podemos escribir
entonces la igualdad de conjuntos (X ≤ x) ∪ (X > x) = Ω. Y aplicando probabilidad se obtiene:
P(X ≤ x) + P(X > x) = 1
Nota importante. A través de una variable aleatoria se puede considerar que los posibles re-
sultados de un experimento aleatorio no son elementos ω en Ω sino números reales que la variable
aleatoria puede tomar. Esta es una consideración radical pues ya no consideraremos experimentos
aleatorios particulares, ni espacios muestrales arbitrarios Ω, ni eventos (subconjuntos) de Ω, en lu-
gar de ello consideraremos que una cierta variable aleatoria de interés toma valores en un cierto
subconjunto de números reales. La probabilidad definida antes para subconjuntos de Ω se traslada,
como explicamos antes, a probabilidades para subconjuntos de R. Esta perspectiva permite estudiar
modelos generales y después aplicarlos a cualquier situación particular. A partir de ahora y en lo que
resta del curso el término variable aleatoria constituirá un elemento frecuente en los enunciados.
6.2. Distribución de probabilidad

En esta sección vamos a estudiar a las dos funciones que se asocian a cada variable aleatoria y que
además nos provean de información acerca de las caracterı́sticas de dicha variable aleatoria. Una de
estas funciones es llamada función de distribución y se asocia a una variable continua o discreta, la
otra depende del tipo de variable estudiada, en el caso continuo se denomina función de densidad
de probabilidad y en caso discreto simplemente función de probabilidad. Estas funciones nos
permiten representar a un mismo tiempo tanto los valores que pueden tomar la variable aleatoria
como las probabilidades de los distintos eventos involucrados. Entonces en primer término defininamos
primero la función de probabilidad para una variable aleatoria discreta, después la función de densidad
para una variable continua, y finalmente definamos la función de distribución para ambos tipos de
variables aleatorias.
defiSea X una variable aleatoria discreta que toma los valores x1 , x2 , . . . con probabilidades respec-
tivas P(X = x1 ), P(X = x2 ), . . . . Esta lista de valores numéricos y sus probabilidades puede ser finita
o bien infinita, pero numerable. La función de probabilidad de la variable aleatoria X denotada por
f (x) : R −→ [0, ∞) se define como sigue

P(X = x) si x = x1 , x2 , . . .
f (x) = (6.2.1)
0 en otro caso
En palabras, la función de probabilidad es simplemente aquella función que indica los valores de
la probabilidad en los distintos valores que toma la variable aleatoria discreta. Recordemos que es
importante poder distinguir entre X y x, pues conceptualmente son cosas muy distintas. Denotaremos
generalmente a una función de probabilidad con la letra f minúscula. A veces escribiremos fX (x) y
el subı́ndice nos ayudará a especificar que tal función es la función de probabilidad de la variable
aleatoria X. Esta notación será particularmente útil cuando consideremos varias variables aleatorias
a la vez.
6.2.1. Propiedades de la función de probabilidad

Si toda función de la forma (6.2.1) cumple las siguientes dos propiedades la llamaremos función
de probabilidad.
1) f (x) ≥ 0 para todo x ∈ R
2) ∑ f (x) = 1
x

6.2. DISTRIBUCIÓN DE PROBABILIDAD U.N.A.
ejeonsidere la variable aleatoria discreta X que toma los valores 1, 2 y 3, con probabilidades 0,3;
0,5 y 0,2 respectivamente. Entonces la función de probabilidad de X es

 0, 3 si x = 1
f (x) = 0, 5 si x = 2
0, 2 si x = 3

Esta función se muestra gáficamente en la Figura 6.2. Alternativamente podemos también expresar
esta función mediante la tabla mostrada más abajo. En esta representación se entiende de manera
implı́cita que f (x) es cero para cualquier valor de x distinto de 1, 2 y 3. En particular, compruebe
que las siguientes probabilidades son correctas:
P(X ≤ 2) = 0, 7 P(|X| = 1) = 0, 3 y P(X < 1) = 0
0.7
f(x)
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0 1 2 3 4
Figura 6.2: Representación gráfica de la función del ejemplo 6.2.1
x 1 2 3
p(x) 0,3 0,5 0,2
ejencontremos el valor de la constante c que hace que la siguiente función sea de probabilidad.

cx si x = 0, 1, 2, 3
f (x) =
0 en otro caso
Los posibles valores de la variable aleatoria discreta, no especificada, son 0, 1, 2 y 3, con probabi-
lidades 0, c, 2c y 3c, respectivamente. Como la suma de estas probabilidades debe ser uno, obtenemos
la ecuación c + 2c + 3c = 1. De aqui obtenemos c = 16 . Este es el valor de c que hace que f (x) sea no
negativa y sume uno, es decir, una función de probabilidad.
defiSea X una variable aleatoria continua. Decimos que la función integrable y no negativa f (x) :
R −→ [0, ∞) es la función de densidad de X si para cualquier intervalo (a, b) de R se cumple la igualdad
Z b
P(X ∈ (a, b)) = f (x)dx
a
U.N.A.
Es decir, la probabilidad de que la variable tome un valor dentro del intervalo (a, b) se puede
calcular o expresar como el área bajo la función de densidad en el intervalo (a, b). De esta forma el
cálculo de una probabilidad se reduce al cálculo de una integral. Véase la Figura 6.3. No es difı́cil
comprobar que toda función de densidad f (x) de una variable aleatoria continua X cumple las dos
propiedades que mencionamos a continuación análogas al caso discreto.
4
b
f(x) = ⌠ f(x)dx
3
⌡a
2
1
0
a b
0 1 2 3 4
Rb
Figura 6.3: Representación gráfica de la función f (x) = a f (x)dx x ∈ (a, b)
6.2.2. Propiedades de la función de densidad de probabilidad

Si toda función de la forma f (x) : R −→ [0, ∞) cumple las siguientes dos propiedades la llamaremos
función de densidad de probabilidad.
1) f (x) ≥ 0 para todo x ∈ R

Z +∞
2) f (x)dx = 1
−∞
Toda función f (x) : R −→ [0, ∞) que satisfaga estas dos propiedades, sin necesidad de tener una
variable aleatoria de por medio, se llamará función de densidad.
ejea función f (x) dada por:
1


 si x ∈ (1, 3)
f (x) = 2


0 en otro caso
es una función de densidad de una variable aleatoria continua que toma valores en el intervalo
(1, 3), y cuya gráfica aparece en la Figura 6.4. Observe que se trata de una función no negativa y
cuya integral vale uno.

C. U.N.A.
2.0
f(x) = (1 2)
1.5
1.0
0.5
0.0
a b
−0.5
0 1 2 3 4
1
Figura 6.4: Representación gráfica de la función f (x) = 2 x ∈ (1, 3)
ejencontrar el valor de la constante c que hace que la siguiente función sea de densidad.

 c|x| si x ∈ [−1, 1]
f (x) =
0 en otro caso

Se trata de una variable aleatoria continua que toma valores en el intervalo [−1, 1]. Como esta
función debe integrar uno tenemos que:
Z ∞ Z 1 Z 1 x2 1
1= f (x)dx = c|x|dx = 2c xdx = 2c =c
−∞ −1 0 2 0
Por lo tanto, cuando tomamos c = 1 la función anterior resulta ser una función de densidad pues
ahora cumple con ser no negativa e integrar uno.
defi. Sea X una variable aleatoria discreta o continua. La función de distribución de X, denotada
por F(x) : R −→ [0, 1], se define como
F(x) = P(X ≤ x)
Esto es, la función de distribución evaluada en un número x cualquiera es simplemente la proba-
bilidad de que la variable aleatoria tome un valor menor o igual a x, o en otras palabras, que tome
un valor en el intervalo (−∞, x]. Siendo F(x) una probabilidad, sus valores están siempre entre 0 y
1. Esta función resulta ser importante y se le conoce también, por razones evidentes, con el nombre
de función de acumulación de probabilidad. Con un par de ejemplo mostraremos la forma de
calcular esta función a partir de la función de probabilidad o de la función de densidad.
ejeonsideremos la variable aleatoria discreta X del ejemplo 6.2.1. Tenemos que la correspondiente
función de distribución evaluada en x se calcula sumando las probabilidades P(X = u) para valores
de u menores o iguales a x, es decir,
0 si x<1
0, 3 si 1≤x<2
F(x) = P(X ≤ x) = ∑ P(X = u) = .
u≤x
0, 8 si 2≤x<3
1 si x≥3
U.N.A.
cuya gráfica aparece en la Figura 6.5. Este es el comportamiento tı́pico de una función de
distribución de una v.a. discreta, es no decreciente, constante por pedazos, y si la función tiene una
discontinuidad en x, entonces el tamaño de tal discontinuidad es exactamente la probabilidad de
que la variable aleatoria tome ese valor.
2.0
F(x) = P(X<x)
1.5
1.0
0.5
0.0
−0.5
0 1 2 3 4 5
Figura 6.5: Representación gráfica de F(x) = P(X ≤ x) = ∑ P(X = u)

u≤x
ejeonsideremos ahora la variable aleatoria continua X del ejemplo 6.2.3. La correspondiente función
de distribución se obtiene calculando la siguiente integral:
si x ≤ 1
 


0 
 0 si x ≤ 1

 

Z x 
 Z x 
1 x−1

F(x) = P(X ≤ x) = f (u)du = du si 1 < x < 3 = si 1 < x < 3
−∞ 
 1 2 
 2

 

 
si x ≥ 3
 
1 si x ≥ 3 1
cuya gráfica aparece en la Figura 6.7. Observe que esta función es continua y no decreciente.

6.2. DISTRIBUCIÓN DE PROBABILIDAD U.N.A.
2.0
F(x) = P(X < x)

1.5
1.0
0.5
0.0
x
−0.5
0 1 2 3 4 5
Figura 6.6: Representación gráfica de F(x) del ejemplo 6.2.6
En los dos ejemplos anteriores se ha mostrado la forma de obtener F(x) a partir de f (x). Ahora
explicaremos el proceso contrario. En el caso continuo tenemos que para toda x en R,
Z x
F(x) = P(X ≤ x) = f (u)du
−∞
d
de modo que por el teorema fundamental del cálculo, y cuando F(x) es diferenciable, (F(x)) = f (x).
dx
De este modo podemos encontrar f (x) a partir de F(x). En el caso discreto, f (x) = P(X = x) =
F(x) − F(x− ), en donde F(x− ) es el lı́mite por la izquierda de la función F en el punto x, en sı́mbolos,
F(x− ) = lı́m F(x − h), con h > 0. Análogamente, la expresión F(x+ ) significa el lı́mite por la derecha
h−→0
de la función F en el punto x, es decir, F(x+ ) = lı́m F(x + h), con h > 0.
h−→0
proToda función de distribución F(x) satisface las siguientes propiedades:
.. 1. 0 ≤ F(x) ≤ 1
2. lı́m F(x) = 1
x−→∞
3. lı́m F(x) = 0
x−→−∞
4. Si x1 ≤ x2 , entonces F(x1 ) ≤ F(x2 )

5. Si x1 ≤ x2 , entonces P(x1 < X ≤ x2 ) = F(x2 ) − F(x1 )
6. F(x) = F(x+ )
Demostración
1. Como F(x) es una probabilidad pues, por definición, F(x) = P(X ≤ x). Por lo tanto se cumple
la primera propiedad.
2. Cuando x tiende a infinito el conjunto (X ≤ x) se aproxima al conjunto (X ≤ ∞) que es idéntico
a Ω = R, por lo tanto, cuando x −→ ∞,
F(x) −→ P(X ≤ ∞) = P(R) = 1
6.3. ESPERANZA, VARIANZA Y MOMENTOS U.N.A.
3. Análogamente el conjunto (X ≤ x) se aproxima al conjunto (X ≤ −∞) = 0/ cuando x tiende a

menos infinito. Por lo tanto, cuando x −→ ∞,
F(x) −→ P(X ≤ −∞) = P(0)

/ =0
4. Es suficiente observar que si x1 ≤ x2 , entonces (X ≤ x1 ) ⊆ (X ≤ x2 ). Aplicando probabilidad

obtenemos P(X ≤ x1 ) ≤ P(X ≤ x2 ).
5. Por teoria elemental de conjuntos el evento (x1 < X ≤ x2 ) puede descomponerse en la diferencia
(X ≤ x2 ) − (X ≤ x1 ), en donde (X ≤ x1 ) ⊆ (X ≤ x2 ). Por lo tanto
P(x1 < X ≤ x2 ) = P(X ≤ x2 ) ≤ P(X ≤ x1 ) = F(x2 ) − F(x1 )
6. Para h > 0 tenemos que F(x + h) = P(X ≤ x + h) = P(X ≤ x) + P(x < X ≤ x + h), de modo que
cuando h tiende a cero, el conjunto (x < X ≤ x+h) tiende al conjunto vacı́o. Concluimos entonces
que, cuando h −→ 0 con h > 0,
F(x + h) −→ F(x) + P(0)

/ = F(x)
La propiedad 4) significa que F(x) es una función monótona no decreciente. Mientras que la
propiedad 6) establece que F(x) es una función continua por la derecha.
6.2.3. Distribuciones discretas

Las distribuciones de variables aleatorias discretas más importantes son las siguientes:
a) Distribución binomial
b) Distribución binomial negativa
c) Distribución Poisson
d) Distribución geométrica
e) Distribución hipergeométrica
6.2.4. Distribuciones continuas

Las distribuciones de variable continua más importantes son las siguientes:
a) Distribución ji cuadrado
b) Distribución exponencial
c) Distribución t-student
d) Distribución normal
e) Distribución Gamma
f) Distribución Beta
Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con curvas.
6.3. Esperanza, varianza y momentos

Todos los seres humanos tenemos caracterı́sticas numéricas que nos identifican y nos distinguen de
otras personas, por ejemplo, la edad, estatura, talla, peso, etc. Si pudiéramos considerar la totalidad de
todos estos números para una persona en particular, la identificarı́amos de manera única. Algo similar
sucede con las variables aleatorias. En esta sección estudiaremos algunas caracterı́sticas numéricas
asociadas a las variables aleatorias.

6.3. ESPERANZA, VARIANZA Y MOMENTOS
S. U.N.A.
6.3.1. Esperanza
defiLa esperanza de una variable aleatoria X es un número real denotado por E(X) y que
se calcula como sigue:
Esperanza . 1. Si X es una variable aleatoria discreta con función de probabilidad f (x), entonces:
E(X) = ∑ x f (x)
x
en donde la suma se efectúa sobre todos los posibles valores que pueda tomar la variable
aleatoria X, y se define cuando esta suma sea absolutamente convergente, es decir,
E(X) = ∑ |x| f (x)

x
El número de sumandos puede ser finito o infinito dependiendo del conjunto de valores de la
variable aleatoria.
2. Si X es una variable aleatoria continua con función de densidad de probabilidad f (x), entonces
la esperanza es Z ∞
E(X) = x f (x)dx
−∞
suponiendo que esta integral es absolutamente convergente, es decir,
Z ∞
E(X) = |x f (x)|dx
−∞
Si la suma o la integral anteriores no cumplen la condición de convergencia absoluta, entonces

se dice que la esperanza no existe. La esperanza de una variable aleatoria es entonces un número
que indica el promedio ponderado de los diferentes valores que puede tomar la variable aleatoria. A
la esperanza se le conoce también con los nombre de: media, valor esperado o valor promedio. En
general se usa la letra griega µ (mu) para denotarla. La integral o suma arriba mencionados pueden no
ser convergentes y en ese caso se dice que la variable aleatoria no tiene esperanza finita. La situación
anterior se ilustra en los ejercicios 126 y 127. La esperanza es uno de los conceptos más importantes
en probabilidad y tiene un amplio uso en las aplicaciones y otras ramas de la ciencia. Ilustraremos a
continuación la forma de calcular la esperanza.
ejeea X una variable aleatoria discreta con función de densidad dada por la siguiente tabla.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
La esperanza de X es el número
3
1 4 1 2 1
E(X) = ∑ x f (x) = −1 · + 0 · + 1 · + 2 · =
x=−1 8 8 8 8 2
Observe que la suma su efectúa para todos los valores de x indicados en la tabla, es decir : -1, 0, 1 y
2. También es instructivo observar que la esperanza no es necesariamente uno de los valores tomados
por la variable aleatoria. En este ejemplo el valor 12 nunca es tomado por la variable aleatoria, pero
es su valor esperado.
ejeonsidere la variable aleatoria continua X con función de densidad:

 2x si 0 < x < 1
f (x) =
0 en otro caso

La esperanza de X es 1
Z 1
2 2 2
Z ∞
E(X) = x f (x)dx = x · 2x = x =
−∞ 0 3 3
0
Observe que la integral sólo es relevante en el intervalo (0, 1), pues fuera de dicho intervalo la
función de densidad se anula.

Esperanza de una función de una variable aleatoria

En algunos casos es necesario saber calcular la esperanza de una función de una variable aleatoria.
Por ejemplo, si X es una variable aleatoria, entonces es claro que Y = X 2 es una función de X y es
también una variable aleatoria. Si quisiéramos calcular la esperanza de Y = X 2 según la definición
Z ∞
tendrı́amos que calcular y fY (y)dy, para lo cual se necesita encontrar primero la función de den-
−∞
sidad de Y , y ello en general no es fácil. El siguiente resultado es muy útil y nos dice cómo calcular
esta esperanza conociendo únicamente la función de densidad de X. A veces se le refiere como el
teorema del estadı́stico inconsciente.
proea X una variable aleatoria y sea g : R −→ R una función tal que g(X) es una variable
aleatoria con esperanza finita. Entonces:
Si X es una variable aleatoria discreta; con función de probabilidad fX (x), se define la esperanza
de la variable aleatoria discreta g(x) esta dada por la siguiente:
E[g(X)] = ∑ g(x) fX (x) (6.3.2)

X
2.
1. Si X es una variable aleatoria continua; con función de densidad de probabilidad fX (x); entonces
la esperanza de la variable aleatoria continua g(x) está dada por la siguiente ecuación:
Z ∞
E[g(X)] = g(x) fX (x)dx (6.3.3)
−∞
En general, la demostración de este resultado es complicada, asi es que la omitiremos y nos

concentraremos en su uso y aplicación.
ejealcularemos E(Y ) en donde Y = X 2 , y X es la variable aleatoria continua del ejemplo anterior,
es decir, con función de densidad

 2x si 0 < x < 1
f (x) =
0 en otro caso

Por la proposición anterior tenemos que:

1
Z 1
2 4 1
Z ∞
E(Y ) = E(X 2 ) = g(x) f (x)dx = 2
x · 2x = x =
−∞ 0 4 2
0
ejeea X una variable aleatoria con función de probabilidad dada por la tabla que aparece abajo.
Encuentre la función de probabilidad de Y = X 2 usando la ecuación(6.3.2).
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
Por la ecuación (6.3.2) la esperanza de Y = X 2 es

1 4 1 2 5
E(Y ) = ∑ g(x) f (x) = ∑ x2 f (x) = (−1)2 · + 02 · + 12 · + 22 · =
X X 8 8 8 8 4
Propiedades de la esperanza
proean X y Y variables aleatorias con esperanzas finitas y sea c una constante. Entonces
S. a) E(c) = c
b) E(cX) = cE(X)
c) Si X ≥ 0, entonces E(X) ≥ 0
d) E(X +Y ) = E(X) + E(Y )
Demostración
a) Si X es una v.a. discreta por definición de esperanza para caso discreto tenemos que:
E(c) = ∑ cP(X = x) = c ∑ P(X = x) = c

x x
Si X es una v.a. continua por definición de esperanza para caso continuo tenemos que:
Z ∞ Z ∞
E(c) = c f (x)dx = c f (x)dx = c
−∞ −∞
b) Si X es una v.a. discreta por definición de esperanza para caso discreto tenemos que:
E(cX) = ∑(cx)P(X = x) = c ∑ xP(X = x) = cE(X)

x x
Si X es una v.a. continua por definición de esperanza para caso continuo tenemos que:
Z ∞ Z ∞
E(cX) = (cx) f (x)dx = c x f (x)dx = cE(X)
−∞ −∞
c) Este inciso es muy evidente pues cuando se cumple la hipótesis (E(X) ≥ 0), en la integral o
suma correspondiente solo aparecerán términos que son no negativos.
d) Esta última propiedad, en cambio, no es sencilla de demostrar y aún en el caso discreto requiere
de detalles técnicos que preferimos omitir.
Oservaciones:
Observe que la segunda y la cuarta propiedad establecen que la esperanza es lineal, es decir,
separa sumas y también separa multiplicaciones por constantes; esto es
E(c1 X + c2Y ) = c1 E(X) + c2 E(Y )
Además si X1 , X2 , . . . , Xn son v.a. y c1 , c2 , . . . , cn son constantes arbitrarias se tiene que:

n n
E ∑ ci Xi = ∑ ci E(Xi )
k=1 k=1
Si X e Y son v.a. independientes entonces E(XY ) = E(X)E(Y ). Esto mismo se extiende para
n n
una sucesión X1 , X2 , . . . , Xn de v.a. independientes, esto es E ∑ Xi = ∏ E(Xi ). Esta última
i=1 i=1
propiedad no la detallaremos pero la utilizaremos en algunas demostraciones.
6.3.2. Varianza
defiLa varianza de una variable aleatoria X, denotada por Var(X), se define como la siguiente
esperanza, si ésta existe,


 ∑[x − E(X)]2 f (x) si X es una v.a. discreta
x


Var(X) = E[X − E(X)]2 =
 Z ∞
[x − E(X)]2 f (x)dx si X es una v.a. continua



−∞
La varianza es una medida del grado de dispersión de los diferentes valores tomados por la variable
aleatoria. Se le denota regularmente por la letra σ2 (sigma cuadrada). A la raı́z cuadrada positiva de
la varianza, esto es σ, se le llama desviación estándar. Nuevamente la anterior suma o integral puede
no existir y en ese caso decimos que la variable aleatoria no tiene varianza finita. Observemos que
para calcular Var(X) necesitamos conocer primero E(X). Veamos algunos ejemplos sencillos.
ejealcularemos la varianza de la variable aleatoria discreta X con función de probabilidad dada
por la siguiente tabla.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
1
Recordemos primeramente que por cálculos previos, E(X) = . Aplicando la definición de varianza
2
para v.a. discreta Var(X) = ∑[x − E(X)]2 f (x), tenemos que:
x
1 2 1 1 2 4 1 2 1 1 2 2
Var(X) = − 1 − · + 0− · + 1− · + 2− · =1
2 8 2 8 2 8 2 8
ejealcularemos la varianza de la variable aleatoria continua X con función de densidad f (x) = 2x
2
para x ∈ (0, 1) y cero en otro caso. En un cálculo previo habı́amos encontrado que E(X) = . Aplicando
Z ∞ 3
2
la definición de varianza para una v.a. continua Var(X) = [x − E(X)] f (x)dx, tenemos que
−∞
Z 1
2 2
Z 1
8 8 x4 8 4 1 1
Var(X) = x− 2xdx = 2x3 − x2 + x dx = − x3 + x2 =
0 3 0 3 9 2 9 9 0 18
6.3. ESPERANZA, VARIANZA Y MOMENTOS
(Momentos) . U.N.A.
Propiedades de la varianza
Ahora enunciamos algunas propiedades de la varianza.
proean X y Y dos variables aleatorias, y sea c una constante. Entonces
S. a) Var(X) ≥ 0
b) Var(c) = 0
c) Var(cX) = c2Var(X)
d) Var(X + c) = Var(X)
e) Var(X) = E(X 2 ) − (E(X))2
f) Var(X +Y ) 6= V (X) +V (Y )
Demostración
a) Este inciso es evidente a partir de la definición de varianza pues en ella aparece una suma o
integral de términos no negativos.
b) Para este inciso la constante c es una v.a. con un único valor, de modo que E(c) = c, entonces
Var(X) = E(c − c)2 = E(0)2 = E(0) = 0
c) Para este inciso tenemos que:

Var(cX) = E[cX − E(cX)]2 = E[cX − cE(X)]2 = E[c2 (X − E(X))2 ]
= c2 E[X − E(X)]2 = c2Var(X)
d) La demostración de este inciso tiene un procedimiento análogo al anterior, esto es,
Var(X + c) = E[(X + c) − E(X + c)]2 = E[X + c − (E(X) + E(c))]2
= E[X + c − E(X) − c)]2 = E[X − E(X)]2 = Var(X)
e) Para demostrar esta propiedad se desarrolla el cuadrado en la definición de varianza, y se usa

la propiedad de linealidad de la esperanza, esto es,
Var(X) = E[X − E(X)]2 = E[X 2 − 2XE(X) + (E(X))2 ]
= E(X 2 ) − 2E[XE(X)] + E[E(X)]2 = E(X 2 ) − 2[E(X)]2 + [E(X)]2
= E(X 2 ) − [E(X)]2
f) Finalmente para demostrar la propiedad (f) es suficiente dar un ejemplo. Puede tomarse el caso
Y = X, en general y por lo demostrado antes, se tiene que
Var(X +Y ) = Var(2X) = 22Var(X) = 4Var(X) 6= 2Var(X) = Var(X) +Var(Y )
Observación:
Si X e Y son v.a. independientes y c1 , c2 son constantes arbitrarias entonces
Var(c1 X + c2Y ) = c21Var(X) + c22Var(Y )
Además si X1 , X2 , . . . , Xn son v.a. independientes todas entre si y c1 , c2 , . . . , cn son constantes

arbitrarias se tiene que:
n n
Var ∑ ci Xi = ∑ c2i Var(Xi )
k=1 k=1
Nota: En este curso no entraremos en detalles con respecto a las v.a. independientes por eso no
demostraremos las propiedades que este hecho implica en la esperanza y la varianza de la suma de
v.a. de este tipo mencionadas anteriormente.

6.3.3. Momentos
Los momentos de una variable aleatoria son números que representan algunas caracterı́sticas de la
distribución de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
de manera única a la distribución de probabilidad. A continuación definiremos los momentos si existen
de una variable aleatoria alrededor del origen y alrededor de la media también llamada momento
central.
defiSe define el n−ésimo momento de una variable aleatoria X alrededor del origen, cuando existe,
como el número E(X n ), para cualquier valor natural de n. El n−ésimo momento central de X, cuando
existe, es el número E[(X − µ]n , en donde µ = E(X).
Observe que el primer momento de X alrededor del origen es simplemente la esperanza, y el
segundo momento central es la varianza. Tenemos entonces que si X es una variable aleatoria con
función de probabilidad f (x) si es discreta o función de densidad de probabilidad f (x) si es continua,
entonces el n−ésimo momento de X, si existe, se calcula como sigue:


 ∑ xn f (x) si X es una v.a. discreta
x


E(X n ) = Z ∞

xn f (x)dx si X es una v.a. continua



−∞
El n−ésimo momento central de X se calcula, para variables aleatorias discretas y continuas

respectivamente, como indican las siguientes fórmulas:


 ∑ (x − µ)n f (x) si X es una v.a. discreta
x


E[X − µ]n = Z ∞

(x − µ)n f (x)dx si X es una v.a. continua



−∞
ejeea la variable aleatoria discreta X con función de probabilidad dada por la siguiente tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
S. a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer, segundo y tercer momento alrededor de la media
Desarrollo de los incisos
a) Por definición de momentos alrededor del origen tenemos que
2
1 2 1
E(X) = ∑ x f (x) = 0 · 4 + 1 · 4 + 2 · 4 = 1
x=0
2
1 2 1 3
E(X 2 ) = ∑ x2 f (x) = 02 · 4 + 12 · 4 + 22 · 4 = 2
x=0
2
1 2 1 5
E(X 3 ) = ∑ x3 f (x) = 03 · 4 + 13 · 4 + 23 · 4 = 2
x=0
b) Por definición de momentos alrededor de la media cuyo valor es 1 tenemos que

2
1 2 1
E(X − µ) = ∑ (x − 1) f (x) = (0 − 1) · 4 + (1 − 1) · 4 + (2 − 1) · 4 = 0
x=0
2
1 2 1 1
E[(X − µ)2 ] = ∑ (x − 1)2 f (x) = (0 − 1)2 · 4 + (1 − 1)2 · 4 + (2 − 1)2 · 4 = 2
x=0
2
1 2 1
E[(X − 1)3 ] = ∑ (x − 1)3 f (x) = (0 − 1)3 · 4 + (1 − 1)3 · 4 + (2 − 1)3 · 4 = 0
x=0
ejena variable aleatoria X tiene función de densidad de probabilidad dada por:

x
 2 si 0 < x < 2


f (x) = .


0 en otro caso
U. a) Hallar el primer, segundo y tercer momento alrededor del origen
6.4. FUNCIÓN GENERADORA DE MOMENTOS
S. U.N.A.
b) Calcular el primer y segundo momento alrededor de la media

Desarrollo de los incisos
a) Por definición de momentos alrededor del origen tenemos que
x3 2 4
Z 2
x
E(X) = x dx = =
0 2 6 0 3
x4 2
Z 2
2 2x
E(X ) = x dx = = 2
0 2 8 0
Z 2 5
x 2 16
3 3x
E(X ) = x dx = =
0 2 10 0 5
b) Por definición de momentos alrededor de la media tenemos que
4 4 4 4
E(X − µ) = E X − = E(X) − E = − =0
3 3 3 3
Z 2
4 2 i 4 2 x 1 2 3 8 2 16
h Z
2
E[(X − µ) ] = E X − = x− dx = x − x + x dx
3 0 3 2 2 0 3 9
1 x4 8 3 8 2 2 2

= − x + x =
2 4 9 9 0 9
6.4. Función generadora de momentos

A continuación definiremos una función especial denominada función generadora de momentos.
defiSea X una variable aleatoria con función de probabilidad f (x) en el caso de que sea discreta
o función de densidad f (x) en el caso de que sea continua. Se define a la función generadora de
momentos de la variable aleatoria X como la siguiente esperanza,
MX (t) = E(etX )
La función generadora de momentos de X se calcula, para variables aleatorias discretas y continuas

respectivamente, como indican las siguientes fórmulas:


 ∑ etx f (x) si X es una v.a. discreta
x

MX (t) = Z .
 ∞
etx f (x)dx si X es una v.a. continua



−∞
ejeea X la variable aleatoria discreta del ejemplo 6.3.7, es decir, con función de probabilidad dada
por la tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
Obtener su función generadora de momentos. Por la definición de función generadora de momentos
tenemos
2
0 1 1t 2 2t 1 e2t + 2et + 1
MX (t) = E(etX ) = ∑ etx
f (x) = e · + e · + e · =
x=0 4 4 4 4
ejena variable aleatoria X tiene función de densidad de probabilidad dada por:


−2x si x ≥ 0
2e

f (x) = .

0 en otro caso

Obtener su función generadora de momentos. Por la definición de función generadora de momentos

tenemos Z ∞ Z ∞ Z ∞
−2x
tX
MX (t) = E(e ) = tx
e f (x)dx = tx
e 2e dx = 2 e−(2−t)x dx
−∞ 0 0
2 ∞
−(2−t)x 2
= e =
−(2 − t) 0 2−t
6.4. FUNCIÓN GENERADORA DE MOMENTOS U.N.A.
Propiedades de la función generadora de momentos

proea X una variable aleatoria con los primeros n momentos alrededor del origen finitos, estos es,
E(X k ) < ∞; ∀k ∈ {0, 1, 2, . . . , n} y función generadora de momentos MX (t) , entonces se tiene que:
dn
M X (0) = E(X n )
dt n
Demostración Por definición de función generadora de momentos, MX (t) = E(eXt ) y por serie de
∞
(tX)k
Taylor, e(Xt) = ∑ . Por lo tanto
k=0 k!
∞
(tX)k ∞ k
t
MX (t) = E ∑ k! = ∑ k! E(X k )
k=0 k=0
Derivando n veces a MX (t) obtenemos la siguiente secuencia
d ∞
t k−1 k
∞
t k−1
MX (t) = ∑ E(X ) = ∑ E(X k−1 X) = E(XetX )
dt k=1 (k − 1)! k=1 (k − 1)!
d2 ∞
t k−2 ∞
t k−2
dt 2
M X (t) = ∑ (k − 2)! E(X k
) = ∑ (k − 2)! E(X k−2X 2) = E(X 2etX )
k=2 k=2
..
.
dn ∞
t k−n k
∞
t k−n
n
M X (t) = ∑ E(X ) = ∑ E(X k−n X n ) = E(X n etX )
dt k=n (k − n)! k=n (k − n)!
Por lo que finalmente
dn
n
MX (0) = E(X n )
dt
ejeomemos nuevamente a la variable aleatoria discreta X del ejemplo 6.4.1 junto con su función
generadora de momentos y calculemos los cuatro primeros momentos de la variable alrededor del
origen. Entonces
et + et + 1
MX (t) =
2
d 2t
e + et 1+1
E(X) = Mx (t) = = =1

dx t=0 2 t=0 2
d2 2e2t + et 2+1 3
E(X 2 ) = 2 Mx (t) = = =

dx t=0 2 t=0 2 2
d 3 2t
4e + e t 4+1 5
E(X) = 3 Mx (t) = = =

dx t=0 2 t=0 2 2
d 4 2t
8e + e t 8+1 9
E(X) = 4 Mx (t) = = =

dx t=0 2 t=0 2 2
ejeomemos ahora la variable aleatoria continua X del ejemplo 6.4.2 junto con su función generadora
de momentos y calculemos los cuatro primeros momentos de la variable alrededor del origen. Entonces
2
MX (t) =
2−t
d 2 2 1
E(X) = Mx (t) = = =

(2 − t)2 t=0 22 2

dx t=0
2 d2 4 4 1
E(X ) = 2 Mx (t) = = 3=

dx t=0 3
(2 − t) t=0 2 2
d3 12 12 3
E(X) = 3 Mx (t) = = 4 =

dx t=0 4
(2 − t) t=0 2 4
d4 48 48 3
E(X) = 4 Mx (t) = = 5 =

dx t=0 5
(2 − t) t=0 2 2
proi X1 , X2 , . . . , Xn son v.a. independientes entonces
n
M n (t) = ∏ MXi (t)
∑ Xi i=1
i=1

6.5. PROBLEMAS U.N.A.
Demostración
Por definición de función generadora de momentos se tiene que
n
∑ Xit n n n
M n (t) = E ei=1 = E ∏ eXit = ∏ E(eXit ) = ∏ MXi (t)
∑ Xi i=1 i=1 i=1
i=1
Notese que para esta demostración utilizamos la propiedad de la esperanza para v.a. indepen-
dientes.
6.5. Problemas
Variables Aleatorias
1. Determine en cada caso si la variable aleatoria en cuestión es discreta o continua. Cuáles son
sus posible valores?
a) Tiempo de vida de una persona escogida al azar.

b) Número de errores tipográficos en una página escogida al azar de un libro.
c) Tiempo de servicio en una transacción escogida al azar realizada por una persona en un
cajero automático.
d) Monto de una reclamación por accidente automovilı́stico escogida al azar del conjunto de
reclamaciones efectuadas a una compañı́a aseguradora.
Funciones de probabilidad, de densidad y de distribución
2. Grafique y compruebe que las siguientes funciones son de probabilidad

 2
x

 si x = −2, −1, 0, 1, 2
10

a) f (x) = .


0 en otro caso

(2x − 5)2


 si x = 1, 2, 3, 4, 5
70

b) f (x) = .


0 en otro caso

3. Grafique y compruebe que las siguientes funciones son de densidad

x+1



 2 si x ∈ (−1, 1)
a) f (x) = .


0 en otro caso

(
e−x si x > 0
b) f (x) = .
0 si x ≤ 0
4. Encuentre el valor de la constante c para que f (x) sea una función de probabilidad. Grafique
esta función y calcule P(X ∈ 2, 3, 4) y P(X < 3) en cada caso.

cx si x = 1, 2, . . . , 10

a) f (x) = .

0 en otro caso


2
cx si x = 1, 2, . . . , 10

b) f (x) = .

0 en otro caso


5. Determine si la siguiente función es de probabilidad. Grafique la función y justifique su res-

puesta. 
1

 si x = 0, 1
6







f (x) = 2 si x = 2 .



 3




0 otro caso
6. Determine si la siguiente función es de probabilidad. Grafique la función y justifique su res-

puesta.  4 3 x 1 4−x

 x!(4 − x)! 4
 si x = 0, 1, 2, 3, 4
4
f (x) = .



0 otro caso
7. Encuentre el valor de la constante c para que la siguiente función sea de densidad. Grafique
f (x) y calcule P(X ≥ π) y P(X ∈ [π, 2π]).

c(1 + senx) si x ∈ [0, 2π]

f (x) = .

0 en otro caso

8. Encuentre el valor de la constante c para que la siguiente función sea de densidad. Grafique
f (x) y calcule P(X ∈ (1, ∞)).
f (x) = ce−|x| para − ∞ < x < ∞
9. Determine si cada una de las siguientes funciones es de densidad. Grafique la función en cada
caso y justifique su respuesta.
4x



5 si x ∈ [0, 2]
a) f (x) = .


0 otro caso

 2
2x 4

 − 2x + si x ∈ [0, 3]
3 3

b) f (x) = .


0 en otro caso

10. Explique porqué no es posible encontrar un valor de la constante c para que la siguiente función
sea de probabilidad o de densidad.

cx
 si x = −2, −1, 0, 1, 2
a) f (x) = .

0 otro caso


c senx
 si x ∈ [−π, π]
b) f (x) = .

0 en otro caso

11. Sea X una v.a. discreta con función de probabilidad dada por la siguiente tabla. Grafique f (x)
y calcule P(X ≥ 0), P(X < 0) y P(X 2 = 1).
x -1 0 1
f(x) 0,2 0,3 0,5
12. Dadas las variables aleatorias con funciones de probabilidad dada por las tablas
x 0 1 2 3 4
f(x) 1/210 4/35 3/7 8/21 1/14

x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36
a) Grafique en ambos casos

b) Calcule P(X ≤ 2), P(X ≥ 3) y P(1 ≤ X ≤ 3) en ambos casos
13. Sea X una v.a. discreta con función de probabilidad dada por la tabla que aparece abajo.
Grafique f (x). Calcule la función de probabilidad de las siguientes variables aleatorias Y =
X 2 , Z = |X| y W = 2X − 5. Grafique en cada caso.
x -2 -1 0 2 3 5
f(x) 0,1 0,15 0,4 0,1 0,15 0,1
14. Sea X discreta con función de probabilidad dada por la tabla que aparece abajo. Encuentre el
valor de c y grafique f (x). Calcule y grafique la función de probabilidad de la variable Y = X 2 .
x -2 0 2
f(x) 0,1 c 0,1
15. Sea X una variable aleatoria con la siguiente función de distribución. Encuentre y grafique f (x).
Calcule P(0 ≤ X < 10).
 1 x+1

 1 − si x = 0, 1, 2, 3, . . .
 2
F(x) = .


0 otro caso

16. Sea X una v.a. continua con función de densidad

1



 10 si − k ≤ x ≤ 4k
f (x) = .


0 otro caso

a) Determine el valor de la constante k y grafique f (x)

b) Calcule y grafique F(x)
c) Calcule P(−1 ≤ X ≤ 3), P(X ≥ 2) y P(X ≤ 0)
1
d) Encuentre m tal que P(|X − 1| ≥ m) =
2
17. Sea X una variable aleatoria continua con la función de densidad que aparece abajo. Encuentre
el valor de la constante c y grafique la función f (x). Encuentre y grafique además la función de
distribución F(x).
2x

 9 si 0 < x < c


f (x) = .


0 si en otro caso

(
ce−3x si x > 0
18. Dada la siguiente función f (x) = .
0 si x ≤ 0
a) Obtenga el valor de c que haga que esta función sea de densidad para X
b) Calcule y grafique F(x)
c) Calcule P(X ≤ 10), P(X ≥ 5) y P(5 ≤ X ≤ 10)
19. El tiempo en minutos que una persona espera un autobús es una v.a. con función de densidad
dada por 
1
2 si 0 < t < 1







f (t) = 14 si 2 < t < 4 .






0 para otro valor de t
Hallar la probabilidad de que el tiempo en que la persona que espera el autobús sea de
a) mayor de 3 minutos
b) entre 1 y 2 minutos
c) menor de 3 minutos
20. Una v.a. tiene función de densidad


2 si 1 ≤ t ≤ 2
cx

f (t) = cx si 2 ≤ t ≤ 3 .

0 para otro valor de x

Hallar:
a) la constante c
b) la función de distribución
1 3
c) P(X > 2) y P <X <
2 2
21. Sea X una variable aleatoria con la función de distribución que aparece abajo. Es X discreta
o continua? Grafique F(x). Encuentre y grafique la correspondiente función de densidad f (x).
Calcule además P(X = 2) y P(1 < X < 2).


 0 para x < 1





1

F(x) = si 1 ≤ x < 2 .


 3




1 para x ≥ 2
22. Sea X una variable aleatoria con la función de distribución que aparece abajo. Es X discreta
o continua? Grafique F(x). Encuentre y grafique la correspondiente función de densidad f (x).
1 1
Calcule además P(X = ) y P(X > ).
2 2

0√ para x < 0

F(x) = x si 0 ≤ x < 1 .

1 para x ≥ 1

23. Una urna contiene cuatro bolas numeradas 1, 2, 3 y 4. Se extraen dos bolas al azar, una a la
vez y sin reemplazo. Sea X la variable aleatoria que denota la suma de los números de las dos
bolas seleccionadas.
a) Determine Ω
b) Calcule y grafique f (x)
c) Calcule y grafique F(x)
d) Calcule P(X ≥ 6), P(3 < X ≤ 5) y P(X = 6)
Esperanza, varianza, momentos y función generadora de momentos
1. Sea a un número fijo. Construya una variable aleatoria X tal que E(X) = a.
2. Calcule la esperanza de la variable aleatoria discreta X cuya función de probabilidad es


1

 si x = 0, 1
3







a) f (x) = 1 si x = 2, 3 .



 6




0 otro caso


1

 si x = −1, 1
4







b) f (x) = 1 si x = 0 .



 2




0 otro caso
3. Calcule la esperanza de la variable aleatoria continua X cuya función de densidad es
a) f (x) = e−x , para x > 0

b) f (x) = 6x(1 − x), para 0 < x < 1
4. Sea X una variable aleatoria discreta con la función de probabilidad que aparece abajo. De-
muestre que f (x) es efectivamente una función de probabilidad y que la esperanza de X no
existe. Este es un ejemplo de una variable aleatoria discreta que no tiene esperanza finita.
 1
 x(x + 1) para x = 1, 2, 3, . . .


f (x) = .



0 para otros casos
5. Sea X una variable aleatoria continua con la función de densidad que aparece abajo. Demuestre
que esta función es efectivamente una función de densidad. Compruebe además que la esperanza
de X no existe. Este es un ejemplo de una variable aleatoria continua que no tiene esperanza
finita. Es un caso particular de la distribución Cauchy.
1
f (x) = , para − ∞ < x < ∞
π(x2 + 1)
6. Demuestre que no existe la esperanza de la v.a X cuando su función de densidad es

1

 x2 para x > 1


f (x) = .


0 para x ≤ 1

7. Encuentre la esperanza y luego demuestre que la varianza de una variable aleatoria con la
siguiente función de densidad no existe.
2

 x3 para x > 1


f (x) = .


0 para x ≤ 1

8. Diga falso o verdadero. Justifique en cada caso.
a) La esperanza de una v.a. puede ser cero.

b) No hay dos v.a.s distintas con la misma esperanza.
c) La esperanza de una v.a. nunca es negativa.
d) La varianza de una v.a. puede ser cero.
e) La varianza de una v.a. nunca es negativa.
f) No hay dos v.a.s distintas con la misma varianza.
9. Demuestre que
a) E(E(X)) = E(X)
b) Var(Var(X)) = 0
10. Sea X la variable aleatoria constante c. Compruebe que
a) E(X) = c
b) E(X n ) = cn
c) Var(X) = 0
11. Calcule la media y varianza de la variable aleatoria X con función de probabilidad


1

 si x = 0, 1, 2
9







f (x) = 2 si x = 3, 4, 5 .



 9




0 otro caso
12. Calcule la media y varianza de la variable aleatoria X cuya función de probabilidad es

 x+1
1

 si x = 0, 1, 2, 3, . . .
 2
f (x) = .


0 otro caso

a) Var(E(X)) = 0
b) E(Var(X)) = E(X)
14. Sea X una variable aleatoria continua con función de densidad f (x) = 12e−|x| , para −∞ < x < ∞.
Demuestre que f (x) es efectivamente una función de densidad y compruebe que
a) E(X) = 0
b) E(X 2 ) = 2
c) Var(X) = 2
d) E(X n ) = n! para n par
a) E(−X) = −E(X)
b) Var(−X) = −Var(X)
c) E(Var(X)) = Var(E(X))
16. Encuentre el error en la siguiente demostración de la afirmación de que la varianza de cualquier

variable aleatoria es cero.
0 = Var(0)
= Var(X + (−X))
= Var(X) +Var(−X)
= Var(X) +Var(X)
= 2Var(X)

Capı́tulo 7
Distribuciones de probabilidad
Estudiaremos a continuación algunas distribuciones de probabilidad de variables aleatorias im-

portantes. Estas distribuciones son modelos particulares para asignar probabilidades a subconjuntos
de números reales. Empezaremos con las distribuciones de tipo discreto y continuaremos después
con las de tipo continuo. Es importante señalar que ésta es sólamente una lista parcial de algunas
distribuciones de probabilidad de mayor uso.
7.1. Distribuciones discretas de probabilidad

7.1.1. Distribución Bernoulli
Un ensayo Bernoulli se define como aquel experimento aleatorio con únicamente dos posibles
resultados, llamados genéricamente éxito y f racaso , con probabilidades respectivas P(Éxito) = p y
P(Fracaso) = 1 − p.
Construcción de una distribución de Bernoulli

Sea un experimento aleatorio que arroja únicamente dos posibles resultados, denominados éxito
y fracaso. Si se define la variable aleatoria X como aquella función que lleva el resultado éxito al
número 1 y el resultado fracaso al número 0, entonces decimos que X tiene una distribución Bernoulli
con parámetro p ∈ (0, 1), y escribimos X ∼ Ber(p). La función de probabilidad es
p (1 − p)1−x si x = 0, 1
x
f (x) =
0 para otro caso
proea X ∼ Ber(p), entonces tenemos que E(X) = p Var(X) = p(1− p) MX (t) = 1− p+ pet
Demostración
S .a)b)c)
a) A partir de la definición de esperanza se tiene que
E(X) = ∑ x f (x) = 0 · (1 − p) + 1 · p = p
x
b) Según la definición de varianza, Var(X) = ∑[x − E(X)]2 f (x), entonces tenemos que
x
Var(X) = (0 − p)2 (1 − p) + (1 − p)2 p = p2 (1 − p) + p(1 − p)2 = p(1 − p)

c) Recordando que la función generadora de momentos se define como MX (t) = E(etX ), entonces
MX (t) = ∑ etx f (x) = e0 (1 − p) + et p = 1 − p + pet

x
ejeonsidere el experimento aleatorio de lanzar una moneda al aire. Calcula la esperanza, la varianza
y la función generadora de momentos. Suponga que ω1 = cara y ω2 = cruz son los dos resultados
1 1
posibles, con probabilidades p = y 1 − p = , respectivamente. Sea X la variable aleatoria dada por
2 2 1
X(ω1 ) = 1, y X(ω2 ) = 0. Entonces X tiene distribución Ber , por lo tanto
2
1
E(X) = p =
2
1 1 1
Var(X) = p(1 − p) = (1 − ) =
2 2 4
1 1 t 1
MX (t) = 1 − + e = (1 + et )
2 2 2
57
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD U.N.A.
7.1.2. Distribución binomial

La distribución binomial fue desarrollada por suizo Jakob Bernoulli (1654−1705), es la principal
distribución de probabilidad discreta. La variable aleatoria binomial y su distribución están basadas
en un experimento que satisface las condiciones citadas a continuación.
Construcción de la distribución binomial

Suponga que se realizan n ensayos idénticos independientes de Bernoulli en donde la probabilidad
de éxito y de fracaso en cada uno de ellos es la misma, siendo la probabilidad de éxito igual a p y
la del fracaso igual a 1 − p, con p ∈ (0, 1). El espacio muestral de este experimento consiste de todas
las posibles sucesiones de longitud n de éxitos y de fracasos, esto es
Ω = {(EEE . . . E), (FEE . . . E), (FFE . . . E), . . . , (FFF . . . FE), (FFF . . . F)}
Usando el principio multiplicativo, es fácil ver que este conjunto tiene 2n elementos. Si ahora se
define la variable aleatoria X como el número de éxitos en cada una de estas sucesiones, esto es
X(EEE . . . E) = n, X(FEE . . . E) = n − 1, . . . , X(FFF . . . EF) = 1, X(FFF . . . F) = 0
entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribución binomial con parámetros
n y p. Se escribe X ∼ bin(n, p), y su función de probabilidad es

n!

 px (n − p)1−x si x = 0, 1, . . . , n
x!(n − x)!

f (x) =


 0 para otro caso
proea X ∼ bin(n, p), entonces tenemos que E(X) = np Var(X) = n(1 − p) MX (t) = (1 −
p + pet )n
Demostración
S .a)b)c)
a) Como la variable aleatoria X constituye el número de éxitos obtenidos en cada uno
n
de los posibles resultados en el experimento (posibles sucesiones de Ω). Entonces X = ∑ X j,
j=1
donde X j ∼ Ber(p), ∀ j = {1, 2, . . . , n}, por lo que la esperanza, varianza y función generadora de
momentos de cada X j son E(X j ) = p, Var(X j ) = p(1 − p) y MX j (t) = pet + p − 1 respectivamente.
Aplicando la propiedad de linealidad de la esperanza se tiene
n n n
E(X) = E ∑ Xj = ∑ E(X j ) = ∑ p = np
j=1 j=1 j=1
b) Tomando en cuenta la propiedad de varianza que establece que si tenemos n variables aleatorias
independientes, todas con varianzas finitas, entonces la varianza de las suma de las n v.a. es
idéntica a la suma de las varianzas de las variables, por lo tanto la varianza de X es:
n n n
Var(X) = Var( ∑ X j ) = ∑ Var(X j ) = ∑ p(1 − p) = np(1 − p)
j=1 j=1 j=1
c) Una de las propiedades de la función generadora de momentos establece que si tenemos n

variables aleatorias independientes, entonces la función generadora de momentos de la suma
de las n v.a. es idéntico al producto de la función generadora de momentos de las variables,
entonces
n n
MX (t) = M n (t) = ∏ MX j (t) = ∏ (pet + p − 1) = (pet + p − 1)n
∑ Xj j=1 j=1
j=1
ejel experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro interés es el
número de caras obtenidas en los cuatro lanzamientos. Como es evidente, la probabilidad de
obtener un éxito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la de obtener un
fracaso es también 0,50.
E. a) Cuál es la probabilidad de no obtener caras en los cuatro lanzamientos?

b) Cuál es la probabilidad de obtener dos caras en los cuatro lanzamientos?
c) Haga una distribución de probabilidad binomial
d) Calcular la media, la desviación estándar y la función generadora de momentos de esta distri-

bución binomial
Esta distribución binomial tiene por función de probabilidad a la siguiente función
 1 x 1 4−x
4!
si x = 0, 1, 2, 3, 4


x!(4 − x)! 2 2

f (x) =


 1 4
4!
si x = 0, 1, 2, 3, 4


x!(4 − x)! 2

=


a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es,
4! 1 4 1
P(X = 0) = =
0!(4 − 0)! 2 16
b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es,
4! 1 4 6 3
P(X = 2) = = =
2!(4 − 2)! 2 16 8
c) La distribución de probabilidad está dada por la siguiente tabla
x 0 1 2 3 4
p(x) 1/16 4/16 3/8 1/4 1/16
c) Teniendo en cuenta la proposición
7.1.3. Distribución Poisson

Esta distribución fue descubierta por Simeón Denis Poisson (1781−1840) en 1837 como lı́mite
de la distribución binomial. En 1838 en su trabajo Recherches sur la probabilité des jugements en
matiéres criminelles et matiére civile (Investigación sobre la probabilidad de los juicios en materias
criminales y civiles). El trabajo estaba enfocado en ciertas variables aleatorias N que cuentan, entre
otras cosas, un número de ocurrencias discretas (muchas veces llamadas arribos) que tienen lugar
durante un intervalo de tiempo de duración determinada.
La distribución de Poisson tiene conexión con los procesos de Poisson. Se aplica a varios fenómenos
discretos de la naturaleza (esto es, aquellos fenómenos que ocurren 0, 1, 2, 3, . . . veces durante un
periodo definido de tiempo o en una área determinada) cuando la probabilidad de ocurrencia del
fenómeno es constante en el tiempo o el espacio.
Ejemplos de eventos que pueden ser modelados por la distribución de Poisson

a) El número de autos que pasan a través de un cierto punto en una ruta (suficientemente distantes
de los semáforos) durante un periodo definido de tiempo.
b) El número de errores de ortografı́a que uno comete al escribir una única página.
c) El número de llamadas telefónicas en una central telefónica por minuto.
d) El número de servidores web accedidos por minuto.
e) El número de animales muertos encontrados por unidad de longitud de ruta.
f) El número de mutaciones de determinada cadena de ADN después de cierta cantidad de radia-

ción.
g) El número de núcleos atómicos inestables que decayeron en un determinado periodo de tiempo

en una porción de sustancia radiactiva.

7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
U. a) U.N.A.
h) La radiactividad de la sustancia se debilitará con el tiempo, por lo tanto el tiempo total del
intervalo usado en el modelo debe ser significativamente menor que la vida media de la sustancia.
i) El número de estrellas en un determinado volumen de espacio.
j) La distribución de receptores visuales en la retina del ojo humano.
k) La inventiva de un inventor a través de su carrera
La distribución de Poisson surge cuando estamos interesados en medir el números de sucesos

aleatorios que suceden en un intervalo de tiempo fijo. La variable aleatoria se distribuye a lo largo
del tiempo o del espacio. Las condiciones para que se trate de una distribución de Poisson son:
Los eventos de interés deben ocurrir independientemente unos de otros
La probabilidad de que suceda un evento en un intervalo depende de la longitud del intervalo

y no de su posición.
Construcción de una distribución de Poisson

Supongamos que deseamos observar el número de ocurrencias de un cierto evento dentro de un
intervalo de tiempo dado, por ejemplo, el número de clientes que llegan a un cajero automático
durante la noche, o tal vez deseamos registrar el número de accidentes que ocurren en cierta avenida
durante todo un dı́a. Para modelar este tipo de situaciones podemos definir la variable aleatoria X
como el número de ocurrencia de este evento en el intervalo de tiempo dado. Es claro entonces que
X puede tomar los valores 0, 1, 2, . . . , y en principio no ponemos una cota superior para el número de
observaciones del evento. Adicionalmente supongamos que conocemos la tasa media de ocurrencia del
evento de interés, que denotamos por la letra λ (lambda). El parámetro λ es positivo y se interpreta
como el número promedio de ocurrencias del evento, por unidad de tiempo. La probabilidad de que
la variable aleatoria X tome un valor entero x ≥ 0 se definirá a continuación. Decimos que X tiene
una distribución Poisson con parámetro λ > 0, y escribimos X ∼ Poisson(λ) cuando:

 e−λ λx

 si x = 0, 1, 2, . . .
f (x) = x!


t
proea X ∼ Poisson(λ), entonces tenemos que E(X) = λ Var(X) = λ MX (t) = eλ(e −1)
Demostración
S .a)b)c)
∞
e−λ λx ∞
e−λ λx ∞ −λ x−1
e λ
E(X) = ∑x =∑ =λ∑ =λ
x=0 x! x=1 (x − 1)! x=1 (x − 1)!
b) Según una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) − [E(X)]2 , entonces
calculemos primero E(X 2 )
∞
e−λ λx ∞
e−λ λx ∞
e−λ λx
E(X 2 ) = ∑ x2 = ∑x = ∑ (x − 1 + 1)
x=0 x! x=1 (x − 1)! x=1 (x − 1)!
∞
e−λ λx ∞
e−λ λx ∞
e−λ λx ∞ −λ x−1
e λ
= ∑ (x − 1) +∑ =∑ +λ ∑
x=1 (x − 1)! x=1 (x − 1)! x=2 (x − 2)! x=1 (x − 1)!
∞
e−λ λx−2 ∞ −λ x−1
e λ
= λ2 ∑ +λ ∑ = λ2 + λ
x=2 (x − 2)! x=1 (x − 1)!
Entonces:
Var(X) = λ2 + λ − λ2 = λ
c) Por la definición de función generadora de momentos, se tiene que

∞
e−λ λx ∞
(et λ)x t t
MX (t) = ∑ etx = e−λ ∑ = e−λ · ee λ = eλ(e −1)
x=0 x! x=0 x!

ejena distribución de Poisson está dada por
e−1,8 (1, 8)x

P(X = x) =
x!
Hallar
P(X = 1), P(X ≤ 2) y P(X ≥ 3)
b) E(X),Var(X) y MX (t)
Desarrollo
a) Tomando la función de probabilidad tenemos que
e−1,8 (1, 8)1

P(X = 1) = = 1, 8e−1,8 = 0, 2975
1!
P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)
e−1,8 (1, 8)0 e−1,8 (1, 8)1 e−1,8 (1, 8)2

= + + = 0, 7306
0! 1! 2!
P(X ≥ 3) = 1 − P(x < 3) = 1 − [P(X = 0) + P(X = 1) + P(X = 2)]
= 1 − 0, 7306 = 0, 2694
b) A partir de la proposición
t
E(X) = Var(X) = λ = 1, 8 y MX (t) = e1,8(e −1)
Relación con la distribución binomial
La distribución de Poisson puede ser vista como un caso lı́mite de la distribución binomial,
es decir, una distribución binomial en la que n → ∞ y p → 0 se puede aproximar por una
distribución de Poisson de parámetro λ = np.
ejen una central telefónica automática la probabilidad de que una llamada sea conectada
erróneamente es 10−3 .
E. a) Para un dı́a donde son conectadas 2000 llamadas independientes, hallar el valor apro-
ximado de la probabilidad que se efectúen 4 conexiones erróneas.
b) Cuál es el número mı́nimo de llamadas independientes que se requieren para asegurar con
probabilidad 0,9 que por lo menos una de las llamadas sea conectada erróneamente?
Desarrollo
a) Sea X la v.a que represente el número de llamadas telefónicas conectadas erróneamente

en un dı́a determinado. Entonces la función de probabilidad de X está dada por:
e−np (np)x
P(X = x) =
x!
donde p = 10−3 y n = 2000 según las condiciones de este problema. Entonces np = 2 y
e−2 (2)4
P(X = 4) = = 0, 09
4!
b) Si X es nuevamente el número de llamadas conectadas erróneamente en un dı́a determinado

entonces X ∼ Poisson(np). Según la información P(X ≥ 1) ≥ 0, 9 y considerando que P(X ≥
1) = 1 − P(X < 1) = 1 − P(X = 0) entonces:
e−np (np)0
1− ≥ 0, 9
0!
0, 1 ≥ e−np
ln|0, 1| ≥ −np
n ≤ 2303 llamadas

7.1.4. Distribución geométrica

En la teorı́a de probabilidad y estadı́stica, la distribución geométrica es cualquiera de las dos
distribuciones de probabilidad discretas siguientes:
La distribución de probabilidad del número X de ensayos de Bernoulli necesaria para obtener

un éxito, contenido en el conjunto {1, 2, 3, . . . } o
la distribución de probabilidad del número Y = X − 1 de fallos antes del primer éxito, contenido
en el conjunto {0, 1, 2, 3, . . . }
A cualquiera de éstas dos distribuciones se la denomina distribución geométrica, es una cues-

tión de convención y conveniencia.
Construcción de una distribución geométrica

Supongamos que tenemos ahora una sucesión infinita de ensayos independientes Bernoulli, en
cada uno de los cuales la probabilidad de éxito es p. Para cada una de estas sucesiones definimos
la variable aleatoria X como el número de fracasos antes de obtener el primer éxito. Por ejemplo,
X(FEFEFF . . . ) = 1, X(EFFEEE . . . ) = 0, X(FFFEFE . . . ) = 3. Observamos que X puede tomar los
valores 0, 1, 2, . . . . La probabilidad de que X tome el valor entero x ≥ 0 es p(1 − p)x . Decimos entonces
que X tiene una distribución geométrica con parámetro p, y escribimos X ∼ geo(p) cuando

 p(1 − p)x si x = 0, 1, 2, . . .
P(X = x) =
0 para otro caso

El nombre de esta distribución proviene del hecho de que cuando escribimos la suma de todas las
probabilidades, obtenemos una suma geométrica. La inspección sucesiva de artı́culos hasta encontrar
una defectuoso, posiblemente en un proceso de control de calidad, puede modelarse usando una
distribución geométrica.
proi X es la v.a. que muestra el número de fracasos antes del primer éxito esto es; X ∼ geo(p)
entonces:
(1 − p)
S. a) E(X) =
p
(1 − p)
b) Var(X) =
p2
p 1
c) MX (t) = , con t < ln

t
1 − e (1 − p) 1− p

Demostración

∞ ∞ ∞
E(X) = ∑ xp(1 − p)x = p ∑ x(1 − p)x = p(1 − p) ∑ x(1 − p)x−1
x=0 x=0 x=0
∞
d x d h ∞ x
i
= −p(1 − p) ∑ [(1 − p) ] = −p(1 − p) ∑ (1 − p)
x=1 d p d p x=1
d 1 (−1) 1 − p
= −p(1 − p) − 1 = −p(1 − p) 2 =
dp p p p
b) Según una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) − [E(X)]2 , entonces
calculemos primero E(X 2 )
∞ ∞ ∞
E(X 2 ) = ∑ x2 p(1 − p)x = p ∑ x2(1 − p)x = p(1 − p) ∑ x2(1 − p)x−1
x=0 x=1 x=1
∞
d x d h ∞ x
i
= −p(1 − p) ∑ [x(1 − p) ] = −p(1 − p) ∑ x(1 − p)
x=1 d p d p x=1
d h1 ∞ x
i d h1 − pi
= −p(1 − p) ∑ px(1 − p) = −p(1 − p)
d p p x=1 d p p2

h −p2 − (1 − p)2p i p − 2 (1 − p)(2 − p)

= −p(1 − p) = −p(1 − p) =
p4 p3 p2
Entonces:
(1 − p)(2 − p) (1 − p)2 1 − p
Var(X) = − = 2
p2 p2 p
c) Por la definición de función generadora de momentos, se tiene que
∞ ∞ 1
tx x t x p
MX (t) = ∑ e p(1 − p) = p ∑ [e (1 − p)] = con t < ln

t
1 − e (1 − p) 1− p

x=0 x=0
∞
1
Observación: Recordar que una serie geométrica es de la forma ∑ rx−1 y converge a
1−r
si su
x=1
radio r cumple con la condición |r| < 1
ejeupongamos que un dado ordinario (equilibrado) es lanzado repetidas veces hasta que
aparece el resultado 1 por primera vez. Calcular
S. a) obtener la distribución de probabilidad de la v.a. que se ajuste a este experimento y calcular
la probabilidad de obtener el 1 en el cuarto lanzamiento
b) la esperanza, la varianza y la función generadora de momentos

Desarrollo
a) Sea X la v.a que represente el número de lanzamientos necesarios del dado para obtener por
primera vez el resultado 1. Entonces X ∼ geo(P = 16 ), con lo cual
 x
 16 56
 si x = 0, 1, 2, . . .
P(X = x) =

0 para otro caso

Por lo que
1 5 3 125
P(X = 3) = 1− =
6 6 1296
b) Según la proposición
7.1.5. Distribución binomial negativa

Si en una sucesión infinita de ensayos de Bernoulli (el resultado en cada experimento es un
éxito o fracaso) cada uno con parámetro p ∈ (0, 1); la variable aleatoria X cuenta el número
de fracasos antes de obtener el r−ésimo éxito, entonces decimos que X tiene una distribución
binomial negativa con parámetros r y p, y escribimos X ∼ bin neg(r, p).
7.1.6. Construcción de una distribución binomial negativa

Para construir una distribución binomial negativa es necesario conocer el número de pruebas
que se repiten, el r-ésimo éxito en el número de pruebas que se repiten y la probabilidad de que
suceda un éxito en cada una de las pruebas.
Para n = r, r + 1, . . . se define An como el suceso que establece que el número total de pruebas
requeridas para obtener exactamente r éxitos es n. Como el suceso An ocurre si y solo si ocurren
exactamente r − 1 éxitos en las primeras n − 1 pruebas y el r−ésimo éxito se da en la n−ésimo
prueba. Puesto que todas las pruebas son de Bernoulli entonces son todas independientes entre
si y áplicando el principio de análisis combinatorio, se obtiene que:

n−1
P(An ) = pr−1 (1 − p)(n−1)−(r−1) p
r−1
con lo cual
n−1
P(An ) = pr (1 − p)n−r (7.1.1)
r−1
Si decimos que X es la v.a. que cuenta el número de fracasos antes de obtener el r−ésimo éxito,
entonces X puede tomar los valores del conjunto {0, 1, 2, . . . }. Además recordemos que n por
definición de An es número de fracasos (x) más número de éxitos (r), esto es n = x + r. Entonces
se entiende la v.a. X podrı́a caracterizar numéricamente al suceso An como X(An ) = x, por lo

que tendremos;
P(An ) = P(Ax+r ) = P(X = x) (7.1.2)
Tomando en cuenta las ecuaciones
Aparece el término pr pues la sucesión de ensayos Bernoulli no concluye sino hasta obtener r
éxitos. Podemos

tener

un número variable de fracasos, de ahı́ el término (1 − p)x , y finalmente
r+x−1
el factor   que nos dice las diferentes formas en que los r éxitos pueden aparecer en
x
los r + x − 1 ensayos realizados antes del último que necesariamente fue un éxito.
Es claro que esta distribución es una generalización de la distribución geométrica, la cual se

obtiene tomando r = 1.
proi X es la v.a. que muestra el número de fracasos antes del r éxito esto es; X ∼ bin neg(r, p)
entonces:
r(1 − p)
S . a) E(X) =
p
r(1 − p)
b) Var(X) =
p2
h p ir 1
c) MX (t) = , con t < ln

t
1 − e (1 − p)

1− p

Demostración
Si X es la v.a que cuenta el número de fracasos antes del r−ésimo éxito en sucesión de pruebas
r
de Bernoulli; entonces X = ∑ Xi, donde todas las v.a. Xi son independientes entre si y cada
i=1
1− p 1− p p
Xi ∼ geo(p), ∀ i = 1, 2, . . . , r; con lo cual E(Xi ) = ,Var(Xi ) = 2 y MXi (t) = .
p p 1 − et (1 − p)
Esto resulta del hecho de que para cada éxito se tubo que haber tenido un cierto número de
fracasos, que es la caracterı́stica de la distribución geométrica. Entonces
a) la esperanza de X es
r r r
1 − p r(1 − p)
E(X) = E ∑ Xi = ∑ E(Xi ) = ∑ =
i=1 i=1 i=1 p p
b) la varianza de X es
r r r
1 − p r(1 − p)
Var(X) = Var ∑ Xi = ∑ Var(Xi ) = ∑ p2 = p2
i=1 i=1 i=1
c) y la función generadora de momentos de X es

r r ir
p h p
MX (t) = M r (t) = ∏ MXi (t) = ∏ t
=
i=1 1 − e (1 − p) 1 − et (1 − p)
∑ Xi i=1
i=1
ejee lanza repetidas veces una moneda honesta, cuyos dos resultados son cara y cruz.
S . a) Cuál es la probabilidad de obtener la tercera cruz en el quinto lanzamiento?
b) Obtener la esperanza, varianza y la función generadora de momentos para esta distribu-
ción.
Desarrollo
a) Sea X la v.a. que represente el número de caras (fracasos) necesarias astes de obtener por
tercera vez cruz. Entonces X ∼ bin neg(3, 12 ), con lo cual

2+x 3 x
1 1
si x = 0, 1, 2, . . .



x
2 2
P(X = x) =


0 para otro caso

Por lo que
2+2 1 3 1 2 1 5 6
P(X = 2) = =6 = = 0, 1875
2 2 2 2 32
b) Según la proposición
U.N.A.
7.1.7. Distribución hipergeométrica

Como la mayorı́a de los muestreos se hacen sin remplazamiento. Ası́, si la población es pe-
queña la probabilidad de obtener el artı́culo del tipo requerido cambia en cada observación.
En estadı́stica la distribución hipergeométrica es una distribución de probabilidad discreta
con tres parámetros discretos N, r y n. Además es apropiada para muestreos sin reemplaza-
miento de poblaciones pequeñas. Esta distribución se refiere a un espacio muestral donde
hay elementos que tienen dos tipos de caracterı́sticas posibles. Indica la probabilidad de
obtener un número de objetos x de uno de estos tipos, al sacar una muestra de tamaño n,
de un total de N objetos, de los cuales k son del tipo requerido.
Construcción de una distribución hipergeométrica
Supongamos que tenemos un conjunto de N objetos de los cuales k son de una primera
clase y N − k son de una segunda clase. Supongamos que de este conjunto tomamos una
muestra aleatoria de tamaño n (n ≤ N), la muestra es sin reemplazo y el orden de los
objetos seleccionados no importa. El espacio muestral de este experimento consiste de
todas las posibles muestras de tamaño n que se pueden
obtener del conjunto mayor de
N
tamaño N. La cardinalidad del espacio muestral es . Si para cada muestra definimos
n
la variable aleatoria X como el número de objetos de la primera clase contenidos en la
muestra seleccionada, entonces X puede tomar los valores 0, 1, 2, . . . , n; suponiendo n ≤ k.
La probabilidad de que X tome un valor x estará dada por la fórmula que enunciamos a
continuación. Decimos que X tiene una distribución hipergeométrica con parámetros N, k
y n, y escribimos X ∼ hipergeo(N, k, n) si

N −k
! !
k



 x n−x
si x = 0, 1, 2, . . . , n

 !
 N
P(X = x) =

 n




0 para otro caso


k
El término nos dice las diferentes formas en que de los k objetos de la primera clase
x

N −k
se pueden escoger x de ellos, y el término es nuevamente las diferentes formas
n−x
de escoger n − x objetos de la totalidad de N − k objetos de la segunda clase. Usamos el
principio multiplicativo para obtener el número total de muestras diferentes en donde x
objetos son de la primera clase y n − x objetos son de la segunda clase.
proada una población finita de tamaño N con dos clases posibles de objetos. Si X es la
v.a. que muestra el número de objetos de la primera clase contenidos en una muestra
de tamaño n seleccionada de dicha población entonces X ∼ hipergeo(N, k, n) y presenta
las siguientes caracteristicas:
nk
D . a) E(X) =
N
nk k N − n
b) Var(X) = 1−
N N N −1
Demostración
Como primer paso seleccionemos n objetos de la población de tamaño N que contiene k

n
objetos de una primera clase y N − k objetos de la segunda clase. Definamos a X = ∑ Xi
i=1
como la v.a aleatoria que cuenta el número de objetos de la primera clase en la muestra
seleccionada; en donde cada Xi , ∀ i = 1, 2, . . . , n es una v.a que presenta las siguientes
caracterı́sticas:
◦ Xi = 1 si se selecciona un objeto de la primera clase en la i−ésima extracción
◦ Xi = 0 si se selecciona un objeto de la segunda clase en la i−ésima extracción
Debido a la aleatoriedad, la probabilidad de que la i−ésima bola extraida sea de la primera
k
clase es simplemente . Por lo tanto:
N
k N −k
◦ P(Xi = 1) = y P(Xi = 0) =
N N
U.N.A.
k
◦ E(Xi ) = P(Xi = 1) =
N
k k 2 k k
◦ Var(Xi ) = E(Xi2 ) − [E(Xi )]2 = − = 1−
N N N N
Entonces tenemos que:
a) la esperanza de X es
n n n
k nk
E(X) = E X =
∑ i ∑ i ∑N = NE(X ) =
i=1 i=1 i=1
b) la varianza de X es
n
Var(X) = Var ∑ Xi = E(X 2 ) − E(X)
i=1
calculemos entonces:

k N −k k−1 N −k
2
n x x
2 x n−x nk n x−1 n−x
E(X ) = ∑
N
= ∑
N − 1

x=0 N x=1
n n−1

k−1 N −k
(x − 1 + 1)
nk n x−1 n−x
= ∑
N −1

N x=1
n−1

k−2 N −k k−1 N −k
" #
nk (k − 1)(n − 1) n x−2 n−x
n
x−1 n−x
= ∑ +∑
N N −1 x=2
N −2
x=1
N −1
" "n − 2
# #n − 1
nk (k − 1)(n − 1) nk (k − 1)(n − 1) + N − 1
= +1 =
N N −1 N N −1
Por lo tanto
" # " #
nk (k − 1)(n − 1) + N − 1 nk 2 nk N 2 − (k + n)N + nk
Var(X) = − =
N N −1 N N N(N − 1)
nk N − k N − n
=
N N N
ejeupóngase que una urna contiene cinco bolas rojas y diez azules. Si se seleccionan
bolas de la urna sin reemplazamiento; sea X la v.a que cuenta el número de bolas
rojas extraidas. Si se extraen al azar sin reemplazamiento siete bolas
S . a) Cuál es la probabilidad de seleccionar exactamente cuatro bolas rojas?
b) Cuál es la probabilidad de seleccionar almenos tres bolas rojas?
c) Calcular la esperanza y la varianza de esta distribución
Desarrollo
Como X es la v.a que cuenta el número de bolas rojas extraidas en un muestreo sin
reemplazmiento; se tiene que X ∼ hipergeo(15, 5, 7). Por lo tanto
 ! !
5 10



 x 7−x
si x = 0, 1, 2, 3, 4, 5

 !
 15
P(X = x) =

 7




0 para otro caso

a) Para contestar la pregunta de este item basta calcular P(X = 4), esto es;

5 10
4 3 5 · 120 40
P(X = 4) =
15
= =
6435 429
7

7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
S . a) U.N.A.
b) Para contestar esta parte debemos calcular P(X ≥ 3); que equivale a decir,
P(X ≥ 3) = P(X = 3) + P(X = 4) + P(X = 5)
Por lo tanto

5 10 5 10 5 10
3 4 4 3 5 2 140 40 1 61
P(X ≥ 3) =
15
+
15
+
15
= + + =
429 429 143 143
7 7 7
c) Según la proposición
7.2. Distribuciones continuas de probabilidad

7.2.1. Distribución uniforme continua
Las distribuciones uniformes corresponden al experimento de elegir puntos al azar
entre dos puntos fijos a y b. Como la probabilidad de elegir cualquier punto es la
misma, la función de densidad tendrá la misma altura en todos los puntos entre a y
1
b, es decir se trata de una función constante desde a y b, de altura .
b−a
defiecimos que una variable aleatoria X tiene una distribución uniforme continua en
el intervalo (a, b), y escribimos X ∼ uni f (a, b) cuando su función de densidad es
1

 si a < x < b
b−a

f (x) =


0 en otro caso
La gráfica general de esta función se muestra en la Figura 7.1, y es evidente que se
trata de una función de densidad pues es no negativa e integra uno. Los parámetros
de esta distribución son los números a y b.
2.5
f(x)
2.0
1.5
1.0
1
b−a
0.5
0.0
x
a b
−0.5
0 1 2 3 4
Figura 7.1: Representación gráfica de la función de la distribución uniforme

U.N.A.
proea X la v.a. continua con distribución uniforme en el intervalo (a, b), entonces
X tiene las siguientes caracterı́sticas
a+b
E(X) =
2
(b − a)2
b) Var(X) =
12
e − eat
bt
c) MX (t) =
(b − a)t


 0 si x > a



 x
d) F(x) = si a ≤ x < b

 b−a



1 si x ≥ b

Demostración
Como X es una v.a. continua con distribución uniforme en el intervalo (a, b) entonces
su función de densidad de probabilidad es
1

 si a < x < b
b−a

f (x) =


0 en otro caso
con lo cual
a) por definición de esperanza para v.a. continua
Z b
1 1 b 1 a+b
Z ∞
E(X) = x f (x)dx = x dx = x2 = (b2 − a2 ) =

−∞ a b−a 2(b − a) a 2(b − a) 2
b) por definición de varianza para v.a continua

a + b 2 1 1 a + b 3 b
Z ∞
Var(X) = x− dx = x−
2 b−a 3(b − a) 2

−∞ a
1 h a+b 3 a+b 3 i 1 h b − a 3 a − b 3 i
= b− − a− = −
3(b − a) 2 2 3(b − a) 2 2
1 (b − a)2 (b − a)2
= =
3 4 12
c) por defincición de función generadora de momentos
Z ∞
1 1
Z b
1 b ebt − eat
tx
MX (t) = e dx = etx dx = etx =

−∞ b−a b−a a t(b − a) a (b − a)t
d) por definición de función de distribución

 
 0 si x < a  0 si x < a

 


 

 Z x 1  x
F(x) = P(X ≤ x) = du si a ≤ x < b = si a ≤ x < b

 0 b−a 
 b−a

 

 
1 si x ≥ b
 
1 si x > b

U.N.A.
2.0
F(x) = P(X < x)

1.5
1.0
0.5
0.0
x
−0.5
0 1 2 3 4 5
x
Figura 7.2: Representación gráfica de F(x) = b−a
ejeeje721 Supongase que tenemos una cuerda de 2m de longitud que queremos

cortar por un punto al azar a una cierta distancia de uno de los extremos. Sea X
la v.a. que represente el punto elegido; entonces
. a) Expresar y gráficar la función de densidad?
b) Calcular P(X ≤ 0, 7), P(X ≥ 1) y P(0, 5 ≤ X ≤ 1, 25)
c) Obtener E(X),Var(X) y MX (t), además a partir de la función de densidad obtener
y graficar la función de distribución
Desarrollo
Como X es la v.a que represente el punto elegido entre 0 y 2; entonces X ∼ uni f (0, 2)
a) Como el área debe ser 1, la altura del rectángulo será 12 , entonces la función de
densidad es:
1
si 0 < x < 2
f (x) = 2 .
0 en otro caso

U.N.A.
2.5
1
f(x) =
2.0
2−0
1.5
1.0
0.5
0.0
x
a b
−0.5
0 1 2 3 4
Figura 7.3: Gráfica X ∼ uni f (0, 2) del ejemplo ??
b) Calculemos ahora P(X ≤ 0, 7), P(X ≥ 1) y P(0, 5 ≤ X ≤ 1, 25)

Z 0,7
1 1 0,7 1
P(X ≤ 0, 7) = dx = x = (0, 7 − 0) = 0, 35
0 2 2 0 2
Z 2
1 1 2 1 1
P(X ≥ 1) = dx = x = (2 − 1) =
1 2 2 1 2 2
Z 1,25
1 1 1,25 1

P(0, 5 ≤ X ≤ 1, 25) = dx = x = (1, 25 − 0, 5) = 0, 375
0,5 2 2 0,5 2
c) Por la proposición 7.2.1
0+2 (2 − 0)2 1 e2t − e0t e2t − 1

E(X) = =1 Var(X) = = MX (t) = =
2 12 3 (2 − 0)t 2t


 0 si x < 0



 x
F(x) = si 0 ≤ x < 2

 2



1 si x ≥ 2


U.N.A.
2.0
x
F(x) =
1.5
2
1.0
0.5
0.0
x
−0.5
−1 0 1 2 3 4
Figura 7.4: Representación gráfica de F(x) del ejemplo ??
7.2.2. Distribución Normal

La distribución normal fue reconocida por primera vez por el francés Abraham de Moi-
vre (1667−1754). Posteriormente, Carl Friedrich Gauss (1777−1855) elaboró desarro-
llos más profundos y formuló la ecuación de la curva; de ahı́ que también se la conozca,
más comúnmente, como la campana de Gauss. La distribución de una variable nor-
mal está completamente determinada por dos parámetros, su media sı́mbolizada por
µ y su desviación estándar simbolizada por σ.
La distribución continua de probabilidad más importante de toda la estadı́stica es la
distribución de probabilidad normal.

U.N.A.
1 ∞ (x−u)2
f(x) = ⌠ e(−2( ))
1
σ2 dx
2 ⌡−∞
2πσ
Figura 7.5: Representación gráfica de f (x) de una variable aleatoria normal
defiecimos que una v.a. X tiene distribución de probabilidad normal si su función de

densidad de probabilidad está definida por la siguiente ecuación:
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) , para −∞ < x < ∞
2πσ2
en donde µ ∈ R y σ > 0 son los parámetros. Escribimos entonces X ∼ N(µ, σ2 ). La
gráfica de esta función de densidad tiene forma de campana como se puede apreciar
en la Figura No es inmediato pero es posible demostrar que E(X) = µ, y ello significa
que la campana esta centrada en este valor, el cual puede ser negativo, positivo o
cero. También puede demostrarse que Var(X) = σ2 , y que la distancia del punto µ a
cualquiera de los dos puntos en donde la función tiene puntos de inflexión es σ, por
lo tanto la campana se abre o se cierra de acuerdo a la magnitud de este parametro.
Caracterı́sticas de la distribución de probabilidad normal
La distribución de probabilidad normal con su curva tiene las siguientes caracte-
rı́sticas:
D . 1. La curva normal tiene forma de campana. La media, la moda y la mediana
de la distribución son iguales y se localizan en el centro de la distribución.
2. La distribución de probabilidad normal es simétrica alrededor de su media. Por o
tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad
después. El área total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se
aleja de la media en cualquier dirección. Esto significa que la curva se acerca al
eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.
La familia de la distribución de probabilidad normal

La forma de la campana de Gauss depende de los parámetros µ y σ. La media µ
indica la posición de la campana, de modo que para diferentes valores de µ la gráfica
es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar σ
determina el grado de apuntalamiento de la curva. Cuanto mayor sea el valor de σ,
U.N.A.
más se dispersarán los datos en torno a la media y la curva será más plana. Un valor
pequeño de este parámetro indica, por lo tanto, una gran probabilidad de obtener
datos cercanos al valor medio de la distribución.
Como se deduce, no existe una única distribución normal, sino una familia de dis-
tribuciones con una forma común, diferenciadas por los valores de sus medias y sus
varianzas.
Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas es-
tarán centradas en la misma posición y tendrán diferentes formas; tal como lo muestra
la Figura 7.6.
Probability density
Deviates
Figura 7.6: Curvas normales que tienen medias iguales y desviaciones estándar diferentes
Si las curvas tienen desviaciones estándar iguales y medias diferentes, las curvas serán
idénticas pero centradas en diferentes posiciones sobre el eje horizontal, ası́ como lo
muestra la Figura 7.7.

U.N.A.
Probability density
Deviates
Figura 7.7: Curvas normales que tienen medias diferentes y desviaciones estándar iguales
Si las curvas tienen medias diferentes y también sus desviaciones estándar son diferen-
tes entonces aparte de estar centradas en diferentes lugares del eje x, tendrá formas
diferentes; ası́ como lo muestra la Figura 7.8.

U.N.A.
Probability density
Deviates
Figura 7.8: Curvas normales que tienen medias diferentes y desviaciones estándar diferentes
La distribución normal estándar

En particular, decimos que la variable aleatoria X tiene una distribución normal están-
dar si tiene una distribución normal con parámetros E(X) = µ = 0 y Var(X) = σ2 = 1.
En este caso la función de densidad se reduce a la siguiente expresión
1 x2
f (x) = √ e− 2
2π
Para facilitar los cálculos se decidiá tabular las diferentes probabilidades para variable
aleatoria que sigue una distribución normal. Pero, puesto que serı́a imposible tener
una tabla para cada posible distribución normal, se elaboró solamente una, la tabla
de la distribución normal estándar.
De esta manera solo se tiene que transformar o estandarizar una distribución normal
especı́fica, se revisa la tabla, y se conoce la probabilidad. Para la estandarización se
debe realizar la siguiente operación.
proea X una variable aleatoria con distribución normal con parámetros µ y σ2 . En-
tonces la siguiente variable aleatoria tiene una distribución normal estándar
x−µ
Z= (7.2.3)
σ
Demostración
Para probar que Z sigue una distribución normal estandar debemos mostrar que
E(Z) = 0 y Var(Z) = 1. Recordemos además que si X ∼ N(µ, σ2 ) entonces E(X) = µ
y Var(X) = σ2 . Para realizar la demostración de esta proposición recordemos además
las propiedades de la esperanza y la varianza de una v.a. Por lo tanto
x − µ 1 1 1
E(Z) = E = E(X − µ) = [E(X) − µ] = [µ − µ] = 0
σ σ σ σ
x − µ 1 1 1
Var(Z) = Var = 2 Var(X − µ) = 2 Var(X) = 2 σ2 = 1
σ σ σ σ
U.N.A.
A la operación anterior se le conoce con el nombre de estandarización, y bajo tal

transformación se dice que la variable X ha sido estandarizada. Es común usar la letra
Z para denotar una variable aleatoria con distribución normal estándar, y seguiremos
nosotros también esa costumbre.
La proposición anterior parece muy modesta pero tiene una gran importancia ope-
racional pues establece que el cálculo de las probabilidades de una variable aleatoria
normal cualquiera se reduce al cálculo de las probabilidades para la normal estándar.
Explicaremos esta situación con más detalles. Suponga que X es una variable aleatoria
con distribución N(µ, σ2 ), y que deseamos calcular, por ejemplo, P(a < X < b), para
a < b números dados. Tenemos entonces que
a − µ X − µ b − µ
P(a < X < b) = P(a − µ < X − µ < b − µ) = P < <
σ σ σ
por lotanto
a − µ b − µ
P(a < X < b) = P <Z<
σ σ
La igualdad de estas probabilidades es consecuencia de la igualdad de los eventos.
De esta forma una probabilidad que involucra a la variable X se ha reducido a una
probabilidad que involucra a una variable Z.
Áreas bajo la curva normal

Una caracterı́stica que tiene cualquier distribución normal es que el área bajo la curva,
que representa la probabilidad de que la variable aleatoria tome ciertos valores X ≤ x,
se distribuye siempre en la misma proporción.
En la tabla de la distribución normal estándar, están registradas las áreas bajo la curva
normal que se encuentran a la derecha de los valores Z positivos, de esta forma solo
se necesita transformar la distribución normal de interés en una distribución normal
estándar mediante la fórmula, y el área a la derecha del valor z será el mismo que el
área a la derecha de x, esto es P(X ≤ x) = P(Z ≤ z).
ejeos coeficientes intelectuales de 600 aspirantes de cierta universidad se distribu-
yen aproximadamente de forma normal con una media de 115 y una desviación
estándar de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de
que:
L . a) tenga un coeficiente mayor de 120
b) tenga un coeficiente menor de 100
c) tenga un coeficiente menor de 122
d) tenga un coeficiente entre 115 y 125
e) tenga un coeficiente entre 90 y 105
Desarrollo
Según las condiciones del problema la v.a. X representa el coeficiente intelectual del
estudiante elegido y además X ∼ N(115, 144)
Para calcular las probabilidades de los distintos itens debemos transformar esta dis-
tribución normal en una distribución normal estándar (con media cero y desviación
estándar 1), para lo cual hay que cambiar el valor de x por un valor z con la fórmula
x − 115
z= . Entonces la probabilidad de que:
12
120 − 115
a) tenga un coeficiente mayor de 120 es: P(X > 120) = P Z > = P(Z > 0, 41)
12
La distribución ya transformada queda ası́:

U.N.A.
probability density
P(Z > 0.41)
115 120
u=115
Figura 7.9: Área para P(Z > 0,41)
Se busca el valor del área para 0 ≤ Z ≤ 0, 41 en la tabla de áreas bajo la curva normal
estandar, que es el valor 0,1591 . Y como el área a la derecha del valor z = 0, 41 es el
área que buscamos, entonces este es el resultado, es decir, la probabilidad de que un
aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es
P(X > 120) = P(Z > 0, 41) = 0, 5 − 0, 1591 = 0, 3409
b) tenga un coeficiente menor de 100 es:

100 − 115
P(X < 100) = Z < = P(Z < −1, 25)
12

U.N.A.
probability density
P(Z < − 1.25)
100 115
u=115
Figura 7.10: Área para P(Z < −1,25)
En la tabla de áreas bajo la curva normal estandar no se tabularon valores z negativos,

pero como la curva normal es simétrica, el área entre cero y el valor z = −1, 25 sı́mboli-
zado por A(−1, 25); es del mismo tamaño que el área entre cero y el valor z = 1, 25 dada
por A(1, 25), por lo que solo se necesita buscar en la tabla el área correspondiente al
valor positivo de z. Como el área que se busca esta a la izquierda de z = −1, 25, se tiene
que:
P(X < 100) = P(Z < −1, 25) = 0, 5 − A(1, 25) = 0, 5 − 0, 3944 = 0, 1056
c) tenga un coeficiente menor de 122 es:
122 − 115
P(X < 122) = Z < = P(Z < 0, 58)
12

U.N.A.
probability density
P(Z < 0.58)
122 115
u=115
Figura 7.11: Área para P(Z < 0,58)
estándar, que es el valor 0,2190. Y como el área a la izquierda del valor z = 0, 58 es el
área que buscamos, entonces el resultado a buscar es:
P(X < 122) = P(Z < 0, 58) = 0, 5 + 0, 2190 = 0, 7190
d) tenga un coeficiente entre de 115 y 125 es:

115 − 115 125 − 115
P(115 < X < 125) = <Z< = P(0 < Z < 0, 83)
12 12

U.N.A.
0.4
0.3
probability density
P(0< Z < 0.83)

0.2
0.1
0.0
115 125
u=115
Figura 7.12: Área para P(0 < Z < 0,83)
estándar, que es el valor 0,2967. Y como el área a buscar es el área entre z = 0 y z = 0, 83,
entonces el resultado a buscar es:
P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967
e) tenga un coeficiente entre de 90 y 105 es:

90 − 115 105 − 115
P(90 < X < 105) = <Z< = P(−2, 08 < Z < −0, 83)
12 12

U.N.A.
0.4
0.3
probability density
P(−2.08< Z < −0.83)

0.2
0.1
0.0
90−105 115
u=115
Figura 7.13: Área para P(−2,08 < Z < −0,83)
Se busca el valor del área para −2, 08 ≤ Z ≤ −0, 83 en la tabla de áreas bajo la curva
normal estandar, que es el valor 0,2967. Y como el área a buscar es el área entre z = 0
y z = 0, 83, entonces el resultado a buscar es:
P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967
7.2.3. Distribución ji−cuadrada

Si X1 , X2 , . . . , Xk son variables aleatorias normales e independientes. La suma de X12 , X22 , . . . , Xk2
se dice que es una variable aleatoria ji−cuadrada (χ2 ) con k > 0 grados de libertad,
es decir
χ2k = X12 + X22 + · · · + Xk2
Hay un número infinito de distribuciones ji−cuadrada, una correspondiente a cada
entero positivo k.
defiecimos que la variable aleatoria continua X tiene una distribución ji−cuadrada con
k grados de libertad (k entero positivo), si su función de densidad está dada por la
siguiente expresión:
 k
1 −1 − x
 √2k Γ( k ) x 2 e 2
 si 0 < x < ∞
2
f (x) =

0 si x ≤ 0


U.N.A.
chi−squared
k=1
k=2
0.15
k=3
k=4
k=5
0.10
p(x)
0.05
0.00
0 10 20 30 40
Figura 7.14: Gráfica de f (x) cuando el parámetro k toma los valores 1,2,3,4 y 5
Por la definición anterior; ji−cuadrada es una variable aleatoria continua con posibles
valores en el intervalo (0, ∞). Esta distribución tiene un solo parámetro denotado aqui
por la letra k, y al cual se le llama grados de libertad. También al parémetro
de ji−cuadrado se denota por la letra griega ν. A pesar de la aparente expresión
complicada de f (x), no es difı́cil comprobar que es efectivamente una función de
densidad de probabilidad. La gráfica de esta función para varios valores del parámetro
k aparece en la Figura 7.14.
Escribiremos simplemente X ∼ χ2 (k), en donde la letra griega χ se pronuncia ji o tam-
bién chi. Puede demostrarse que E(X) = k y Var(X) = 2k. La distribución ji−cuadrada
puede obtenerse como indican los siguientes resultados que dejaremos sin demostrar.
proi X es una v. a. que sigue una distribución normal tipificada (X ∼ N(0, 1)), entonces
la v.a. X 2 sigue una distribución ji−cuadrada con un grado de libertad (X 2 ∼ χ2 (1)).
Es decir, el cuadrado de una variable aleatoria con distribución normal estándar tiene
distribución ji−cuadrada con un grado de libertad. Por otro lado, el siguiente resulta-
do establece que la suma de dos variables aleatorias independientes con distribución
ji−cuadrada tiene distribución nuevamente ji−cuadrada con grado de libertad igual
a la suma de los grados de libertad de los sumandos.
proi X ∼ χ2 (n) y Y ∼ χ2 (m) son dos variables aleatorias independientes, entonces X +Y
tiene distribución χ2 (n + m).
En general si las v.a. X1 , X2 , . . . , Xn son independientes y si Xi ; ∀i = 1, 2, . . . , n tiene
una distribución χ2 con n j grados de libertad para j = 1, 2, . . . , k entonces la suma
X1 + X2 + · · · + Xn tiene una distribución χ2 con n1 + n2 + · · · + nk grados de libertad.
proean X1 , X2 , . . . , Xn una muestra aleatoria de una distribución normal con media µ y
n
Xi − µ 2
varianza σ2 . La distribución de la v.a. Y = ∑ es del tipo ji−cuadrado con
i=1 σ
n grados de libertad.
Caracterı́sticas de la distribución ji−cuadrada

La distribución ji−cuadrada es un caso particular de la distribución gamma.
U.N.A.
Las distribuciones ji−cuadradas son positivamente asimétricas.

Está distribución esta estrechamente ligada con muestras aleatorias de una distri-
bución normal.
En la práctica, las probabilidades ji−cuadradas, cuando k ≥ 30, pueden calcularse
empleando aproximaciones normales en la forma usual.
La distribución ji−cuadrado tiene muchas aplicaciones en inferencia estadı́stica,
por ejemplo en el test ji−cuadrado que consiste en una prueba de independencia
y bondad de ajuste, además en la estimación de varianzas.
También está involucrada en el problema de estimar la media de una población
normalmente distribuida y en el problema de estimar la pendiente de una recta de
regresión lineal, a través de su papel en la distribución t de Student que veremos
más adelante, y participa en todos los problemas de análisis de varianza, por su
papel en la distribución F de Snedecor, que es la distribución del cociente de dos
variables aleatorias de distribución ji−cuadrada e independientes.
7.2.4. Distribución t de Student

Esta distribución fue desarrollada por William Sealy Gossett, que trabajaba en el
departamento de fermentación de la cervecerı́a Guinness en Irlanda. Las circunstancias
en las que se llevan a cabo los procesos de fermentación en la producción de cerveza
demostraron a Gosset las limitaciones de la teorı́a de muestras grandes y le enfatizaron
la necesidad de un método correcto para el tratamiento de muestras pequeñas. Estas
circunstancias de su trabajo dirigieron a Gosset al descubrimiento de la distribución t,
quién publicó sus estudios sobre esta distribución en 1908 con el seudónimo Student.
Gossett se interesó en el comportamiento del valor de una v.a. Y ∼ N(0, 1) cuando se
utilizaba S en vez de σ, y particularmente en la discrepancia entre S y σ cuando S se
calcula de muestras muy pequeñas.
La distribución t está renacionada con muestras aleatorias de una distribución nor-
mal. Esta distribución, ası́ como la χ2 , han sido ampliamente aplicadas en problemas
importantes de inferencia estadı́stica. La distribución t es conocida también como
distribución de Student en honor de W.S. Gosset. La distribución t se define como
sigue:
Considerense dos variables aleatorias independientes Y y W , tales que Y tenga una
distribución normal tipificada y W tenga una distribución χ2 con n grados de libertad.
Sea X la variable aleatoria definida como:
Y
X=r
W
n
entonces, la distribución de X se denomina la distribución t con n grados de
libertad.
defiecimos que la variable aleatoria continua X tiene una distribución t con n grados
de libertad si su función de densidad está dada por cuya gráfica vemos en la figura
7.15:
Γ n+1
2
x2 − n+1
2
f (x) = √ 1 + para − ∞ < x < ∞
nπ Γ( n2 ) n
en tal caso se escribe X ∼ t(n)
n
Es posible demostrar que E(X) = 0, y Var(X) = para n > 2.
(n − 2)

U.N.A.
t−student
0.35
0.30
0.25
0.20
f(x)
0.15
0.10
0.05
0.00
−4 −2 0 2 4
Figura 7.15: Gráfica de f (x) t−student
Relación con muestras de una distribución normal

Supongamos que las variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra aleato-
ria de una distribución normal con media µ y varianza σ2 . Como es usual, se define a
1 n 1 n
la media muestral como X = ∑ Xi y a la varianza muestral como S2 = ∑ (Xi − X)2 .
n i=1 n i=1
Si se definen las variables aleatorias Y y W mediante las relaciones
n
√
(X − µ) n
∑ (Xi − X)2 nS2
i=1
Y= y W= =
σ σ2 σ2
Vemos que Y ∼ N(0, 1) y W ∼ χ2 (n − 1). Además se sabe que si X y S2 son variables
aleatorias que resultan de muestras aleatorias normales entonces son independientes.
Y
Por lo que la v.a. T definida por la relación T = q tiene distribución t con n − 1
W
n−1
grados de libertad. Entonces
√ √
(X − µ) n (X − µ) n √
σ σ (X − µ) n − 1
T= s = √ =
nS2 nS S
σ2 √
n − 1σ
n−1
Un aspecto importamte es que ni el valor de T ni la distribución de T dependen del
valor de la varianza σ2 . Por lo tanto podemos utilizar la distribución t en situaciones de
muestreo sobre poblaciones normales que cumplan con las siguientes caracteristicas:
las muestras extraidas son pequeñas (n < 30) y
la varinza σ2 es desconocida.

U.N.A.
Las caracterı́sticas de la distribución t

1. Es una distribución continua.
2. Tiene forma de campana y es simétrica.
3. Es una familia de curvas.
4. Todas tienen la misma media de cero, pero sus desviaciones estándar difieren de
acuerdo al tamaño de la muestra.
5. La distribución t es más baja y dispersa que la distribución normal. Cuando el
tamaño de la muestra se incrementa, la distribución t se aproxima a la normal.
En resumen la distribución t se puede encontrar en los siguientes contextos:
proi las variables aleatorias Y ∼ N(0, 1) y W ∼ χ2 (n) son independientes, entonces la
v.a.
Y
X = q ∼ t(n)
W
n
proean X1 , X2 , . . . , Xn variables aleatorias independientes cada una de ellas con distri-

bución N(µ, σ2 ). Entonces la v.a.
√
(X − µ) n − 1
T= ∼ t(n − 1)
S
1 n 2= 1
n
donde X = ∑
n i=1
Xi y S ∑ (Xi − X)2.
n i=1
7.2.5. Distribución exponencial

El modelo de probabilidad de la exponencial tiene su origen en el proceso de Poisson.
Una probabilidad de Poisson se relaciona con la probabilidad de ocurrencia de un
número especı́fico de éxitos en intervalos de tiempos finitos, donde el número de éxitos
es la variable aleatoria.
Invirtiendo los papeles de una variable aleatoria de Poisson se tiene lo que se llama un
modelo exponencial. Una variable aleatoria exponencial X es el intervalo de tiempo,
o espacio requerido para obtener un número especifico de éxitos.
La distribución exponencial se utiliza a menudo en problemas prácticos para repre-
sentar la distribución del tiempo que transcurre antes de la ocurrencia de un suceso.
La distribución exponencial se usa para modelar intervalos de tiempos entre sucesos.
Es muy usada para simular el tiempo entre llegadas cuando las llegadas son comple-
tamente aleatorias y para modelar tiempo de servicio, en los sistemas de colas.
defiecimos que una variable aleatoria continua X tiene una distribución exponencial
con parámetro λ > 0, y escribimos X ∼ exp(λ), cuando su función de densidad de
probabilidad es
λe−λx si x > 0
f (x) = .
0 si x ≤ 0
La gráfica de esta función cuando el parámetro λ toma los valores particulares 0,5;
1,0 y 1,5 se muestra en la Figura 7.16.
La correspondiente función de distribución de esta v.a. está dada por
0 si x ≤ 0
F(x) = P(X ≤ x) = .
1 − e−λx si x > 0
La gráfica de esta función cuando el parámetro λ toma los valores particulares 0,5;
1,0 y 1,5 se muestra en la Figura 7.17.

U.N.A.
distribucion exponencial
0.5
λ = 0.5
λ=1
λ = 1.5
0.4
0.3
f(x)
0.2
0.1
0.0
0 1 2 3 4 5 6 7
Figura 7.16: Gráfica de f (x) de la exponencial
distribucion exponencial
1.0
0.8
0.6
f(x)
λ = 0.5
λ=1
λ = 1.5
0.4
0.2
0.0
0 1 2 3 4 5 6 7
Figura 7.17: Gráfica de F(x) de la exponencial

U.N.A.
7.3. PROBLEMAS
proea X la v.a. continua con distribución exponencial, entonces X tiene las siguien-
tes caracterı́sticas
1
S . a) E(X) =
λ
1
b) Var(X) = 2
λ
λ
c) MX (t) =
λ−t
Demostración
Por definición de esperanza se tiene que
1 ∞ 1
Z ∞ Z ∞
E(X) = x f (x)dx = λ xe−λx dx = −e−λx x + =
−∞ 0 λ 0 λ
2x 2 ∞ 2
Z ∞ Z ∞
E(X 2 ) = x2 f (x)dx = λ x2 e−λx dx = −e−λx x2 + + 2 = 2
−∞ 0 λ λ 0 λ
Entonces la varianza está dada por
2 1 2 1
Var(X) = 2 − = 2
λ λ λ
Finalmente por definición de función generadora de momentos se tiene que
λe−(λ−t)x ∞
Z ∞ Z ∞ Z ∞
λ
MX (t) = ext f (x)dx = λ ext e−λx dx = λ e−(λ−t)x dx = =
−∞ 0 0 −(λ − t) 0 λ−t
ejeuponga que el tiempo en minutos que un usuario cualquiera permanece revisan-
1
do su correo electrónico sigue una distribución exponencial de parámetro λ = .
5
Calcule la probabilidad de que un usuario cualquiera permanezca conectado al
servidor de correo
S . a) menos de un minuto
b) más de un ahora
c) Calcula la esperanza, varianza y la función generadora de momentos
Solución
a) Para este primer inciso tenemos que
Z 1
1 1 1 1
1
1
P(X < 1) = e− 5 x dx = − 5e− 5 x = 1 − e− 5 = 0, 1813
0 5 5 0
b) Siguiendo el mismo razonamiento del inciso anterior y teniendo en cuenta que una
hora equivale a 60 minutos se tiene que
1 −1x 1
Z ∞
1 ∞

P(X > 60) = e 5 dx = − 5e− 5 x = e−12 = 6, 14 · 10−6
60 5 5 60
c) Tomando en cuenta la proposición
7.3. Problemas
Distribución binomial
1. Sea X una variable aleatoria con distribución bin(n, p) tal que E(X) = 4 y
Var(X) = 2. Cuáles son los valores de n y p?
2. Sea X una variable aleatoria con distribución bin(n, p). Demuestre que la va-
riable Y = n − X tiene distribución bin(n, 1 − p). Proporcione una explicación
probabilı́sta de este resultado.
3. Sea X con distribución bin(n, p). Demuestre que para x = 0, 1, . . . , n−1, se cumple
la siguiente fórmula. Esta expresión permite calcular las probabilidades de esta
distribución de una forma iterativa.
p(n − x)
P(X = x + 1) = P(X = x)
(1 − p)(x + 1)
4. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada
cara caiga exactamente 3 veces.
U.N.A.
7.3. PROBLEMAS
5. Se lanza una moneda equilibrada 2n veces. Calcule la probabilidad de que ambas

caras caigan el mismo número de veces.
6. Sea X una variable aleatoria con distribución bin(n, p). Demuestre que
0 ≤ Var(X) ≤ E(X)
7. Suponiendo que es igualmente probable que nazca un hombre (H) o una mujer
(M), y considerando la observación de 6 nacimientos. Cuál de los siguientes
eventos es más probable que ocurra?
a) MHHMHM
b) MMMMHM
c) HMHMHM
8. La probabilidad de que un paciente se recupere de una extraña enfermedad es
0, 4. Si se sabe que 15 personas contraen esa enfermedad,
a) Haga un histograma donde represente la distribución binomial para este caso.
b) Cuál es la probabilidad de que sobrevivan al menos 10?
c) Cuál es la probabilidad de que sobrevivan de 3 a 8?
d) Calcule la media y la varianza de esta distribución binomial.
9. En la ciudad la necesidad de dinero para comprar drogas se establece como la
razón del 75 % de los robos. Encuentre la probabilidad de que entre los siguientes
cinco casos de robo:
a) dos resulten de la necesidad de dinero para comprar drogas
b) al menos tres resulten de la necesidad de dinero para comprar drogas
c) Represente esta distribución binomial en un histograma
d) Calcule la media y la varianza de esta distribución binomial
10. Un prominente médico afirma que 70 % de las personas con cáncer de pulmón
son fumadores empedernidos. Si su aseveración es correcta:
a) encuentre la probabilidad de que de 10 de tales pacientes menos de la mitad
sean fumadores empedernidos
b) encuentre la probabilidad de que de 10 de los pacientes con cáncer de pulmón
ninguno sea fumador empedernido
11. De acuerdo con un estudio publicado por un grupo de sociólogos de la Universi-
dad de Massachussets aproximadamente el 60 % de los consumidores de Valium
en el estado de Massachussets tomaron Valium por primera vez debido a pro-
blemas psicológicos. Encuentre la probabilidad de que entre los siguientes ocho
consumidores entrevistados en este estado:
a) tres comenzaron a tomar Valium por problemas psicológicos.
b) al menos cinco comenzaron a consumir Valium por problemas que no fueron
psicológicos
12. De acuerdo a una encuesta a nivel nacional en Estados Unidos de la universidad
de Michigan a estudiantes universitarios de último año revela que el 70 % de
los estudiantes desaprueba el consumo diario de la mariguana. Si se seleccionan
doce estudiantes al azar y se les pide su opinión, encuentre la probabilidad de
que el número de los que desaprueban fumar mariguana todos los dı́as sea:
a) entre siete y nueve
b) a lo más cinco
c) no memos de ocho
d) Represente esta distribución binomial en un histograma
e) Calcule la media y la varianza de esta distribución binomial.
13. Un estudio examinó las actitudes hacia los antidepresivos. El estudio reveló que
aproximadamente el 70 % cree que los antidepresivos en realidad no curan nada,
sólo encubren el problema real. De acuerdo con este estudio
a) cuál es la probabilidad de que al menos tres de las siguientes cinco personas
seleccionadas al azar sean de esta opinión?
U.N.A.
7.3. PROBLEMAS
b) Represente esta distribución binomial en un histograma

c) Calcule la media y la varianza de esta distribución binomial.
14. El departamento de mercadotecnia de Kellogg Company planea realizar una
investigación para determinar si los consumidores de cereal en hojuelas pueden
distinguir su cereal favorito de otros. Para probar el cuestionario y el procedi-
miento a ser usado se invitó a ocho personas a participar en un experimento. Se
les colocó frente a cinco pequeños tazones de cereal en hojuelas marcados con
las letras A, B,C, D, y E para que identificaran su cereal favorito. A las personas
se les informó que solo uno de los tazones contenı́a su cereal favorito.
a) Si una persona no pudo identificar su cereal favorito y supuso que estaba en
el tazón C. Cuál es la probabilidad de que la persona haya adivinado correcta-
mente?
b) Cuál es la variable aleatoria en este problema?
c) Es la variable aleatoria discreta o continua? Por qué?
d) Suponga que a las ocho personas les fue imposible identificar su cereal favorito
y trataron de adivinar en cual tazón estaba. Cuál es la probabilidad de que
ninguno de los ocho haya adivinado correctamente?
e) Desarrolle una distribución binomial para este experimento
f) Calcule la media, varianza, y desviación estándar de la distribución.
g) Represente la distribución de probabilidad en una gráfica.
h) Suponga que siete de las ocho personas identifican el cereal que más les gusta.
Es razonable decir que ellos adivinaron? Explique. Cuál es tu conclusión?
i) Por qué es la distribución binomial apropiada para este problema?
15. Al determinar la concentración letal de una sustancia presente en agua conta-
minada, se encuentra que una cierta concentración mata el 20 % de los peces
que se exponen a ella durante 24 horas. Se colocan 20 peces en un tanque con
esta concentración de la sustancia. Calcular la probabilidad de que a las 24 hs.
a) sobrevivan exactamente 14
b) sobrevivan por lo menos 10
c) sobrevivan cuando mucho 16
d) sobrevivan entre 5 y 10
16. Harley Davidson, director de control de calidad de la compañı́a de automóvi-
les Kyoto Motor, se encuentra realizando su revisión mensual de trasmisiones
automáticas . En el procedimiento, se retiran 10 trasmisiones de la pila de com-
ponentes y se les revisa en busca de defectos de fabricación. A lo largo del tiempo
solo, el 2 % de las trasmisiones tienen defectos de fabricación (suponga que los
defectos se presentan de manera independiente en diferentes trasmisiones).
a) Cual es la probabilidad de que la muestra de Harlley contenga mas de dos
trasmisiones con defectos de fabrica?
b) Cual es la probabilidad de que ninguna de las trasmisiones elegidas tengan
defectos de fabrica?
17. Harry Ohme esta a cargo de la sección de electrónica de una gran tienda de-
partamental. Se has dado cuenta de que la probabilidad de que un cliente que
solamente se encuentra curioseando compre algo es de 0,3. Suponga que 15
clientes visitan la sección de electrónica cada hora.
a) Cual es la probabilidad de que almenos una de las personas que curiosea compré
algo durante una hora dada?
b) Cual es la probabilidad de que almenos cuatro personas que curiosean compre
c) Cual es la probabilidad de que ninguna de las personas que curiosean compre
d) Cual es la probabilidad de que no más de cuatro personas que curiosean compre
18. Un aparato de radio que no funciona se agrupa accidentalmente con 5 radios
que funcionan. Cual es la probabilidad de que se escoja un conjunto de tres
radios, el aparato que no funciona este entre los tres escogidos?
19. Una abogada especializada en litigios por drogas estima que gana el 70 % de
sus casos que van a la corte. Acaba de leer Drogas : Uncasoparalegalizacin en
el número del 3 de octubre de 1989 y quiere usar parte de los argumentos del
U.N.A.
7.3. PROBLEMAS
artı’culo en su próximo juicio. Considere su probabilidad de éxito estimado, si

actualmente representa a 5 acusados en distintos casos. Cuál es la probabilidad
de qué:
a) gane por lo menos tres casos?
b) por lo menos un caso?
20. En el pasado, Phin Anderson ha cometido errores en el 5 % de las declaraciones
de impuestos que prepara. Cual es la probabilidad de que no cometa errores en
las primeras 7 declaraciones que prepara para esta año fiscal?
21. Un jefe de proyectos ha comprobado que un subcontratista falla en entregar
a tiempo las ordenes corrientes, en aproximadamente el 20 % de las ocasiones.
El jefe de proyectos tiene 6 ordenes que este subcontratista se comprometió a
entregar. Calcule la probabilidad de que:
a) el subcontratista entregue todas las ordenes
b) el subcontratista entregue almenos cuatro ordenes
c) el subcontratista entregue exactamente 5 ordenes
22. Un complejo sistema electrónico esta construido con cierto número de compo-
nentes de apoyo en sus subsistema. Un subsistema contiene cuatro componentes
idénticos, cada uno con una probabilidad de 0,2 de fallar en menos de 1000 hs. El
subsistema funciona si dos componentes cualesquiera de los cuatro trabajan en
forma adecuada. Se suponen que los componentes operan independientemente.
a) Encuentre la probabilidad de que exactamente dos de cuatro componentes re-
sistan mas de 1000hs.
b) Encuentre la probabilidad de que el subsistema funcione por mas de 1000hs.
23. Sobre una mesa se derraman 20 monedas. Calcular la probabilidad de caigan:
a) por lo menos 5 caras
b) más de 15 caras
c) entre 12 y 17 caras
d) a lo sumo tres caras
e) como mı́nimo dos caras
f) cuando mucho cuatro caras
24. Un examen de opción múltiple esta compuesto de 15 preguntas, con cinco res-
puestas posibles cada una, de las cuales solamente una es la correcta. Supóngase
que uno de los estudiantes que realiza el examen contesta las preguntas al azar.
Cual es la probabilidad de que conteste al menos 10 preguntas correctamente?
25. Un sistema para detectar incendios utiliza tres celdas sensibles a la temperatura
que actúan independientemente, talque una o más pueden activar la alarma.
Cada celda tiene una probabilidad p = 0, 8 de activar la alarma al alcanzar la
temperatura de 100 grados Celsius o más. Sea Y el número de celdas que activan
la alarma cuando la temperatura alcanza 100 grados. Encuentre la probabilidad
de que la alarma funcione cuando la temperatura alcanza los 100 grados.
26. Suponga que un lote de producción de 40000 hornos de microondas incluye
32000 sin ningún defecto, que no requieren en absoluto ningún ajuste. Sin em-
bargo el departamento de control de calidad, sin conocer el dato referente al
lote de producción, toma una muestra aleatoria de 10 hornos para calcular la
calidad global.
a) Cuál es la probabilidad de que la muestra sea dividida equitativamente es decir
5 hornos defectuosos y 5 no defectuosos?
b) Cuál es la probabilidad de que se encuentre a lo sumo 3 defectuosos?
c) Cuál es la probabilidad de que se encuentre por lo menos un horno no defec-
tuoso?
d) Cuál es la probabilidad de que a lo mas 6 sean no defectuosos?
27. A la larga, el 20 % de los gerentes que reciben capacitación obtienen la califi-
cación de sobresaliente, el 50 % la de aceptable y el 30 % la de insatisfactorio.
En una muestra de 20 gerentes seleccionados al azar, encuentre las siguientes
probabilidades:
a) exactamente 4 gerentes son calificados con sobresaliente
b) al menos 4 gerentes son calificados con sobresaliente
c) exactamente 15 gerentes son calificados con sobresaliente o aceptable

U.N.A.
7.3. PROBLEMAS
d) al menos 15 gerentes son calificados con sobresaliente o aceptable

28. Una cadena de moteles ha adoptado la polı́tica de hacer un descuento del 3 %
a los clientes que paguen en efectivo en vez de hacerlo con tarjeta de crédito.
Su experiencia indica que el 30 % de los clientes aceptan el descuento. Sea Y el
número de personas que aceptan el descuento entre los próximos 20 clientes.
a) Suponiendo que las probabilidades binomiales sean aplicables, encuentre la pro-
babilidad de que exactamente 5 entre los próximos 20 clientes acepten el des-
cuento.
b) Encuentre P(5o menos clientes acepten el descuento)
c) Cuál es el valor esperado y la desviación estándar del número de personas que
aceptarán el descuento?
29. Un fabricante de medicamentos afirma que solo el 10 % que resultan efectivas
en las pruebas con animales pasan el resto de las que se le exige para su comer-
cialización. Actualmente, el fabricante tiene 8 nuevos medicamentos de probada
efectividad en experimentos con animales y que esperan pasar en las siguientes
pruebas.
a) Encuentre la probabilidad de que ninguno de los 8 medicamentos sea comercia-
lizado.
b) Encuentre la probabilidad de que al menos 2 de ellos sean comercializados.
c) Encuentre el número esperado de medicamentos comercializados entre los 8
nuevos medicamentos
30. Una compañı́a pequeña utiliza un servicio de paqueterı́a para enviar los pedidos
de quesos especiales que son para obsequios. La compañı́a ha encontrado que
el 90 % de los paquetes se entregan a tiempo. Se envı́a un embarque de 20
paquetes. Sea Y = número de paquetes embarcados a tiempo. Suponiendo que
las hipótesis binomiales se cumplen calcular:
a) la probabilidad de que de al menos un paquete se entregue a tiempo
b) la probabilidad de que a lo sumo 6 paquetes no se entreguen a tiempo
c) la probabilidad de que por lo menos 7 paquetes se entreguen a tiempo
d) el valor esperado y la varianza del número de paquetes embarcados a tiempo
31. La revista Statistical Adstrac (U.S) informa que la mediana del ingreso familiar
en Estados Unidos durante 1985 fue 27755 dólares. En cuatro familias seleccio-
nadas al azar, calcular la probabilidad de que:
a) las cuatro tuvieron ingresos mayores que 27755 dólares en 1985
b) una de las cuatro haya tenido ingresos menores 27755 dólares en 1985
32. Entre personas que donan sangre en una clı́nica, 80 % tienen RH+, es decir
el factor Rhesus en su sangre. Cinco personas donan sangre en al clı́nica en
determinado dı́a.
a) Calcular la probabilidad de que al menos una de las cinco no tenga el factor
RH+.
b) Calcular la probabilidad de que cuando mucho 4 de las 5 tenga sangre del tipo
RH+.
Distribución Geométrica
1. Considere una urna con 3 bolas negras y 5 bolas blancas. Se escoge una bola al
azar, se registra su color, y después se regresa a la urna. Cuántas extracciones
en promedio se necesitan realizar hasta obtener una bola negra por primera
vez?
2. Sea X una variable aleatoria con distribución geo(p). Demuestre que para cua-
lesquiera a, b = 0, 1, 2, . . . se cumple la siguiente propiedad llamada de pérdida
de memoria: P(X ≤ a + b|X ≤ a) = P(X ≤ b).
Distribución Poisson
1. Sea X una variable aleatoria con distribución Poisson(λ). Demuestre que para
todo x = 0, 1, 2, . . . se cumple la siguiente fórmula. Esta expresión permite
calcular las probabilidades Poisson de una forma iterativa.
λ
P(X = x + 1) = P(X = x)
(x + 1)
2. Sea X una variable aleatoria con distribución Poisson(λ). Demuestre que la
(1 + e−2λ )
probabilidad de que X tome un valor par es .
2
U.N.A.
7.3. PROBLEMAS
3. El número de computadoras que fallan por mes en un laboratorio de cómputo

tiene una distribución Poisson con un promedio mensual de λ = 2 máquinas
descompuestas. El laboratorio tiene capacidad para reparar hasta dos máqui-
nas por mes. Cuando se descomponen más de dos máquinas, las restantes se
envı́an fuera del laboratorio para su reparación.
a) Cuál es la probabilidad de que en un mes cualquiera sea necesario enviar
máquinas fuera del laboratorio para su reparación?
b) Responda al inciso anterior cuando se reduce la capacidad de reparación del
laboratorio a una computadora por mes.
c) Cuál es el nḿero de computadoras con falla más probable en un mes?
4. Sea Y una variable aleatoria que tiene una distribución de Poisson cuyo pro-
medio es de 2. Calcular:
a) P(Y = 4)
b) P(Y ≥ 4)
c) P(Y ≤ 4)
5. Si la probabilidad de que un tornillo sea defectuosa es 0,008. Cuál es la proba-
bilidad de que en una caja con 100 tornillos contenga uno o más defectuosos?
6. Supongamos que la probabilidad de que una persona reciba una inyección de
penicilina y sufra una reacción desfavorable es de 0,0002. Si 3000 personas
reciben aplicaciones de este medicamento. Cuál es la probabilidad de que
0,1,2,3,4 o 5 personas reaccionen mal?
7. El número de llamadas telefónicas que entra en una central de edificio de
oficinas es de 4 minutos en promedio.
a) Calcular la probabilidad de que no lleguen llamadas en un determinado pe-
riodo de un minuto.
b) Calcular la probabilidad de que por lo menos lleguen 4 llamadas en un periodo
de un minuto.
c) Calcular la probabilidad de que por lo menos lleguen dos llamadas en un
periodo determinado de dos minutos.
8. Se certifica la calidad de los discos para computadora pasándolos por un cer-
tificador que cuenta el número de pulsos faltantes. Una determinada marca
de discos para computadora tiene en promedio 0,1 pulsos faltantes por discos.
a) Calcular la probabilidad de que el siguiente disco que se inspeccione no le falte
pulso.
b) Calcular la probabilidad de que al siguiente disco que se inspeccione le falte
mas de un pulso.
c) Calcular la probabilidad de que a ninguno de dos discos inspeccionados le
falten pulsos.
9. En Estados Unidos se ha establecido el limite máximo nacional de velocidad
de 50 millas por hora, desde 1974. Kamerud que ha estudiado los efectos
de esta ley, informa que las frecuencia de accidentes fatales en las carreteras
interestatales en 1975, estando vigente el limite, es aproximadamente 19 · 109
millas−vehı́culo.
a) Calcular la probabilidad de que se tengan cuando mucho 15 accidentes fatales
en 109 millas−vehı́culo.
b) Calcular la probabilidad de que por lo menos se tengan 20 accidentes fatales
en 109 millas−vehı́culo.
10. En un sistema de computo de tiempo compartido, el número de peticiones de
telepuerto es 0,20 por milisegundo, en promedio y sigue una distribución de
Poisson.
a) Calcular la probabilidad de que no lleguen peticiones durante el siguiente
milisegundo.
b) Calcular la probabilidad de que no lleguen peticiones durante los siguiente
tres milisegundo.
11. Los grandes almacenes Bon han determinado que la demanda de cierto modelo
de cámara fotográfica tiene una distribución de Poisson con una media de 2 por
semana. La directora del departamento de cámara quiere estudiar la demanda
actual para ver si se justifica ofrecer clases de fotografı́a. Acaba de leer un
articulo sobre el paisaje en el American Photographer y piensa que ese tipo
de clases seria efectivo.
U.N.A.
7.3. PROBLEMAS
a) Determinar la distribución de probabilidad de la demanda semanal

b) Si la tienda guarda 4 camaras de estas en una semana dada. Cuál es la pro-
babilidad exceda al inventario?
12. Los autos llegan al lavadero 22 con una tasa promedio de 9 por hora. Si la
llegada por hora sigue una distribución de Poisson, averigue la probabilidad
de que lleguen 15 o más autos durante una hora dada de operación.
13. Se estima que el número de taxis que esperan recoger un pasajero delante de
la terminal de ómnibus de Asunción tiene una distribución de Poisson con una
media de 5,5 taxis.
a) Averigue la probabilidad de, en una observación aleatoria haya exactamente
6 taxis esperando.
b) Averigue la probabilidad de, en una observación aleatoria haya más de 10 taxis
esperando.
c) Averigue la probabilidad de, en una observación aleatoria no haya taxis espe-
rando.
14. La concertista de piano Donna Prima se preocupa cada vez más por el número
de tosidos que se presentan en la audiencia justo antes que empiece a tocar.
Durante su ultima gira, Donna estimo un promedio de 8 tosidos justo antes
de empezar su concierto. La señora prima le ha prometido a su director que si
escucha más de 5 tosidos en el concierto esa noche, se rehusará a tocar. Cuál
es la probabilidad de que la artista toque esa noche?
15. En promedio cinco pájaros chocan contra el monumento en Washington y
mueren por este motivo cada semana. Bill Garey, un oficial del Servicio del
Parque Nacional de Estados Unidos, ha solicitado que el congreso estadouni-
dense asigne fondos para adquirir equipos que alejen a los pájaros de dicho
monumento. Un subcomité del congreso le ha respondido que pueden asig-
narle fondos para tal fin a menos que la probabilidad de que mueran más de
tres pájaros cada semana sea mayor que 0,70. Se destinaran los fondos para
la compra de los equipos que alejen a los pájaros del monumento?
16. El número de nudos en un tipo particular de madera tiene una distribución de
Poisson con una media de 1,5 nudos de 10 pies cúbicos de madera. Encuentre
la probabilidad de que un bloque de esta madera de 10 pies cúbico tenga a lo
más un nudo.
17. El 3 % de las calculadoras de bolsillo de un modelo en particular fallan durante
el primer mes de operación. F − Mart acaba de recibir un lote de 100 de estas
calculadoras.
a) Averigue la probabilidad de que ninguna calculadora falle
b) Averigue la probabilidad de que fallen más de tres calculadoras
c) Averigue la probabilidad de que menos de 2 calculadoras fallen
18. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por
cobrar sean correctas. Se seleccionó una muestra aleatoria de 200 cuentas para
auditarlas.
a) Cuál es la probabilidad de que ninguna de las cuentas tenga errores ?
b) Cuál es la probabilidad de que 5 de las cuentas tenga errores ?
c) Cuál es la probabilidad de que más de 5 cuentas tenga errores ?
19. En los últimos 20 años, solo el 2 % en promedio de los cheques endosados a la
American Herat Association fueron rechazados. Este mes, la asociación recibió
200 cheques. Cuál es la probabilidad de que:
a) exactamente 10 de ellos sean rechazadas
b) exactamente 5 de ellos sean rechazadas
20. El centro contencioso del condado de Orange, en California maneja varios
tipos de litigios, pero casi todos ellos son del tipo conyugal. De hecho 96 % de
los pleitos que atiende el centro son de esta naturaleza. Cuál es la probabilidad
de que de 80 litigios atendidos por el centro exactamente 7 no sean del tipo
conyugal?
Distribución Uniforme
1. Sea X una variable aleatoria con distribución uniforme en el intervalo (1, 4).
a) Obtener la función de densidad para esta distribución uniforme
b) Calcular la probabilidad de que X este entre 1 y 3
U.N.A.
7.3. PROBLEMAS
c) Calcular la probabilidad de que X sea mayor que 2

d) Obtener la esperanza y la varianza de esta distribución
2. Se escoge al azar un número del intervalo (0, 2)
a) Obtener la función de densidad para esta distribución uniforme
b) Calcular la probabilidad de que el número elegido este entre 1 y 1,5
c) Calcular la probabilidad de que el número elegido sea mayor que 0,5
d) Obtener la esperanza y la varianza de esta distribución
3. Se escogen al azar dos números del intervalo (0, 3). Sea X la variable aleatoria
que indica la suma de los dos números elegidos. Si X sigue una distribución
uniforme
a) Obtener la función de densidad para X
b) Calcular la probabilidad de que X este entre 2 y 4
c) Calcular la probabilidad de que el número elegido sea menor que 4
d) Obtener la esperanza y la varianza de X
Distribución Normal
1. Sea X con distribución N(10, 25). Calcule
a) P(X ≥ 10)
b) P(X < 0)
c) P(0 < X ≤ 10)
d) P(X ≥ 20)
e) P(−20 < X ≤ 10)
2. Sea X con distribución N(0, 100). Calcule
a) P(X ≤ 10)
b) P(X > 0)
c) P(0 < X ≤ 40)
d) P(X ≥ 30)
e) P(−10 < X ≤ 10)
3. Encuentre x tal que
a) F(x) = 0, 8666
b) 1 − F(x) = 0, 9154
4. Un investigador reporta que unos ratones vivirán un promedio de 40 meses
cuando sus dietas se restringen drásticamente y después se enriquecen con
vitaminas y proteı́nas. Suponga que la vida de tales ratones se distribuye nor-
malmente con una desviación estándar de 6,3 meses, encuentre la probabilidad
de que un ratón viva:
a) Más de 32 meses
b) Menos de 28 meses
c) Entre 37 y 49 meses
d) Entre 45 y 50 meses
e) Entre 40 y 43 meses
f) Cuál es la probabilidad de que de seis ratones 4 vivan más de 30 meses?
5. Las barras de centeno que cierta panaderı́a distribuye a las tiendas locales
tienen una longitud promedio de 30 centı́metros y una desviación estándar de
2 centı́metros. Suponga que las longitudes se distribuyen normalmente, qué
porcentaje de las barras son
a) Más largas de 31,7 cm?
b) Entre 29,3 cm. y 33,5 cm de longitud?
c) Entre 32 cm y 35 cm?
d) Más cortas de 38 cm?
e) Entre 27,5 cm. y 30 cm?
f) Cuál es la probabilidad de que de 4 barras, tres midan más de 35 cm?
6. Un abogado va todos los dı́as de su casa a su oficina en el centro de la ciudad.
El tiempo promedio del viaje es 24 minutos, con una desviación estándar de
3,8 minutos. Si las duraciones de los viajes están distribuidas normalmente:
a) Cuál es la probabilidad de que un viaje tome al menos 12 hora?

U.N.A.
7.3. PROBLEMAS
b) Si la oficina abre a las 9:00 a.m. y él sale de su casa diariamente a las 8:45
a.m., qué porcentaje de las veces llega tarde al trabajo?
c) Si sale de su casa a las 8:35 a.m. y el café se sirve en la oficina de las 8:50 a.m.
a las 9:00 a.m., cuál es la probabilidad de que llegue a la hora del café?
d) Encuentre cual es el tiempo a partir del cual que duran el 15 % de los viajes
más lentos?
e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como
máximo 21 hora.
7. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de
174,5 cm y una desviación estándar de 6,9 cm., cuántos de estos estudiantes
se esperarı́a que tuvieran alturas
a) Menores de 160 cm?
b) Entre 171,5 cm y 182 cm?
c) Mayores a 165 cm?
d) Entre 174,5 cm y 180 cm?
e) Entre 180 cm y 195 cm?
f) Menores de 185 cm?
g) Cuál es la probabilidad de que de cinco estudiantes, al menos 3 midan más de
180 cm?
h) Cuál es la probabilidad de que de 3 estudiantes, ninguno mida menos de 160
cm?
8. Una estación de radio encontró que el tiempo promedio que una persona sinto-
niza esa estación es de 15 minutos con una desviación estándar de 3,5 minutos.
Cuál es la probabilidad de que un radioescucha sintonice la estación por:
a) más de 20 minutos?
b) entre 15 y 18 minutos?
c) entre 10 y 12 minutos?
d) Cuantos minutos como máximo sintonizan la estación el 70 % de los radioes-
cuchas?
e) Cuál es la probabilidad de que de 8 radioescuchas, al menos 7 sintonicen la
estación por más de 5 minutos?
9. Un analista financiero señala que (conforme a su probabilidad subjetiva) el
precio Y de los bonos de gobierno a largo plazo, con un valor de 1000 dólares,
tendrá al cabo de un año una distribución normal con un valor esperado de
980 dólares y desviación tı́pica de 40 dólares.
a) Encuentre P(Y ≥ 1000)
b) Encuentre P(Y ≤ 940)
c) Encuentre P(960 ≤ Y ≤ 1060)
10. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que
se basa en un sistema de pago a destajo) tiene una distribución normal con
un valor esperado de 5,10 dólares y una desviación estándar de 0,40 dólares.
a) Encuentre la probabilidad de que el salario por hora de un trabajador sea
superior a 5,40 dólares
b) Encuentre la probabilidad de que el salario por hora de un trabajador se
encuentre entre 4,70 y 5,50 dólares
c) Encuentre la probabilidad de que el salario por hora sea superior al salario
mı́nimo de 3,90 dólares
11. Se ha determinado que la vida útil de cierta marca de llantas radiales tiene
una distribución normal con media 38000 kilómetros y desviación estándar
3000 kilómetros.
a) Cuál es la probabilidad de que una llanta elegida al azar tenga vida útil de
cuando menos 35000 km.?
b) Cuál es la probabilidad de que dure mas de 45000 km.?
12. Si un distribuidor hace un pedido de 500 llantas de las especificadas en el
problema anterior . Aproximadamente, cuantas llantas duraran:
a) entre 40000 y 45000 kilómetros?
b) 40000 kilómetros o más?
U.N.A.
7.3. PROBLEMAS
13. Una operación de maquinado produce ejes de aceros cuyos diámetros están
distribuidos normalmente con un promedio de 1,005 pulgadas y desviación
estándar de 0,01 pulgadas. Las especificaciones piden diámetros que queden
en el intervalo 1, 00 ± 0, 02 pulgadas. Qué porcentaje de la producción no
cumplirá las especificaciones?
14. Las ausencias por enfermedad de los empleados de una empresa en un mes
tiene una distribución normal aproximada con promedios de 200 horas y una
varianza de 400 horas.
a) Calcular la probabilidad de que el mes próximo el ausentismo total por enfer-
medad sea menar que 150 horas.
b) Para plantear el programa del mes próximo. Cuánto tiempo debe suponer
darse el ausentismo por enfermedad, si aquella cantidad solo se debe superar
con una probabilidad de tan solo 0,10.
15. Una empresa eléctrica fabrica focos que tienen una duración, antes de fun-
dirse, que se distribuye normalmente con una media igual a 800 horas y una
desviación estándar de 40 horas.
a) Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas
b) Sabiendo que el porcentaje de los focos de mayor duración es de 35, 5 %, en-
cuentre el tiempo de duración.
16. Las calificaciones de un examen se distribuyen normalmente con valor espe-
rado igual a 74 y desviación estándar igual a 7. Si 12 % de la clase obtiene
Calificación A . Cuál es la A más baja posible y la B más alta posible?.
17. Si los ingresos mensuales de médicos Norteamericanos están distribuidos nor-
malmente, con media 15000 dólares y con un desvı́o estándar de 3500 dólares
. Cuál es la probabilidad de que un medico elegido al azar tenga un ingreso
anual de :
a) superior a 16260 dólares
b) entre 16260 y 18500 dólares
c) entre 11500 y 18500 dólares
d) entre 8000 y 11500 dólares
18. Los puntos logrados por los candidatos en una prueba de actitud están dis-
tribuidos normalmente con una media de 500 y una desviación 100. Qué por-
centaje de los candidatos reciben puntajes
a) superiores a 700
b) entre 400 y 600
19. Si la estatura de los estudiantes de una universidad están normalmente distri-
buidos con media de 70 pulgadas, con un desvı́o estándar de 3 pulgadas.
a) Si la estatura mı́nima para ser probado en el equipo de baloncesto es de
72 pulgadas. Que proporción de los estudiantes estarı́an en condiciones de
someterse a la prueba?
b) Si para ocupar la posición de centro hay que tener una estatura de 76 pulgadas.
Que proporción de los estudiantes aptos para jugar baloncesto podrı́an ocupar
dicho lugar?
20. El examen dado por un grupo de estudiantes arroja una media de 65 con una
desviación tı́pica de 10. Si quisiéramos dar al 15 % superior una calificación A
, al 20 % siguiente B, al 30 % del medio C, al siguiente 25 % D y al 10 % más
bajo F. Qué calificaciones numéricas siguen el trazado de la curva?.
21. Las distribución de los salarios de 2000 trabajadores tiene una media de 70
dólares y una varianza de 36 dólares. Suponga que la distribución es normal
aproximada. Calcular la probabilidad que ganen:
a) entre 65 y 77 dólares
b) 82 dólares y mas
c) Cuantos trabajadores ganan 60 dólares o menos?
22. Un especialista en ictiologı́a tropical esta interesado en estimar cuanto tiempo
puede sobrevivir cierto tipo de pez en agua con determinado porcentaje de
toxicidad. Luego de una serie de experimentos llega a estimar que la vida
media de este tipo de pez alcanza 100 dı́as con un desvió estándar de 20 dı́as.
a) Cuál es la probabilidad de un pez sobreviva más de 110 dı́as?

U.N.A.
7.3. PROBLEMAS
b) Cuál es la probabilidad de un pez sobreviva entre 95 y 105 dı́as?

23. Dos estudiantes fueron informados de que habı́an recibido referencias tipifica-
das de 0, 8 y −0, 4 respectivamente, en un examen de inglés. Si sus puntuacio-
nes fueron de 88 y 64 respectivamente. Hallar la media y la desviación tı́pica
de las puntuaciones.
24. La media de los pesos de 500 estudiantes de un cierto colegio es 151 libras y la
desviación tı́pica 15 libras. Suponiendo que los pesos se distribuyen normal-
mente, hallar
a) el número de estudiantes que pesan entre 120 y 155 libras
b) la probabilidad de que un estudiante pese más de 185 libras
25. Una fabrica de productos para televisores vende transistores de vida media de
1000 horas y desviación estándar de 100 horas. Suponiendo que la distribución
de vida en horas de los transistores es normal, calcular:
a) la probabilidad de que un transistor elegido al azar tenga una duración de
vida comprendida entre 875 y 1075 horas
b) la probabilidad de que un transistor elegido al azar tenga una duración de
vida mayor a 1020 horas
26. La cantidad semanal que una compañı́a gasta en mantenimiento y reparaciones
tiene una distribución normal aproximada cuyo promedio es de 400 dólares y
su desviación estándar 20 dólares. Si el presupuesto para cubrir los gastos de
reparación para la semana siguiente es de 450 dólares.
a) Cuál es la probabilidad de que los costos reales sean mayores que la cantidad
supuesta?
b) De cuanto debe ser el presupuesto semanal para mantenimientos y reparacio-
nes para que tan solo se rebase con una probabilidad de 0,1?.
27. Los conductores que se fabrican para utilizar en determinado sistema de
computo necesitan tener resistencias que varı́en entre 0,12 y 0,14 ohm. Las
resistencias reales medidas de los conductores que producen la compañı́a A
tiene una distribución normal con un promedio de 0,13 ohm y una desviación
estándar de 0,005 ohm.
a) Cuál es la probabilidad de que un conductor seleccionado al azar de la pro-
ducción de la compañı́a A cumpla con las especificaciones?
b) Si se usan cuatro de estos conductores en el sistema y son de la compañı́a
A . Cuál es la probabilidad de que los cuatro conductor cumplan con las
especificaciones?
28. A una temperatura de 25gradosC, las resistencias de un termistor de deter-
minado tipo tiene una distribución normal con un promedio de 10000 ohm y
una desviación tı́pica de 4000 ohm. Los termistores se clasificaran para enviar
a un cliente, los que tengan resistencias entre 8000 y 15000 ohm. Qué fracción
de los termistores se debe enviar?
29. Los tiempos de las primera averı́a de una unidad de cierta marca de impresoras
de chorro de tinta tienen aproximadamente una distribución normal con un
promedio de 1500 horas y una desviación estándar de 200 horas.
a) Qué fracción de esas impresoras fallarán antes de 1000 horas?
b) Cuál debe ser el tiempo de garantı́a para estas impresoras si el fabricante
desea que solo presente averı́as el 5 % de las impresoras dentro del tiempo de
garantı́a?
30. Una encuesta entre los habitantes de cierta ciudad, indicó que el ingreso pro-
medio era de 45000 guaranı́es, con una desviación estándar de 5000 guaranı́es.
Admitiendo una distribución normal para la variable ingreso, calcular
a) porcentaje de habitantes con renta superior a 55000 guaranı́es
b) porcentaje de habitantes con rentas comprendidas entre 50000 y 52000 gua-
ranı́es
31. Se acepta que la vida de las bombillas producidas por una compañı́a eléctrica
tiene una distribución normal, con una media igual a 1000 hs. y una desviación
tı́pica de 50 hs. Determinar la probabilidad de que una bombilla tomada al
azar se queme:
a) en memos de 900 hs.
b) entre 900 y 1100 hs.
U.N.A.
7.3. PROBLEMAS
32. El peso medio de 500 bacas es de 151 kilogramos, con una dispersión de
15 kilogramos. Suponiendo que la variable peso se encuentre normalmente
distribuida, determinar:
a) Cuántas vacas pesan entre 120 y 155 kilogramos?
b) Cuántas vacas pesan 185 kilos o más?
c) Cuántas vacas pesan menos de 128 kilogramos?
33. En un examen de matemáticas, el puntaje promedio es de 42 puntos, con una
desviación estándar de 9 puntos. Hay un 10 % de compañeros que por tener
mayor puntaje reciben un premio. Se pide determinar el puntaje mı́nimo para
lograr dicho premio, suponiendo normal la distribución de las calificaciones.
34. Los resultados obtenidos por los aspirantes que rindieron examen de ingreso
en una Facultad, indicaron una distribución aproximadamente normal de la
variable punta je con un valor medio de 60 puntos y una dispersión de 8 puntos.
Calcular el porcentaje de aspirante que obtuvieron puntajes:
a) mayores a 70 puntos
b) inferiores a 56 puntos
c) entre 65 y 75 puntos
Distribución Exponencial
1. Suponga que el tiempo que un usuario cualquiera permanece conectado a un
servidor en una red de cómputo se puede modelar como una variable aleatoria
con distribución exponencial con media igual a 10 minutos. De mil usuarios,
Cuántos tienen un conexión superior a una hora?. Calcule además la proba-
bilidad de que un usuario cualquiera
a) no permanezca conectado más de 10 minutos.
b) permanezca conectado más de 10 minutos pero menos de una hora
2. Sabemos que la duración del tipo de bombillas que usamos sigue una distri-
bución exponencial de media 6 horas.
a) Si una persona entra a la habitación con la luz encendida dispuesta a perma-
necer siete horas. Podrá hacerlo sin que se funda la bombilla?.
b) Encuentre el tiempo promedio de duración de las bobillas.
3. Si la cantidad de dinero pagado por cada póliza en una compañı́a de seguros
se distribuye exponencialmente con media 2000.
a) Si una persona en este momento está pagando una poliza de seguros a la
compañı́a, cuál es la probabilidad de que sea un monto superior a 2500?.
b) Encuentre la cantidad promedio de pago de dinero por un seguro a la compa-
ñı́a.
4. Una máquina de servicio tiene una unidad de reserva para sustituirla de in-
mediato cuando falle. El Tiempo a la falla (tiempo entre fallas) de la máquina
(o de su unidad de reserva) es exponencial, y sucede cada 40 minutos en pro-
medio.
a) El operador de la máquina dice que ésta tiene la costumbre de descomponerse
cada noche a eso de las 8:30 P.M. Analizar lo que dice el operador.
b) La cantidad promedio de fallas en una semana, suponiendo que el servicio se
ofrece 24 horas por dı́a y 7 dı́as por semana.
c) La probabilidad de que haya al menos una falla en un perı́odo de 2 horas.
d) La probabilidad de que la próxima falla no suceda en menos de 3 horas.
e) Si no ha sucedido falla en 3 horas después de la última falla, cuál es la proba-
bilidad de que el tiempo entre fallas sea de 4 horas cuando mucho?.
5. El tiempo entre llegadas en una dependencia del Banco Mercan es exponencial
con valor medio de 0,05 hora. La oficina abre a las 8:00 A.M.
a) Escriba la distribución exponencial que describa el tiempo entre llegadas.
b) Determine la probabilidad de que no lleguen clientes a la oficina hasta las 8:15
A.M.
c) Son las 8:35 A.M. El último cliente entró a las 8:26, Cuál es la probabilidad
de que el siguiente cliente llegue antes de las 8:38 A.M.?, Y de que no llegue
hasta las 8:40?.
d) Cuál es la cantidad promedio de clientes que llegan entre las 8:10 y las 8:45
A.M.?
U.N.A.
7.3. PROBLEMAS
6. Suponga que el tiempo entre descomposturas de una máquina es exponencial,

con promedio de 6 horas. Si la máquina ha trabajado sin fallar durante las
últimas tres horas, cuál es la probabilidad de que continue sin fallar durante
la próxima hora?, De que se descomponga durante la siguiente 0,5 hora?.
7. El tiempo entre llegadas a una sala de juego en la sociedad de alumnos es
exponencial, con una media de 10 minutos.
a) Cuál es la frecuencia de llegadas por hora?
b) Cuál es la probabilidad de que no lleguen alumnos a esa sala durante los 15
minutos siguientes?.
c) Cuál es la probabilidad de que al menos un alumno visite la sala de juegos
durante los próximos 20 minutos?
8. El gerente de un nuevo restaurante de comida rápida desea cuantificar el
proceso de llegadas de clientes, estimando la fracción del intervalo de tiempo
entre llegadas que sea:
a) menor que 2 minutos,
b) entre 2 y 3 minutos y
c) más de 3 minutos.
Las llegadas en restaurantes parecidos tienen una frecuencia de 35 clientes por
hora. El tiempo entre llegadas tiene distribución exponencial.
9. Ana y Pedro, dos empleados de un restaurante de comida rápida, juegan lo
siguiente mientras esperan la llegada de clientes. Pedro le paga 2 dólares a
Ana si el próximo cliente no llega en menos de 1 minuto; en caso contrario,
Ana le paga a Pedro 2 dólares. Calcule la recompensa promedio de Pedro en
un perı́odo de 8 horas. El tiempo entre llegadas es exponencial, con una media
de 1,5 minutos.
10. Si un cliente llega a McDonalds en menos de 4 minutos después del cliente
inmediato anterior, recibirá un descuento del 10 %. Si el tiempo entre llegadas
es entre 4 y 5 minutos, el descuento, es del 6 %. Si el tiempo entre llegadas
es mayor que 5 minutos, el cliente tiene 2 % de descuento. El tiempo entre
llegadas es exponencial, con media de 6 minutos.
a) Determine la probabilidad de que un cliente que llegue reciba el máximo des-
cuento.
b) Determine el descuento promedio a cada cliente que llega
11. Se sabe que el tiempo entre fallas de un refrigerador Kencore es exponencial,
con una media de 9000 horas (más o menos 1 año de funcionamiento), y la em-
presa otorga una garantı́a de 1 año con el refrigerador. Cuál es la probabilidad
de que la garantı́a cubra una reparación por descompostura?.
12. Los niños nacen en un estado poco poblado, con una frecuencia de un naci-
miento cada 12 minutos. El tiempo entre nacimientos sigue una distribución
exponencial. Determinar
a) La cantidad promedio de nacimientos por año
b) La probabilidad de que no haya nacimientos en cualquier dı́a
c) La probabilidad de emitir 50 certificados de nacimientos en 3 horas, cuando se
emitieron 40 certificados durante las primeras 2 horas del perı́odo de 3 horas.
d) Suponga que el empleado que pasa la información de los certificados de na-
cimiento a la computadora suele esperar hasta que se hayan acumulado 5
certificados. Calcule la probabilidad de que el empleado capture un nuevo lote
en cada hora.
13. Un coleccionista de arte viaja una vez al mes, en promedio, para asistir a
subastas. En cada viaje se garantiza una compra. El tiempo entre los viajes
tiene distribución exponencial. Determine lo siguiente:
a) La probabilidad de que el coleccionista no compre obras de arte en un perı́odo
de 3 meses.
b) La probabilidad de que el coleccionista no compre más de 8 obras de arte por
año.
c) La probabilidad de que el tiempo entre viajes sucesivos sea mayor que 1 mes.
14. En un banco, la frecuencia de llegadas es de 2 clientes por minuto. Determine
lo siguiente:

U.N.A.
7.3. PROBLEMAS
a) La cantidad promedio de llegadas durante 5 minutos.

b) La probabilidad de que no haya llegadas durante el próximo 0,5 minuto.
c) La probabilidad de que haya al menos una llegada durante el siguiente 0,5
minuto.
d) La probabilidad de que el tiempo entre dos llegadas sucesivas sea de 3 minutos,
cuando menos.
15. El tiempo entre llegadas al restaurante Juan Arepa es exponencial con media
de 5 minutos. El restaurante abre a las 11:00 A.M. Determine:
a) La probabilidad de tener 10 llegadas al restaurante hasta las 11:12 A.M. si
hubo 8 llegadas hasta las 11:05.
b) La probabilidad de que un cliente llegue entre las 11:28 y las 11:33 A.M. si el
último cliente llegó a las 11:25 A.M.

U.N.A.
7.3. PROBLEMAS
REGLAS BASICAS DE INTEGRACION

Z Z
1) du = u + c 11) sec udu = ln | sec u + tan u| + c
un+1
Z Z
2) un du = +c 12) csc udu = − ln | csc u + cot u| +
n+1
Z Z Z
3) k f (u)du = k f (u)du 13) sec2 udu = tan u + c
Z Z Z Z
4) [ f (u) + g(u)]du = f (u)du + g(u)du 14) csc2 udu = − cot u + c
du
Z Z
5) = ln u + c 15) sec u tan udu = − csc u + c
u
Z Z
u u
6) e du = e + c 16) csc u. cot udu = − csc u + c
du u
Z Z
7) sin udu = − cos u + c 17) √ = sinh + c
2
a −u 2 a
du 1 u
Z Z
8) cos udu = sin u + c 18) = tanh +c
a2 + u2 a a
du 1 u
Z Z
9) tan udu = − ln | cos u| + c 19) p = sec + c
u (u2 − a2 ) a a
Z
10) cot udu = ln | sin u| + c

U.N.A.
7.3. PROBLEMAS
REGLAS BASICAS DE DERIVADAS

d d
1) [c] = 0 12) [cos u] = −(sin u)u0
dx dx
d d
2) [x] = 1 13) [tan u] = (sec2 u)u0
dx dx
d d
3) cu = cu0 14) [cot u] = −(csc2 u)u0
dx dx
d n d
4) [u ] = nu(n−1) 15) [sec u] = (sec u. tan u)u0
dx dx
d d
5) [u ± v] = u0 ± v0 16) [csc u] = −(csc u. cot u)u0
dx dx
d d u0
6) u.v = u.v0 + v.u0 17) [sinh u] = p
dx dx (1 − u2 )
d u u.v0 − v.u0 d u0
7) [ ]= talquev 6= 0 18) [cosh u] = p
dx v v2 dx (1 + u2 )
d u d u0
8) [|x|] = u0 talqueu 6= 0 19) [tanh u] =
dx |u| dx (1 + u2 )
d u0 d u0
9) [ln u] = talqueu 6= 0 20) [coth u] =
dx u dx (1 − u2 )
d u d u0
10) [e ] = eu u0 21) [csc u] = √ 2
dx dx |u| u − 1
d d −u0
11) [sin u] = (cos u)u0 22) [csc u] = √ 2
dx dx |u| u − 1

U.N.A.
7.3. PROBLEMAS
Documento8distNormal.pdf

2017 Est Unc A Ing Civil

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

2017 Est Unc A Ing Civil

Transféré par

Droits d'auteur :

Formats disponibles

U.N.A.

UNIVERSIDAD NACIONAL DE CAAGUAZÚ

CORONEL OVIEDO - PARAGUAY

ERNESTO SILVERO LAZAGA

CORONEL OVIEDO − PARAGUAY

2. Medidas de Tendencia Central 15

3. Medidas de posición no central (Cuantiles) 21

6.2.4. Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla

La palabra estadı́stica se origina, en las técnicas de recolección, organización, conservación,

Es la ciencia que se ocupa de la ordenación y análisis de datos procedentes de muestras y

1.1.1. Estadı́stica Descriptiva

El objetivo de la Estadı́stica descriptiva es estudiar procedimientos para sintetizar la infor-

Muestra: Subconjunto de la población de interés (que representa adecuadamente a la misma).

• Edad de los niños

• El precio y la demanda de un producto

Según el tipo de caracterı́stica a medir se pueden clasificar en:

Cualitativas nominales: Miden caracterı́sticas que no toman valores numéricos. A estas

Cuantitativas continuas: Toman valores numéricos dentro de un intervalo real (dentro de

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla

a) Las categorı́as de datos son mutuamente excluyentes y exhaustivas.

Escala cuantitativa Racional

a) Las categorı́as de datos son mutuamente excluyentes y exhaustivas.

d) El punto cero refleja la ausencia de estas caracterı́sticas.

Mutuamente excluyentes: Un individuo, objeto o medición pertenece únicamente a una categor

La estadı́stica descriptiva hace énfasis en tres aspectos:

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla

Frecuencia frecuencia Frecuencia

Cuadro 1.1: Forma General de Representar Frecuencias

Intervalos Marca de Clase

Cuadro 1.2: Forma General de Representar Intervalos

Calcular el rango o recorrido R = Xmax − Xmin

Determinar el número de intervalos (m) y la amplitud de clase (A), m ∼

Calcular el rango ampliado Ra = m.A

Establecer la diferencia a = Ra − R , es decir la cantidad en que ha sido alterado el recorrido,

Distribuir adecuadamente la cantidad a de la siguiente manera.

> temper <- (airquality$Temp)

Marca Frecuencia frecuencia Frecuencia

Cuadro 1.3: Ejemplo de Intervalos y Frecuencias

Calculando las empı́ricas para la construcción de intervalos

Calcular el rango o recorrido R = Xmax − Xmin = 97 − 56 = 41

El número de intervalos (m) y la amplitud de clase (A), m ∼

Calcular el rango ampliado Ra = m.A = 8 ∗ 6 = 48

Establecer la diferencia a = Ra − R = 48 − 41 = 7 , es decir la cantidad en que ha sido alterado

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla

1.3. Representaciones gráficas

Si la variable toma pocos valores diferentes o es cualitativa, entonces para representar la

Diagrama de barras: Consiste en un gráfico cartesiano en el que se dibuja xi en abscisas y

> t1 <- read.table("/home/ernesto/Documentos/paraclase 2017/estadisticauncaoviedo/Te

> plot(t1$frec,type = "o",ylab="Frequency",xlab="Temperature", main="Frequency polyg

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla

Diagrama acumulativo de frecuencias: Se usa para representar frecuencias acumulativas.

> plot(t1$frerltacm,type = "o",ylab="Frequency",xlab="Temperature", main="Cumulative

Cumulative Frequency Plot

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla

Histograma: Es la representación gráfica utilizada para las variables continuas. Es básicamente

> utils::str(hist(airquality$Temp, col="gray", ylim = c(0,37),xlab = "Temperature" ,

Diagrama de sectores (gráfico de tarta): Se representa la frecuencia de cada modalidad

> library(colorspace, pos=10)

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla

Pictograma: Se representa cada modalidad asociando un dibujo cuyo volumen (anchura/altura)

The decimal point is at the |

Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla