Académique Documents
Professionnel Documents
Culture Documents
INGENIERÍA
1. Introducción a la Estadı́stica 3
1.1. Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. Estadı́stica Descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Construcción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Representaciones gráficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4. Medidias de Dispersión 22
4.1. Varianza y Desviación Tı́pica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2. Otras medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.3. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.4. Medidas de apuntamiento o curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.5. Otras medidas caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.6. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5. Probabilidad 26
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.2. Espacio probabilı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.2.1. Experimentos y sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.3. Técnicas de Conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.1. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.2. Permutaciones con repeticiones . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.3. Pruebas ordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3.4. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3.5. Diagramas de árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3.7. Definiciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4. Teoremas de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4.1. Regla de la Adición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.4.2. Regla de la complementación . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.4.3. Regla de Diferenciación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.4.4. Reglas de Multiplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.4.5. Probabilidad condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.4.6. Teorema de las probabilidades totales . . . . . . . . . . . . . . . . . . . . . . . 32
5.4.7. Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.5. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6. Variables aleatorias 36
6.1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6.2. Distribución de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.2.1. Propiedades de la función de probabilidad . . . . . . . . . . . . . . . . . . . . 37
6.2.2. Propiedades de la función de densidad de probabilidad . . . . . . . . . . . . . 39
6.2.3. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1
ÍNDICE GENERAL U.N.A.
7. Distribuciones de probabilidad 57
7.1. Distribuciones discretas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.1. Distribución Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.2. Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.1.3. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.1.4. Distribución geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.1.5. Distribución binomial negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.1.6. Construcción de una distribución binomial negativa . . . . . . . . . . . . . . . 63
7.1.7. Distribución hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2. Distribuciones continuas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.2.1. Distribución uniforme continua . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.2.2. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.2.3. Distribución ji−cuadrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
7.2.4. Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.2.5. Distribución exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Introducción a la Estadı́stica
1.1. Estadı́stica
3
1.1. ESTADÍSTICA U.N.A.
y parte de la necesidad de conocer el entorno en que nos movemos midiendo elementos individuales
para obtener conclusiones generales aplicables a todo el conjunto.
Esta sección velara por los procedimientos para resumir la información de una caracterı́stica
que se pueda observar en los elementos individuales (Estadı́stica descriptiva unidemensional).
Conceptos Básicos
Población : Conjunto de personas, objetos o acontecimientos sobre los que queremos obtener
una conclusión. Que portan información sobre el fenómeno que se estudia. Para inferir algo
acerca de una población, usualmente tomamos una muestra de ella.
Variables
Son las caracterı́sticas (o atributos) que se pueden observar o estudiar en los individuos de
la población. Susceptibles de adoptar distintos valores o ser expresados en categorı́as, es un aspecto
especifico de la realidad referido a la unidad del análisis y puede ser medidos o cuantificados.
ejeas siguientes caracterı́sticas son ejemplos de variables:
L. • Estatura de las personas
Cualitativas ordinales: Miden caracterı́sticas que no toman valores numéricos pero sı́ pre-
sentan entre sus posibles valores una relación de orden.
ejeas siguientes caracterı́sticas son ejemplos de variables cualitativas ordinales:
L. • Nivel de estudios: sin estudios, primaria, secundaria, etc.
• Calificaciones de exámenes: regular, bueno, exelente, etc
• Exposición a un contaminante: nulo, leve, moderado, etc.
Cuantitativas discretas: Las variables discretas pueden asumir solo ciertos valores, toman
un número discreto de valores (en el conjunto de números naturales) y hay usualmente huecos
entre los valores (valores puntuales).
ejeas siguientes caracterı́sticas son ejemplos de variables cuantitativas discretas:
L. • Número de hijos de una familia.
• Goles en un partido de fútbol.
• Número de estudiantes en la clase de estadı́sticas, etc.
La estadı́stica no realiza sus funciones directamente sobre las modalidades observadas, sino
que éstas se representan por números, y la estadı́stica realiza sus funciones sobre esos números.
Se denomina medición al proceso de atribuir números a las caracterı́sticas. La medición estudia
las condiciones de construcción de representaciones numéricas, y los modelos desarrollados para la
medición se llaman escalas. Por lo tanto los datos se pueden clasificar de acuerdo con niveles de
medición. Hay cuatro escalas de medición que son: nominal, ordinal, de intervalo y de razón.
Escala Nominal
El término nivel nominal es normalmente usado para referirse a datos que solamente pueden
clasificarse en categorı́as. Es la escala de medición más bajo o más primitiva. Sin embargo, no hay
mediciones y no hay escalas involucradas, solo hay conteo. En este tipo de nivel de medición el orden
en que están acomodadas las categorı́as es totalmente arbitrario.
Escala Ordinal
Este tipo de nivel de medición tiene caracterı́sticas similares al nivel nominal con la dife-
rencia de que en el nivel ordinal las categorı́as indican que unas son más que las otras.
Escala cuantitativa intervalar
En este nivel de medición, las categorı́as están definidas por intervalos de valores, y están
acomodadas en orden a la magnitud de los valores. El tamaño de los intervalos es el mismo.
Propiedades de la escala de intervalos
b) Las categorı́as de datos están ordenadas de acuerdo con la cantidad de la caracterı́sticas que
poseen.
c) Diferencias iguales en la caracterı́stica están representadas por diferencias iguales en los números
asignados a las categorı́as.
b) Las categorı́as de datos están ordenadas de acuerdo con la cantidad de las caracterı́sticas que
poseen.
c) Diferencias iguales en la caracterı́stica están representadas por diferencias iguales en los números
asignados a las categorı́as.
Observación
Exhaustivas: Cada individuo, objeto o medición debe pertenecer a una de las categorı́as.
La forma de la distribución: Para describir como están distribuidos los datos utiliza una
herramienta llamada distribución de frecuencia y presenta la información por medio de tablas
y gráficas.
Las medidas de tendencia central: que resumen la información a una cifra que es repre-
sentativa de la serie de datos.
Las medidas de variabilidad: que nos indican que tan variables son los datos respecto a las
medidas de tendencia centra.
En este capı́tulo se presenta una manera de elaborar una distribución de frecuencia, en las
secciones siguientes se abordarán los temas de medidas de tendencia central y medidas de variabilidad.
1.2. Construcción
Una distribución de frecuencias es una serie de datos agrupados en categorı́as, en las cuales
se muestra el número de observaciones que contiene cada categorı́a. Los pasos para la construcción de
una distribución de frecuencias son mejor explicados con un ejemplo. Pero antes algunas definiciones
importantes.
Frecuencias
El primer método para resumir una muestra de tamaño n{x1 , ..., xn } de una variable esta-
dı́stica X, que presenta las modalidades c1 , ..., cm , es calcular la tabla de frecuencias. Como su nombre
indica es una tabla donde se presentan las modalidades observadas y sus frecuencias de aparición:
Frecuencia Absoluta: Número de veces que aparece la modalidad. Se denotará por
ni , donde 0 ≤ ni ≤ n
Frecuencia Absoluta Acumulada: Número de veces que aparece la modalidad o valores inferiores.
Se denotará por
Ni , donde 0 ≤ Ni ≤ n, y Ni−1 ≤ Ni , Nm = n
Frecuencia Relativa: Tanto por uno de las veces que aparece la modalidad.
ni
fi = , donde 0 ≤ fi ≤ 1
n
Frecuencia Relativa Acumulada: Tanto por uno de las veces que aparece la modalidad o valores
inferiores.
Ni
Fi = , donde 0 ≤ Fi ≤ 1, y Fi−1 ≤ Fi , Fm = 1
n
En muchos casos se hace necesario el agrupamiento en intervalos o clases que haga más
compacta, manejable y presentable la información.
El número de clases y la amplitud de los intervalos los fija el investigador de acuerdo con el
conocimiento que posea de la población, la necesidad de hacer comparación con otras investigaciones
y la presentación de la información. Sin embargo, se recomienda que la información no sea demasiado
compacta, lo cual le restarı́a precisión, ni demasiado dispersa, ya que no se tendrı́a claridad.
En términos generales, es usual que el número de intervalos no sea inferior a 5 ni superior
a 15. Struges propone que el número de clases o intervalos sea determinado por la expresión.
m∼
= 1 + 3, 322log10 N
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
1.2. CONSTRUCCIÓN U.N.A.
[e3 . . . e4 ] x2 = (e3 +e
2
4)
.. ..
. .
(e j +e j+1 )
[e j . . . e j+1 ] xj = 2
La amplitud debe ser igual para todos los intervalos y, en lo posible, no se debe trabajar con clases
abiertas.
Reglas empı́ricas para la construcción de intervalos
Cuando no se tiene experiencia en el manejo de la información es aconsejable seguir los
pasos que se dan a continuación:
Determinar los datos de mayor y menor valor Xmax , Xmin .
También puede ser definida como la cantidad positiva más pequeña que le hace falta al rango
o recorrido para ser divisible exactamente por la amplitud.
Con el fin de prever dobles conteos, quien clasifica deberá especificar si los intervalos son
abiertos a la derecha o abiertos a la izquierda, o cerradas ambas, en estas notas, trabajaremos
con intervalos cerrados; es decir, del tipo a ≤ X ≤ b , donde el lı́mite superior está incluido
dentro de la clase.
El conjunto de datos airquality dispone de medidas de calidad del aire en Nueva York con
las variables cuantitativas Ozone (ozono en ppb), Solar.R (radiación solar en langleys), Wind (viento
en mph), Temp (temperatura en F). En la tabla siguiente se muestra la tabla de frecuencias agrupada
en 10 clases para la variable Temp.
[1] 67 72 74 62 56 66 65 59 61 69 74 69 66 68 58 64 66 57 68 62 59 73 61 61 57
[26] 58 57 67 81 79 76 78 74 67 84 85 79 82 87 90 87 93 92 82 80 79 77 72 65 73
[51] 76 77 76 76 76 75 78 73 80 77 83 84 85 81 84 83 83 88 92 92 89 82 73 81 91
[76] 80 81 82 84 87 85 74 81 82 86 85 82 86 88 86 83 81 81 81 82 86 85 87 89 90
[101] 90 92 86 86 82 80 79 77 79 76 78 78 77 72 75 79 81 86 88 97 94 96 94 91 92
[126] 93 93 87 84 80 78 75 73 81 76 77 71 71 78 67 76 68 82 64 71 81 69 63 70 77
[151] 75 76 68
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
1.2. CONSTRUCCIÓN U.N.A.
En primer lugar es bueno ordenar los datos como mejor convenga en este caso, de menor a
mayor.
> sort(temper)
[1] 56 57 57 57 58 58 59 59 61 61 61 62 62 63 64 64 65 65 66 66 66 67 67 67 67
[26] 68 68 68 68 69 69 69 70 71 71 71 72 72 72 73 73 73 73 73 74 74 74 74 75 75
[51] 75 75 76 76 76 76 76 76 76 76 76 77 77 77 77 77 77 77 78 78 78 78 78 78 79
[76] 79 79 79 79 79 80 80 80 80 80 81 81 81 81 81 81 81 81 81 81 81 82 82 82 82
[101] 82 82 82 82 82 83 83 83 83 84 84 84 84 84 85 85 85 85 85 86 86 86 86 86 86
[126] 86 87 87 87 87 87 88 88 88 89 89 90 90 90 91 91 92 92 92 92 92 93 93 93 94
[151] 94 96 97
Determinar los datos de mayor y menor valor Xmax = 97, Xmin = 56.
Construir los intervalos, calcular los puntos medios o marcas de clase y hacer el agrupamiento
de frecuencias. Por cuestiones de concordancia con el programa R vamos a ajustar el número
de intervalos en diez .
Barchart
30
25
20
Frequency
15
10
5
0
58 63 68 73 78 83 88 93 98
Temperature
Polı́gono de frecuencias: Igual que el diagrama de barras pero lo que se unen son los puntos
(xi , ni ) consecutivos.
Frequency polygon
35
30
25
Frequency
20
15
10
5
2 4 6 8
Temperature
0.4
0.2
2 4 6 8
Temperature
List of 6
$ breaks : int [1:10] 55 60 65 70 75 80 85 90 95 100
$ counts : int [1:9] 8 10 15 19 33 34 20 12 2
$ density : num [1:9] 0.0105 0.0131 0.0196 0.0248 0.0431 ...
$ mids : num [1:9] 57.5 62.5 67.5 72.5 77.5 82.5 87.5 92.5 97.5
$ xname : chr "airquality$Temp"
$ equidist: logi TRUE
- attr(*, "class")= chr "histogram"
Histogram of airquality$Temp
34
33
30
Frequency
20
20
19
15
12
10
10
2
0
60 70 80 90 100
Temperature
Pie Chart
3
2
6 8
Diagrama de tallo y hojas: Los datos se redondean a dos o tres cifras significativas, tomán-
dose como tallo la primera o dos primeras cifras y como hojas las ultimas cifras. El tallo se
separa de las hojas por una lı́nea vertical. Ası́, cada tallo se representa una sola vez y el número
de hojas representa la frecuencia. La impresión resultante es la de acostar un histograma.
> stem(airquality$Temp)
56 | 0000
58 | 0000
60 | 000
62 | 000
64 | 0000
66 | 0000000
68 | 0000000
70 | 0000
72 | 00000000
74 | 00000000
76 | 0000000000000000
78 | 000000000000
80 | 0000000000000000
82 | 0000000000000
84 | 0000000000
86 | 000000000000
88 | 00000
90 | 00000
92 | 00000000
94 | 00
96 | 00
Diagramas de caja: El diagrama de caja consta de una caja central que está delimitada por la
posición de los cuartiles Q3 y Q1 . Dentro de esa caja se dibuja la lı́nea que representa la mediana.
También ocasionalmente se puede representar la media dentro de la caja. De los extremos de
la caja salen unas lı́neas que se extienden hasta los puntos LI = máx{mı́n(xi ), Q1 − 1, 5(RI)} y
LS = mı́n{máx(xi ), Q3 + 1, 5(RI)} que representarı́an el rango razonable hasta el cual se pueden
encontrar datos. Los datos que caen fuera del intervalo (LI, LS) se consideran datos atı́picos
y se representan individualmente. La informacioń obtenida a partir de las medidas de
centralización, dispersión y forma se puede usar para realizar diagramas de caja (boxplots) que
visualmente nos proporcionen la información de cómo están distribuidos los datos. Damos como
ejemplo este grafico y después pasamos a explicar las medidas de tendencia central.
Box Plot
LS
90
Q3
80
Med
Q1
70
60
LI
Ejercicio1:
Una empresa de informática dedicada al análisis de virus en ordenadores, contabiliza los vi-
rus detectados con su producto en 20 ordenadores de domicilios particulares. Los resultados obtenidos
son los siguientes:
46 29 35 61 54 37 53
57 52 51 43 67 66 31
53 51 48 59 55 47
Construir una tabla con las frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas del conjunto de datos.
Ejercicio2: Los datos siguientes corresponden al tiempo necesario para procesar 25 trabajos
en una CPU.
Construir una tabla con las frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas del conjunto de datos.
A las medidas de tendencia central con frecuencia se les llama promedios. El propósito de
una medida de tendencia central es indicar con toda precisión el centro de un conjunto de observa-
ciones.
1 n
x̄ = ∑ xi (2.1.1)
n i=1
Donde la expresión corresponde a tener todos los datos cuantitativos.
1 n
x̄ = ∑ fixi (2.1.2)
n i=1
1 N
µ= ∑ Xi (2.1.3)
N i=1
Muy semejante 2.1.1
Donde :
15
2.2. MEDIANA U.N.A.
2.2. Mediana
Se define la mediana (Me ) como aquel valor que, teniendo los datos ordenados de menor a
mayor, deja igual número de valores a su izquierda que a su derecha. Si el número de datos es par
se calcula como la media de los dos valores centrales. Si el número de datos es impar se toma como
mediana el valor central.
Si los datos se han agrupado se determina primero el intervalo mediano (aquel intervalo
donde la frecuencia relativa acumulada es menor o igual que 0,5 en su extremo inferior y mayor
que 0,5 en su extremo superior) para a continuación elegir un representante de este intervalo como
mediana (la marca de clase, LIi + li (0,5 − Fi−1 )/ fi , etc.).
Cuando los datos se encuentran agrupados en una distribución de frecuencia no conocemos
los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos :
Calcular el valor n/2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo
mediano).
Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es
igual o mayor que n/2.
Aplicando la siguiente fórmula con los valores del intervalo mediano:
n −F
2 aa
X̃ = LRI + A (2.2.4)
F
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
2.3. MODA U.N.A.
Donde:
X̃ : mediana de la muestra.
La mediana serı́a la medida de posición central más robusta (i.e. más insensible a datos
anómalos) y coincidirı́a con la media truncada al 100 %.
n n
Además la mediana verifica que ∑ |xi − Me| = mı́na∈R ∑ |xi − a|.
i=1 i=1
Propiedades de la mediana
2.3. Moda
Localizar la clase del intervalo que contenga la frecuencia de clase más grande.
∆1
X̂ = LRI + A (2.3.5)
∆1 + ∆2
Donde:
Si hay dos intervalos contiguos con frecuencia máxima la moda será la media aritmética de
las dos marcas de clases. Si hay dos o más intervalos no contiguos con frecuencia de clase máxima
habrá dos o más modas que serán las marcas de clases de dichos intervalos.
Propiedades de la moda
La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar, y
relativa).
Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
Desventajas de la moda
En muchas series de datos no hay moda porque ningún valor aparece más de una vez.
En algunas series de datos hay más de una moda, en este caso uno podrı́a preguntarse. Cual
es el valor representativo de la serie de datos?
Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de lı́mite
superior, el intervalo inferior carece de lı́mite inferior o ambos.
Para una distribución simétrica los valores de la media, la mediana y la moda coinciden es
decir: X̄ = X̃ = X̂, con lo cual la distribución de datos no presenta sesgo.
Observación : Esta igualdad no es exacta, sino que se cumple con mayor o menor
aproximación en función del grado de simetrı́a de la curva que represente gráficamente la
distribución.
Para una distribución asimétrica negativa se tiene que: X̄ < X̃ < X̂, con lo cual la distribución
de datos presenta un sesgo negativo.
Para una distribución asimétrica positiva se tiene que: X̂ < X̃ < X̄, con lo cual la distribución
de datos presenta un sesgo positivo.
Observación: La regla empı́rica se acepta como válida siempre que el grado de curva no
sea muy acentuado.
ejeas ganancias obtenidas por Atkins Construction Company en cuatro proyectos recientes fueron
3 %, 2 %, 4 % y 6 %. Cuál es la media de las ganancias? Por lo que la media de ganancias
obtenidas por Atkins Construction Company en los cuatro proyectos esta dada por
p4
(0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464
o sea 3,464 %
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los
errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los
efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en
elevar al cuadrado todas las observaciones (ası́ los signos negativos desaparecen), en obtener después
su media aritmética y en extraer, finalmente, la raı́z cuadrada de dicha media para volver a la unidad
de medida original.
s s
X12 + X22 + · · · + Xn2 1 n 2
C= = ∑ Xi (2.4.7)
N N i=1
m → ∞ máximo.
m → −∞ mı́nimo.
Media−f generalizada
Esta media puede generalizarse para una función monótona como la media−f generalizada:
!
n
1
x̄ = f −1 · ∑ f (xi ) (2.5.10)
n i=1
donde f : I → I sea una función inyectiva e I ⊂ R un intervalo. Escogiendo formas particulares
para f se obtienen algunas de las medias más conocidas:
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen
a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de
frecuencias.
Los cuantiles más conocidos son: cuartiles, deciles y percentiles.
Cuartiles ( Qi ) Son valores de la variable que dividen a la distribución en 4 partes, cada
una de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 es el primer
cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que deja a su izquierda
el 50 % de los datos, y Q3 es el tercer cuartil que deja a su izquierda el 75 % de los datos. (Q2 = Me)
Deciles ( Di ) Son los valores de la variable que dividen a la distribución en las partes
iguales, cada una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 = Me
)
Centiles o Percentiles ( Pi ) Son los valores que dividen a la distribución en 100 partes
iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habrá 99 percentiles.
(Q2 = D5 = Me = P50 )
Cálculo de los cuantiles en distribuciones no agrupadas en intervalos
kN
Se calculan a través de la siguiente expresión: q siendo :
n : Número de observaciones.
21
Capı́tulo 4
Medidias de Dispersión
Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto
a la media (s2 : caso muestral σ2 : caso poblacional). Se define la desviación tı́pica como la raı́z
positiva de la varianza (s : caso muestral σ : caso poblacional). Se suele utilizar más la desviación
tı́pica porque presenta las mismas unidades que la variable original. Al estar definidas como promedio
de cuadrados son siempre no negativas.
Las fórmulas de la varianza de una población y de una muestra son ligeramente diferentes.
Las fórmulas son:
N N
2
∑ (Xi − µ) ∑ Xi2
i=1 i=1
σ2 = = − µ2 (4.1.1)
N N
para la varianza de una población y
n n
∑ (Xi − X)2 ∑ Xi2
i=1 i=1 2
S2 = = −X (4.1.2)
n n
para la varianza de una muestra.
Las desviaciones estándar de la población y muestra se calculan simplemente sacando la
raı́z cuadrada a la respectiva varianza.
p
σ = σ2 (4.1.3)
desviación estándar de una población y
√
S= S2 (4.1.4)
desviación estándar de una muestra
Usos frecuentes de la desviación estándar Enfatizando, la desviación estándar es útil
para describir un conjunto de datos midiendo el grado de dispersión de las observaciones individuales
alrededor de su media. Existen dos aplicaciones adicionales para la stándar:
22
4.2. OTRAS MEDIDAS DE DISPERSIÓN U.N.A.
Teorema de Chebyshev establece que para todo conjunto de datos, por lo menos 1 − k12 % de
las observaciones están dentro de k desviaciones estándar de la media en donde k es cualquier
número mayor que 1.
Las medidas relativas como el recorrido relativo o el coeficiente de variación sólo tienen
sentido cuando la media de la variable es mayor que cero.
Las medidas de forma tratan de medir el grado de simetrı́a y apuntamiento en los datos.
Medidas de asimetrı́a
(x̄ − Q2 )
Coeficiente de asimetrı́a de Pearson: AsP = .
s
∑ni=1 (xi − x̄)3
Coeficiente de asimetrı́a de Fisher: AsF = .
ns3
Varias de las medidas vistas anteriormente utilizan desviaciones de los datos respecto a la
media elevadas a distintos órdenes. Este tipo de coeficientes se denominan momentos.
1 n r
Se define el momento respecto al origen de orden r(r ≥ 0) como: ar = ∑ xi .
n i=1
1 n
Se define el momento central de orden r(r ≥ 0) como: mr = ∑ (xi − x̄)r .
n i=1
La relación entre los dos tipos de momentos viene dada a partir del binomio de Newton:
r
k k
mr = ∑ (−1) ( )ar−k ak1
k=0 r
0,4 1,9 1,5 0,9 0,3 1,6 0,4 1,5 1,2 0,8
0,9 0,7 0,9 0,7 0,7 1,5 0,5 1,5 1,7 1,8
a) Calcule las mediadas de tendencia central, las variaciones e interprete los resultados
b) Compare.
Determine las medidas de tendencia central, variaciones y analice la relación entre ellas
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
4.6. EJERCICIOS PROPUESTOS U.N.A.
5. las edades de 60 personas que trabajan en una fábrica textil se han tabulado dando la siguiente
tabla de frecuencias:
Edades Número de personas
13-17 2
18-22 6
23-27 10
28-32 13
33-37 18
38-42 6
43-47 2
48-52 2
53-57 16
Total 60
6. Se conduce un estudio de los efectos de fumar sobre los patrones de sueños. La medición que
se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene estos datos:
Fumadores 69,3 56,0 22,1 47,6 53,2 48,1 52,7 34,4 60,2 43,8
No fumadores 28,6 25,1 26,4 34,9 29,8 38,5 30,2 30,6 31,8 41,6
7. La compañı́a National Tire tiene fondos de reserva en valores negociable a corto plazo. El saldo
diario de cierre (en millones de dólares) de la cuenta de valores negociables en lapso de dos
semanas es el que mostramos a continuación.
a) Calcula las mediadas de tendencia central para cada grupo e interprete los resultados
obtenidos.
b) Calcula la desviación media, la varianza, la desviación tı́pica y el coeficiente de variación
de cada grupo.
c) Diga cual de los grupos tiene mejor concentración
Probabilidad
5.1. Introducción
Consideraremos que un experimento es un proceso por medio del cual se obtiene una
observación. Bajo este enfoque podemos distinguir entre experimentos deterministas y aleatorios.
Los primeros son aquellos que siempre que se repitan bajo condiciones análogas llevan al mismo
resultado, por tanto éste se puede predecir. Por el contrario, un experimento aleatorio es el que
puede dar lugar a varios resultados, conocidos previamente, sin que sea posible saber de antemano
cuál de ellos se va a producir.
Estos últimos son los que interesan a la Teorı́a de la Probabilidad. Como ejemplo de los
mismos tenemos el observar qué número sale al lanzar un dado al aire. Muchos experimentos de la
vida real entran en el campo de los experimentos aleatorios, ya que son muchas las situaciones en las
que no se puede tener un control total sobre las variables de las que depende que se llegue a una u
otra realización.
A continuación, describimos los principales conceptos necesarios para el estudio de un
experimento aleatorio:
Suceso elemental: Es cada uno de los posibles resultados del experimento aleatorio. Se de-
notan con la letra griega ω.
Espacio Muestral: Conjunto formado por todos los sucesos elementales. Se denota por Ω =
{ω/ωes un suceso elemental}.
Suceso: Se llama suceso a cualquier subconjunto del espacio muestral. Se denota por 0/ al
suceso imposible y Ω se corresponde con el suceso seguro.
1 Estadı́sticaIngenierı́a Técnica en Informática de Sistemas (Manuel Febrero Bande, Pedro Galeano San Miguel,
Julio González Dı́az, Beatriz Pateiro López
26
5.3. TÉCNICAS DE CONTEO U.N.A.
Métodos para determinar (sin tener que enumerar en forma directa) el número de resultados
posibles de un experimento o el número de elementos de un conjunto particular. Estas técnicas son
usualmente conocidas como Técnicas de Conteo o análisis combinatorio.
Principio fundamental del conteo: Si un evento puede realizarse de n1 maneras diferen-
tes, y si, continuando el procedimiento, un segundo evento puede realizarse de n2 maneras diferentes,
y si, después de efectuados, un tercer evento puede realizarse de n3 maneras diferentes, y ası́ sucesi-
vamente, entonces el número de maneras en que los eventos pueden realizarse en el orden indicado
es el producto n1 · n2 · n3 . . . .
ejeupongamos que queremos determinar el número de placas de automóviles que pueden grabarse
utilizando 2 letras distintas y 3 dı́gitos de los cuales el primero no es 0. Entonces si asumimos un
alfabeto de 26 letras tendremos: 26 · 25 · 9 · 10 · 10 = 585000 placas.
Notación factorial
El producto de los enteros positivos desde 1 hasta n (inclusive), lo denotamos por el sı́mbolo
n! (el cual llamamos n factorial): n! = n · (n − 1) · (n − 2) . . . 3 · 2 · 1 : Para el caso n = 0 defı́nimos 0! = 1.
Por ejemplo, 4! = 4 · 3 · 2 · 1 = 24, 8! = 6! = (8 · 7 · 6!) = 6! = 8 · 7 = 56.
5.3.1. Permutaciones
ejeay 10 asistentes de enseñanza disponibles para clasificar los exámenes de un determinado curso.
El primer examen del curso consta de 4 preguntas. El jefe de cátedra desea elegir un asistente distinto
para calificar cada pregunta (un único asistente por pregunta). De cuántas maneras se puede elegir
a los asistentes para calificar el examen? En esta situación n = 10 (número de asistentes) y k = 4
(número de preguntas) y las maneras posibles son P4;10 = 10 · 9 · 8 · 7 = 5040.
Pruebas con sustitución: en este caso se regresa el elemento al conjunto antes de seleccio-
nar uno nuevo y según el principio fundamental del conteo tenemos nk pruebas ordenadas diferentes
de tamaño k con sustitución entonces.
Pk;n = nk
5.3.4. Combinaciones
P
3;4
Es decir C3;4 · 3! = P3;4 o C3;4 = 3! . Y en general para cada combinación de n objetos
tomados de a k tenemos que,
n Pk;n n!
Ck;n = = =
k k! k!(n − k)!
.
Algebra de sucesos: Es un subconjunto del conjunto de todos los sucesos asociados a un experi-
mento aleatorio, se denota por A = σ − algebra y ha de cumplir las siguientes condiciones:
ω, 0/ ∈ A
A ∈ A → Ac ∈ A
A, B ∈ A → A ∪ B; A ∩ B ∈ A
El principal objetivo de un experimento aleatorio suele ser determinar con qué probabi-
lidad ocurre cada uno de los sucesos elementales. A continuación citamos las tres definiciones más
manejadas para asignar probabilidades a los sucesos:
Definición axiomática (Kolmogorov 1933): Dado el espacio probabilizable (Ω, A), diremos
que P es una probabilidad sobre dicho espacio si cumple:
• P(Ω) = 1.
• Si A ∩ B = 0,
/ entonces P(A ∪ B) = P(A) + P(B).
• 0 ≤ P(A) ≤ 1.
S = {1, 2, 3, 4, 5, 6}
A = {2, 4, 6}
B = {1, 2}
P(A) = 1 − P(A)
ejei el evento A es cae un número par y si el evento B es cae un número menor de 3, ambos perte-
necientes al espacio muestral Ω = {1, 2, 3, 4, 5, 6} que resulta del experimento aleatorio consistente en
el lanzamiento de un dado, entonces la probabilidad de que caiga un número par pero no es menor
que tres es:
3 1
P(A − B) = P(A) − P(A ∩ B) = − = 0, 3333
6 6
Y la probabilidad de que caiga un número menor que tres pero no sea par es:
2 1
P(B − A) = P(B) − P(AB) = − = 0,167
6 6
P(A ∩ B) = P(A).P(B)
o equivalentemente P(B/A) = P(B) si P(A) > 0 (y también P(A/B) = P(A) si P(B) > 0).
ejena maquina empaca vegetales en una bolsa de plástico. Experiencias anteriores revelan que en
ocasiones los paquetes tienen menos del peso correcto, y en otras más, pero la mayorı́a de las veces
tiene el peso satisfactorio. Como muestra la siguiente tabla:
Peso Probabilidad
debajo del correcto 0,025
correcto 0,900
arriba del correcto 0,075
Supongamos que queremos saber la probabilidad de que al inspeccionar tres paquetes, los tres pesen
correctamente. Establezcamos los siguientes eventos:
P(A) = 0, 900
P(B) = 0, 900
P(C) = 0, 900
Según el teorema de multiplicación la probabilidad de que los tres eventos ocurran es:
P(A ∩ B ∩C) = P(A) · P(B) · P(C) = (0, 900) · (0, 900) · (0, 900) = 0, 729
P(A ∩ B)
P(A/B) =
P(B)
.
Es importante destacar que dado un suceso B, la función PB , que a cada suceso A le asigna
la probabilidad de A condicionada a B, es una función de probabilidad que satisface las propiedades
de la definición axiomática de Kolmogorov. Es decir, PB (A) = P(A/B).
A1 A2 ... An
Lo que nos dice este teorema es que dado un conjunto de sucesos mutuamente excluyentes tales
que su unión sea el suceso seguro Ω, entonces la probabilida de un suceso cualquiera B se puede
descomponer como la suma de las probabilidades de B dentro de cada uno de los sucesos (rectángulos
del dibujo) por la probabilidad de caer en dicho suceso. Con otras palabras, la probabilidad del suceso
B se reparte entre los sucesos en los que hemos particionado Ω.
P(B/A j ) · P(A j )
P(A j /B) = n
∑i=1 P(B/Ai ) · P(Ai )
Esta fórmula sale de combinar las fórmulas de la probabilidad condicionada con el teorema de las
probabilidades totales. La utilidad de la misma radica en que conociendo como son las probabilidades
de B condicionadas a los sucesos en los que hemos descompuesto el espacio muestral, podemos calcular
también cuánto valen las probabilidades cuando quien condiciona es el propio suceso B.
ejen un hospital se realiza una prueba para detectar una enfermedad. Se sabe que la pa-
decen 1 de cada 10.000 personas. Asimismo, también se sabe que cuando un paciente tiene la
enfermedad la prueba da positivo el 90 % de las veces y que cuando está sano el test da positivo
un 10 % de las veces.
E. Cuál es la probabilidad de que el test dé positivo?
Hasta qué punto es fiable el test? Es decir, si una persona da positivo, qué probabilidad hay de
que tenga la enfermedad?
Solución:
Aquı́ se usa el teorema de las probabilidades totales. Denotemos por A el suceso ’tener la
enfermedad’y por B él test da positivo’, de modo que sabemos que:
. Entonces:
P(B/A)P(A) 0, 00009
P(A/B) = C C
= = 0, 000899
P(B/A)P(A) + P(B/A )P(A ) 0, 10008
. De modo que aunque alguien dé positivo en el test, la probabilidad de que tenga la enfermedad
es todavı́a muy pequeña. Harı́a falta una prueba más fiable.
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fuman, que
350 consumen bebidas alcohólicas y que 250 tienen estos dos hábitos nocivos para la salud.
Cuál es la probabilidad de que un estudiante seleccionado aleatoriamente
2. La probabilidad de que una compañı́a norteamericana ubique una de sus plantas en Juárez es
0, 7, la probabilidad de que instale una planta en Chihuahua es 0, 4, la probabilidad de que no
se ubique ni en Juárez ni en Chihuahua es 0, 20. Cuál es la probabilidad de que
4. Se realizó una encuesta sobre preferencias en materia de periódicos, de 350 personas entre-
vistadas, 200 leen el Heraldo, 140 leen el Diario y 105 leen los dos periódicos. Encontrar la
probabilidad de los siguientes eventos:
6. Don Pepe tiene una tienda, en el trabajan tres cajeras, Andrea, Bianca, y Consuelo. Andrea
realiza el 50 % de los cobros, Bianca el 30 % y Consuelo el 20 %. Cuando cobra Andrea hay un
1 % de probabilidad de que lo haga mal, cuando lo hace Bianca hay un 2 % de que cobre mal,
y si cobra Consuelo hay un 3 % de probabilidad de que se equivoque.
Un cliente se queó con Don Pepe porque le cobraron mal. Cuál es la probabilidad de que el mal
cobro lo haya hecho Andrea?.
7. El profesor Ramos tiene muchos años impartiendo la clase de matemáticas, por experiencia
sabe que el 80 % de los estudiantes contestan los problemas que les encarga de tarea. También
sabe que el 90 % de los estudiantes que hacen la tarea aprueban el curso y que el 60 % de los
estudiantes que no hacen la tarea reprueban. Manuel aprobó el curso, cual es la probabilidad
de que hizo la tarea?
9. El 30 % de las ventas de una tienda departamental son en efectivo, el 30 % son pagadas con
cheque en el momento de la compra y el 40 % son a crédito. El 20 % de las compras en efectivo,
90 % de las compras con cheque y el 60 % de las compras a crédito son mayores a $500. En
este momento se está realizando una compra por $1000, cual es la probabilidad de que sea en
efectivo?
10. Cierta población de 1500 habitantes, fue clasificado, según su nacionalidad, resultando: 950
paraguayos, 200 españoles, 300 italianos y 50 franceses. Si se elige un habitante al azar, calcular
la probabilidad de que:
11. Supóngase que el Señor Gómez planea salir la noche del sábado próximo. Las probabilidades
de que baya a un juego de baloncesto, al cine o a una carrera de caballo son 0,35; 0,30 y 0,20
respectivamente. Determinar la probabilidad de que:
12. Suponga que la probabilidad de que llegue a asistir a una universidad es 0,60, la probabilidad de
que trabaje tiempo completo es 0,70, la probabilidad de que llegue a asistir a una universidad
y trabaje tiempo completo es 0,50. Cuál es la probabilidad de que asista a una universidad o
trabaje tiempo completo? Respuesta: 0,80
13. Se tiene un grupo de 12 tornillos, de los cuales 4 son defectuosos. Se recogen 2 tornillos al azar.
Cuál es la probabilidad de que:
14. De 100 individuos que presenten su solicitud para ocupar puestos de analista de sistemas en
una gran empresa en el ultimo año. 40 contaban con experiencia laboral previa y 30 tenı́an
titulo profesional. Sin embargo 20 de los solicitantes tenı́an tanto experiencia laboral como
titulo profesional, de modo que han sido incluidos en ambos conteos.
15. Una caja contiene 20 unidades de cierto producto electrónico, 4 de ellos son defectuosos y 16 son
buenas. Se seleccionarán aleatoriamente 4 unidades y se venderán. Obténgase la probabilidad
de que:
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
5.5. EJERCICIOS PROPUESTOS U.N.A.
1
a) las cuatro unidades vendidas sean defectuosos Respuesta: 4845
48
b) entre las cuatro unidades vendidas 2 sean buenas Respuesta: 323
13
c) se vendan al menos tres unidades defectuosas Respuesta: 969
17. La probabilidad de que cierto componente electrónico funcione es de 0,90. Un aparato contiene
dos de estos componentes. El aparato funciona si por lo menos uno de los componentes funciona.
Sin importar cual de los componentes funcione o no. Cuáles son los posibles resultados? (
Puede suponer independencia en la operación de los componentes).
Cuál es la probabilidad de que el aparato no funcione Respuesta: 0,99
18. La suma de las probabilidades de que tres hombres H1 , H2 y H3 peguen en el blanco es 0,95.
Además la posibilidad de que H1 de en el blanco es el doble de que lo haga H2 y H2 tiene la
misma posibilidad de dar en el blanco que H3 , cada uno dispara una vez al blanco.
Variables aleatorias
X : Ω −→ R
defina variable aleatoria es discreta cuando el conjunto de valores que ésta toma es un conjunto
discreto, es decir, un conjunto finito o numerable. Por ejemplo, el conjunto {0, 1, 2, . . . , n} es un
conjunto discreto porque es finito, lo mismo N pues aunque es infinito, es numerable y por lo tanto
discreto.
ejen experimento aleatorio consiste en escoger a una persona ω al azar. La variable aleatoria X
evaluada en ω corresponde a conocer la siguiente caracterı́stica, o una codificación de esta caracte-
rı́stica, de la persona escogida. En cada caso se trata de una variable aleatoria discreta: a) Edad en
ños. b) Número de hijos. c) Peso. d) Estatura. e) Sueldo. f) Nivel
escolar. g) Estado civil. h) Lugar de nacimiento.
defina variable aleatoria es continua cuando toma todos los valores dentro de un intervalo (a, b) ⊆
R.
ejen el ejemplo del lanzamiento de un dardo en un tablero circular de radio uno, el espacio muestral
Ω (Figura 6.1) es infinito no numerable, las variables X,Y, Z,V y W definidas allı́ son todas variables
aleatorias continuas. Si se dibujan cı́rculos concéntricos alrededor del origen y si se asignan premios
asociados a cada una de las regiones resultantes, puede obtenerse un ejemplo de una variable aleatoria
discreta sobre este espacio muestral.
La clasificación anterior de variables aleatorias no es completa pues existen variables que no son
de ninguno de los dos tipos mencionados. Por simplicidad en este curso estudiaremos únicamente
variables aleatorias que son discretas o continuas.
Usaremos también la siguiente notación importante: Si A es un subconjunto de R, entonces la
expresión (X ∈ A), incluyendo el paréntesis, denota el conjunto {ω ∈ Ω : X(ω) ∈ A}, es decir, (X ∈
A) = {ω ∈ Ω : X(ω) ∈ A}. En palabras, la expresión (X ∈ A) denota aquel conjunto de elementos ω de
Ω tales que bajo la aplicación de la función X toman un valor dentro del conjunto A. A este conjunto
se le llama la imagen inversa de A, y se le denota por X −1 A.
ejeonsideremos el experimento de lanzar una moneda al aire y la variable aleatoria X que
lleva el resultado Cara al valor 0 y el resultado Cruz al valor 1. Tenemos por ejemplo que
(X ∈ [1, ∞)) = {Cruz} pues el conjunto de elementos de Ω tales que bajo la función X toman un
valor mayor o igual a uno, es decir caen dentro del intervalo [1, ∞), es únicamente el elemento
Cruz. Por lo tanto P(X ∈ [1, ∞)) = P{Cruz} = 21 . Del mismo modo puede verificarse que
C. a) P(X ∈ [1, 2)) = P({Cruz}) = 21 .
36
6.2. DISTRIBUCIÓN DE PROBABILIDAD
C. U.N.A.
d) P(X = 1) = P({Cruz}) = 21 .
f) P(X ≥ 0) = P(Ω) = 1.
Usaremos con mucha frecuencia la notación arriba explicada. El lector debe asegurarse de com-
prender bien que si x es un número real entonces (X ≤ x) es un subconjunto de Ω y por lo tanto
un evento. Lo mismo sucede con el complemento de este conjunto que es (X > x). Podemos escribir
entonces la igualdad de conjuntos (X ≤ x) ∪ (X > x) = Ω. Y aplicando probabilidad se obtiene:
Nota importante. A través de una variable aleatoria se puede considerar que los posibles re-
sultados de un experimento aleatorio no son elementos ω en Ω sino números reales que la variable
aleatoria puede tomar. Esta es una consideración radical pues ya no consideraremos experimentos
aleatorios particulares, ni espacios muestrales arbitrarios Ω, ni eventos (subconjuntos) de Ω, en lu-
gar de ello consideraremos que una cierta variable aleatoria de interés toma valores en un cierto
subconjunto de números reales. La probabilidad definida antes para subconjuntos de Ω se traslada,
como explicamos antes, a probabilidades para subconjuntos de R. Esta perspectiva permite estudiar
modelos generales y después aplicarlos a cualquier situación particular. A partir de ahora y en lo que
resta del curso el término variable aleatoria constituirá un elemento frecuente en los enunciados.
En palabras, la función de probabilidad es simplemente aquella función que indica los valores de
la probabilidad en los distintos valores que toma la variable aleatoria discreta. Recordemos que es
importante poder distinguir entre X y x, pues conceptualmente son cosas muy distintas. Denotaremos
generalmente a una función de probabilidad con la letra f minúscula. A veces escribiremos fX (x) y
el subı́ndice nos ayudará a especificar que tal función es la función de probabilidad de la variable
aleatoria X. Esta notación será particularmente útil cuando consideremos varias variables aleatorias
a la vez.
2) ∑ f (x) = 1
x
ejeonsidere la variable aleatoria discreta X que toma los valores 1, 2 y 3, con probabilidades 0,3;
0,5 y 0,2 respectivamente. Entonces la función de probabilidad de X es
0, 3 si x = 1
f (x) = 0, 5 si x = 2
0, 2 si x = 3
Esta función se muestra gáficamente en la Figura 6.2. Alternativamente podemos también expresar
esta función mediante la tabla mostrada más abajo. En esta representación se entiende de manera
implı́cita que f (x) es cero para cualquier valor de x distinto de 1, 2 y 3. En particular, compruebe
que las siguientes probabilidades son correctas:
P(X ≤ 2) = 0, 7 P(|X| = 1) = 0, 3 y P(X < 1) = 0
0.7
f(x)
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0 1 2 3 4
x 1 2 3
p(x) 0,3 0,5 0,2
ejencontremos el valor de la constante c que hace que la siguiente función sea de probabilidad.
cx si x = 0, 1, 2, 3
f (x) =
0 en otro caso
Los posibles valores de la variable aleatoria discreta, no especificada, son 0, 1, 2 y 3, con probabi-
lidades 0, c, 2c y 3c, respectivamente. Como la suma de estas probabilidades debe ser uno, obtenemos
la ecuación c + 2c + 3c = 1. De aqui obtenemos c = 16 . Este es el valor de c que hace que f (x) sea no
negativa y sume uno, es decir, una función de probabilidad.
defiSea X una variable aleatoria continua. Decimos que la función integrable y no negativa f (x) :
R −→ [0, ∞) es la función de densidad de X si para cualquier intervalo (a, b) de R se cumple la igualdad
Z b
P(X ∈ (a, b)) = f (x)dx
a
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
6.2. DISTRIBUCIÓN DE PROBABILIDAD
Es decir, la probabilidad de que la variable tome un valor dentro del intervalo (a, b) se puede
calcular o expresar como el área bajo la función de densidad en el intervalo (a, b). De esta forma el
cálculo de una probabilidad se reduce al cálculo de una integral. Véase la Figura 6.3. No es difı́cil
comprobar que toda función de densidad f (x) de una variable aleatoria continua X cumple las dos
propiedades que mencionamos a continuación análogas al caso discreto.
4
b
f(x) = ⌠ f(x)dx
3
⌡a
2
1
0
a b
0 1 2 3 4
Rb
Figura 6.3: Representación gráfica de la función f (x) = a f (x)dx x ∈ (a, b)
Toda función f (x) : R −→ [0, ∞) que satisfaga estas dos propiedades, sin necesidad de tener una
variable aleatoria de por medio, se llamará función de densidad.
ejea función f (x) dada por:
1
si x ∈ (1, 3)
f (x) = 2
0 en otro caso
es una función de densidad de una variable aleatoria continua que toma valores en el intervalo
(1, 3), y cuya gráfica aparece en la Figura 6.4. Observe que se trata de una función no negativa y
cuya integral vale uno.
2.0
f(x) = (1 2)
1.5
1.0
0.5
0.0
a b
−0.5
0 1 2 3 4
1
Figura 6.4: Representación gráfica de la función f (x) = 2 x ∈ (1, 3)
ejencontrar el valor de la constante c que hace que la siguiente función sea de densidad.
c|x| si x ∈ [−1, 1]
f (x) =
0 en otro caso
Se trata de una variable aleatoria continua que toma valores en el intervalo [−1, 1]. Como esta
función debe integrar uno tenemos que:
Z ∞ Z 1 Z 1 x2 1
1= f (x)dx = c|x|dx = 2c xdx = 2c =c
−∞ −1 0 2 0
Por lo tanto, cuando tomamos c = 1 la función anterior resulta ser una función de densidad pues
ahora cumple con ser no negativa e integrar uno.
defi. Sea X una variable aleatoria discreta o continua. La función de distribución de X, denotada
por F(x) : R −→ [0, 1], se define como
F(x) = P(X ≤ x)
Esto es, la función de distribución evaluada en un número x cualquiera es simplemente la proba-
bilidad de que la variable aleatoria tome un valor menor o igual a x, o en otras palabras, que tome
un valor en el intervalo (−∞, x]. Siendo F(x) una probabilidad, sus valores están siempre entre 0 y
1. Esta función resulta ser importante y se le conoce también, por razones evidentes, con el nombre
de función de acumulación de probabilidad. Con un par de ejemplo mostraremos la forma de
calcular esta función a partir de la función de probabilidad o de la función de densidad.
ejeonsideremos la variable aleatoria discreta X del ejemplo 6.2.1. Tenemos que la correspondiente
función de distribución evaluada en x se calcula sumando las probabilidades P(X = u) para valores
de u menores o iguales a x, es decir,
0 si x<1
0, 3 si 1≤x<2
F(x) = P(X ≤ x) = ∑ P(X = u) = .
u≤x
0, 8 si 2≤x<3
1 si x≥3
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
6.2. DISTRIBUCIÓN DE PROBABILIDAD
cuya gráfica aparece en la Figura 6.5. Este es el comportamiento tı́pico de una función de
distribución de una v.a. discreta, es no decreciente, constante por pedazos, y si la función tiene una
discontinuidad en x, entonces el tamaño de tal discontinuidad es exactamente la probabilidad de
que la variable aleatoria tome ese valor.
2.0
F(x) = P(X<x)
1.5
1.0
0.5
0.0
−0.5
0 1 2 3 4 5
ejeonsideremos ahora la variable aleatoria continua X del ejemplo 6.2.3. La correspondiente función
de distribución se obtiene calculando la siguiente integral:
si x ≤ 1
0
0 si x ≤ 1
Z x
Z x
1 x−1
F(x) = P(X ≤ x) = f (u)du = du si 1 < x < 3 = si 1 < x < 3
−∞
1 2
2
si x ≥ 3
1 si x ≥ 3 1
cuya gráfica aparece en la Figura 6.7. Observe que esta función es continua y no decreciente.
2.0
x
−0.5
0 1 2 3 4 5
En los dos ejemplos anteriores se ha mostrado la forma de obtener F(x) a partir de f (x). Ahora
explicaremos el proceso contrario. En el caso continuo tenemos que para toda x en R,
Z x
F(x) = P(X ≤ x) = f (u)du
−∞
d
de modo que por el teorema fundamental del cálculo, y cuando F(x) es diferenciable, (F(x)) = f (x).
dx
De este modo podemos encontrar f (x) a partir de F(x). En el caso discreto, f (x) = P(X = x) =
F(x) − F(x− ), en donde F(x− ) es el lı́mite por la izquierda de la función F en el punto x, en sı́mbolos,
F(x− ) = lı́m F(x − h), con h > 0. Análogamente, la expresión F(x+ ) significa el lı́mite por la derecha
h−→0
de la función F en el punto x, es decir, F(x+ ) = lı́m F(x + h), con h > 0.
h−→0
proToda función de distribución F(x) satisface las siguientes propiedades:
.. 1. 0 ≤ F(x) ≤ 1
2. lı́m F(x) = 1
x−→∞
3. lı́m F(x) = 0
x−→−∞
5. Por teoria elemental de conjuntos el evento (x1 < X ≤ x2 ) puede descomponerse en la diferencia
(X ≤ x2 ) − (X ≤ x1 ), en donde (X ≤ x1 ) ⊆ (X ≤ x2 ). Por lo tanto
6. Para h > 0 tenemos que F(x + h) = P(X ≤ x + h) = P(X ≤ x) + P(x < X ≤ x + h), de modo que
cuando h tiende a cero, el conjunto (x < X ≤ x+h) tiende al conjunto vacı́o. Concluimos entonces
que, cuando h −→ 0 con h > 0,
La propiedad 4) significa que F(x) es una función monótona no decreciente. Mientras que la
propiedad 6) establece que F(x) es una función continua por la derecha.
a) Distribución binomial
c) Distribución Poisson
d) Distribución geométrica
e) Distribución hipergeométrica
a) Distribución ji cuadrado
b) Distribución exponencial
c) Distribución t-student
d) Distribución normal
e) Distribución Gamma
f) Distribución Beta
Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con curvas.
6.3.1. Esperanza
defiLa esperanza de una variable aleatoria X es un número real denotado por E(X) y que
se calcula como sigue:
Esperanza . 1. Si X es una variable aleatoria discreta con función de probabilidad f (x), entonces:
E(X) = ∑ x f (x)
x
en donde la suma se efectúa sobre todos los posibles valores que pueda tomar la variable
aleatoria X, y se define cuando esta suma sea absolutamente convergente, es decir,
El número de sumandos puede ser finito o infinito dependiendo del conjunto de valores de la
variable aleatoria.
2. Si X es una variable aleatoria continua con función de densidad de probabilidad f (x), entonces
la esperanza es Z ∞
E(X) = x f (x)dx
−∞
suponiendo que esta integral es absolutamente convergente, es decir,
Z ∞
E(X) = |x f (x)|dx
−∞
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
La esperanza de X es el número
3
1 4 1 2 1
E(X) = ∑ x f (x) = −1 · + 0 · + 1 · + 2 · =
x=−1 8 8 8 8 2
Observe que la suma su efectúa para todos los valores de x indicados en la tabla, es decir : -1, 0, 1 y
2. También es instructivo observar que la esperanza no es necesariamente uno de los valores tomados
por la variable aleatoria. En este ejemplo el valor 12 nunca es tomado por la variable aleatoria, pero
es su valor esperado.
ejeonsidere la variable aleatoria continua X con función de densidad:
2x si 0 < x < 1
f (x) =
0 en otro caso
La esperanza de X es 1
Z 1
2 2 2
Z ∞
E(X) = x f (x)dx = x · 2x = x =
−∞ 0 3 3
0
Observe que la integral sólo es relevante en el intervalo (0, 1), pues fuera de dicho intervalo la
función de densidad se anula.
2.
1. Si X es una variable aleatoria continua; con función de densidad de probabilidad fX (x); entonces
la esperanza de la variable aleatoria continua g(x) está dada por la siguiente ecuación:
Z ∞
E[g(X)] = g(x) fX (x)dx (6.3.3)
−∞
ejeea X una variable aleatoria con función de probabilidad dada por la tabla que aparece abajo.
Encuentre la función de probabilidad de Y = X 2 usando la ecuación(6.3.2).
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
Propiedades de la esperanza
proean X y Y variables aleatorias con esperanzas finitas y sea c una constante. Entonces
S. a) E(c) = c
b) E(cX) = cE(X)
c) Si X ≥ 0, entonces E(X) ≥ 0
d) E(X +Y ) = E(X) + E(Y )
Demostración
a) Si X es una v.a. discreta por definición de esperanza para caso discreto tenemos que:
Si X es una v.a. continua por definición de esperanza para caso continuo tenemos que:
Z ∞ Z ∞
E(c) = c f (x)dx = c f (x)dx = c
−∞ −∞
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.3. ESPERANZA, VARIANZA Y MOMENTOS U.N.A.
b) Si X es una v.a. discreta por definición de esperanza para caso discreto tenemos que:
Si X es una v.a. continua por definición de esperanza para caso continuo tenemos que:
Z ∞ Z ∞
E(cX) = (cx) f (x)dx = c x f (x)dx = cE(X)
−∞ −∞
c) Este inciso es muy evidente pues cuando se cumple la hipótesis (E(X) ≥ 0), en la integral o
suma correspondiente solo aparecerán términos que son no negativos.
d) Esta última propiedad, en cambio, no es sencilla de demostrar y aún en el caso discreto requiere
de detalles técnicos que preferimos omitir.
Oservaciones:
Observe que la segunda y la cuarta propiedad establecen que la esperanza es lineal, es decir,
separa sumas y también separa multiplicaciones por constantes; esto es
Si X e Y son v.a. independientes entonces E(XY ) = E(X)E(Y ). Esto mismo se extiende para
n n
una sucesión X1 , X2 , . . . , Xn de v.a. independientes, esto es E ∑ Xi = ∏ E(Xi ). Esta última
i=1 i=1
propiedad no la detallaremos pero la utilizaremos en algunas demostraciones.
6.3.2. Varianza
defiLa varianza de una variable aleatoria X, denotada por Var(X), se define como la siguiente
esperanza, si ésta existe,
∑[x − E(X)]2 f (x) si X es una v.a. discreta
x
Var(X) = E[X − E(X)]2 =
Z ∞
[x − E(X)]2 f (x)dx si X es una v.a. continua
−∞
La varianza es una medida del grado de dispersión de los diferentes valores tomados por la variable
aleatoria. Se le denota regularmente por la letra σ2 (sigma cuadrada). A la raı́z cuadrada positiva de
la varianza, esto es σ, se le llama desviación estándar. Nuevamente la anterior suma o integral puede
no existir y en ese caso decimos que la variable aleatoria no tiene varianza finita. Observemos que
para calcular Var(X) necesitamos conocer primero E(X). Veamos algunos ejemplos sencillos.
ejealcularemos la varianza de la variable aleatoria discreta X con función de probabilidad dada
por la siguiente tabla.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
1
Recordemos primeramente que por cálculos previos, E(X) = . Aplicando la definición de varianza
2
para v.a. discreta Var(X) = ∑[x − E(X)]2 f (x), tenemos que:
x
1 2 1 1 2 4 1 2 1 1 2 2
Var(X) = − 1 − · + 0− · + 1− · + 2− · =1
2 8 2 8 2 8 2 8
ejealcularemos la varianza de la variable aleatoria continua X con función de densidad f (x) = 2x
2
para x ∈ (0, 1) y cero en otro caso. En un cálculo previo habı́amos encontrado que E(X) = . Aplicando
Z ∞ 3
2
la definición de varianza para una v.a. continua Var(X) = [x − E(X)] f (x)dx, tenemos que
−∞
Z 1
2 2
Z 1
8 8 x4 8 4 1 1
Var(X) = x− 2xdx = 2x3 − x2 + x dx = − x3 + x2 =
0 3 0 3 9 2 9 9 0 18
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.3. ESPERANZA, VARIANZA Y MOMENTOS
(Momentos) . U.N.A.
Propiedades de la varianza
Ahora enunciamos algunas propiedades de la varianza.
proean X y Y dos variables aleatorias, y sea c una constante. Entonces
S. a) Var(X) ≥ 0
b) Var(c) = 0
c) Var(cX) = c2Var(X)
d) Var(X + c) = Var(X)
f) Var(X +Y ) 6= V (X) +V (Y )
Demostración
a) Este inciso es evidente a partir de la definición de varianza pues en ella aparece una suma o
integral de términos no negativos.
b) Para este inciso la constante c es una v.a. con un único valor, de modo que E(c) = c, entonces
Var(X) = E(c − c)2 = E(0)2 = E(0) = 0
= E(X 2 ) − [E(X)]2
f) Finalmente para demostrar la propiedad (f) es suficiente dar un ejemplo. Puede tomarse el caso
Y = X, en general y por lo demostrado antes, se tiene que
Observación:
Nota: En este curso no entraremos en detalles con respecto a las v.a. independientes por eso no
demostraremos las propiedades que este hecho implica en la esperanza y la varianza de la suma de
v.a. de este tipo mencionadas anteriormente.
6.3.3. Momentos
Los momentos de una variable aleatoria son números que representan algunas caracterı́sticas de la
distribución de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
de manera única a la distribución de probabilidad. A continuación definiremos los momentos si existen
de una variable aleatoria alrededor del origen y alrededor de la media también llamada momento
central.
defiSe define el n−ésimo momento de una variable aleatoria X alrededor del origen, cuando existe,
como el número E(X n ), para cualquier valor natural de n. El n−ésimo momento central de X, cuando
existe, es el número E[(X − µ]n , en donde µ = E(X).
Observe que el primer momento de X alrededor del origen es simplemente la esperanza, y el
segundo momento central es la varianza. Tenemos entonces que si X es una variable aleatoria con
función de probabilidad f (x) si es discreta o función de densidad de probabilidad f (x) si es continua,
entonces el n−ésimo momento de X, si existe, se calcula como sigue:
∑ xn f (x) si X es una v.a. discreta
x
E(X n ) = Z ∞
xn f (x)dx si X es una v.a. continua
−∞
ejeea la variable aleatoria discreta X con función de probabilidad dada por la siguiente tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
S. a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer, segundo y tercer momento alrededor de la media
Desarrollo de los incisos
a) Por definición de momentos alrededor del origen tenemos que
2
1 2 1
E(X) = ∑ x f (x) = 0 · 4 + 1 · 4 + 2 · 4 = 1
x=0
2
1 2 1 3
E(X 2 ) = ∑ x2 f (x) = 02 · 4 + 12 · 4 + 22 · 4 = 2
x=0
2
1 2 1 5
E(X 3 ) = ∑ x3 f (x) = 03 · 4 + 13 · 4 + 23 · 4 = 2
x=0
2
1 2 1 1
E[(X − µ)2 ] = ∑ (x − 1)2 f (x) = (0 − 1)2 · 4 + (1 − 1)2 · 4 + (2 − 1)2 · 4 = 2
x=0
2
1 2 1
E[(X − 1)3 ] = ∑ (x − 1)3 f (x) = (0 − 1)3 · 4 + (1 − 1)3 · 4 + (2 − 1)3 · 4 = 0
x=0
x3 2 4
Z 2
x
E(X) = x dx = =
0 2 6 0 3
x4 2
Z 2
2 2x
E(X ) = x dx = = 2
0 2 8 0
Z 2 5
x 2 16
3 3x
E(X ) = x dx = =
0 2 10 0 5
b) Por definición de momentos alrededor de la media tenemos que
4 4 4 4
E(X − µ) = E X − = E(X) − E = − =0
3 3 3 3
Z 2
4 2 i 4 2 x 1 2 3 8 2 16
h Z
2
E[(X − µ) ] = E X − = x− dx = x − x + x dx
3 0 3 2 2 0 3 9
1 x4 8 3 8 2 2 2
= − x + x =
2 4 9 9 0 9
MX (t) = E(etX )
ejeea X la variable aleatoria discreta del ejemplo 6.3.7, es decir, con función de probabilidad dada
por la tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
Obtener su función generadora de momentos. Por la definición de función generadora de momentos
tenemos
2
0 1 1t 2 2t 1 e2t + 2et + 1
MX (t) = E(etX ) = ∑ etx
f (x) = e · + e · + e · =
x=0 4 4 4 4
d ∞
t k−1 k
∞
t k−1
MX (t) = ∑ E(X ) = ∑ E(X k−1 X) = E(XetX )
dt k=1 (k − 1)! k=1 (k − 1)!
d2 ∞
t k−2 ∞
t k−2
dt 2
M X (t) = ∑ (k − 2)! E(X k
) = ∑ (k − 2)! E(X k−2X 2) = E(X 2etX )
k=2 k=2
..
.
dn ∞
t k−n k
∞
t k−n
n
M X (t) = ∑ E(X ) = ∑ E(X k−n X n ) = E(X n etX )
dt k=n (k − n)! k=n (k − n)!
Por lo que finalmente
dn
n
MX (0) = E(X n )
dt
ejeomemos nuevamente a la variable aleatoria discreta X del ejemplo 6.4.1 junto con su función
generadora de momentos y calculemos los cuatro primeros momentos de la variable alrededor del
origen. Entonces
et + et + 1
MX (t) =
2
d 2t
e + et 1+1
E(X) = Mx (t) = = =1
dx t=0 2 t=0 2
d2 2e2t + et 2+1 3
E(X 2 ) = 2 Mx (t) = = =
dx t=0 2 t=0 2 2
d 3 2t
4e + e t 4+1 5
E(X) = 3 Mx (t) = = =
dx t=0 2 t=0 2 2
d 4 2t
8e + e t 8+1 9
E(X) = 4 Mx (t) = = =
dx t=0 2 t=0 2 2
ejeomemos ahora la variable aleatoria continua X del ejemplo 6.4.2 junto con su función generadora
de momentos y calculemos los cuatro primeros momentos de la variable alrededor del origen. Entonces
2
MX (t) =
2−t
d 2 2 1
E(X) = Mx (t) = = =
(2 − t)2 t=0 22 2
dx t=0
2 d2 4 4 1
E(X ) = 2 Mx (t) = = 3=
dx t=0 3
(2 − t) t=0 2 2
d3 12 12 3
E(X) = 3 Mx (t) = = 4 =
dx t=0 4
(2 − t) t=0 2 4
d4 48 48 3
E(X) = 4 Mx (t) = = 5 =
dx t=0 5
(2 − t) t=0 2 2
proi X1 , X2 , . . . , Xn son v.a. independientes entonces
n
M n (t) = ∏ MXi (t)
∑ Xi i=1
i=1
Demostración
Por definición de función generadora de momentos se tiene que
n
∑ Xit n n n
M n (t) = E ei=1 = E ∏ eXit = ∏ E(eXit ) = ∏ MXi (t)
∑ Xi i=1 i=1 i=1
i=1
Notese que para esta demostración utilizamos la propiedad de la esperanza para v.a. indepen-
dientes.
6.5. Problemas
Variables Aleatorias
1. Determine en cada caso si la variable aleatoria en cuestión es discreta o continua. Cuáles son
sus posible valores?
(2x − 5)2
si x = 1, 2, 3, 4, 5
70
b) f (x) = .
0 en otro caso
4. Encuentre el valor de la constante c para que f (x) sea una función de probabilidad. Grafique
esta función y calcule P(X ∈ 2, 3, 4) y P(X < 3) en cada caso.
cx si x = 1, 2, . . . , 10
a) f (x) = .
0 en otro caso
2
cx si x = 1, 2, . . . , 10
b) f (x) = .
0 en otro caso
7. Encuentre el valor de la constante c para que la siguiente función sea de densidad. Grafique
f (x) y calcule P(X ≥ π) y P(X ∈ [π, 2π]).
c(1 + senx) si x ∈ [0, 2π]
f (x) = .
0 en otro caso
8. Encuentre el valor de la constante c para que la siguiente función sea de densidad. Grafique
f (x) y calcule P(X ∈ (1, ∞)).
9. Determine si cada una de las siguientes funciones es de densidad. Grafique la función en cada
caso y justifique su respuesta.
4x
5 si x ∈ [0, 2]
a) f (x) = .
0 otro caso
2
2x 4
− 2x + si x ∈ [0, 3]
3 3
b) f (x) = .
0 en otro caso
10. Explique porqué no es posible encontrar un valor de la constante c para que la siguiente función
sea de probabilidad o de densidad.
cx
si x = −2, −1, 0, 1, 2
a) f (x) = .
0 otro caso
c senx
si x ∈ [−π, π]
b) f (x) = .
0 en otro caso
11. Sea X una v.a. discreta con función de probabilidad dada por la siguiente tabla. Grafique f (x)
y calcule P(X ≥ 0), P(X < 0) y P(X 2 = 1).
x -1 0 1
f(x) 0,2 0,3 0,5
12. Dadas las variables aleatorias con funciones de probabilidad dada por las tablas
x 0 1 2 3 4
f(x) 1/210 4/35 3/7 8/21 1/14
x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36
13. Sea X una v.a. discreta con función de probabilidad dada por la tabla que aparece abajo.
Grafique f (x). Calcule la función de probabilidad de las siguientes variables aleatorias Y =
X 2 , Z = |X| y W = 2X − 5. Grafique en cada caso.
x -2 -1 0 2 3 5
f(x) 0,1 0,15 0,4 0,1 0,15 0,1
14. Sea X discreta con función de probabilidad dada por la tabla que aparece abajo. Encuentre el
valor de c y grafique f (x). Calcule y grafique la función de probabilidad de la variable Y = X 2 .
x -2 0 2
f(x) 0,1 c 0,1
15. Sea X una variable aleatoria con la siguiente función de distribución. Encuentre y grafique f (x).
Calcule P(0 ≤ X < 10).
1 x+1
1 − si x = 0, 1, 2, 3, . . .
2
F(x) = .
0 otro caso
a) Obtenga el valor de c que haga que esta función sea de densidad para X
b) Calcule y grafique F(x)
c) Calcule P(X ≤ 10), P(X ≥ 5) y P(5 ≤ X ≤ 10)
19. El tiempo en minutos que una persona espera un autobús es una v.a. con función de densidad
dada por
1
2 si 0 < t < 1
f (t) = 14 si 2 < t < 4 .
0 para otro valor de t
Hallar la probabilidad de que el tiempo en que la persona que espera el autobús sea de
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.5. PROBLEMAS U.N.A.
a) mayor de 3 minutos
b) entre 1 y 2 minutos
c) menor de 3 minutos
Hallar:
a) la constante c
b) la función de distribución
1 3
c) P(X > 2) y P <X <
2 2
21. Sea X una variable aleatoria con la función de distribución que aparece abajo. Es X discreta
o continua? Grafique F(x). Encuentre y grafique la correspondiente función de densidad f (x).
Calcule además P(X = 2) y P(1 < X < 2).
0 para x < 1
1
F(x) = si 1 ≤ x < 2 .
3
1 para x ≥ 2
22. Sea X una variable aleatoria con la función de distribución que aparece abajo. Es X discreta
o continua? Grafique F(x). Encuentre y grafique la correspondiente función de densidad f (x).
1 1
Calcule además P(X = ) y P(X > ).
2 2
0√ para x < 0
F(x) = x si 0 ≤ x < 1 .
1 para x ≥ 1
23. Una urna contiene cuatro bolas numeradas 1, 2, 3 y 4. Se extraen dos bolas al azar, una a la
vez y sin reemplazo. Sea X la variable aleatoria que denota la suma de los números de las dos
bolas seleccionadas.
a) Determine Ω
b) Calcule y grafique f (x)
c) Calcule y grafique F(x)
d) Calcule P(X ≥ 6), P(3 < X ≤ 5) y P(X = 6)
1. Sea a un número fijo. Construya una variable aleatoria X tal que E(X) = a.
4. Sea X una variable aleatoria discreta con la función de probabilidad que aparece abajo. De-
muestre que f (x) es efectivamente una función de probabilidad y que la esperanza de X no
existe. Este es un ejemplo de una variable aleatoria discreta que no tiene esperanza finita.
1
x(x + 1) para x = 1, 2, 3, . . .
f (x) = .
0 para otros casos
5. Sea X una variable aleatoria continua con la función de densidad que aparece abajo. Demuestre
que esta función es efectivamente una función de densidad. Compruebe además que la esperanza
de X no existe. Este es un ejemplo de una variable aleatoria continua que no tiene esperanza
finita. Es un caso particular de la distribución Cauchy.
1
f (x) = , para − ∞ < x < ∞
π(x2 + 1)
7. Encuentre la esperanza y luego demuestre que la varianza de una variable aleatoria con la
siguiente función de densidad no existe.
2
x3 para x > 1
f (x) = .
0 para x ≤ 1
9. Demuestre que
a) E(E(X)) = E(X)
b) Var(Var(X)) = 0
a) E(X) = c
b) E(X n ) = cn
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
6.5. PROBLEMAS U.N.A.
c) Var(X) = 0
a) Var(E(X)) = 0
b) E(Var(X)) = E(X)
14. Sea X una variable aleatoria continua con función de densidad f (x) = 12e−|x| , para −∞ < x < ∞.
Demuestre que f (x) es efectivamente una función de densidad y compruebe que
a) E(X) = 0
b) E(X 2 ) = 2
c) Var(X) = 2
d) E(X n ) = n! para n par
a) E(−X) = −E(X)
b) Var(−X) = −Var(X)
c) E(Var(X)) = Var(E(X))
= Var(X + (−X))
= Var(X) +Var(−X)
= Var(X) +Var(X)
= 2Var(X)
Distribuciones de probabilidad
E(X) = ∑ x f (x) = 0 · (1 − p) + 1 · p = p
x
b) Según la definición de varianza, Var(X) = ∑[x − E(X)]2 f (x), entonces tenemos que
x
Ω = {(EEE . . . E), (FEE . . . E), (FFE . . . E), . . . , (FFF . . . FE), (FFF . . . F)}
Usando el principio multiplicativo, es fácil ver que este conjunto tiene 2n elementos. Si ahora se
define la variable aleatoria X como el número de éxitos en cada una de estas sucesiones, esto es
entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribución binomial con parámetros
n y p. Se escribe X ∼ bin(n, p), y su función de probabilidad es
n!
px (n − p)1−x si x = 0, 1, . . . , n
x!(n − x)!
f (x) =
0 para otro caso
proea X ∼ bin(n, p), entonces tenemos que E(X) = np Var(X) = n(1 − p) MX (t) = (1 −
p + pet )n
Demostración
S .a)b)c)
a) Como la variable aleatoria X constituye el número de éxitos obtenidos en cada uno
n
de los posibles resultados en el experimento (posibles sucesiones de Ω). Entonces X = ∑ X j,
j=1
donde X j ∼ Ber(p), ∀ j = {1, 2, . . . , n}, por lo que la esperanza, varianza y función generadora de
momentos de cada X j son E(X j ) = p, Var(X j ) = p(1 − p) y MX j (t) = pet + p − 1 respectivamente.
Aplicando la propiedad de linealidad de la esperanza se tiene
n n n
E(X) = E ∑ Xj = ∑ E(X j ) = ∑ p = np
j=1 j=1 j=1
b) Tomando en cuenta la propiedad de varianza que establece que si tenemos n variables aleatorias
independientes, todas con varianzas finitas, entonces la varianza de las suma de las n v.a. es
idéntica a la suma de las varianzas de las variables, por lo tanto la varianza de X es:
n n n
Var(X) = Var( ∑ X j ) = ∑ Var(X j ) = ∑ p(1 − p) = np(1 − p)
j=1 j=1 j=1
ejel experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro interés es el
número de caras obtenidas en los cuatro lanzamientos. Como es evidente, la probabilidad de
obtener un éxito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la de obtener un
fracaso es también 0,50.
E. a) Cuál es la probabilidad de no obtener caras en los cuatro lanzamientos?
a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es,
4! 1 4 1
P(X = 0) = =
0!(4 − 0)! 2 16
b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es,
4! 1 4 6 3
P(X = 2) = = =
2!(4 − 2)! 2 16 8
x 0 1 2 3 4
p(x) 1/16 4/16 3/8 1/4 1/16
b) El número de errores de ortografı́a que uno comete al escribir una única página.
h) La radiactividad de la sustancia se debilitará con el tiempo, por lo tanto el tiempo total del
intervalo usado en el modelo debe ser significativamente menor que la vida media de la sustancia.
Demostración
S .a)b)c)
a) A partir de la definición de esperanza se tiene que
∞
e−λ λx ∞
e−λ λx ∞ −λ x−1
e λ
E(X) = ∑x =∑ =λ∑ =λ
x=0 x! x=1 (x − 1)! x=1 (x − 1)!
b) Según una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) − [E(X)]2 , entonces
calculemos primero E(X 2 )
∞
e−λ λx ∞
e−λ λx ∞
e−λ λx
E(X 2 ) = ∑ x2 = ∑x = ∑ (x − 1 + 1)
x=0 x! x=1 (x − 1)! x=1 (x − 1)!
∞
e−λ λx ∞
e−λ λx ∞
e−λ λx ∞ −λ x−1
e λ
= ∑ (x − 1) +∑ =∑ +λ ∑
x=1 (x − 1)! x=1 (x − 1)! x=2 (x − 2)! x=1 (x − 1)!
∞
e−λ λx−2 ∞ −λ x−1
e λ
= λ2 ∑ +λ ∑ = λ2 + λ
x=2 (x − 2)! x=1 (x − 1)!
Entonces:
Var(X) = λ2 + λ − λ2 = λ
= 1 − 0, 7306 = 0, 2694
b) A partir de la proposición
t
E(X) = Var(X) = λ = 1, 8 y MX (t) = e1,8(e −1)
La distribución de Poisson puede ser vista como un caso lı́mite de la distribución binomial,
es decir, una distribución binomial en la que n → ∞ y p → 0 se puede aproximar por una
distribución de Poisson de parámetro λ = np.
ejen una central telefónica automática la probabilidad de que una llamada sea conectada
erróneamente es 10−3 .
E. a) Para un dı́a donde son conectadas 2000 llamadas independientes, hallar el valor apro-
ximado de la probabilidad que se efectúen 4 conexiones erróneas.
b) Cuál es el número mı́nimo de llamadas independientes que se requieren para asegurar con
probabilidad 0,9 que por lo menos una de las llamadas sea conectada erróneamente?
Desarrollo
e−np (np)x
P(X = x) =
x!
donde p = 10−3 y n = 2000 según las condiciones de este problema. Entonces np = 2 y
e−2 (2)4
P(X = 4) = = 0, 09
4!
e−np (np)0
1− ≥ 0, 9
0!
0, 1 ≥ e−np
ln|0, 1| ≥ −np
n ≤ 2303 llamadas
la distribución de probabilidad del número Y = X − 1 de fallos antes del primer éxito, contenido
en el conjunto {0, 1, 2, 3, . . . }
El nombre de esta distribución proviene del hecho de que cuando escribimos la suma de todas las
probabilidades, obtenemos una suma geométrica. La inspección sucesiva de artı́culos hasta encontrar
una defectuoso, posiblemente en un proceso de control de calidad, puede modelarse usando una
distribución geométrica.
proi X es la v.a. que muestra el número de fracasos antes del primer éxito esto es; X ∼ geo(p)
entonces:
(1 − p)
S. a) E(X) =
p
(1 − p)
b) Var(X) =
p2
p 1
c) MX (t) = , con t < ln
t
1 − e (1 − p) 1− p
Demostración
∞
d x d h ∞ x
i
= −p(1 − p) ∑ [(1 − p) ] = −p(1 − p) ∑ (1 − p)
x=1 d p d p x=1
d 1 (−1) 1 − p
= −p(1 − p) − 1 = −p(1 − p) 2 =
dp p p p
b) Según una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) − [E(X)]2 , entonces
calculemos primero E(X 2 )
∞ ∞ ∞
E(X 2 ) = ∑ x2 p(1 − p)x = p ∑ x2(1 − p)x = p(1 − p) ∑ x2(1 − p)x−1
x=0 x=1 x=1
∞
d x d h ∞ x
i
= −p(1 − p) ∑ [x(1 − p) ] = −p(1 − p) ∑ x(1 − p)
x=1 d p d p x=1
d h1 ∞ x
i d h1 − pi
= −p(1 − p) ∑ px(1 − p) = −p(1 − p)
d p p x=1 d p p2
Entonces:
(1 − p)(2 − p) (1 − p)2 1 − p
Var(X) = − = 2
p2 p2 p
c) Por la definición de función generadora de momentos, se tiene que
∞ ∞ 1
tx x t x p
MX (t) = ∑ e p(1 − p) = p ∑ [e (1 − p)] = con t < ln
t
1 − e (1 − p) 1− p
x=0 x=0
∞
1
Observación: Recordar que una serie geométrica es de la forma ∑ rx−1 y converge a
1−r
si su
x=1
radio r cumple con la condición |r| < 1
ejeupongamos que un dado ordinario (equilibrado) es lanzado repetidas veces hasta que
aparece el resultado 1 por primera vez. Calcular
S. a) obtener la distribución de probabilidad de la v.a. que se ajuste a este experimento y calcular
la probabilidad de obtener el 1 en el cuarto lanzamiento
a) Sea X la v.a que represente el número de lanzamientos necesarios del dado para obtener por
primera vez el resultado 1. Entonces X ∼ geo(P = 16 ), con lo cual
x
16 56
si x = 0, 1, 2, . . .
P(X = x) =
0 para otro caso
Por lo que
1 5 3 125
P(X = 3) = 1− =
6 6 1296
b) Según la proposición
Para n = r, r + 1, . . . se define An como el suceso que establece que el número total de pruebas
requeridas para obtener exactamente r éxitos es n. Como el suceso An ocurre si y solo si ocurren
exactamente r − 1 éxitos en las primeras n − 1 pruebas y el r−ésimo éxito se da en la n−ésimo
prueba. Puesto que todas las pruebas son de Bernoulli entonces son todas independientes entre
si y áplicando el principio de análisis combinatorio, se obtiene que:
n−1
P(An ) = pr−1 (1 − p)(n−1)−(r−1) p
r−1
con lo cual
n−1
P(An ) = pr (1 − p)n−r (7.1.1)
r−1
Si decimos que X es la v.a. que cuenta el número de fracasos antes de obtener el r−ésimo éxito,
entonces X puede tomar los valores del conjunto {0, 1, 2, . . . }. Además recordemos que n por
definición de An es número de fracasos (x) más número de éxitos (r), esto es n = x + r. Entonces
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD U.N.A.
Aparece el término pr pues la sucesión de ensayos Bernoulli no concluye sino hasta obtener r
éxitos. Podemos
tener
un número variable de fracasos, de ahı́ el término (1 − p)x , y finalmente
r+x−1
el factor que nos dice las diferentes formas en que los r éxitos pueden aparecer en
x
los r + x − 1 ensayos realizados antes del último que necesariamente fue un éxito.
Demostración
Si X es la v.a que cuenta el número de fracasos antes del r−ésimo éxito en sucesión de pruebas
r
de Bernoulli; entonces X = ∑ Xi, donde todas las v.a. Xi son independientes entre si y cada
i=1
1− p 1− p p
Xi ∼ geo(p), ∀ i = 1, 2, . . . , r; con lo cual E(Xi ) = ,Var(Xi ) = 2 y MXi (t) = .
p p 1 − et (1 − p)
Esto resulta del hecho de que para cada éxito se tubo que haber tenido un cierto número de
fracasos, que es la caracterı́stica de la distribución geométrica. Entonces
a) la esperanza de X es
r r r
1 − p r(1 − p)
E(X) = E ∑ Xi = ∑ E(Xi ) = ∑ =
i=1 i=1 i=1 p p
b) la varianza de X es
r r r
1 − p r(1 − p)
Var(X) = Var ∑ Xi = ∑ Var(Xi ) = ∑ p2 = p2
i=1 i=1 i=1
ejee lanza repetidas veces una moneda honesta, cuyos dos resultados son cara y cruz.
S . a) Cuál es la probabilidad de obtener la tercera cruz en el quinto lanzamiento?
b) Obtener la esperanza, varianza y la función generadora de momentos para esta distribu-
ción.
Desarrollo
a) Sea X la v.a. que represente el número de caras (fracasos) necesarias astes de obtener por
tercera vez cruz. Entonces X ∼ bin neg(3, 12 ), con lo cual
2+x 3 x
1 1
si x = 0, 1, 2, . . .
x
2 2
P(X = x) =
0 para otro caso
Por lo que
2+2 1 3 1 2 1 5 6
P(X = 2) = =6 = = 0, 1875
2 2 2 2 32
b) Según la proposición
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
Supongamos que tenemos un conjunto de N objetos de los cuales k son de una primera
clase y N − k son de una segunda clase. Supongamos que de este conjunto tomamos una
muestra aleatoria de tamaño n (n ≤ N), la muestra es sin reemplazo y el orden de los
objetos seleccionados no importa. El espacio muestral de este experimento consiste de
todas las posibles muestras de tamaño n que se pueden
obtener del conjunto mayor de
N
tamaño N. La cardinalidad del espacio muestral es . Si para cada muestra definimos
n
la variable aleatoria X como el número de objetos de la primera clase contenidos en la
muestra seleccionada, entonces X puede tomar los valores 0, 1, 2, . . . , n; suponiendo n ≤ k.
La probabilidad de que X tome un valor x estará dada por la fórmula que enunciamos a
continuación. Decimos que X tiene una distribución hipergeométrica con parámetros N, k
y n, y escribimos X ∼ hipergeo(N, k, n) si
N −k
! !
k
x n−x
si x = 0, 1, 2, . . . , n
!
N
P(X = x) =
n
0 para otro caso
k
El término nos dice las diferentes formas en que de los k objetos de la primera clase
x
N −k
se pueden escoger x de ellos, y el término es nuevamente las diferentes formas
n−x
de escoger n − x objetos de la totalidad de N − k objetos de la segunda clase. Usamos el
principio multiplicativo para obtener el número total de muestras diferentes en donde x
objetos son de la primera clase y n − x objetos son de la segunda clase.
proada una población finita de tamaño N con dos clases posibles de objetos. Si X es la
v.a. que muestra el número de objetos de la primera clase contenidos en una muestra
de tamaño n seleccionada de dicha población entonces X ∼ hipergeo(N, k, n) y presenta
las siguientes caracteristicas:
nk
D . a) E(X) =
N
nk k N − n
b) Var(X) = 1−
N N N −1
Demostración
k
◦ E(Xi ) = P(Xi = 1) =
N
k k 2 k k
◦ Var(Xi ) = E(Xi2 ) − [E(Xi )]2 = − = 1−
N N N N
Entonces tenemos que:
a) la esperanza de X es
n n n
k nk
E(X) = E X =
∑ i ∑ i ∑N = NE(X ) =
i=1 i=1 i=1
b) la varianza de X es
n
Var(X) = Var ∑ Xi = E(X 2 ) − E(X)
i=1
calculemos entonces:
k N −k k−1 N −k
2
n x x
2 x n−x nk n x−1 n−x
E(X ) = ∑
N
= ∑
N − 1
x=0 N x=1
n n−1
k−1 N −k
(x − 1 + 1)
nk n x−1 n−x
= ∑
N −1
N x=1
n−1
k−2 N −k k−1 N −k
" #
nk (k − 1)(n − 1) n x−2 n−x
n
x−1 n−x
= ∑ +∑
N N −1 x=2
N −2
x=1
N −1
" "n − 2
# #n − 1
nk (k − 1)(n − 1) nk (k − 1)(n − 1) + N − 1
= +1 =
N N −1 N N −1
Por lo tanto
" # " #
nk (k − 1)(n − 1) + N − 1 nk 2 nk N 2 − (k + n)N + nk
Var(X) = − =
N N −1 N N N(N − 1)
nk N − k N − n
=
N N N
ejeupóngase que una urna contiene cinco bolas rojas y diez azules. Si se seleccionan
bolas de la urna sin reemplazamiento; sea X la v.a que cuenta el número de bolas
rojas extraidas. Si se extraen al azar sin reemplazamiento siete bolas
S . a) Cuál es la probabilidad de seleccionar exactamente cuatro bolas rojas?
b) Cuál es la probabilidad de seleccionar almenos tres bolas rojas?
c) Calcular la esperanza y la varianza de esta distribución
Desarrollo
Como X es la v.a que cuenta el número de bolas rojas extraidas en un muestreo sin
reemplazmiento; se tiene que X ∼ hipergeo(15, 5, 7). Por lo tanto
! !
5 10
x 7−x
si x = 0, 1, 2, 3, 4, 5
!
15
P(X = x) =
7
0 para otro caso
a) Para contestar la pregunta de este item basta calcular P(X = 4), esto es;
5 10
4 3 5 · 120 40
P(X = 4) =
15
= =
6435 429
7
b) Para contestar esta parte debemos calcular P(X ≥ 3); que equivale a decir,
P(X ≥ 3) = P(X = 3) + P(X = 4) + P(X = 5)
Por lo tanto
5 10 5 10 5 10
3 4 4 3 5 2 140 40 1 61
P(X ≥ 3) =
15
+
15
+
15
= + + =
429 429 143 143
7 7 7
c) Según la proposición
f(x)
2.0
1.5
1.0
1
b−a
0.5
0.0
x
a b
−0.5
0 1 2 3 4
proea X la v.a. continua con distribución uniforme en el intervalo (a, b), entonces
X tiene las siguientes caracterı́sticas
a+b
E(X) =
2
(b − a)2
b) Var(X) =
12
e − eat
bt
c) MX (t) =
(b − a)t
0 si x > a
x
d) F(x) = si a ≤ x < b
b−a
1 si x ≥ b
Demostración
Como X es una v.a. continua con distribución uniforme en el intervalo (a, b) entonces
su función de densidad de probabilidad es
1
si a < x < b
b−a
f (x) =
0 en otro caso
con lo cual
a) por definición de esperanza para v.a. continua
Z b
1 1 b 1 a+b
Z ∞
E(X) = x f (x)dx = x dx = x2 = (b2 − a2 ) =
−∞ a b−a 2(b − a) a 2(b − a) 2
2.0
x
−0.5
0 1 2 3 4 5
x
Figura 7.2: Representación gráfica de F(x) = b−a
2.5
1
f(x) =
2.0
2−0
1.5
1.0
0.5
0.0
x
a b
−0.5
0 1 2 3 4
2.0
x
F(x) =
1.5
2
1.0
0.5
0.0
x
−0.5
−1 0 1 2 3 4
1 ∞ (x−u)2
f(x) = ⌠ e(−2( ))
1
σ2 dx
2 ⌡−∞
2πσ
más se dispersarán los datos en torno a la media y la curva será más plana. Un valor
pequeño de este parámetro indica, por lo tanto, una gran probabilidad de obtener
datos cercanos al valor medio de la distribución.
Como se deduce, no existe una única distribución normal, sino una familia de dis-
tribuciones con una forma común, diferenciadas por los valores de sus medias y sus
varianzas.
Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas es-
tarán centradas en la misma posición y tendrán diferentes formas; tal como lo muestra
la Figura 7.6.
Probability density
Deviates
Figura 7.6: Curvas normales que tienen medias iguales y desviaciones estándar diferentes
Si las curvas tienen desviaciones estándar iguales y medias diferentes, las curvas serán
idénticas pero centradas en diferentes posiciones sobre el eje horizontal, ası́ como lo
muestra la Figura 7.7.
Deviates
Figura 7.7: Curvas normales que tienen medias diferentes y desviaciones estándar iguales
Si las curvas tienen medias diferentes y también sus desviaciones estándar son diferen-
tes entonces aparte de estar centradas en diferentes lugares del eje x, tendrá formas
diferentes; ası́ como lo muestra la Figura 7.8.
Deviates
Figura 7.8: Curvas normales que tienen medias diferentes y desviaciones estándar diferentes
115 120
u=115
Se busca el valor del área para 0 ≤ Z ≤ 0, 41 en la tabla de áreas bajo la curva normal
estandar, que es el valor 0,1591 . Y como el área a la derecha del valor z = 0, 41 es el
área que buscamos, entonces este es el resultado, es decir, la probabilidad de que un
aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es
100 115
u=115
122 115
u=115
Se busca el valor del área para 0 ≤ Z ≤ 0, 58 en la tabla de áreas bajo la curva normal
estándar, que es el valor 0,2190. Y como el área a la izquierda del valor z = 0, 58 es el
área que buscamos, entonces el resultado a buscar es:
0.4
0.3
probability density
115 125
u=115
Se busca el valor del área para 0 ≤ Z ≤ 0, 83 en la tabla de áreas bajo la curva normal
estándar, que es el valor 0,2967. Y como el área a buscar es el área entre z = 0 y z = 0, 83,
entonces el resultado a buscar es:
0.4
0.3
probability density
90−105 115
u=115
Se busca el valor del área para −2, 08 ≤ Z ≤ −0, 83 en la tabla de áreas bajo la curva
normal estandar, que es el valor 0,2967. Y como el área a buscar es el área entre z = 0
y z = 0, 83, entonces el resultado a buscar es:
chi−squared
k=1
k=2
0.15
k=3
k=4
k=5
0.10
p(x)
0.05
0.00
0 10 20 30 40
Figura 7.14: Gráfica de f (x) cuando el parámetro k toma los valores 1,2,3,4 y 5
Por la definición anterior; ji−cuadrada es una variable aleatoria continua con posibles
valores en el intervalo (0, ∞). Esta distribución tiene un solo parámetro denotado aqui
por la letra k, y al cual se le llama grados de libertad. También al parémetro
de ji−cuadrado se denota por la letra griega ν. A pesar de la aparente expresión
complicada de f (x), no es difı́cil comprobar que es efectivamente una función de
densidad de probabilidad. La gráfica de esta función para varios valores del parámetro
k aparece en la Figura 7.14.
Escribiremos simplemente X ∼ χ2 (k), en donde la letra griega χ se pronuncia ji o tam-
bién chi. Puede demostrarse que E(X) = k y Var(X) = 2k. La distribución ji−cuadrada
puede obtenerse como indican los siguientes resultados que dejaremos sin demostrar.
proi X es una v. a. que sigue una distribución normal tipificada (X ∼ N(0, 1)), entonces
la v.a. X 2 sigue una distribución ji−cuadrada con un grado de libertad (X 2 ∼ χ2 (1)).
Es decir, el cuadrado de una variable aleatoria con distribución normal estándar tiene
distribución ji−cuadrada con un grado de libertad. Por otro lado, el siguiente resulta-
do establece que la suma de dos variables aleatorias independientes con distribución
ji−cuadrada tiene distribución nuevamente ji−cuadrada con grado de libertad igual
a la suma de los grados de libertad de los sumandos.
proi X ∼ χ2 (n) y Y ∼ χ2 (m) son dos variables aleatorias independientes, entonces X +Y
tiene distribución χ2 (n + m).
En general si las v.a. X1 , X2 , . . . , Xn son independientes y si Xi ; ∀i = 1, 2, . . . , n tiene
una distribución χ2 con n j grados de libertad para j = 1, 2, . . . , k entonces la suma
X1 + X2 + · · · + Xn tiene una distribución χ2 con n1 + n2 + · · · + nk grados de libertad.
proean X1 , X2 , . . . , Xn una muestra aleatoria de una distribución normal con media µ y
n
Xi − µ 2
varianza σ2 . La distribución de la v.a. Y = ∑ es del tipo ji−cuadrado con
i=1 σ
n grados de libertad.
t−student
0.35
0.30
0.25
0.20
f(x)
0.15
0.10
0.05
0.00
−4 −2 0 2 4
0 si x ≤ 0
F(x) = P(X ≤ x) = .
1 − e−λx si x > 0
La gráfica de esta función cuando el parámetro λ toma los valores particulares 0,5;
1,0 y 1,5 se muestra en la Figura 7.17.
distribucion exponencial
0.5
λ = 0.5
λ=1
λ = 1.5
0.4
0.3
f(x)
0.2
0.1
0.0
0 1 2 3 4 5 6 7
distribucion exponencial
1.0
0.8
0.6
f(x)
λ = 0.5
λ=1
λ = 1.5
0.4
0.2
0.0
0 1 2 3 4 5 6 7
proea X la v.a. continua con distribución exponencial, entonces X tiene las siguien-
tes caracterı́sticas
1
S . a) E(X) =
λ
1
b) Var(X) = 2
λ
λ
c) MX (t) =
λ−t
Demostración
Por definición de esperanza se tiene que
1 ∞ 1
Z ∞ Z ∞
E(X) = x f (x)dx = λ xe−λx dx = −e−λx x + =
−∞ 0 λ 0 λ
2x 2 ∞ 2
Z ∞ Z ∞
E(X 2 ) = x2 f (x)dx = λ x2 e−λx dx = −e−λx x2 + + 2 = 2
−∞ 0 λ λ 0 λ
Entonces la varianza está dada por
2 1 2 1
Var(X) = 2 − = 2
λ λ λ
Finalmente por definición de función generadora de momentos se tiene que
λe−(λ−t)x ∞
Z ∞ Z ∞ Z ∞
λ
MX (t) = ext f (x)dx = λ ext e−λx dx = λ e−(λ−t)x dx = =
−∞ 0 0 −(λ − t) 0 λ−t
ejeuponga que el tiempo en minutos que un usuario cualquiera permanece revisan-
1
do su correo electrónico sigue una distribución exponencial de parámetro λ = .
5
Calcule la probabilidad de que un usuario cualquiera permanezca conectado al
servidor de correo
S . a) menos de un minuto
b) más de un ahora
c) Calcula la esperanza, varianza y la función generadora de momentos
Solución
a) Para este primer inciso tenemos que
Z 1
1 1 1 1
1
1
P(X < 1) = e− 5 x dx = − 5e− 5 x = 1 − e− 5 = 0, 1813
0 5 5 0
b) Siguiendo el mismo razonamiento del inciso anterior y teniendo en cuenta que una
hora equivale a 60 minutos se tiene que
1 −1x 1
Z ∞
1 ∞
P(X > 60) = e 5 dx = − 5e− 5 x = e−12 = 6, 14 · 10−6
60 5 5 60
7.3. Problemas
Distribución binomial
1. Sea X una variable aleatoria con distribución bin(n, p) tal que E(X) = 4 y
Var(X) = 2. Cuáles son los valores de n y p?
2. Sea X una variable aleatoria con distribución bin(n, p). Demuestre que la va-
riable Y = n − X tiene distribución bin(n, 1 − p). Proporcione una explicación
probabilı́sta de este resultado.
3. Sea X con distribución bin(n, p). Demuestre que para x = 0, 1, . . . , n−1, se cumple
la siguiente fórmula. Esta expresión permite calcular las probabilidades de esta
distribución de una forma iterativa.
p(n − x)
P(X = x + 1) = P(X = x)
(1 − p)(x + 1)
4. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada
cara caiga exactamente 3 veces.
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS
0 ≤ Var(X) ≤ E(X)
7. Suponiendo que es igualmente probable que nazca un hombre (H) o una mujer
(M), y considerando la observación de 6 nacimientos. Cuál de los siguientes
eventos es más probable que ocurra?
a) MHHMHM
b) MMMMHM
c) HMHMHM
8. La probabilidad de que un paciente se recupere de una extraña enfermedad es
0, 4. Si se sabe que 15 personas contraen esa enfermedad,
a) Haga un histograma donde represente la distribución binomial para este caso.
b) Cuál es la probabilidad de que sobrevivan al menos 10?
c) Cuál es la probabilidad de que sobrevivan de 3 a 8?
d) Calcule la media y la varianza de esta distribución binomial.
9. En la ciudad la necesidad de dinero para comprar drogas se establece como la
razón del 75 % de los robos. Encuentre la probabilidad de que entre los siguientes
cinco casos de robo:
a) dos resulten de la necesidad de dinero para comprar drogas
b) al menos tres resulten de la necesidad de dinero para comprar drogas
c) Represente esta distribución binomial en un histograma
d) Calcule la media y la varianza de esta distribución binomial
10. Un prominente médico afirma que 70 % de las personas con cáncer de pulmón
son fumadores empedernidos. Si su aseveración es correcta:
a) encuentre la probabilidad de que de 10 de tales pacientes menos de la mitad
sean fumadores empedernidos
b) encuentre la probabilidad de que de 10 de los pacientes con cáncer de pulmón
ninguno sea fumador empedernido
c) Represente esta distribución binomial en un histograma
d) Calcule la media y la varianza de esta distribución binomial
11. De acuerdo con un estudio publicado por un grupo de sociólogos de la Universi-
dad de Massachussets aproximadamente el 60 % de los consumidores de Valium
en el estado de Massachussets tomaron Valium por primera vez debido a pro-
blemas psicológicos. Encuentre la probabilidad de que entre los siguientes ocho
consumidores entrevistados en este estado:
a) tres comenzaron a tomar Valium por problemas psicológicos.
b) al menos cinco comenzaron a consumir Valium por problemas que no fueron
psicológicos
c) Represente esta distribución binomial en un histograma
d) Calcule la media y la varianza de esta distribución binomial
12. De acuerdo a una encuesta a nivel nacional en Estados Unidos de la universidad
de Michigan a estudiantes universitarios de último año revela que el 70 % de
los estudiantes desaprueba el consumo diario de la mariguana. Si se seleccionan
doce estudiantes al azar y se les pide su opinión, encuentre la probabilidad de
que el número de los que desaprueban fumar mariguana todos los dı́as sea:
a) entre siete y nueve
b) a lo más cinco
c) no memos de ocho
d) Represente esta distribución binomial en un histograma
e) Calcule la media y la varianza de esta distribución binomial.
13. Un estudio examinó las actitudes hacia los antidepresivos. El estudio reveló que
aproximadamente el 70 % cree que los antidepresivos en realidad no curan nada,
sólo encubren el problema real. De acuerdo con este estudio
a) cuál es la probabilidad de que al menos tres de las siguientes cinco personas
seleccionadas al azar sean de esta opinión?
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS
b) Si la oficina abre a las 9:00 a.m. y él sale de su casa diariamente a las 8:45
a.m., qué porcentaje de las veces llega tarde al trabajo?
c) Si sale de su casa a las 8:35 a.m. y el café se sirve en la oficina de las 8:50 a.m.
a las 9:00 a.m., cuál es la probabilidad de que llegue a la hora del café?
d) Encuentre cual es el tiempo a partir del cual que duran el 15 % de los viajes
más lentos?
e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como
máximo 21 hora.
7. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de
174,5 cm y una desviación estándar de 6,9 cm., cuántos de estos estudiantes
se esperarı́a que tuvieran alturas
a) Menores de 160 cm?
b) Entre 171,5 cm y 182 cm?
c) Mayores a 165 cm?
d) Entre 174,5 cm y 180 cm?
e) Entre 180 cm y 195 cm?
f) Menores de 185 cm?
g) Cuál es la probabilidad de que de cinco estudiantes, al menos 3 midan más de
180 cm?
h) Cuál es la probabilidad de que de 3 estudiantes, ninguno mida menos de 160
cm?
8. Una estación de radio encontró que el tiempo promedio que una persona sinto-
niza esa estación es de 15 minutos con una desviación estándar de 3,5 minutos.
Cuál es la probabilidad de que un radioescucha sintonice la estación por:
a) más de 20 minutos?
b) entre 15 y 18 minutos?
c) entre 10 y 12 minutos?
d) Cuantos minutos como máximo sintonizan la estación el 70 % de los radioes-
cuchas?
e) Cuál es la probabilidad de que de 8 radioescuchas, al menos 7 sintonicen la
estación por más de 5 minutos?
9. Un analista financiero señala que (conforme a su probabilidad subjetiva) el
precio Y de los bonos de gobierno a largo plazo, con un valor de 1000 dólares,
tendrá al cabo de un año una distribución normal con un valor esperado de
980 dólares y desviación tı́pica de 40 dólares.
a) Encuentre P(Y ≥ 1000)
b) Encuentre P(Y ≤ 940)
c) Encuentre P(960 ≤ Y ≤ 1060)
10. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que
se basa en un sistema de pago a destajo) tiene una distribución normal con
un valor esperado de 5,10 dólares y una desviación estándar de 0,40 dólares.
a) Encuentre la probabilidad de que el salario por hora de un trabajador sea
superior a 5,40 dólares
b) Encuentre la probabilidad de que el salario por hora de un trabajador se
encuentre entre 4,70 y 5,50 dólares
c) Encuentre la probabilidad de que el salario por hora sea superior al salario
mı́nimo de 3,90 dólares
11. Se ha determinado que la vida útil de cierta marca de llantas radiales tiene
una distribución normal con media 38000 kilómetros y desviación estándar
3000 kilómetros.
a) Cuál es la probabilidad de que una llanta elegida al azar tenga vida útil de
cuando menos 35000 km.?
b) Cuál es la probabilidad de que dure mas de 45000 km.?
12. Si un distribuidor hace un pedido de 500 llantas de las especificadas en el
problema anterior . Aproximadamente, cuantas llantas duraran:
a) entre 40000 y 45000 kilómetros?
b) 40000 kilómetros o más?
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS
13. Una operación de maquinado produce ejes de aceros cuyos diámetros están
distribuidos normalmente con un promedio de 1,005 pulgadas y desviación
estándar de 0,01 pulgadas. Las especificaciones piden diámetros que queden
en el intervalo 1, 00 ± 0, 02 pulgadas. Qué porcentaje de la producción no
cumplirá las especificaciones?
14. Las ausencias por enfermedad de los empleados de una empresa en un mes
tiene una distribución normal aproximada con promedios de 200 horas y una
varianza de 400 horas.
a) Calcular la probabilidad de que el mes próximo el ausentismo total por enfer-
medad sea menar que 150 horas.
b) Para plantear el programa del mes próximo. Cuánto tiempo debe suponer
darse el ausentismo por enfermedad, si aquella cantidad solo se debe superar
con una probabilidad de tan solo 0,10.
15. Una empresa eléctrica fabrica focos que tienen una duración, antes de fun-
dirse, que se distribuye normalmente con una media igual a 800 horas y una
desviación estándar de 40 horas.
a) Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas
b) Sabiendo que el porcentaje de los focos de mayor duración es de 35, 5 %, en-
cuentre el tiempo de duración.
16. Las calificaciones de un examen se distribuyen normalmente con valor espe-
rado igual a 74 y desviación estándar igual a 7. Si 12 % de la clase obtiene
Calificación A . Cuál es la A más baja posible y la B más alta posible?.
17. Si los ingresos mensuales de médicos Norteamericanos están distribuidos nor-
malmente, con media 15000 dólares y con un desvı́o estándar de 3500 dólares
. Cuál es la probabilidad de que un medico elegido al azar tenga un ingreso
anual de :
a) superior a 16260 dólares
b) entre 16260 y 18500 dólares
c) entre 11500 y 18500 dólares
d) entre 8000 y 11500 dólares
18. Los puntos logrados por los candidatos en una prueba de actitud están dis-
tribuidos normalmente con una media de 500 y una desviación 100. Qué por-
centaje de los candidatos reciben puntajes
a) superiores a 700
b) entre 400 y 600
19. Si la estatura de los estudiantes de una universidad están normalmente distri-
buidos con media de 70 pulgadas, con un desvı́o estándar de 3 pulgadas.
a) Si la estatura mı́nima para ser probado en el equipo de baloncesto es de
72 pulgadas. Que proporción de los estudiantes estarı́an en condiciones de
someterse a la prueba?
b) Si para ocupar la posición de centro hay que tener una estatura de 76 pulgadas.
Que proporción de los estudiantes aptos para jugar baloncesto podrı́an ocupar
dicho lugar?
20. El examen dado por un grupo de estudiantes arroja una media de 65 con una
desviación tı́pica de 10. Si quisiéramos dar al 15 % superior una calificación A
, al 20 % siguiente B, al 30 % del medio C, al siguiente 25 % D y al 10 % más
bajo F. Qué calificaciones numéricas siguen el trazado de la curva?.
21. Las distribución de los salarios de 2000 trabajadores tiene una media de 70
dólares y una varianza de 36 dólares. Suponga que la distribución es normal
aproximada. Calcular la probabilidad que ganen:
a) entre 65 y 77 dólares
b) 82 dólares y mas
c) Cuantos trabajadores ganan 60 dólares o menos?
22. Un especialista en ictiologı́a tropical esta interesado en estimar cuanto tiempo
puede sobrevivir cierto tipo de pez en agua con determinado porcentaje de
toxicidad. Luego de una serie de experimentos llega a estimar que la vida
media de este tipo de pez alcanza 100 dı́as con un desvió estándar de 20 dı́as.
a) Cuál es la probabilidad de un pez sobreviva más de 110 dı́as?
32. El peso medio de 500 bacas es de 151 kilogramos, con una dispersión de
15 kilogramos. Suponiendo que la variable peso se encuentre normalmente
distribuida, determinar:
a) Cuántas vacas pesan entre 120 y 155 kilogramos?
b) Cuántas vacas pesan 185 kilos o más?
c) Cuántas vacas pesan menos de 128 kilogramos?
33. En un examen de matemáticas, el puntaje promedio es de 42 puntos, con una
desviación estándar de 9 puntos. Hay un 10 % de compañeros que por tener
mayor puntaje reciben un premio. Se pide determinar el puntaje mı́nimo para
lograr dicho premio, suponiendo normal la distribución de las calificaciones.
34. Los resultados obtenidos por los aspirantes que rindieron examen de ingreso
en una Facultad, indicaron una distribución aproximadamente normal de la
variable punta je con un valor medio de 60 puntos y una dispersión de 8 puntos.
Calcular el porcentaje de aspirante que obtuvieron puntajes:
a) mayores a 70 puntos
b) inferiores a 56 puntos
c) entre 65 y 75 puntos
Distribución Exponencial
1. Suponga que el tiempo que un usuario cualquiera permanece conectado a un
servidor en una red de cómputo se puede modelar como una variable aleatoria
con distribución exponencial con media igual a 10 minutos. De mil usuarios,
Cuántos tienen un conexión superior a una hora?. Calcule además la proba-
bilidad de que un usuario cualquiera
a) no permanezca conectado más de 10 minutos.
b) permanezca conectado más de 10 minutos pero menos de una hora
2. Sabemos que la duración del tipo de bombillas que usamos sigue una distri-
bución exponencial de media 6 horas.
a) Si una persona entra a la habitación con la luz encendida dispuesta a perma-
necer siete horas. Podrá hacerlo sin que se funda la bombilla?.
b) Encuentre el tiempo promedio de duración de las bobillas.
3. Si la cantidad de dinero pagado por cada póliza en una compañı́a de seguros
se distribuye exponencialmente con media 2000.
a) Si una persona en este momento está pagando una poliza de seguros a la
compañı́a, cuál es la probabilidad de que sea un monto superior a 2500?.
b) Encuentre la cantidad promedio de pago de dinero por un seguro a la compa-
ñı́a.
4. Una máquina de servicio tiene una unidad de reserva para sustituirla de in-
mediato cuando falle. El Tiempo a la falla (tiempo entre fallas) de la máquina
(o de su unidad de reserva) es exponencial, y sucede cada 40 minutos en pro-
medio.
a) El operador de la máquina dice que ésta tiene la costumbre de descomponerse
cada noche a eso de las 8:30 P.M. Analizar lo que dice el operador.
b) La cantidad promedio de fallas en una semana, suponiendo que el servicio se
ofrece 24 horas por dı́a y 7 dı́as por semana.
c) La probabilidad de que haya al menos una falla en un perı́odo de 2 horas.
d) La probabilidad de que la próxima falla no suceda en menos de 3 horas.
e) Si no ha sucedido falla en 3 horas después de la última falla, cuál es la proba-
bilidad de que el tiempo entre fallas sea de 4 horas cuando mucho?.
5. El tiempo entre llegadas en una dependencia del Banco Mercan es exponencial
con valor medio de 0,05 hora. La oficina abre a las 8:00 A.M.
a) Escriba la distribución exponencial que describa el tiempo entre llegadas.
b) Determine la probabilidad de que no lleguen clientes a la oficina hasta las 8:15
A.M.
c) Son las 8:35 A.M. El último cliente entró a las 8:26, Cuál es la probabilidad
de que el siguiente cliente llegue antes de las 8:38 A.M.?, Y de que no llegue
hasta las 8:40?.
d) Cuál es la cantidad promedio de clientes que llegan entre las 8:10 y las 8:45
A.M.?
Lic.Esp. Ernesto Silvero Lazaga Lic. Msc. Cesar Daniel Amarilla
U.N.A.
7.3. PROBLEMAS
un+1
Z Z
2) un du = +c 12) csc udu = − ln | csc u + cot u| +
n+1
Z Z Z
3) k f (u)du = k f (u)du 13) sec2 udu = tan u + c
Z Z Z Z
4) [ f (u) + g(u)]du = f (u)du + g(u)du 14) csc2 udu = − cot u + c
du
Z Z
5) = ln u + c 15) sec u tan udu = − csc u + c
u
Z Z
u u
6) e du = e + c 16) csc u. cot udu = − csc u + c
du u
Z Z
7) sin udu = − cos u + c 17) √ = sinh + c
2
a −u 2 a
du 1 u
Z Z
8) cos udu = sin u + c 18) = tanh +c
a2 + u2 a a
du 1 u
Z Z
9) tan udu = − ln | cos u| + c 19) p = sec + c
u (u2 − a2 ) a a
Z
10) cot udu = ln | sin u| + c
d d
2) [x] = 1 13) [tan u] = (sec2 u)u0
dx dx
d d
3) cu = cu0 14) [cot u] = −(csc2 u)u0
dx dx
d n d
4) [u ] = nu(n−1) 15) [sec u] = (sec u. tan u)u0
dx dx
d d
5) [u ± v] = u0 ± v0 16) [csc u] = −(csc u. cot u)u0
dx dx
d d u0
6) u.v = u.v0 + v.u0 17) [sinh u] = p
dx dx (1 − u2 )
d u u.v0 − v.u0 d u0
7) [ ]= talquev 6= 0 18) [cosh u] = p
dx v v2 dx (1 + u2 )
d u d u0
8) [|x|] = u0 talqueu 6= 0 19) [tanh u] =
dx |u| dx (1 + u2 )
d u0 d u0
9) [ln u] = talqueu 6= 0 20) [coth u] =
dx u dx (1 − u2 )
d u d u0
10) [e ] = eu u0 21) [csc u] = √ 2
dx dx |u| u − 1
d d −u0
11) [sin u] = (cos u)u0 22) [csc u] = √ 2
dx dx |u| u − 1
Documento8distNormal.pdf