Académique Documents
Professionnel Documents
Culture Documents
1
Queremos investigar “El sueldo de los trabajadores de una empresa” los valores de la variable
serían: S/. 800, S/. 900, S/ 5000, S/ 20000; etc.
2
Ejemplo
1) Se quiere estudiar la “edad” de los estudiantes de FCC
2) Se quiere estudiar el “peso” de las alumnas de la FCC
3) Se pide determinar la “velocidad” promedio de los autos que circulan por la av. Colonial.
4) Se quiere estudiar la “cotización” de las acciones de la bolsa de valores de Lima.
En cada una de ellas, observamos que los datos a consignar son cantidades.
1.2.1 Variable cuantitativa discreta:
Son aquellas variables que sólo pueden tomar valores enteros o se pueden obtener mediante conteo.
Es decir, presenta separaciones o interrupciones entre escala de valores que pueden tomar.
Ejemplo
1) Número de hijos de una familia.
2) Número de estudiantes de un colegio.
3) Numero de empresas en régimen general
4) cantidad de infracciones por un conductor
1.2.2 Variable cuantitativa Continua:
Son aquellas variables que pueden tomar cualquier valor dentro de un intervalo especificado de
valores.
Ejemplo
1) la velocidad de un carro: 30.5 k/h, 62.25k/h
2) la temperatura durante los meses de verano: 30.50 , 31.80 , .
3) tiempo de vida útil de un artefacto: 2.5 años, 5.8 años
4) Sueldo de los trabajadores de una empresa
Población
Es una colección o un conjunto de todos los individuos (personas, animales, objetos) que al menos tienen
una característica común y que se puede medir una o más características de naturaleza cualitativa o
cuantitativa.
El tamaño de la población se denota con “N”
3
Ejemplo
1) Si estudiamos el precio de las viviendas de la ciudad de Lima, la población será el total de las
viviendas de la ciudad de Lima.
2) Si queremos determinar la intención de votos para los partidos políticos PPC y el APRA en todo el
Perú, la población será el total de los electores.
Clasificación de la población
• Población finita
Es aquella población que tiene un número limitado de individuos o unidades de análisis.
(elementos).
Ejemplo
Las estaturas de todos los estudiantes universitarios del Perú.
• Población Infinita
Es aquella población que tiene un número ilimitado de individuos o unidades de análisis
(elementos).
Ejemplo
Los productos manufacturados producidos en América latina.
Muestra
Viene a ser un subconjunto o una parte representativa de individuos de una población.
El tamaño de la muestra de denota por: “n” y el tamaño de la población se denota por: “N” (n ≤ N)
Ejemplo
La Media poblacional “µ”, La desviación típica “δ” y La proporción poblacional “P” son parámetros
poblacionales, pues para determinar al valor de cada uno de ellos, es necesario utilizar
información de toda la población.
Estadístico o estadígrafo: Es una medida resumen calculada sobre la muestra
Ejemplo
La media muestral “𝑥̅ ”, la desviación típica “S” y la Proporción muestral “P” son estadísticos, pues
para determinar al valor de cada uno de ellos, solo es necesario utilizar información de una parte
de la población.
Ejemplo
Cuando calculamos el salario promedio de todos los trabajadores de una empresa, considerando
la población la empresa, ese promedio viene a ser entonces un parámetro.
4
Datos de Acumulada Acumulada simple Acumulada Acumulada Acumulada Acumulada
las Var. b menor que mayor que menor que mayor que 100hi% menor que mayor que
xi ni Ni N*i hi Hi H*i pi Pi P*i
X1 n1 N1 N*1 h1 H1 H*1 100h1 100H1 100H*1
X2 n2 N2 N*2 h2 H2 H*2 100h2 100H2 100H*2
X3 n3 N3 N*3 h3 H3 H*3 100h3 100H3 100H*3
X4 n4 N4 N*4 h4 H4 H*4 100h4 100H4 100H*4
. . . . . . . . .
. . . . . . . . .
xm Nm=n N*m hm Hm H*m 100h 1Hm 100H*m
m
n 1 100%
𝑛 100%
Clases (𝒎𝒊 ) : Se llaman clases a cada uno de los grupos que se divide el conjunto de datos de la
muestra.
𝑥0 − 𝑥1 calse 1
𝑥1 − 𝑥2 clase 2
𝑥2 − 𝑥3 clase 3
. . .
. . .
. . .
𝑥𝑛−1 − 𝑥𝑛 clase n
𝑦𝑖 + 𝑦𝑖−1
𝑦𝑖 =
2
Ejemplo 1
Un ingeniero agrónomo visita 25 cooperativas agraria de naranjas en el valle de Huara y en cada una
anotó el número de plantas atacadas por ciertos hongos, de lo cual resultaron los datos siguientes.
15 20 25 15 18 16 17 18 20 18 18 18 19 16 17 19 16 17 17 17 19 18 19 18 15
1) Diga de qué tipo de datos son estos
2) Construya la tabla de frecuencias para estos datos
2) ¿Cuántas cooperativas agrarias tienen a lo más 20 plantas atacadas por hongos?
3) ¿Cuántas cooperativas agrarias tienen por lo menos 17 plantas atacadas por hongos?
4) ¿Qué proporción de cooperativas bajo estudio tienen 18 plantas atacadas por hongos?
5) ¿Qué porcentaje de cooperativas tienen a lo más 18 atacadas por hongos
6) ¿Qué porcentaje de cooperativas tienen 18 o más plantas atacadas por hongos?
7) ¿Qué porcentaje de cooperativas tienen al menos 17 plantas atacadas por hongos?
Solución
plantas número de frecuencia frecuencia frecuencia frecuencia frecuencia frecuencia frec. frec.
atacadas
cooperativas absoluta absoluta relativa relativa relativa porcentual porc. porc.
por hongos
≤ ≥ ≤ ≥ ≤ ≥
𝑥𝑖 𝑛𝑖 𝑁𝑖 𝑁𝑖∗ ℎ𝑖 𝐻𝑖 𝐻𝑖∗ 𝑃𝐼
15 3 3 25 3/25 3/25 25/25 3/25*100 =12% 12% 100%
2) ¿Cuantas cooperativas agrarias tiene a lo más 20 plantas atacadas por hongos? ) Rpta : 24
3) ¿Cuantas cooperativas agrarias tienen por lo menos 17 plantas atacadas por hongos? Rpta : 19
4) ¿Qué proporción de cooperativas bajo estudio tienen 18 plantas atacadas por hongos? Rpta :
7/25
5) ¿Qué proporción de cooperativas tienen 18 o menos plantas atacadas por hongos? Rpta :
18/25
6) ¿Qué porcentaje de cooperativas tienen a lo más 18 atacadas por hongos Rpta : 72
%
7) ¿Qué porcentaje de cooperativas tienen al menos 17 plantas atacadas por hongos? Rpta : 76
%
Ejemplo 2
La inversión real (en miles de dólares) anual de un grupo de pequeñas empresas fue:
6
10 12 8 40 6 8 10 30 2 8 6 14
16 20 25 28 30 26 30 4 6 10 18 17
13 17 21 7 6 8 14 7 15 19 27 22
0 14 6 8 9 11 13 15 18 20 30 60
12 6 5 5 6 8 7 12 15 36 39 52
a) Formar una tabla de la distribución de frecuencias con intervalos de amplitud constante
b) El número de pequeñas empresas que han invertido 40 mil dólares o más
c) El número de pequeñas empresas que invirtieron 10 mil dólares o más pero menos de 25 mil
dólares
d) La proporción de las empresas que invirtieron a los más 48 mil dólares
e) El porcentaje de las empresas que invirtieron entre 16 y 32 mil dólares
f) El porcentaje de las empresas que invirtieron a lo más 56 mil dólares
Solución
b) El número de pequeñas empresas que han invertido 40 mil dólares o más Rpta. 3 empresas
0 8 16 24 32 40 1 48 1 56 1 64
c) el número de pequeñas empresas que invirtieron 10 mil dólares o más pero menos de 25 mil
dólares
0 8 10 𝑥 16 10 24 𝑦 25 32 40 48 56
64
si en un intervalo de 16 − 8 = 8 → 15 empresas
6𝑥15
un intervalo de 16 − 10 = 6 → 𝑥 empresas ; Usando la regla de tres simple 𝑥 = =
8
11.25
7
si en un intervalo de 32 − 24 = 8 → 15 empresas
1𝑥15
un intervalo de 25 − 24 = 1 → 𝑦 empresas ; Usando la regla de tres simple 𝑦 = =
8
1.875
Por lo tanto
𝑥 + 10 + 𝑦 = 11.25 + 10 + 1.875 = 23.125 ≈ 23 Empresas
d) La proporción de las empresas que invirtieron a los más 48 mil dólares Rpta. 0.967
empresas
e) El porcentaje de las empresas que invirtieron entre 16 y 32 mil dólares. Rpta. 16.667+13.333=
30 %
8 16 16.667 24 13.333 32 40 48 56 64
f) El porcentaje de las empresas que invirtieron a lo más 56 mil dólares Rpta. 98.333 %
8
3) Gráfico de líneas
Ejemplo
Realizar gráficos para la tabla adjunta.
Xi ni Ni 𝑁 ∗𝑖 hi Hi 𝐻∗ 𝑖
0 1 1 16 1/16 = 0.0625 1/16 = 0.0625 16/16 = 1
1 6 7 15 6/16 = 0.375 7/16 =0.4375 15/16 = 0.9375
2 5 12 9 5/16 = 0.3125 12/16 = 0.75 14/16 = 0.5625
3 3 15 4 3/16 = 0.1875 15/16 = 0.9375 4/16 = 0.25
4 1 16 1 1/16 = 0.0625 16/16 = 0.0625 1/16 = 0.0625
Solución
9
El histograma de frecuencias sirve para representar gráficamente las distribuciones de frecuencias
absolutas o relativas de datos cuantitativos continuos (de datos tabulados en clases o intervalos)
Los polígonos de frecuencias absolutas o relativas se obtienen uniendo los puntos medios o marcas de
clase de las bases superiores del histograma.
Ejemplo
Grafique el histograma, el polígono de frecuencias absolutas y la ojiva de frecuencia absoluta acumulada
mayor que para la siguiente tabla.
clase yi ni Ni N*i hi Hi H*i pi Pi P*i
11 – 17 14 4 4 120 0.03 0.03 1.00 3.33 3.33 100.00
17 – 23 20 8 12 116 0.07 0.10 0.97 6.67 10.00 96.67
23 – 29 26 16 28 108 0.13 0.23 0.90 13.33 23.33 90.00
29 - 35 32 76.67
32 60 92 0.27 0.50 0.77 26.67 50.00
35 – 41 38 32 92 60 0.27 0.77 0.50 26.67 76.67 50.00
41 – 47 44 16 108 28 0.13 0.90 0.23 13.33 90.00 23.33
47 – 53 50 8 116 12 0.07 0.97 0.10 6.67 96.67 10.00
53 - 59 56 4 120 4 0.03 1.00 0.03 3.33 100.00 3.33
Solución
35 Histograma de la Frecuencia Absoluta 35 Poligono de la Frecuencia Absoluta
30 32 32 30 32 32
25 25
20 20
15 15
16 16 16 16
10 10
5 8 8 5 8 8
4 4 4 4
0 0
10
140 140 120 116
120 120 120 108
116
108 92
100 100
92
80 80 60
60 60 60
40 40 28
28 12
20 4
12 20
0 4
0
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8
Ojiva de la Frecuencia Relativa menor que Ojiva de la Frecuencia Relativa mayor que
1.2 1.2
1 0.97 1 1 1 0.97
0.9 0.9
0.8 0.77 0.8 0.77
0.6 0.6
0.5 0.5
0.4 0.4
0.2 0.23 0.2 0.23
0.1 0.1
0 0.03 0 0.03
1 2 3 4 5 6 7 8 0 2 4 6 8 10
15
10 13.33 13.33
5 6.67 6.67
3.33 3.33
0
15
10 13.33 13.33
5 6.67 6.67
3.33 3.33
0
11
Ejercicios propuestos
1. Describa en sus propios términos la diferencia entre una población y una amuestra; entre un
parámetro y un estadístico
2. Cuál es la diferencia entre una variable cualitativa y una variable cuantitativa, dé ejemplos
3. Cuál es la diferencia entre una variable continua y una variable discreta, dé ejemplos
4. Un informe reciente en la revista FORTUNE revelo que los japoneses pronto controlaran hasta un 35%
de las ventas de autos en los Estados Unidos; comparado con el 285 de finales de los años 80 esta
apenas un 8% por encima de lo ocurrido en 1970. ¿esta información es contiene estadística
descriptiva, inferencial o ambas?
5. ¿Cuáles la diferencia entre la estadística descriptiva y la estadística inferencial? ¿cuál cree usted que
constituye una forma más elevada de análisis estadístico y por qué?
6. La Revista FORBES (febrero de 1997) reporto datos sobre las condiciones y estilos de vida en varias
ciudades de estados unidos. Algunos de esos datos se reportan en el siguiente cuadro:
12
r) Dirección
s) Año de nacimiento
t) Estado civil
u) Ingreso mensual familiar
v) Número de DNI
9. Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte
de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferían esta marca.
a) ¿Qué constituye la muestra?
b) ¿Qué constituye la población?
c) ¿Cuál es la proporción dentro de la muestra, de la ama s de casa que prefieren la marca del
detergente?
10. La tabla muestra una distribución de frecuencias de la duración de 400 tubos de radio comprobados
en la L Asociados.
Duración en Frec
horas
300 400 14
400 500 45
500 600 58
600 700 76
700 800 68
800 900 62
900 1000 48
1000 1100 29
Donde n = 400. Completar para luego determinar
a) ímite superior de la quinta clase
b) Límite inferior de octava clase
c) Marca de clase de la séptima clase
d) Tamaño del intervalo de clase
e) Frecuencia de cuarta clase
f) Frecuencia relativa de la sexta clase
g) Porcentaje de tubos cuya duración es menor a 600 horas
h) Porcentaje de tubos cuya duración es mayor o igual a 900 horas
i) Porcentaje de tubos cuya duración es al menos 500 horas, pero no mayor de 1000 horas
j) Construir un histograma y un polígono de frecuencia
k) Construir un histograma y un polígono de frecuencias relativas
l) Construir una ojiva porcentual
m) Estimar el porcentaje de tubos con duraciones de menos de 560 horas
n) Estimar el porcentaje de tubos con duraciones de 970 o más horas
o) Estimar el porcentaje de tubos con duraciones entre 620 y 890 horas
11. A continuación, se ofrece una distribución de frecuencias del paso de 150 personas que utilizaron un
elevador cierto día. Construya un histograma con estos datos.
Lim Lim Frec
inf sup
75 90 9
90 105 11
105 120 23
120 135 26
135 150 31
150 165 23
165 180 9
13
180 195 9
195 210 6
210 225 3
12. Nora Velarde, Asesora de una empresa de corretaje, intenta diseñar programas de inversión que
fuesen atractivos para jubilados. Ella sabe que si un inversionista pudiera obtener un cierto nivel de
interés, estaría dispuesto a invertir su capital, pero debajo de un cierto nivel de interés, no estaría
dispuesto a hacerlo. De un grupo de 50 sujetos. Nora obtuvo los datos siguientes con respecto a los
diferentes niveles de réditos requeridos por cada individuo para que pueda invertir 1000 dólares.
15. Los datos que se muestran a continuación son los cargos (en dólares) por los servicios de electricidad,
agua y gas durante el mes de julio del 2010 para una muestra de 50 apartamentos de 3 habitaciones
en la Molina
96 171 202 178 147 102 153 197 127 82
157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 150 154 130 143 187 166 139 149
14
108 119 183 151 114 135 191 137 129 158
Elaborar.
Medidas Posición
Introducción
Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje,
por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene
una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se
obtiene, y cuán variadas son esas calificaciones. En otras palabras, para que una calificación tenga
significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios
estadísticos.
La medida de tendencia central se refiere al punto medio de una distribución y sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba. El propósito de las medidas
de tendencia central es mostrar en qué lugar se ubica la persona promedio o típica del grupo. Sirve como
un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico, como
un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones o
como un método para comparar los resultados medios obtenidos por dos o más grupos.
15
Ejemplo 1
En la práctica calificada de Matemática, un alumno tiene las siguientes notas: 10, 15, 08, 16. Se observa
que el número total de datos es 4 ( 𝑛 = 4), entonces su nota promedio de práctica será.
10 + 15 + 08 + 16
𝑥̅ = = 12.25
4
Media para datos agrupados
Cuando la muestra tiene muchos datos o el tamaño de la muestra es demasiado grande, es más
conveniente agrupar en una tabla de frecuencias y luego calcular la media aritmética; esta agrupación se
puede hacer de manera simple o por intervalos.
a) Datos agrupados de modo simple.
𝑥𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖
𝑥1 𝑛1 𝑥1 𝑛1
𝒙𝟏 𝒏𝟏 + 𝒙𝟐 𝒏𝟐 + 𝒙𝟑 𝒏𝟑 + ⋯ + 𝒙𝒏 𝒏𝒏
𝑥2 𝑛2 𝑥2 𝑛2 ̅=
𝒙
𝑥3 𝑛3 𝑥3 𝑛3 𝒏𝟏 + 𝒏𝟐 + ⋯ + 𝒏𝒏
𝑥𝑛 𝑛𝑛 𝑥𝑛 𝑛𝑛
b) Datos agrupados por intervalos
𝑥𝑖−1 − 𝑥𝑖 𝑦𝑖 𝑛𝑖 𝑦𝑖 𝑛𝑖
𝒚𝟏 𝒏𝟏 +𝒚𝟐 𝒏𝟐 +𝒚𝟑 𝒏𝟑 +⋯+𝒚𝒏 𝒏𝒏
𝑥0 − 𝑥1 𝑦1 𝑛1 𝑦1 𝑛1 ̅=
𝒙 ; Media
𝒏𝟏 +𝒏𝟐 +⋯+𝒏𝒏
𝑥1 − 𝑥2 𝑦2 𝑛2 𝑦2 𝑛2
𝑥2 − 𝑥3 𝑦3 𝑛3 𝑦3 𝑛3 𝒙𝒊−𝟏 + 𝒙𝒊
𝒚𝒊 = ; Marca de clase
𝟐
𝑥𝑛−1 − 𝑥𝑛 𝑦𝑛 𝑛𝑛 𝑦𝑛 𝑛𝑛
Donde 𝑦𝑖 representa la marca de clase y que 𝑓𝑖 es la frecuencia absoluta simple que representa la
cantidad de veces que se repite.
Ejemplo 2
La siguiente tabla muestra las edades de los 75 alumnos del curso de estadística, se pide calcular la edad
promedio de dichos alumnos.
Edad de los alumnos(𝑥𝑖 ) cantidad de alunos (𝑛1 )
17 5
18 15
19 20
20 25
21 10
Solución
𝑥𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖
75 + 270 + 380 + 500 + 210
17 5 75 𝑥̅ =
5 + 15 + 20 + 25 + 10
18 15 270 1435
𝑥̅ = = 19.13
19 20 380 75
20 25 500 La edad promedio es de 19.13 años
21 10 210
Observación
Si el conjunto de datos es demasiado grande, como por ejemplo calcular la edad promedio de los
estudiantes de la UNAC que son aproximadamente 10 mil, o edad promedio de los escolares de la Región
Callao, el cálculo por este método sería muy tedioso, por lo que podemos optar aplicar programas como
el EXCEL o SPSS que simplifica en segundos nuestro trabajo.
16
Es el puntaje que se ubica en el centro de una distribución y representaremos por Me. Es el valor
central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras,
la Mediana agrupa el 50% de los datos antes y 50% de los datos después. Según el número de valores que
se tenga se pueden presentar dos casos:
Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de
datos.
Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales
(los valores centrales se suman y se dividen por 2).
Ejemplo 1
Para obtener la mediana de los números 13, 15, 9, 6, 4, 12, 11, primero tenemos que ordenarlos en
forma ascendente: 4, 6, 9, 11, 12, 13, 15, entonces Me = 11, que viene a ser el termino central de
las datos.
Ejemplo 2
El siguiente cuadro muestra las edades de un grupo de alumnos
12 15 14 15 16 15 17 18 16 19 16 17 15 15 17
18 19 14 15 17 16 18 17 19 17 23 16 17 18 19
se pide determinar la media y la mediana.
Solución
ordenanda en una tabla de frecuencioas se tiene
𝑥𝑖 𝑛𝑖 Ni 𝑥𝑖 𝑛𝑖 ℎ𝑖 𝑃𝑖 P*i
12 1 1 12 0.03 3.33% 3.33%
14 2 3 28 0.07 6.67% 6.67
15 6 9 90 0.20 20.00% 26.67
16 5 14 80 0.17 16.67% 43.33
17 7 21 119 0.23 23.33% 66.67
18 4 25 72 0.13 13.33% 80.00
19 4 29 76 0.13 13.33% 93.33
23 1 30 23 0.03 3.33% 96.67
total 30 500
Medida Formula Observaciones
Donde 𝑥𝑖 se refiere a todo y cada uno de los elementos de la
∑ 𝑥𝑖 𝑛𝑖 500 muestra y 𝑛 es el número total de elementos en la muestra y
Media 𝑥̅ = = = 16.66
𝑛 30 𝑛𝑖 se refiere a la frecuencia de la clase.
17
Del conjunto de datos que se muestra: 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 , 4, 4
El dato 5 y el dato 4 se repiten 3 veces, lo que implica que hay dos modas, se trata entonces de una
distribución bimodal. Por lo tanto las modas son: Mo=5 y Mo=4
Ejemplo 3
En el siguiente cuadro la edad de los 30 alumnos con sus respectivas frecuencias, determine la moda.
frecuencia 1 2 6 5 7 4 4 1
edad 12 14 15 16 17 18 19 23
Solución
Si hacemos un recuento en la columna de frecuencia, se observa que 7 es la que tiene mayor frecuencia.
Por lo tanto la moda es: Mo=17. Se trata entonces de una distribución unimodal.
De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil, porque se
usa en procesos y técnicas estadísticas más complejas. Sin embargo, cuando en una distribución se
presentan casos cuyos datos tengan puntajes son muy bajos o muy altos respecto al resto del grupo,
entonces es recomendable utilizar la mediana o la moda (Porque dadas las características de la media,
esta es afectada por los valores extremos).
La media es considerada como la mejor medida de tendencia central, por las siguientes razones:
Los puntajes contribuyen de manera proporcional al hacer el cómputo de la media.
Es la medida de tendencia central más conocida y utilizada.
Las medias de dos o más distribuciones pueden ser fácilmente promediadas mientras que las medianas y
las modas de las distribuciones no se promedian.
2) Medidas de Tendencia no Central
Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que
no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la
muestra en tramos iguales. Estas medidas son: Cuartiles, Deciles y Percetiles.
Ejemplo
Considere el siguiente conjunto de datos: 2, 5, 6, 3, 7, 4, 9 y determine los cuartiles.
Solución
Ordenando de menor a mayor se tiene los cuartiles
Cuartil 1: Q1=3, cuartil 2: Q2=5 y cuartil 3: Q3=7
2.2 Deciles (Di)
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos
iguales, en los que cada uno de ellos concentra el 10% del total del conjunto de datos de la distribución.
2.3 Percentiles (Pi)
18
Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien
tramos iguales, en los que cada uno de ellos concentra el 1% del total del conjunto de datos de la
distribución.
Ejemplo 1
Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos. Los
deciles y percentiles se calculan de igual manera, aunque harían falta distribuciones con mayor número
de datos.
𝑥𝑖 𝑛𝑖 𝑁𝑖 ℎ𝑖 𝐻𝑖
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
1º cuartil: es el valor 1,22 cm, ya que por debajo de ella se sitúa el 25% de la frecuencia (tal como se puede
ver en la columna de la frecuencia relativa acumulada).
2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se sitúa otro 25% de la frecuencia.
3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de la frecuencia.
Además, por encima suya queda el restante 25% de la frecuencia.
Atención: cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en el
ejemplo en los tres cuartiles) la medida de posición no central sería realmente una de las repeticiones.
Introducción
En todos los casos cuando se propone hacer un estudio de una población o una muestra, se va a necesitar
más información que la obtenida con las medidas de posición (tendencia central o no central). Debido a
esto se necesita encontrar las medidas de variación, las cuales sirven para medir el grado en que los datos
de una muestra o población tienden a concentrarse o alejarse respecto a aun valor central llamado Media
aritmética o promedio aritmético. Además, esta medida nos resulta útil para comparar la variabilidad de
varias muestras o poblaciones bajo estudio.
19
El despreciar la existencia de la variación, puede conducir a decisiones incorrectas, es más, entregar el
sólo promedio aritmético estaríamos en muchos casos desinformando en lugar de informar. De ahí, la
importancia de apropiarnos de los conceptos de medidas dispersión o de variabilidad como:
La desviación típica, el rango, el rango intercuartílico, el coeficiente de variación entre otras.
Medidas de Dispersión
Estudia la distribución de los valores de la serie de datos de la muestra, analizando si estos se encuentran
más o menos concentrados, o más o menos dispersos. entre más grande sea el grado de dispersión,
menores uniformidades tendrán los datos (sinónimo de heterogeneidad) y por lo tanto menor
representatividad o confiabilidad del promedio de tendencia central o localización por haber sido
obtenido de datos dispersos. Por el contrario, si este valor es pequeño (respecto a la unidad de medida)
entonces hay una gran uniformidad entre los datos. Cuando es cero quiere decir que todos los datos son
iguales.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:
1. Rango (R)
Mide la amplitud de los valores de la muestra. Es la distancia entre el valor máximo y el valor mínimo de
la muestra.
R = 𝑋𝑚𝑎𝑥 – 𝑋𝑚𝑖𝑛
Si ordenamos el conjunto de datos de la muestra bajo estudio en forma ascendente de la siguiente forma:
𝑥1 ; 𝑥2 ; 𝑥3 ; 𝑥4 ; … … … … … … … 𝑥𝑛−1 ; 𝑥𝑛
𝑋𝑚𝑎𝑥 = 𝑥𝑛
{ Entonces R=𝑥𝑛 − 𝑥1
𝑋𝑚𝑖𝑛 = 𝑥1
3. Varianza (𝑉𝑎𝑟(𝑥) = 𝑆𝑥 )
Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de la
diferencia al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha
repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
Para datos tabulados:
∑(𝑥𝑖 − 𝑥̅ )2 𝑛𝑖 ∑ 𝑛𝑖 (𝑥𝑖 )2
𝑎) 𝑉𝑎𝑟(𝑥) = ó 𝑏) 𝑉𝑎𝑟(𝑥) = − 𝑥̅ 2
𝑛 𝑛
Donde 𝑥𝑖 son los datos de la muestra
Para datos tabulados por intervalos:
20
∑(𝑌𝑖 −𝑥̅ )2 𝑛𝑖 ∑(𝑌𝑖 )2 𝑛𝑖
𝑎) 𝑉𝑎𝑟(𝑥) = 𝑛
ó 𝑏) 𝑉𝑎𝑟(𝑥) = 𝑛
− 𝑥̅ 2 ;
𝜎𝑥 = √𝑣𝑎𝑟(𝑥)
√𝑣𝑎𝑟(𝑥)
𝐶𝑉 = 𝑥100
𝑥̅
Ejemplo 1
se mide la estatura de los 30 alumnos de un colegio obteniendo la tabla adjunta. y se pide calcular las
medidas de dispersión.
𝑛𝑖 1 4 4 2 1 2 3 3 4 3 3
Variable: 𝑥𝑖 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30
Solución
(Valor) 𝑛𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖 𝑥𝑖 2
1,20 1 1.20 1.44
1,21 4 4.80 5.8564
1,22 4 4.88 5.9536
1,23 2 2.46 3.0258
1,24 1 1.24 1.5376
1,25 2 2.50 3.125
1,26 3 3.78 4.7628
1,27 3 3.81 4.8387
1,28 4 5.12 6.5536
1,29 3 3.87 4.9923
1,30 3 3.9
5.07
total
30 37.6 5.8564
1.- Rango:
Xmax –Xmin → Rango = 1,30 - 1.20 = 10cm.
2. Varianza:
37.6
Observamos que 𝑥̅ = = 1.253
30
∑(𝑥𝑖 −𝑥̅ )2 𝑛𝑖
Aplicando la fórmula: 𝑉𝑎𝑟(𝑥) = 𝑛
⟹ 𝑉𝑎𝑟(𝑥) = 0.001
3.- Desviación típica: 𝜎𝑥 = √0.001 = 0.032
0.032
4.- Coeficiente de variación de Pearson: 𝐶𝑉 = 1.253 = 0.0255
Ejemplo 2
Calcule las medidas de dispersión para la tabla adjunta.
ni 1 2 4 10 16 8 4
𝑥𝑖−1 − 𝑥𝑖 [26 − 34[ [34 − 42[ [42 − 50[ [50 − 58[ [58 − 66[ [66 − 74[ [74 − 82[
21
Solución
Frecuencias
Variable
absolutas
𝑥𝑖−1 − 𝑥𝑖 Yi ni Ni niYi 𝑛𝑖 𝑌𝑖 2
[26 − 34[ 30 1
1 30 900
[34 − 42[ 34 2
3 68 2312
[42 − 50[ 38 4
7 152 5776
[50 − 58[ 42 10
17 420 17640
[58 − 66[ 46 16
33 736 33856
[66 − 74[ 50 8
41 400 20000
[74 − 82[ 54 4
45 216 11664
total 45
2022 92148
Aplicando la fórmula:
∑(𝑥𝑖 −𝑥̅ )2 𝑛𝑖 92148
𝑉𝑎𝑟(𝑥) = = = 2047.73 ⟹ 𝑉𝑎𝑟(𝑥) = 2047.73
𝑛 45
Propiedades de la varianza
1. 𝑉𝑎𝑟(𝑥) ≥ 0 → 𝜎𝑥 ≥ 0
2. 𝑉𝑎𝑟(𝑏) = 0 donde b es constante
3. Sea 𝑌 = 𝑥𝑖 ± 𝑏 entonces 𝑉𝑎𝑟(𝑌) = 𝑉𝑎𝑟(𝑥)
4. Sea 𝑌 = 𝑎𝑥𝑖 entonces 𝑉𝑎𝑟(𝑌) = 𝑎2 𝑉𝑎𝑟(𝑥)
1. Grado de concentración
Mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la
muestra.
Para medir el grado de concentración de una distribución de una frecuencia se puede usar varios
indicadores, entre ellos el índice de Gini (IG).
22
∑ 𝑝𝑖−𝑞𝑖 𝑁 𝑥1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥1 𝑛𝑖
𝐼𝐺 = ∑ 𝑝𝑖
; Donde 𝑝𝑖 = ( 𝑖) 100 y 𝑞𝑖 = ( ) 100
𝑛 𝑥1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥𝑛 𝑛𝑛
Observación
a. Si IG=0, entonces la concentración es mínima
b. Si IG=1, entonces la concentración es máxima
Ejemplo 1:
La siguiente tabla muestra los sueldos de los empleados de una empresa (en dólares). Calcule el IG
Solución
𝑛1
𝑝1 = 𝑛
=
𝑁2
𝑝2 = 𝑛
=
𝑁3
𝑝3 = 𝑛
=
𝑥1 𝑛1
𝑞1 = =
𝑥1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥𝑛 𝑛𝑛
𝑥1 𝑛1 +𝑥2 𝑛2
𝑝6 = 𝑥 =
1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥𝑛 𝑛𝑛
𝑥1 𝑛1 +𝑥2 𝑛2 +𝑥3 𝑛3
𝑝7 = =
𝑥1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥𝑛 𝑛𝑛
2. Asimetría
La asimetría es la medida que indica la simetría de la distribución de una variable respecto a la media
aritmética, sin necesidad de hacer la representación gráfica. Los coeficientes de asimetría indican si
hay el mismo número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
Asimetría negativa: la cola de la distribución se alarga para valores inferiores a la media, la mayor
cantidad de datos están a la derecha de la media.
Simétrica: Existe el mismo número de datos a la izquierda y la derecha de la media. En este caso,
coinciden la media, la mediana y la moda. La distribución se adapta a la forma de la campana de
Gauss, o distribución normal.
Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media, la mayor
cantidad de datos están a la izquierda de la media.
23
𝑀𝑒 < 𝑋̅ < 𝑀𝑜 𝑋̅ = 𝑀𝑒 = 𝑀𝑜 𝑀𝑜 < 𝑀𝑒 < 𝑋̅
24
1 1
(∑(𝑥𝑖 − 𝑥̅ )3 𝑛𝑖) = (123270000) = 308175
𝑛 40
Usando el coeficiente de asimetría de Fisher
1 1
𝑛 (∑(𝑥𝑖 − 𝑥̅ )3 𝑛𝑖) 𝑛 (∑(𝑥𝑖 − 𝑥̅ )3 𝑛𝑖) 3081750
𝐴𝐹 = = = = 0.9269 > 0
√{𝑣𝑎𝑟(𝑥)} 3 √{22275} 3 3324501.77
Indica que la distribución de los datos es asimétrica positiva, respecto al promedio, los datos no están
distribuidos equitativamente, la mayor cantidad de datos están a la izquierda pero cercano a la media, y
una cantidad pequeña están muy distante de la media.
14
12
10 12
8 10
6 8
4 5
2 3 1 1
0
200 300 400 500 600 700 800
2. Distribución Leptocúrtica
Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
K>0
4. Distribución Platicúrtica:
Presenta un reducido grado de concentración alrededor de los valores centrales de la variable. K < 0
25
Leptucurtica
Mesocurtica
Platicurtica
Ejemplo 1.- Calcular el coeficiente de Curtosis del sueldo de los trabajadores de la empresa COSMOS
Sueldos en dólares Nº de trabajad.
𝑥𝑖 𝑛𝑖
200 10
300 12
400 8
500 5
600 3
700 1
800 1
300 12
400 8
500 5
Solución
𝑥𝑖 𝑛𝑖 𝑛𝑖𝑥𝑖 (𝑥𝑖 − 𝑥̅ )2 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )4 𝑛𝑖
200 10 2000 272250 7412006250
300 12 3600 50700 214207500
400 8 3200 9800 12005000
500 5 2500 91125 1660753125
600 3 1800 165675 9149401875
700 1 700 112225 12594450625
800 1 800 189225 35806100625
891000 66848925000
∑(𝑥𝑖 − 𝑥̅ )2 𝑛𝑖 891000
𝑉𝑎𝑟(𝑥) = ⟹ 𝑉𝑎𝑟(𝑥) = = 22.275
𝑛 40
1
[∑(𝑥𝑖 − 𝑥̅ )4 𝑛𝑖] 66848925000
𝐾= 𝑛 −3 ⟹ 𝐾= − 3 = 0368 ∴ 𝐾 = 0368
(𝑉𝑎𝑟(𝑥))2 40(22275)(22275)
26
Distribución Bidimensional
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de
cada elemento de la población: por ejemplo: peso y altura de un grupo de estudiantes; superficie y precio
de las viviendas de una ciudad; potencia y velocidad de una gama de coches deportivo.
Covarianza
La covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias respecto a
sus medias. Es el dato básico para determinar si existe una dependencia entre ambas variables y además
es el dato necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o
la recta de regresión
𝑖=𝑛
1 ∑𝑖=𝑛
𝑖=𝑖 𝑥𝑖 𝑦𝑖
𝐶𝑜𝑣(𝑥, 𝑦) = (∑(𝑦𝑖 − 𝑦̅)(𝑥𝑖 − 𝑥̅ )) 𝐶𝑜𝑣(𝑥, 𝑦) = − 𝑥̅ 𝑦̅
𝑛 𝑛
𝑖=
Ejemplo 1
Dos jueces X e Y asignaron separadamente a los 10 finalistas del concurso las siguientes puntuaciones
X 3 10 9 1 2 4 6 5 8 7
Y 3 8 10 4 1 2 5 6 7 9
Halle la covarianza dada por los jueces bajo el supuesto de que emitieran su juicio con absoluta
independencia indicando así el signo de la dependencia.
Solución
Xi Yi XiYi X2i Y2i
3 3 9 9 9 55 55
𝑥̅ = ; 𝑦̅ =
10 8 80 100 64 10 10
9 10 90 81 100 ∑𝑖=𝑛
𝑖=𝑖 𝑥𝑖 𝑦𝑖 385
1 4 4 1 16 𝐶𝑜𝑣(𝑥; 𝑦) = −𝑥
̅𝑦̅= − (5.5)(5.5) = 6.95
𝑛 10
2 1 2 4 1
4 2 8 16 4
6 5 30 36 25
5 6 3 25 36
8 7 56 64 49
7 9 63 49 81
55 55 345 385 385
27
𝐶𝑜𝑣(𝑥, 𝑦)
𝑟= donde −1≤𝑟 ≤1
𝑆𝑥 ∗ 𝑆𝑦
Si 𝑟 > 0 la relación es positiva, la recta tiene pendiente positiva o tiene relación directa.
Si 𝑟 < 0 la relación es Negativa, la recta tiene pendiente negativa o tiene relación inversa.
Si 𝑟 está cercano a -1 o +1, la relación entre las variables es fuerte.
si 𝑟 está cercano al cero, la relación entre las variables es débil.
Ejemplo 2
Halle el coeficiente de correlación del ejemplo 1
Solución
𝑛
1 385
𝑆𝑥 = √𝑣𝑎𝑟(𝑥) = √ ∑ 𝑥𝑖2 𝑛𝑖 − (𝑥̅ )2 = √ − 30.25 = √8.25 = 2.87
𝑛 10
𝑖=1
𝑛
1 385
𝑆𝑦 = √𝑣𝑎𝑟(𝑦) = √ ∑ 𝑦𝑖2 𝑛𝑖 − (𝑦̅)2 = √ − 30.25 = √8.25 = 2.87,
𝑛 10
𝑖=1
Cov(x, y) 6.95
Además por ejemplo 1, 𝐶𝑜𝑣(𝑥; 𝑦) = 6.95 entonces 𝑟= = = 0.843
Sx ∗ Sy 2.87 ∗ 2.87
Se concluye que la correlación entre las dos variables es fuerte, la variable independiente influye
fuertemente sobre la variable dependiente.
Relación Determinista
Conocido el valor de 𝑋, el valor de 𝑌 queda perfectamente establecido. Son del tipo: 𝑦 = 𝑓 (𝑥)
Ejemplo:
La relación existente entre la temperatura en grados centígrados (𝑥) y grados Fahrenheit (𝑦 ) es
𝑦 = 1,8𝑥 + 32
Relación No determinista
Conocido el valor de X, el valor de Y no queda perfectamente establecido. Son del tipo
𝑦 = 𝑓 (𝑥) + 𝑢.
Donde "𝑢" es una perturbación desconocida (variable aleatoria)
Ejemplo
Se tiene una muestra del volumen de producción (𝑥) y el costo total (𝑦 ) asociado a un producto en un
grupo de empresas. Existe relación pero no es exacta.
Lineal
Cuando la función 𝑓 (𝑥) es lineal, 𝑓 (𝑥) = 𝛽1 + 𝛽2𝑥
Si β2 > 0 hay relación lineal positiva.
Si β2 < 0 hay relación lineal negativa
Observación
Si se analiza la estatura y el peso de los alumnos de una clase es muy posible que exista relación entre
ambas variables: mientras más alto sea el alumno, mayor será su peso. Este coeficiente se aplica cuando
la relación que puede existir entre las variables es lineal (es decir, si representáramos en un gráfico o en
28
un diagrama de dispersion, los pares de valores de las dos variables que forman la nube de puntos se
aproximaría a una recta).
En el gráfico adjunto se muestra los tipos de relaciones que se pueden presentar
y y
x x
x x
29
Para ello, el coeficiente de correlación lineal o coeficiente de Pearson, nos permite determinar si
efectivamente existe relación entre las dos variables. Una vez que se concluye que sí existe relación, la
regresión nos permite definir la recta que mejor se ajusta a esta nube de puntos.
Ecuación de la recta Regresión lineal o Recta de Ajuste
𝐿 ∶ 𝑦 = 𝛽1 + 𝛽2 𝑥
Donde:
𝑦 : es la variable dependiente
𝑥 : es la variable independiente
𝐶𝑜𝑣(𝑥, 𝑦)
𝛽2 =
𝑣𝑎𝑟(𝑥)
𝛽1 = 𝑦̅ − 𝛽̂2 𝑥̅
y y Relación lineal negativa
Relación lineal positiva
x x
Ejemplo 1
Determine la recta de ajuste para la siguiente tabla de datos
x 1 2 2 3 4 4 5 6
y 2 3 4 4 4 6 5 7
Donde 𝑥 es la variable independiente y 𝑦 la variable dependiente.
Solución
Calculando la covarianza, la varianza y la media de la variable dependiente se tiene:
𝐶𝑜𝑣(𝑥, 𝑦) = 2.8392 ; 𝑣𝑎𝑟(𝑥) = 2.1093 ; 𝑥̅ = 3.375 y 𝑦̅ = 4.375
Luego
𝐶𝑜𝑣(𝑥, 𝑦) 2.1093
𝛽2 = = = 0.8490566 ⟹ 𝛽2 = 0.8490566
𝑣𝑎𝑟(𝑥) 2.484375
30
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7
Ejemplo 2
El dueño de una empresa que vende carros desea determinar si hay relación lineal entre los años de
experiencia de sus vendedores y la cantidad de carros que venden. Los siguientes datos representan los
años de experiencia (𝑥) y las unidades de carros vendidas al año (𝑦), de 10 vendedores de la empresa.
𝑥 3 4 6 7 8 12 15 20 22 26
𝑦 9 12 16 19 23 27 34 37 40 45
Solución
Calculando la covarianza, la varianza y la media de la variable dependiente se tiene:
𝐶𝑜𝑣(𝑥, 𝑦) = 88.94 ; 𝑣𝑎𝑟(𝑥) = 59.01 ; 𝑥̅ = 12.3 y 𝑦̅ = 26.2
Luego
𝐶𝑜𝑣(𝑥, 𝑦) 88.94
𝛽2 = = = 1.507202 ⟹ 𝛽2 = 1.507202
𝑣𝑎𝑟(𝑥) 59.01
Ejemplo 3 (tarea)
Un a c o mp añ ía d es e a h a ce r p r ed i c cion e s d el va l or an u a l d e su s ve n ta s t otal e s en ci e rto p a í s a
p arti r d e la r el ac ión d e é st a s y la r en t a n a ci on al. Pa ra in v e sti gar l a r e lac ión cu en t a con lo s
si gu ien t es d at os :
31
𝑥 189 190 208 227 239 252 257 274 293 308 316
𝑦 402 404 412 425 429 436 440 447 458 469 469
Donde 𝑥 representa la renta nacional en millo nes de soles y 𝑦representa las ventas de
la compañía en miles de soles en el periodo que va de 1990 hasta el 2000 (ambos
inclusive). Se pide determinar:
a) La recta de regresión de Y sobre X
b) el coeficiente de correlación lineal e interprétalo
c) Si en 2001 la renta nacional del país fue de 235 millones de soles, ¿Cuál será la
predicción para las ventas de la compañía en este año)
Probabilidad
1. Introducción
Antes de entrar a detallar el concepto de probabilidad, veamos algunas definiciones previas que se
usaran en el cálculo de probabilidad.
1.1 Experimento
Es el proceso que induce a que ocurra una y sólo una de varias posibles observaciones. Estos
experimentos pueden ser: Experimentos Deterministas y no Deterministas.
1.2 Experimentos deterministas
Son los experimentos de los que podemos predecir el resultado antes de que se
realicen.
Ejemplos
Si dejamos caer una piedra desde una ventana sabemos, sin lugar a dudas, que
la piedra bajará.
Si la arrojamos hacia arriba, sabemos que subirá durante un determinado
intervalo de tiempo; pero después bajará.
32
Es el conjunto de to dos los posibles resultados de un experimento aleatorio, lo
representaremos por “ Ω”.
Ejemplo
Espacio muestral de lanzar una moneda: Ω = {C, S}.
Espacio muestral de lanzar un dado: Ω = {1, 2, 3, 4, 5, 6}.
1.6 Suceso Aleatorio
Es cualquier subconjunto del espacio muestral.
Ejemplo
Al tirar un dado, un suceso sería que saliera par, otro, obtener múltiplo de 3, y
otro, sacar 5.
Una bolsa contiene bo las blancas y negras. Se extraen sucesivamente tres bolas.
Luego del experimento.
1. El espacio muestral es:
Ω = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}
2. El suceso A = {extraer tres bolas del mismo color} es:
A = {(b,b,b); (n, n,n)}
3. El suceso B = {extraer al menos una bola blanca} es:
B= {(b,b,b ); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}
4. El suceso C = {extraer una sola bola negra} es:
C = {(b,b,n); (b,n,b); (n,b,b)}
Suceso seguro
El Suceso seguro, está formado por todos los posibles resultados del experimento (es decir, por el
espacio muestral).
Ejemplo
1. Tirando un dado obtener una puntuación que sea menor que 7.
2. Al lanzar una moneda obtener cara o sello
Suceso imposible
Suceso imposible (∅) es el que no tiene ningún elemento, o el suceso nunca ocurre.
33
Ejemplo
1. Tirando un dado obtener una puntuación igual a 7.
2. Al lanzar una moneda, esperar que salga el numero 10
Sucesos independientes
Dos sucesos, A y B, son independientes cuando la probabilidad de que suceda A no se ve afectada porque
haya sucedido o no B.
Ejemplo
Al lazar dos dados los resultados son independientes.
El resultado de lanzar dos monedas también son independientes
El suceso estatura de los alumnos de una clase y el color del pelo son independientes: el que
un alumno sea más o menos alto no va a influir en el color de su cabello, ni viceversa.
Sucesos dependientes
Dos sucesos, A y B, son dependientes cuando la probabilidad de que suceda A se ve afectada porque haya
sucedido o no B.
Ejemplo
Extraer dos cartas de una baraja, sin reposición, son sucesos dependientes.
Estudiar una asignatura para un examen y obtener la calificación de dicho examen son eventos
dependientes.
Suceso contrario
El suceso contrario a 𝐴 es otro suceso que se realiza cuando no se realiza 𝐴, Se denota por 𝐴̅.
Ejemplo
Son sucesos contrarios sacar par e impar al lanzar un dado.
Detectar en el control de calidad un producto defectuoso y un producto bueno son sucesos contrarios.
Operación con sucesos
UNION INTERSECCION
34
CONMUTATIVA 𝐴∪𝐵 =𝐵∪𝐴 𝐴∩𝐵 =𝐵∩𝐴
ASOCIATIVA 𝐴 ∪ (𝐵 ∪ 𝐶) = (𝐴 ∪ 𝐵) ∪ 𝐶 𝐴 ∩ (𝐵 ∩ 𝐶) = (𝐴 ∩ 𝐵) ∩ 𝐶
IDEMPOTENTE 𝐴∪𝐴 =𝐴 𝐴∩𝐴=𝐴
SIMPLIFICACION 𝐴 ∪ (𝐵 ∩ 𝐴) = 𝐴 𝐴 ∩ (𝐵 ∪ 𝐴) = 𝐴
DISTRIBUTIVA 𝐴 ∪ (𝐵 ∩ 𝐶) = (𝐴 ∪ 𝐵) ∩ (𝐴 ∪ 𝐶) 𝐴 ∩ (𝐵 ∪ 𝐶) = (𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶)
ELEMENTO NEUTRO 𝐴∪Φ=𝐴 𝐴∩ 𝛀 = 𝛀
ABSORCION 𝐴∪𝛀=𝛀 𝐴∩ Φ = Φ
LEYES DE MORGAN ̅̅̅̅̅̅̅
𝐴 ∪ 𝐵 = 𝐴̅ ∩ 𝐵̅ ̅̅̅̅̅̅̅
𝐴 ∩ 𝐵 = 𝐴̅ ∪ 𝐵̅
PROPIEDADES 𝐴 ∩ 𝐵̅ = 𝐴 −( 𝐴 ∩ 𝐵) = 𝐴 − 𝐵
𝐴 ∩ 𝐴̅ = Φ
Ejemplo
1. Sea el espacio muestral Ω = {1,2,3,4,5,6,7} y Sean los sucesos 𝐴 = {1,3,5} y 𝐵 = {2,3,7},
determine los eventos:
a) 𝐴 ∪ 𝐵 b). 𝐴 ∩ 𝐵 c). 𝐴̅ ∩ 𝐵̅
Solución
𝐴 ∪ 𝐵 = {1,3,5} ∪ {2,3,7} = {1,2,3,5,7}
𝐴 ∩ 𝐵 = {1,3,5} ∩ {2,3,7} = {3}
𝐴̅ ∩ 𝐵̅ = ̅̅̅̅̅̅̅
𝐴 ∪ 𝐵 = {4, 6}
2. Un ingeniero eléctrico tiene en su mano dos cajas de resistores, cada una con cuatro de éstos. Los
resistores de la primera caja están etiquetados con 10 Ω (ohms), pero, de hecho, sus resistencias son
de 9, 10, 11 y 12 Ω. Los resistores de la segunda caja tienen la etiqueta de 20 Ω, pero sus resistencias
son de 18, 19, 20 y 21 Ω. El ingeniero elige un resistor de cada caja y determina la resistencia de cada
uno. Sea A el evento para el cual el primer resistor tiene una resistencia mayor a 10, sea B el evento
en el que el segundo resistor tiene una resistencia menor a 19 y sea C el evento en el cual la suma de
las resistencias es igual a 28. Determine un espacio muestral para este experimento y especifique los
subconjuntos que corresponden a los eventos A, B y C.
Solución
Un buen espacio muestral es el conjunto de pares ordenados en el que el primer elemento representa
la resistencia del primer resistor y el segundo elemento constituye la del segundo resistor. Se denotará
a este espacio muestral con Ω
Ω = {(9, 18), (9, 19), (9, 20), (9, 21), (10, 18), (10, 19), (10, 20), (10, 21), (11, 18), (11, 19), (11, 20), (11, 21), (12,
18), (12, 19), (12, 20), (12, 21)}
Los eventos A, B y C están dados por
A = {(11, 18), (11, 19), (11, 20), (11, 21), (12, 18), (12, 19), (12, 20), (12, 21)}
B = {(9, 18), (10, 18), (11, 18), (12, 18)} y C = {(9, 19), (10, 18)}
3. En base al ejemplo 2, determine 𝐵 ∪ 𝐶 y 𝐴 ∩ 𝐵̅
Solución
El evento 𝐵 ∪ 𝐶 contiene todos los resultados que pertenecen a B o a C, o a ambos. Por tanto,
𝐵 ∪ 𝐶 = {(9, 18), (10, 18), (11, 18), (12, 18), (9, 19)}
El evento 𝐴 ∩ 𝐵̅ contiene los resultados en el espacio muestral que no pertenecen a B. De ahí
que el evento 𝐴 ∩ 𝐵̅ contenga los resultados que pertenecen a 𝐴 y no pertenecen a 𝐵. Por
consiguiente,
𝐴 ∩ 𝐵̅ = {(11, 19), (11, 20), (11, 21), (12, 19), (12, 20), (12, 21)}
35
4. Con referencia al ejemplo 2, si se realiza el experimento:
a) ¿es posible que los eventos A y B ocurran al mismo tiempo?
b) ¿Qué pasa con B y C? ¿A y C?
c) ¿Qué par de eventos es mutuamente excluyente?
Solución
a. Si el resultado es (11, 18) o (12, 18), entonces tanto el evento A como el B ocurren.
b. Si el resultado es (10, 18), entonces ocurren los eventos B y C.
c. Es imposible que ocurran al mismo tiempo A y C, ya que estos eventos son mutuamente
excluyentes al no tener ningún resultado en común.
d. Los eventos A y C ; B y C son mutuamente excluyentes, ya que no tienen elementos en común
5. En una reunión tenemos 20 personas, algunas de las cuales llevan gafas. Determinar por qué
resultados está formado el suceso "ser mujer y no llevar gafas” o “llevar gafas", y no ser hombre,.
Solución
Necesitamos definir, en primer lugar, cuáles son nuestros resultados posibles.
Por ejemplo, podemos suponer los eventos:
𝐻 = { 𝑠𝑒𝑟 ℎ𝑜𝑚𝑏𝑟𝑒} ; 𝑀 = { 𝑠𝑒𝑟 𝑚𝑢𝑗𝑒𝑟} ; 𝐺 = {𝑙𝑙𝑒𝑣𝑎𝑟 𝑔𝑎𝑓𝑎𝑠} y 𝑁𝐺 = {𝑛𝑜 𝑙𝑙𝑒𝑣𝑎𝑟 𝑔𝑎𝑓𝑎𝑠}
En este caso, nuestro espacio muestral está formado por:
Ω = {(𝐻; 𝐺); (𝐻, 𝑁𝐺); (𝑀, 𝐺); (𝑀, 𝑁𝐺), }
Sea el evento “ser mujer y no llevar gafas” 𝐴1 = {(𝑀, 𝑁𝐺)}
Sea el evento “llevar gafas” 𝐴2 = {((𝐻; 𝐺), (𝑀, 𝐺)}, que pueden ser hombres que llevan gafas o mujeres
que llevan gafas
Entonces, el suceso unión de "ser mujer y no llevar gafas" o "llevar gafas" está formado por,
𝐴1 ∪ 𝐴2 = {(𝑀, 𝑁𝐺) ; (𝐻; 𝐺); (𝑀, 𝐺)}
̅ = 𝑀 , es en otras palabras es “ser Mujer”, su complemento.
El evento no ser hombre es entonces: 𝐻
1) Un o d e l o s su ce s o s el e m en ta l e s q u e s e ob t i en e al ex tra er tr e s b ol a s d e u n a u r n a con d o s
b ola s roja s y u n a n e gr a e s.. ..
a. Sac ar n e gra , ro ja, roja
b . Sac ar al m en o s u n a b o la b lan ca
c. Sac ar n e gra , ro ja, n e gra .
2) Un su c es o c o mp u e sto d e l an za r u n d ad o e s. ..
a. Sac ar u n 3
b . Sac ar u n n ú m ero men or q u e 3
c. Sac ar d o s 3
3) Un su c es o i mp o sib le d e lan za r u n d ad o e s q u e s alg a u n n ú m er o q u e ...
a. Se a m en or q u e 6
b . No se a p a r n i i mp a r
c. Se a may o r o ig u al a 6
4) E s u n su c e so s egu ro q u e al l an za r d o s d ad o s la s u ma d e la s p u n tu a cion e s ob te n id a s s ea …
a. m en o r q u e 1 2.
b . u n n ú me ro n atu r al.
c. u n n ú me ro p ar.
5) Al lan z ar u n d ad o s on su ce s o s c om p at ib l e s . ..
a. sa car p ar e i mp a r.
b . sa car m ú lt ip l o d e 2 y m ú ltip lo d e 3.
36
c. sa car m ú lt ip l o d e 3 y m ú ltip lo d e 5.
6) Son su c e so s i n co mp atib l e s q u e a l l an za r d o s d ad os la su ma d e la s p u n tu aci on e s se a…
a. p ar e i mp ar
b . p ar y mú ltip lo d e 2.
c. p ar y mú ltip lo d e 5.
7) Son su c e so s i n d e p en d i e n te s ...
a. lan za r d o s d ad o s.
b . la ext ra cc ión d e u n a s eg u n d a c art a ( s in r ep os i ci ón ) d e u n a b a raja .
c. el A DN d e u n h ij o y el d e su p ad r e.
8) E s u n s u c e so d ep en d i en te ...
a. la p u n t u ac ión ob t en id a al l an za r u n s e gu n d o d a d o.
b . el col or ob t en id o a l s ac ar u n a se gu n d a b ola ( si n rep o s ic ión ) d e u n a u r n a con 3 b ola s
roja s y 2 v er d e s .
c. el s e xo d e u n s e gu n d o h ijo.
a. Un su c es o y su con tra ri o s on : a ) Co mp atib l e s b ) In co mp at ib l e s y c)
N.A
2 Probabilidad
Ejemplos 1
Hallar la probabilidad de que al lanzar dos monedas al aire salgan dos caras.
Solución
Casos posibles, es el espacio muestral es Ω ={𝐶𝐶, 𝐶𝑆, 𝑆𝐶, 𝑆𝑆}; tiene 6 elementos
Casos favorables: {𝐶𝐶} , en este caso el evento tiene un elemento. Entonces la
1
probabilidad que salga 2 caras es: 𝑃(𝐶𝐶) = 4
Ejemplos 2
Calcular la proba bilidad de que al echar un dado al aire, salga un número par.
Solución
Casos posibles: {1, 2, 3, 4, 5, 6}, Casos favorables: {2, 4, 6} L uego,
3
𝑃(𝑝𝑎𝑟) = 6 = 0.5
Ejemplos 3
En un salón de clases hay 8 estudiantes mujeres y 7 estudiantes varones. Si el profesor escoge al azar un
estudiante de su salón, ¿cuál es la probabilidad de que el estudiante escogido sea un varón?
37
Solución
Sea el evento “E” es escoger un estudiante al azar. En total hay 15 estudiantes, pero como se quiere
escoger un varón, entonces hay 7 casos favorables, Por lo tanto:
7
𝑃(𝐸) =
15
38
4. Si un suceso está incluido en otro, su probabilidad es menor o igual a la de éste.
𝐴 ⊂ 𝐵 entonces 𝑃(𝐴) ≤ 𝑃(𝐵)
5. Si 𝐴1 , 𝐴2 , . . . , 𝐴𝐾 son incompatibles dos a dos (𝐴1 ∩ 𝐴2 ∩ … .∩ 𝐴𝐾 = ∅) entonces:
𝑃(𝐴1 ∪ 𝐴2 ∪ … . 𝐴𝑘 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + 𝑃(𝐴𝑘 )
6. Si el espacio Muestral “Ω” es finito y un suceso es {𝐴1 , 𝐴2 , … . 𝐴𝑘 } entonces:
𝑃( Ω) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + 𝑃(𝐴𝑘 )
Ejemplos 1
¿Cuál es la probabilidad de sacar par, al tirar un dado?
Solución
El espacio muestral es Ω = {1,2,3,4,5,6} y el evento que sale par es 𝐴 = {2,4,6}
1 1 1 3
𝑃(𝐴) = 𝑃(2 ∨ 4 ∨ 6) = 𝑃(2) + 𝑃(4) + 𝑃(6) = + + = = 0.5
6 6 6 6
Ejemplos 2
Los eventos 𝐴 y 𝐵 son mutuamente excluyentes. Suponga que 𝑃(𝐴) = 0.30 y 𝑃 (𝐵) = 0.20. ¿Cuál es
la probabilidad de que ocurran ya sea 𝐴 𝑜 𝐵? ¿Cuál es la probabilidad de que ni 𝐴 ni 𝐵 sucedan?
Soluci ón
Se pide: 𝑃(𝐴 ∪ 𝐵) y 𝑃(𝐴̅ ∩ 𝐵̅)
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = 0.3 + 0.2 − 0 = 0.5
𝑃(𝐴̅ ∩ 𝐵̅) = 𝑃(𝐴
̅̅̅̅̅̅̅
∪ 𝐵) = 1 − 𝑃(𝐴 ∪ 𝐵) = 1 − 0.5 = 0.5
Ejemplos 3
Un estudio de 200 empresas de publicidad reveló los siguientes ingresos después de impuestos:
Ingreso después de impuestos Número de empresas
Menos de $1millón 102
De $1 millón a $20 millones 61
$20 millones o más 37
a) ¿Cuál es la probabilidad de que una empresa de publicidad seleccionada al azar tenga un ingreso
después de impuestos menores a $1 millón?
b) ¿Cuál es la probabilidad de que una empresa de publicidad seleccionada al azar tenga un ingreso
después de impuestos entre $1 millón y $20 millones?
c) Un ingreso de $20 millones o más?
Soluci ón
Consideremos los siguientes eventos después de pagar el impuesto:
𝐴 = {𝑖𝑛𝑔𝑟𝑒𝑠𝑜 𝑚𝑒𝑛𝑜𝑠 𝑑𝑒 $1 𝑚𝑖𝑙𝑙𝑜𝑛 } , 𝐵 = {𝑖𝑛𝑔𝑟𝑒𝑠𝑜 𝑒𝑛𝑡𝑟𝑒 $1 𝑦 $20 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠}
𝐶 = {𝑖𝑛𝑔𝑟𝑒𝑠𝑜 𝑑𝑒 $20 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑜 𝑚á𝑠}
102
𝑃(𝐴) = = 0.51
200
31
𝑃(𝐵) = = 0.155
200
102
𝑃(𝐶) = = 0.185
200
39
Ejemplos 4
Una encuesta que llevó a cabo la American Automobile Association (AAA) reveló que el año pasado 60%
de sus miembros hicieron reservaciones en líneas aéreas. Dos de ellos fueron seleccionados al azar. ¿Cuál
es la probabilidad de que ambos hicieran reservaciones el año pasado?
Sol ución
La probabilidad de que el primero haya hecho una reservación el año pasado es de 0.60, que se expresa
por 𝑃(𝑅1 ) = 0.60, donde 𝑅1 representa que el primer miembro hizo una reservación.
La probabilidad de que el segundo miembro elegido haya hecho una reservación es también de 0.60, así
que 𝑃(𝑅2 ) = 0.60. Como el número de miembros de la AAA es muy grande, se supone que 𝑅1 y 𝑅2 son
independientes. En consecuencia, de acuerdo con la fórmula de eventos independientes, la probabilidad
de que ambos hayan hecho una reservación es:
𝑃(𝑅1 ∩ 𝑅2 ) = 𝑃(𝑅1 )𝑥𝑃(𝑅2 ) = 0.6𝑥0.6 = 0.36
Ejemplos 5
Una muestra de 2000 conductores con licencia revelo la siguiente cantidad de violaciones al límite de
velocidad.
Número de violaciones Número de conductores
0 1910
1 48
2 18
3 12
4 9
5 a más 5
d) Que hayan cometido entre 1 y 4 violaciones inclusive, estos eventos son mutuamente excluyentes
𝑃(1 ∪ 2 ∪ 3 ∪ 4) = 𝑃(1) + 𝑃(2) + 𝑃(3) + 𝑃(4)
48 18 12 9
𝑃(1 ∪ 2 ∪ 3 ∪ 4) = + + +
2000 2000 2000 2000
𝑃(1 ∪ 2 ∪ 3 ∪ 4) = 0.0435
Ejemplos 6
En un proceso que fabrica latas de aluminio, la probabilidad de que una lata tenga alguna fisura en su
costado es de 0.02, la de que otra la tenga en la tapa es de 0.03 y de que una más presente una fisura en
el costado y en la tapa es de 0.01. ¿Cuál es la probabilidad de que al elegir una lata en forma aleatoria
tenga una fisura? ¿Cuál es la probabilidad de que no la tenga?
Sol ución
40
Probabilidad de que al elegir una lata en forma aleatoria tenga una fisura
Se tiene que
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜) = 0.02,
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎) = 0.03 y
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜 𝑦 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎) = 0.01.
Usando la fórmula
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜 𝑜 𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎)
= 𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜) + 𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎)
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜 𝑦 𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎) = 0.02 + 0.03 - 0.01
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜 𝑦 𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎) = 0.04
Probabilidad de que no la tenga
Para determinar la probabilidad de que una lata no tenga ninguna fisura, se calcula
𝑃(𝑛𝑖𝑛𝑔𝑢𝑛𝑎 𝑓𝑖𝑠𝑢𝑟𝑎) = 1 – 𝑃(𝑓𝑖𝑠𝑢𝑟𝑎) = 1 – 0.04 = 0.96
Ejemplos 7
Un producto está compuesto de cuatro piezas. La probabilidad de que la primera sea defectuosa es 2 de
cada 1000, segunda sea defectuosa es 4 de cada 1000, tercera sea defectuosa es 7 de cada 1000 y
finalmente que la cuarta sea defectuosa es 1 de cada 1000.
a. Calcular la probabilidad que el producto tenga alguna pieza defectuosa.
b. Calcular la probabilidad de ninguno de los cuatro productos tengas piezas defectuosas.
c. Calcular la probabilidad de que el primer y el tercer el producto tengan piezas defectuosas.
Sol ución
Consideremos los eventos:
2
𝐴1 = {𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑝𝑖𝑒𝑧𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎} Entonces 𝑃(𝐴1 ) = 1000 = 0.002
4
𝐴2 = {𝑙𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑎 𝑝𝑖𝑒𝑧𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎} Entonces 𝑃(𝐴1 ) = 1000 = 0.004
72
𝐴3 = {𝑙𝑎 𝑡𝑒𝑟𝑐𝑒𝑟𝑎 𝑝𝑖𝑒𝑧𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎} Entonces 𝑃(𝐴1 ) = 1000 = 0.007
1
𝐴4 = {𝑙𝑎 𝑐𝑢𝑎𝑟𝑡𝑎 𝑝𝑖𝑒𝑧𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎} Entonces 𝑃(𝐴1 ) = 1000 = 0.001
a. La probabilidad de que el producto tenga alguna pieza defectuosa es la probabilidad de la unión de los
cuatro eventos. Dichos eventos son incompatibles, por lo tanto.
𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ 𝐴4 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + 𝑃(𝐴3 ) + 𝑃(4) = 0.002 + 0.004 + 0.007 + 0.001 = 0.014
b. Sea 𝐴̅ evento que ninguno de los cuatro productos tienen piezas defectuosas, entonces
𝑃(𝐴) = 1 − 𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ 𝐴4 ) = 1 − 0.014 = 0.986
c. la probabilidad de que el primer y el tercer el producto tengan piezas defectuosas es:
𝑃(𝐴1 ∪ 𝐴3 ) = 𝑃(𝐴1 ) + 𝑃(𝐴3 ) = 0.001 + 0.007 = 0.008
41
2. La probabilidad de un suceso más la de su contrario es ...
a) 1 b) 0 c) Depende del suceso en cuestión.
3. La probabilidad del suceso seguro es ...
a) menor que 1. b) igual a 1 . c) mayor que 1.
4. La probabilidad de obtener dos caras al lanzar una moneda ...
a) está comprendida entre 0 y 1 b) 0 c)1
5. ¿Cuál de estas probabilidades es mayor que 1?
a) Que al lanzar un dado salga múltiplo de 1 o de 2 o de 3 o de 4 o de 5 o de 6.
b) Que un hijo tenga madre c) Ninguna pro babilidad es mayor que 1.
6. Una probabilidad puede ser negativa ...
a) cuando un suceso es totalmente imposible c) Nunca.
b) Depende de las circunstancias.
7. Si la probabilidad de que salga cara en un moneda trucada es de 0.57 entonces la
probabilidad de que salga cruz es de ...
a) 0.5 b) 0.43 c) con tan pocos datos no se puede determinar.
8. Un amigo me dijo que lanzó una moneda 10 000 veces y obtuvo 9 990 caras. Esto
es ...
a) imposible b) normal c) improbable .
9. Hemos lanzado una moneda 48 veces, lo más probable es que en el próximo
lanzamiento salga ...
a) Cara b) Sello c) No es más probable ni una opción ni la otra.
10. Si la probabilidad de que en Perú nazca una niña es de 0 .52 entonces la
probabilidad de que nazca niño es de ...
a) 0.48 b)0.50 c) Depende del caso.
Probabilidad condicionada
Ejemplo 2
Sabiendo que: P[A] 0,5 P[B'] 0,6 P[A' B'] 0,25
Calcula P[A B] y P[A / B].
42
Ejemplo 3
a ¿Son independientes A y B?
Ejemplo 4
De dos sucesos A y B sabemos que:
a ¿Son A y B independientes?
Ejemplo 5
Se sabe que el 50% de los egresados de Contabilidad trabajan y que el 10% trabaja y estudia Posgrado.
¿Cuál es la probabilidad de que un egresado de Contabilidad que trabaja estudia Posgrado?
Solución
Sean los eventos:
𝐴 = {egresados que estudian Posgrado} ; 𝐵 = {egresados que trabajan} y
𝐴 ∩ 𝐵 = {𝑒𝑔𝑟𝑒𝑠𝑎𝑑𝑜𝑠 𝑞𝑢𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛 𝑦 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛 𝑃𝑜𝑠𝑔𝑟𝑎𝑑𝑜 }
𝑃(𝐴 ∩ 𝐵) 0.10
𝑃(𝐴/𝐵) = = = 0.20
𝑃(𝐵) 0.50
Regla de Multiplicación
𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) = 𝑃(𝐴1 )𝑃(𝐴2 /𝐴1 )𝑃(𝐴3 /(𝐴1 ∩ 𝐴2 )
Llamado principio de las probabilidades compuestas y especialmente útil para aquellas situaciones en que
las probabilidades condicionadas son más fáciles de obtener que las probabilidades de las intersecciones.
Ejemplo 2:
Se sabe por estudios previos que el 0,1% de la población tiene problemas vasculares. Un estudio sobre
individuos con problemas vasculares revela que el 20% de ellos son placas de ateroma. Si el 10% de los
individuos con placas de ateroma están expuestos a muerte súbita por desprendimiento de trombos.
¿Qué probabilidad tiene un individuo cualquiera de estar expuesto a muerte súbita por desprendimiento
de trombos de una placa de ateroma?
Solución
Consideremos los eventos:
43
A1 = {problemas vasculares} ; A2 = {placas de ateroma}
A3 = {expuesto a muerte súbita por desprendimiento de trombos}
𝑃(𝐴1 ) = 0,001 ; 𝑃(𝐴2 |𝐴1 ) = 0,20; 𝑃(𝐴3 |𝐴1 ∩ 𝐴2 ) = 0,1
𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) = 0,001 𝑥 0,20 𝑥 0,1 = 0,000002
Ejemplo 3
Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen al azar 3 bolas.
Calcular la probabilidad de que la primera sea azul, y las otras dos verdes.
Solución
Definimos:
A1 = {la 1ª bola es azul}; A2 = {la 2ª bola es verde}; A3 = {la 3ª bola es verde}
Aplicando la definición de probabilidad, puesto que hay 10 bolas y 2 son verdes: 𝑃(𝐴1 ) = 2/10
Si la primera bola extraída es azul, en la urna quedan 9 bolas, 5 de ellas verdes: 𝑃(𝐴2 /𝐴1 ) = 5/9
Si la primera bola extraída es azul y la segunda verde, en la urna queda 8 bolas; la probabilidad de que
salga la bola verde, dado que ya salieron un azul y un verde es: 𝑃(𝐴3 /𝐴1 ∩ 𝐴2 ) = 4/8
2 5 4 1
𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) = 𝑃(𝐴1 )𝑥𝑃(𝐴2 )𝑥𝑃(𝐴3 ) = 𝑥 𝑥 = = 0.05
10 9 8 18
Ejemplo 4
Un Taller sabe que por término medio acuden: por la mañana tres automóviles con problemas Eléctricos,
ocho con problemas de Mecánicos y tres con problemas chapa, y por la tarde dos automóviles con
problemas Eléctricos, tres con problemas de Mecánicos y uno con problemas chapa.
Mediante la tabla de doble entrada, calcule:
a. Porcentaje de automóviles que acuden por la tarde
b. Porcentaje de automóviles que acuden con problemas Mecánicos
c. Calcule la probabilidad de que un automóvil con problemas eléctricos, acuda por la mañana
Solución
M: Mañana T: Tarde
Me: Problemas mecánicos 8 3 11
E: Problemas Eléctricos 3 2 5
CH: Problemas de chapa 3 1 4
14 6 20
6
a. 𝑃(𝑇) = = 0.3
20
11
𝑏. 𝑃(𝑀𝑒) = = 0.55
20
𝑃(𝑀 ∩ 𝐸) 3/20
𝑐. 𝑃(𝑀/𝐸) = = = 0.6
𝑃(𝐸) 5/20
Sucesos independientes
Dos sucesos son independientes si y sólo si
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵)
Si dos sucesos son independientes
𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴)𝑥𝑃(𝐵)
𝑃(𝐴/𝐵) = = = 𝑃(𝐴)
𝑃(𝐵) 𝑃(𝐵)
Del mismo modo
𝑃(𝐵 ∩ 𝐴) 𝑃(𝐵)𝑥𝑃(𝐴)
𝑃(𝐵/𝐴) = = = 𝑃(𝐵)
𝑃(𝐴) 𝑃(𝐴)
44
Esta propiedad coincide más con la idea intuitiva de independencia y algunos textos la dan como
definición. Hay que notar, sin embargo, que ambas definiciones no son estrictamente equivalentes.
Si un conjunto de sucesos 𝐴𝑖 forman una partición del espacio muestral y para cualquier otro suceso B se
cumple:
𝑃(𝐵) = 𝑃(𝐴1 )𝑃(𝐵/𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵/𝐴2 ) + 𝑃(𝐴3 )𝑃(𝐵/𝐴3 ) +…………….+ 𝑃(𝐴𝑛 )𝑃(𝐵/𝐴𝑛 )
Ejemplo 1
La prevalencia de infarto cardíaco para hipertensos es del 0,3% y para no hipertensos del 0,1%. Si la
prevalencia de hipertensión en una cierta población es del 25% ¿Cuál es la prevalencia del infarto en esa
población?
Solución
Consideremos los eventos:
A1 = {ser hipertenso} A2 = {no serlo} estos sucesos constituyen una partición; B = {padecer infarto}
Datos:
Probabilidad de padecer infarto dado que es hipertenso: P (B|A1) = 0,003
Probabilidad de padecer infarto dado que no es hipertenso: P (B|A2) = 0,001
Probabilidad de tener hipertensión: P (A1) = 0,25; entonces
la probabilidad de no tener hipertensión es P (A2) = 0,75
Por la propiedad
𝑃(𝐵) = 𝑃(𝐴1 )𝑃(𝐵/𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵/𝐴2 )
P (B) = 0, 25 x 0.003+ 0,75 x 0,001 = 0,0015
Teorema de Bayes
Si los sucesos 𝐴𝑖 son una partición y B un suceso tal que 𝑃(𝐵) ≠ 0, entonces
𝑃(𝐵/𝐴𝑖 )𝑃(𝐴𝑖 )
𝑃(𝐴𝑖 /𝐵) =
𝑃(𝐴1 )𝑃(𝐵/𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵/𝐴2 ) + 𝑃(𝐴3 )𝑃(𝐵/𝐴3 ) + ⋯ . + 𝑃(𝐴𝑛 )𝑃(𝐵/𝐴𝑛 )
𝑃(𝐵/𝐴𝑖 )𝑃(𝐴𝑖 )
𝑃(𝐴𝑖 /𝐵) =
𝑃(𝐵)
45
Ejemplo 1
Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-positivo de 0,05 y falso-negativo
de 0,10. Una mujer con una probabilidad pre-prueba de padecer la enfermedad de 0,15 tiene un resultado
negativo con la misma. Calcular la probabilidad de que no esté enferma.
Solución
Sean los eventos:
NE = {la mujer no está enferma}, + = {el resultado de la prueba es positivo} y
- = {el resultado de la prueba es negativo}. La pregunta pide P(NE|-).
Los datos que se dan son
𝑃(+|𝑁𝐸) = 0,05 ; 𝑃(−|𝐸) = 0,10 y 𝑃(𝐸) = 0,15.
Del primero se deduce que 𝑃(−|𝑁𝐸) = 0,95 y del último 𝑃(𝑁𝐸) = 0,85
Por lo tanto aplicando el teorema de Bayes
𝑃(−/𝑁𝐸)𝑥𝑃(𝑁𝐸)
𝑃(𝑁𝐸/−) =
𝑃(−/𝑁𝐸)𝑥𝑃(𝑁𝐸) + 𝑃(−/𝐸)𝑥𝑃(𝐸)
0.95𝑥0.85
𝑃(𝑁𝐸/−) =
0.95𝑥0.85 + 0.10𝑥0.15
𝑃(𝑁𝐸/−) = 0.982
Ejemplo 2
En un pueblo hay 100 jóvenes; 40 de los chicos y 35 de las chicas juegan al tenis. El total de chicas en el
pueblo es de 45. Si se elige un joven de esa localidad al azar:
a) ¿Cuál es la probabilidad de que sea chico?
b) Si se sabe que juega al tenis, ¿cuál es la probabilidad de que sea chica?
c) ¿Cuál es la probabilidad de que sea un chico que no juegue al tenis?
Solución
Se debe hacer una tabla de doble entrada, completando los datos que faltan:
Chicos Chicas
Juegan al Tenis 40 35 75
No Juegan al Tenis 15 10 25
55 45 100
y es así como se obtienen los siguientes resultados:
55
𝑃(𝑐ℎ𝑖𝑐𝑜) = = 0.55
100
35
𝑃(𝑐ℎ𝑖𝑐𝑎/𝑡𝑒𝑛𝑖𝑠) = = 0.47
75
15
𝑃(𝑐ℎ𝑖𝑐𝑎 ∩ 𝑁𝑜 𝑡𝑒𝑛𝑖𝑠) = = 0.15
100
Ejemplo 3
En un viaje organizado por Europa para 120 personas, 48 de los que van saben hablar inglés, 36 saben
hablar francés, y 12 de ellos hablan los dos idiomas. Se escoge a uno de los viajeros al azar.
a) ¿Cuál es la probabilidad de que hable alguno de los dos idiomas?
b) ¿Cuál es la probabilidad de que hable francés, sabiendo que habla inglés?
46
c) ¿Cuál es la probabilidad de que solo hable francés?
Solución
De igual manera se debe hacer una tabla de doble entrada, completando los datos que faltan:
Ejemplo 4
Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se realizan
correcciones faciales, un 35% implantes mamarios y el restante en otras cirugías correctivas. Se sabe
además, que son de género masculino el 25% de los que se realizan correcciones faciales, 15% implantes
mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al azar, determine:
a) Determine la probabilidad de que sea de género masculino
b) Si resulta que es de género masculino, determine la probabilidad que se haya realizado una cirugía
de implantes mamarios.
Solución
Se definen los sucesos:
F: pacientes que se realizan cirugías faciales
M: pacientes que se realizan implantes mamarios
O: pacientes que se realizan otras cirugías correctivas
H: pacientes de género masculino
m: pacientes de género femenino
Haciendo el diagrama del árbol
47
0.25 H
F
0.75 M
0
0.2
0.15 H
0.35 M
0.85 M
0 .4 5 0.40 H
O
0.60 M
La probabilidad de que sea de género masculino se refiere a un problema de probabilidad total, ya que es
el suceso condicionado y las cirugías los condicionantes. Dicho valor será:
𝑃(𝐻) = 𝑃(𝐹)𝑥𝑃(𝐻/𝐹) + 𝑃(𝑀)𝑥𝑃(𝐻/𝑀) + 𝑃(𝑂)𝑥𝑃(𝐻/𝑂)
𝑃(𝐻) = 0.20𝑥0.25 + 0.35𝑥0.15 + 0.45𝑥0.40 ⟹ 𝑃(𝐻) = 0.28
Como el suceso condicionado ha ocurrido entonces se aplica el teorema de Bayes, luego, el valor de la
probabilidad será
𝑃(𝑀)𝑥𝑃(𝐻/𝑀)
𝑃(𝑀/𝐻) =
𝑃(𝐹)𝑥𝑃(𝐻/𝐹) + 𝑃(𝑀)𝑥𝑃(𝐻/𝑀) + 𝑃(𝑂)𝑥𝑃(𝐻/𝑂)
035𝑥0.15
𝑃(𝑀/𝐻) = ⟹ 𝑃(𝑀/𝐻) = 0.19
0.20𝑥0.25 + 0.35𝑥0.15 + 0.45𝑥0.40
Ejemplo 5
Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso que le da a cada
equipo es de 25% al primero, 35% el segundo en y 40% el tercero. Se sabe que los aparatos tienen
probabilidades de error de 1%, 2% y 3% respectivamente. Un paciente busca el resultado de una ecografía
y observa que tiene un error. Determine la probabilidad de que se ha usado el primer aparato.
Solución:
Se definen los sucesos:
A1 : seleccionar el primer aparato
A2 : seleccionar el segundo aparato
A3 : seleccionar el tercer aparato
E: seleccionar un resultado con error
Se puede observar que la pregunta es sobre determinar la probabilidad de que un examen errado sea del
primer aparato, es decir, ya ha ocurrido el error. Por lo tanto, debemos recurrir al teorema de Bayes.
Primero hallemos la probabilidad de que los aparatos tengan error.
𝑃(𝐸) = 𝑃(A1 )𝑥𝑃(𝐸/A1 ) + 𝑃(A2 )𝑥𝑃(𝐸/A2 ) + 𝑃(A3 )𝑥𝑃(𝐸/A3 )
𝑃(𝐸) = 0.25𝑥0.01 + 0.35𝑥0.02 + 0.40𝑥0.03
𝑃(𝐸) = 0.0215
Ahora, la probabilidad de que el error haya sido por la maquina A1
𝑃(A1 )𝑥𝑃(𝐸/A1 )
𝑃(A1 /𝐸) =
𝑃(𝐸)
0.25𝑥0.01
𝑃(A1 /𝐸) =
0.0215
𝑃(A1 /𝐸) = 0.116 o 11.6%
Distribución Binomial
Una distribución Binomial o de Bernoulli tiene las siguientes características:
1. En cada prueba del experimento, solo son posibles 2 resultados: éxito o fracaso
48
2. La probabilidad de éxito es constante, es decir, que no varía de una prueba a otra. se
representa por 𝑝
3. La probabilidad de fracaso también es constante, se representa por 𝑞 = 1 − 𝑝
4. El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
5. La variable aleatoria Binomial, X expresa el número de éxitos obtenidos en las 𝑛 pruebas. por
tanto los valores que puede tomar X son: 0, 1, 2,3,…., n.
La distribución Binomial se expresa por B(n, p) y su probabilidad se calcula mediante la fórmula
𝑛
𝑃(𝑋 = 𝑘) = ( ) 𝑝𝑘 𝑞𝑛−𝑘
𝑘
La media 𝜇 = 𝑛𝑝
La varianza 𝑆𝑥 = 𝑛𝑝𝑞
Ejemplo 1
La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores ya
han leído. Un grupo de 4 amigos son aficionados a la lectura.
a) ¿cuál es la probabilidad de que en el grupo hayan leído la novela 2 personas?
b) ¿y como máximo 2?
Solución
𝑛=4 ; 𝑝 = 0.8 → 𝑞 = 0.2
4𝑥3
a) 𝑃(𝑋 = 2) = (42)(0.8)2 (0.2)4−2 = 2
(0.64)(0.04) = 0.1536
Ejemplo 3
La pr o babi l i dad de qu e u n a rtí cu l o p r o du ci do p o r u n a fá b r i ca s e a d e f ec tu os o
e s 0 .0 2. S e en vi ó u n ca r gam en t o d e 10 .0 00 a rtí cu l os a u n o s al mac en e s . Hal l ar
el nú m e r o e sp e rad o de a rtí cu l o s d e f e ctu o s os , l a va ri an z a y l a d e svi a ci ón tí pi ca .
Solución
𝑛 = 10000 ; 𝑝 = 0.02 → 𝑞 = 0.98
La media 𝜇 = 𝑛𝑝 = 10000(0.02) = 200
La varianza 𝑆𝑥 = 𝑛𝑝𝑞 = 10000(0.02)(0.98) = 196
Ejemplo 3 (tarea)
En pruebas realizadas a un amortiguador, para automóvil se encontró que el 20% presentan
fuga de aceite. si se instalan 20 de estos amortiguadores, halle la probabilidad de que:
a) 4 salgan defectuosos
49
b) más de 5 tengan fuga de aceite
c) de 3 a 6 amortiguadores salgan defectuosos
d) determine el promedio y la desviación de amortiguadores con defectos.
Distribución normal
Una Variable aleatoria continua X sigue una distribución Normal de madia μ y desviación típica σ, y
se designa por N(μ, σ), si se cumplen las siguientes condiciones :
1. La variable puede tomar cualquier valor: (-∞, +∞)
2. La función de densidad, es la expresión en términos de ecuación matemática de
la curva de Gauss:
1 −1 𝑥−𝜇 2
( )
𝑓(𝑥) = 𝑒 2 𝜎
𝜎√2𝜋
50
Distribución normal estándar, o tipificada o reducida
Es aquella que tiene por media el valor cero , μ = 0 , y por desviación típica la unidad, σ
=1 y se denota por N ( 0, 1)
𝑥−𝜇
𝑍=
𝜎
𝛷(𝑘) = 𝑃(𝑧 ≤ 𝑘)
1. P (Z ≤ a)
51
P(-1.47 < Z ≤ 0.45) = P(Z ≤ 0.45) − [ 1 − P(Z ≤ 1.47)]
= 0.6736 − (1 − 0.9292) = 0.6028
p = K
Nos encontramos con el caso i nverso a los anteriores, conocemos el valor de la
probabilidad y se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la
tabla el valor que más se aproxime a K .
p = 0.75Z ≤ 0.68
Para calcul ar l a vari able X nos vamos a la fórmula de la tipificación.
(X - μ)/σ = 0.68X = μ + 0.68 σ
Ejemplo
Dada una distribución normal estándar con µ = 30 y σ = 6, encuentre:
a) P (Z<k)= 0.0427
Φ (k) = 0.0427 entonces k = -1.72
b) P (Z>k)= 0.2946
Φ (k) = 1- 0.2946 = 0.7054
Luego k =0.54
c) P (-0.93<Z<k)= 0.7235
Φ (k) = 0.7235 + Φ(-0.93 ) = 0.8997
Luego k = 1.28
Ejemplo
Dada la variable X normalmente distribuida con media 18 y desviación estándar 2.5, encuentre:
a) P(X<15)= ¿?
b) El valor de k tal que P(X < k)= 0.2236
c) El valor de k tal que P(X > k)= 0.1814
d) P(17<X<21)
Solución
𝑋−𝜇 15 − 𝜋
𝑃(𝑋 < 15) = 𝑃 ( < )
𝜎 𝜎
15 − 18
𝑃(𝑋 < 15) = 𝑃 (𝑍 < )
2.5
𝑃(𝑋 < 15) = 𝑃(𝑍 < −1.20)
𝑃(𝑋 < 15) = 0.1151
b) El valor de 𝑘 tal que 𝑃(𝑋 < 𝑘) = 0.2236
𝛷( 𝑍 ) = 0.2236 ⟹ 𝑍 = −0.76
𝑘 = 𝑍𝜎 + µ = (−0.76)(2.5) + 18
𝑘 = 16.10
52
d) P(17<X<21)
P(17 < X < 21) = Φ[(21 – 18)/2.5 ] - Φ[(17 – 18)/2.5 ]
= Φ[1.20 ] - Φ[-0.40 ] = 0.8849 – 0.3446 =0.5404
53