Vous êtes sur la page 1sur 53

La estadística

La estadística es una rama de la matemática que se refiere a la recolección, estudio e interpretación de


los datos numérico y hace inferencias basadas en cálculo de probabilidades. Es el arte de realizar
inferencias y sacar conclusiones a partir de datos imperfectos.
Es aplicable a una amplia variedad de disciplinas tales como la física, la psicología, la medicina, la política,
en el área de negocios, Etc.
EJEMPLO
Se observa la estadística de las Aportaciones a la AFP de los empleados en las 5 entidades bancarias del
Perú durante los años 2008, 2009 y 2010
años
aportaciones de las Entidades bancarias a las AFPS
2008 2009 2010
Banco continental 20000 30000 45000
Banco de crédito 25000 38000 34000
Banco de la nación 12000 15200 23000
Banco financiero 28000 35000 38000
Banco del comercio 15000 20000 18000

La estadística se clasifica en dos partes


1) Estadística Descriptiva
La estadística es una ciencia que analiza un conjunto de datos y trata de extraer conclusiones sobre
sus comportamientos, a este conjunto de datos también se llaman variables estadísticas.
Ejemplo 1
La estatura de los estudiantes de la UNAC
La temperatura en los meses de verano etc.
Ejemplo 2
Un gerente mide la aptitud de las 5 secretarias que trabajan en la empresa. Se aplica una prueba
obteniendo las siguientes calificaciones: 85, 90, 93, 95 y 82 puntos. Supongamos que la medida
estadística que emplea es la aptitud promedio = 89 puntos
2) Estadística Inferencial
La estadística Inferencial es un conjunto de métodos o técnicas que generalizan la toma de
decisiones en base a una información parcial obtenida mediante técnicas descriptivas.
Por ejemplo:
Supongamos ahora que el gerente quiere conocer la aptitud promedio de todas las secretarias de la
compañía, pero carece de tiempo y de recursos para aplicar una prueba a todas ellas. Entonces
decide usar la aptitud promedio de las 5 secretarias para generalizar a cerca de todas las secretarias
de la compañía. (Este proceso de estimación se llama inferencia estadística)
3) Variables estadísticas
Es una característica o dato de cada sujeto o unidad de análisis de la población que se va a investigar
y que puede tomar diferentes valores, es decir el valor de la variable varia de sujeto a sujeto. Al
cconjunto de valores que puede tomar una variable se llama la escala de esa variable.
Ejemplo
 Queremos investigar a La población del Callao, las variables podrían ser: el sexo, la estatura, el
peso, color de los ojos, etc. cada una de las variables tiene valor: para la variable sexo, su valor es
“hombre” y” mujer”, para la variable estatura, el valor serio: 1.60m, 1.65m etc.
 Queremos investigar la variable Número de hijos en una población de matrimonios los valores
de la variable serían: un hijo, 2 hijos, 4 hijos 7 hijos, etc.

1
 Queremos investigar “El sueldo de los trabajadores de una empresa” los valores de la variable
serían: S/. 800, S/. 900, S/ 5000, S/ 20000; etc.

Clasificación de las Variables


1) Por los valores que pueden tomar
1.1 Variables no métricas o cualitativas (categoricas)
También llamadas variables categóricas, Son aquellas que no se pueden medir
numéricamente
a) Nominal
Este tipo de variables representan una cualidad o atributo sin implicar el orden entre ellas.
Ejemplo
Clasificar un grupo de individuo según
a) sexo: masculino, femenino
b) Por su estado civil: Soltero, casado
c) color del cabello: negro, castaño
b) Ordinal
Son aquellas variables que establecen jerarquías o categorías ordenadas entre sus
elementos.
Ejemplos
1) Clasificar un grupo de individuos por su grado de instrucción: Analfabeto, primaria,
secundaria, superior.
2) Clasificar a un grupo de personas por sus hábitos de fumar: no fumadores, fumadores
leves fumadores moderados, fumadores severos.
Observación
Por la medición que haga el investigador, en las variables cualitativas se pude observar también variables
dicotómicas y Politómicas.
 Dicotómicas. si tiene solo dos respuestas
Ejemplo
 Agentes causantes de quemaduras: físicas, químicas
 Tipo de parto: natural, cesárea
 Politomicas. si tiene más de dos respuestas
Ejemplo
 Servicios hospitalarios: medicina, neurología, pediatría, neumología, etc.
 Niveles de pobreza: alto, medio, bajo

1.2 Variables métricas o cuantitativas (numéricas)


Es una variable cuantitativa que por su naturaleza puede adoptar cualquier valor numérico
(dentro de un intervalo). Para todo par de valores siempre se puede encontrar un valor
intermedio, la precisión la dá el instrumento de medición. (Peso, estatura...)

2
Ejemplo
1) Se quiere estudiar la “edad” de los estudiantes de FCC
2) Se quiere estudiar el “peso” de las alumnas de la FCC
3) Se pide determinar la “velocidad” promedio de los autos que circulan por la av. Colonial.
4) Se quiere estudiar la “cotización” de las acciones de la bolsa de valores de Lima.
En cada una de ellas, observamos que los datos a consignar son cantidades.
1.2.1 Variable cuantitativa discreta:
Son aquellas variables que sólo pueden tomar valores enteros o se pueden obtener mediante conteo.
Es decir, presenta separaciones o interrupciones entre escala de valores que pueden tomar.
Ejemplo
1) Número de hijos de una familia.
2) Número de estudiantes de un colegio.
3) Numero de empresas en régimen general
4) cantidad de infracciones por un conductor
1.2.2 Variable cuantitativa Continua:
Son aquellas variables que pueden tomar cualquier valor dentro de un intervalo especificado de
valores.
Ejemplo
1) la velocidad de un carro: 30.5 k/h, 62.25k/h
2) la temperatura durante los meses de verano: 30.50 , 31.80 , .
3) tiempo de vida útil de un artefacto: 2.5 años, 5.8 años
4) Sueldo de los trabajadores de una empresa

2 Por el papel en la investigación en las hipótesis.


2.1 Variables independientes
Son variables que manipula el experimentador, es decir el resultado al ser medido por el
investigador no depende de otras variables. Se aplica en investigación cuantitativa (son datos
cuantitativos)
También se les llama variables explicativas o predictoras.
2.2 Variables dependientes
Son aquellas cuyo comportamiento es explicado o pronosticado por una o más variables
independientes. También se las llama variables criterio o respuesta.

Población
Es una colección o un conjunto de todos los individuos (personas, animales, objetos) que al menos tienen
una característica común y que se puede medir una o más características de naturaleza cualitativa o
cuantitativa.
El tamaño de la población se denota con “N”

3
Ejemplo
1) Si estudiamos el precio de las viviendas de la ciudad de Lima, la población será el total de las
viviendas de la ciudad de Lima.
2) Si queremos determinar la intención de votos para los partidos políticos PPC y el APRA en todo el
Perú, la población será el total de los electores.

Clasificación de la población
• Población finita
Es aquella población que tiene un número limitado de individuos o unidades de análisis.
(elementos).
Ejemplo
Las estaturas de todos los estudiantes universitarios del Perú.
• Población Infinita
Es aquella población que tiene un número ilimitado de individuos o unidades de análisis
(elementos).
Ejemplo
Los productos manufacturados producidos en América latina.
Muestra
Viene a ser un subconjunto o una parte representativa de individuos de una población.
El tamaño de la muestra de denota por: “n” y el tamaño de la población se denota por: “N” (n ≤ N)

Parámetro: Es una medida resumen calculada sobre la población

Ejemplo

La Media poblacional “µ”, La desviación típica “δ” y La proporción poblacional “P” son parámetros
poblacionales, pues para determinar al valor de cada uno de ellos, es necesario utilizar
información de toda la población.
Estadístico o estadígrafo: Es una medida resumen calculada sobre la muestra

Ejemplo
La media muestral “𝑥̅ ”, la desviación típica “S” y la Proporción muestral “P” son estadísticos, pues
para determinar al valor de cada uno de ellos, solo es necesario utilizar información de una parte
de la población.

Ejemplo
 Cuando calculamos el salario promedio de todos los trabajadores de una empresa, considerando
la población la empresa, ese promedio viene a ser entonces un parámetro.

 Si se calcula el salario promedio de “algunos” de los trabajadores de la empresa, se trataría de


la media muestral, entonces la media será un “estadístico”.

TABLA DE DISTRIBUCION DE FRECUENCIAS PARA DATOS AGRUPADOS


Frecuencias absolutas Frecuencias relativas Frecuencias porcentuales

4
Datos de Acumulada Acumulada simple Acumulada Acumulada Acumulada Acumulada
las Var. b menor que mayor que menor que mayor que 100hi% menor que mayor que
xi ni Ni N*i hi Hi H*i pi Pi P*i
X1 n1 N1 N*1 h1 H1 H*1 100h1 100H1 100H*1
X2 n2 N2 N*2 h2 H2 H*2 100h2 100H2 100H*2
X3 n3 N3 N*3 h3 H3 H*3 100h3 100H3 100H*3
X4 n4 N4 N*4 h4 H4 H*4 100h4 100H4 100H*4
. . . . . . . . .
. . . . . . . . .
xm Nm=n N*m hm Hm H*m 100h 1Hm 100H*m
m
n 1 100%

DISTRIBUCION DE FRECUENCIAS PARA DATOS AGRUPADOS POR INTERVALOS


Frecuencias absolutas Frecuencias relativas Frec. Porcentual
Amplitud de Marca Acumulada Acumulada Acumulada Acumulada Acumulada Acumulada
clase de clase simple menor que mayor que simple menor que mayor que 100% menor que mayor que
𝑥𝑖−1 − 𝑥𝑖 Yi ni Ni N*i hi Hi H*i pi Pi P*i
𝑥0 − 𝑥1 𝑦1 𝑛1 N1 N*1 h1 H1 H*1 100h1
𝑥1 − 𝑥2 𝑦2 𝑛2 N2 N*2 h2 H2 H*2 100h2
𝑥2 − 𝑥3 𝑦3 𝑛3 Ni N*i h3 Hi H*i 100hi
. . . . . . .
𝑥𝑛−1 − 𝑥𝑛 𝑦𝑛 𝑦𝑛 𝑁𝑛 𝑁 ∗𝑛 ℎ𝑛 𝐻𝑛 𝐻∗𝑛 100ℎ𝑛

𝑛 100%

Clases (𝒎𝒊 ) : Se llaman clases a cada uno de los grupos que se divide el conjunto de datos de la
muestra.
𝑥0 − 𝑥1 calse 1
𝑥1 − 𝑥2 clase 2
𝑥2 − 𝑥3 clase 3
. . .
. . .
. . .
𝑥𝑛−1 − 𝑥𝑛 clase n

Amplitud o recorrido (L)


valor máximo de la muestra: Xmax
L = Xmax – Xmin
valor mínimo de la muestra: Xmin

Amplitud de Clase (Ci)


𝑥𝑖 : Límite superior
𝐶𝑖 = 𝑥𝑖 – 𝑥𝑖−1

𝑥𝑖−1: Límite inferior


5
Marca de Clase (𝑦𝑖 )

𝑦𝑖 + 𝑦𝑖−1
𝑦𝑖 =
2

Ejemplo 1
Un ingeniero agrónomo visita 25 cooperativas agraria de naranjas en el valle de Huara y en cada una
anotó el número de plantas atacadas por ciertos hongos, de lo cual resultaron los datos siguientes.
15 20 25 15 18 16 17 18 20 18 18 18 19 16 17 19 16 17 17 17 19 18 19 18 15
1) Diga de qué tipo de datos son estos
2) Construya la tabla de frecuencias para estos datos
2) ¿Cuántas cooperativas agrarias tienen a lo más 20 plantas atacadas por hongos?
3) ¿Cuántas cooperativas agrarias tienen por lo menos 17 plantas atacadas por hongos?
4) ¿Qué proporción de cooperativas bajo estudio tienen 18 plantas atacadas por hongos?
5) ¿Qué porcentaje de cooperativas tienen a lo más 18 atacadas por hongos
6) ¿Qué porcentaje de cooperativas tienen 18 o más plantas atacadas por hongos?
7) ¿Qué porcentaje de cooperativas tienen al menos 17 plantas atacadas por hongos?

Solución
plantas número de frecuencia frecuencia frecuencia frecuencia frecuencia frecuencia frec. frec.
atacadas
cooperativas absoluta absoluta relativa relativa relativa porcentual porc. porc.
por hongos
≤ ≥ ≤ ≥ ≤ ≥
𝑥𝑖 𝑛𝑖 𝑁𝑖 𝑁𝑖∗ ℎ𝑖 𝐻𝑖 𝐻𝑖∗ 𝑃𝐼
15 3 3 25 3/25 3/25 25/25 3/25*100 =12% 12% 100%

16 3 6 22 3/25 6/25 22/25 3/25*100 = 12% 24% 88%


17 5 11 19 5/25 11/25 19/25 5/25*100 = 20% 44% 76%
18 7 18 14 7/25 18/25 14/25 7/25*100 = 28% 72% 56%
19 4 22 7 4/25 22/25 7/25 4/25*100 = 16% 88% 28%
20 2 24 3 2/25 24/25 3/25 2/25*100 = 8% 96% 12
25 1 25 1 1/25 25/25 1/25 1/25*100 = 4% 100% 4

2) ¿Cuantas cooperativas agrarias tiene a lo más 20 plantas atacadas por hongos? ) Rpta : 24
3) ¿Cuantas cooperativas agrarias tienen por lo menos 17 plantas atacadas por hongos? Rpta : 19
4) ¿Qué proporción de cooperativas bajo estudio tienen 18 plantas atacadas por hongos? Rpta :
7/25
5) ¿Qué proporción de cooperativas tienen 18 o menos plantas atacadas por hongos? Rpta :
18/25
6) ¿Qué porcentaje de cooperativas tienen a lo más 18 atacadas por hongos Rpta : 72
%
7) ¿Qué porcentaje de cooperativas tienen al menos 17 plantas atacadas por hongos? Rpta : 76
%

Ejemplo 2

La inversión real (en miles de dólares) anual de un grupo de pequeñas empresas fue:

6
10 12 8 40 6 8 10 30 2 8 6 14
16 20 25 28 30 26 30 4 6 10 18 17
13 17 21 7 6 8 14 7 15 19 27 22
0 14 6 8 9 11 13 15 18 20 30 60
12 6 5 5 6 8 7 12 15 36 39 52
a) Formar una tabla de la distribución de frecuencias con intervalos de amplitud constante
b) El número de pequeñas empresas que han invertido 40 mil dólares o más
c) El número de pequeñas empresas que invirtieron 10 mil dólares o más pero menos de 25 mil
dólares
d) La proporción de las empresas que invirtieron a los más 48 mil dólares
e) El porcentaje de las empresas que invirtieron entre 16 y 32 mil dólares
f) El porcentaje de las empresas que invirtieron a lo más 56 mil dólares
Solución

𝑚 = √60 = 7.74 Se aproxima a 𝑚 = 8

𝑋𝑚𝑎𝑥 = 60 ; 𝑋𝑚𝑖𝑛 = 0 ⟹ 𝐿 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 = 60 − 0 = 60 ⟹ 𝐿 = 60


𝐿 60
𝐶=𝑚= 8
= 7.5

Si se considera 𝑚 = 8, hay ampliar el rango a 𝐿 = 64

Datos marca Frecuencia Absoluta Frecuencia Relativa Frecuencia Porcentual


𝑋𝑖−1 - 𝑋𝑖 𝑦𝑖 ni Ni N*i hi Hi H*i pi Pi P*i
0 - 8 4 15 15 60 0.25 0.25 1 25 25 100
8 - 16 12 22 37 45 0.367 0.617 0.750 36.667 61.667 75.000
16 - 24 20 10 47 23 0.167 0.783 0.383 16.667 78.333 38.333
24 - 32 28 8 55 13 0.133 0.917 0.217 13.333 91.667 21.667
32 – 40 36 2 57 5 0.033 0.950 0.083 3.333 95.000 8.333
40 – 48 44 1 58 3 0.017 0.967 0.050 1.667 96.667 5.000
48 - 56 52 1 59 2 0.017 0.983 0.033 1.667 98.333 3.333
56 - 64 60 1 60 1 0.017 1.000 0.017 1.667 100.000 1.667
50

b) El número de pequeñas empresas que han invertido 40 mil dólares o más Rpta. 3 empresas

0 8 16 24 32 40 1 48 1 56 1 64
c) el número de pequeñas empresas que invirtieron 10 mil dólares o más pero menos de 25 mil
dólares
0 8 10 𝑥 16 10 24 𝑦 25 32 40 48 56
64

si en un intervalo de 16 − 8 = 8 → 15 empresas
6𝑥15
un intervalo de 16 − 10 = 6 → 𝑥 empresas ; Usando la regla de tres simple 𝑥 = =
8

11.25

7
si en un intervalo de 32 − 24 = 8 → 15 empresas
1𝑥15
un intervalo de 25 − 24 = 1 → 𝑦 empresas ; Usando la regla de tres simple 𝑦 = =
8

1.875
Por lo tanto
𝑥 + 10 + 𝑦 = 11.25 + 10 + 1.875 = 23.125 ≈ 23 Empresas

d) La proporción de las empresas que invirtieron a los más 48 mil dólares Rpta. 0.967
empresas

0 0.25 8 0.367 16 0.167 24 0.133 32 0.033 40 0.017 48 56


64

0.25 + 0.367 + 0.167 + 0.133 + 0.033 + 0.017 = 0.967

e) El porcentaje de las empresas que invirtieron entre 16 y 32 mil dólares. Rpta. 16.667+13.333=
30 %

8 16 16.667 24 13.333 32 40 48 56 64
f) El porcentaje de las empresas que invirtieron a lo más 56 mil dólares Rpta. 98.333 %

0 25 8 36.667 16 16.667 24 13.333 32 3.333 40 1.667 48 1.667 56 64


25 + 36.667 + 16.667 + 13.333 + 3.333 + 1.667 + 1.667 = 98.333

Principales gráficos de la tabla frecuencias


1) Gráfico de barras

2) Gráfico de Sector Circular, Torta o pastel

8
3) Gráfico de líneas

Ejemplo
Realizar gráficos para la tabla adjunta.
Xi ni Ni 𝑁 ∗𝑖 hi Hi 𝐻∗ 𝑖
0 1 1 16 1/16 = 0.0625 1/16 = 0.0625 16/16 = 1
1 6 7 15 6/16 = 0.375 7/16 =0.4375 15/16 = 0.9375
2 5 12 9 5/16 = 0.3125 12/16 = 0.75 14/16 = 0.5625
3 3 15 4 3/16 = 0.1875 15/16 = 0.9375 4/16 = 0.25
4 1 16 1 1/16 = 0.0625 16/16 = 0.0625 1/16 = 0.0625
Solución

Diagrama de Barras Diagrama de Sector Circular

Histograma y Polígono de frecuencias

9
 El histograma de frecuencias sirve para representar gráficamente las distribuciones de frecuencias
absolutas o relativas de datos cuantitativos continuos (de datos tabulados en clases o intervalos)
 Los polígonos de frecuencias absolutas o relativas se obtienen uniendo los puntos medios o marcas de
clase de las bases superiores del histograma.

Polígono de frecuencias acumuladas u ojivas


Los polígonos de frecuencias absolutas mayor que, menor o de frecuencias relativas mayor que o menor
que, se obtienen uniendo los vértices de los rectángulos de los diagramas de frecuencias menores que o
mayores que respectivamente.

Ejemplo
Grafique el histograma, el polígono de frecuencias absolutas y la ojiva de frecuencia absoluta acumulada
mayor que para la siguiente tabla.
clase yi ni Ni N*i hi Hi H*i pi Pi P*i
11 – 17 14 4 4 120 0.03 0.03 1.00 3.33 3.33 100.00
17 – 23 20 8 12 116 0.07 0.10 0.97 6.67 10.00 96.67
23 – 29 26 16 28 108 0.13 0.23 0.90 13.33 23.33 90.00
29 - 35 32 76.67
32 60 92 0.27 0.50 0.77 26.67 50.00
35 – 41 38 32 92 60 0.27 0.77 0.50 26.67 76.67 50.00
41 – 47 44 16 108 28 0.13 0.90 0.23 13.33 90.00 23.33
47 – 53 50 8 116 12 0.07 0.97 0.10 6.67 96.67 10.00
53 - 59 56 4 120 4 0.03 1.00 0.03 3.33 100.00 3.33
Solución
35 Histograma de la Frecuencia Absoluta 35 Poligono de la Frecuencia Absoluta
30 32 32 30 32 32
25 25
20 20
15 15
16 16 16 16
10 10

5 8 8 5 8 8
4 4 4 4
0 0

10
140 140 120 116
120 120 120 108
116
108 92
100 100
92
80 80 60
60 60 60
40 40 28
28 12
20 4
12 20
0 4
0
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8

Histograma de frecuencia Relativa simple


Poligono de frecuencia Relativa simple
0.3 0.27 0.27 0.3 0.27 0.27
0.25 0.25
0.2 0.2
0.15 0.13 0.13 0.13 0.13
0.15
0.1 0.07 0.07 0.1 0.07 0.07
0.05 0.03 0.03
0.05 0.03 0.03
0
0

Ojiva de la Frecuencia Relativa menor que Ojiva de la Frecuencia Relativa mayor que
1.2 1.2
1 0.97 1 1 1 0.97
0.9 0.9
0.8 0.77 0.8 0.77
0.6 0.6
0.5 0.5
0.4 0.4
0.2 0.23 0.2 0.23
0.1 0.1
0 0.03 0 0.03
1 2 3 4 5 6 7 8 0 2 4 6 8 10

30 Histograma de la frecuencia Porcentual


25 26.6726.67
20

15

10 13.33 13.33

5 6.67 6.67
3.33 3.33
0

30 Poligono de la frecuencia porcentual


25 26.6726.67
20

15

10 13.33 13.33

5 6.67 6.67
3.33 3.33
0

11
Ejercicios propuestos
1. Describa en sus propios términos la diferencia entre una población y una amuestra; entre un
parámetro y un estadístico
2. Cuál es la diferencia entre una variable cualitativa y una variable cuantitativa, dé ejemplos
3. Cuál es la diferencia entre una variable continua y una variable discreta, dé ejemplos
4. Un informe reciente en la revista FORTUNE revelo que los japoneses pronto controlaran hasta un 35%
de las ventas de autos en los Estados Unidos; comparado con el 285 de finales de los años 80 esta
apenas un 8% por encima de lo ocurrido en 1970. ¿esta información es contiene estadística
descriptiva, inferencial o ambas?
5. ¿Cuáles la diferencia entre la estadística descriptiva y la estadística inferencial? ¿cuál cree usted que
constituye una forma más elevada de análisis estadístico y por qué?
6. La Revista FORBES (febrero de 1997) reporto datos sobre las condiciones y estilos de vida en varias
ciudades de estados unidos. Algunos de esos datos se reportan en el siguiente cuadro:

7. Establecer cuáles de estos datos son discretos y cuáles son continuos


a) Temperatura medida en un laboratorio medida cada media hora
b) Ingresos anuales de los profesores de la UNAC
c) Longitud de 100 tornillos producidos en una empresa
d) Número de estudiantes en el aula de 4º ciclo de contabilidad
8. ¿Cuál es la escala de medición de cada una de las siguientes variables?
a) Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad.
b) Tiempo que requiere un estudiante para responder a un examen.
c) Llamadas que llegan a la central telefónica de la UNAC en un día.
d) Preferencia por cierta marca de refresco.
e) Color del cabello de los estudiantes que toman el curso de estadística
f) Número de acciones vendidas en un día en la bolsa de valores
g) Vida media de los tubos de televisión producidos por una fabrica
h) Coeficientes intelectuales de los estudiantes.
i) La distancia que viajan los estudiantes para llegar a clases.
j) Los números en los jerseys de un equipo universitario femenino de fútbol.
k) Clasificación de estudiantes por fecha de nacimiento.
l) Clasificación de estudiantes que cursan primero, segundo, tercero o último grados.
m) Profesión
n) Nacionalidad
o) Grado de instrucción
p) Número de hijos
q) Numero telefónico

12
r) Dirección
s) Año de nacimiento
t) Estado civil
u) Ingreso mensual familiar
v) Número de DNI
9. Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte
de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferían esta marca.
a) ¿Qué constituye la muestra?
b) ¿Qué constituye la población?
c) ¿Cuál es la proporción dentro de la muestra, de la ama s de casa que prefieren la marca del
detergente?
10. La tabla muestra una distribución de frecuencias de la duración de 400 tubos de radio comprobados
en la L Asociados.
Duración en Frec
horas
300 400 14
400 500 45
500 600 58
600 700 76
700 800 68
800 900 62
900 1000 48
1000 1100 29
Donde n = 400. Completar para luego determinar
a) ímite superior de la quinta clase
b) Límite inferior de octava clase
c) Marca de clase de la séptima clase
d) Tamaño del intervalo de clase
e) Frecuencia de cuarta clase
f) Frecuencia relativa de la sexta clase
g) Porcentaje de tubos cuya duración es menor a 600 horas
h) Porcentaje de tubos cuya duración es mayor o igual a 900 horas
i) Porcentaje de tubos cuya duración es al menos 500 horas, pero no mayor de 1000 horas
j) Construir un histograma y un polígono de frecuencia
k) Construir un histograma y un polígono de frecuencias relativas
l) Construir una ojiva porcentual
m) Estimar el porcentaje de tubos con duraciones de menos de 560 horas
n) Estimar el porcentaje de tubos con duraciones de 970 o más horas
o) Estimar el porcentaje de tubos con duraciones entre 620 y 890 horas
11. A continuación, se ofrece una distribución de frecuencias del paso de 150 personas que utilizaron un
elevador cierto día. Construya un histograma con estos datos.
Lim Lim Frec
inf sup
75 90 9
90 105 11
105 120 23
120 135 26
135 150 31
150 165 23
165 180 9

13
180 195 9
195 210 6
210 225 3
12. Nora Velarde, Asesora de una empresa de corretaje, intenta diseñar programas de inversión que
fuesen atractivos para jubilados. Ella sabe que si un inversionista pudiera obtener un cierto nivel de
interés, estaría dispuesto a invertir su capital, pero debajo de un cierto nivel de interés, no estaría
dispuesto a hacerlo. De un grupo de 50 sujetos. Nora obtuvo los datos siguientes con respecto a los
diferentes niveles de réditos requeridos por cada individuo para que pueda invertir 1000 dólares.

Lim Lim Frec


inf sup
70 75 5
75 80 6
80 85 10
85 90 11
90 95 4
95 100 3
100 105 7
105 110 4

Construya la distribución de frecuencia acumulada y grafique la distribución de la parte


convirtiéndola en ojiva de frecuencias relativas
13. Una Compañía encuestadora norteamericana informa que, con base en las ventas de 2009, las 5
últimas marcas de refresco que más se vendieron fueron Coke Classic, Diet Coke, Dr. Pepper, Pepsi
Cola y Sprite. La lista siguiente proviene de una muestra de 25 compras de esas marcas que fue:

Coke Classic Dr. Pepper Sprite Coke Classic Pepsi Cola


Diet Coke Diet Coke Coke Classic Diet Coke Coke Classic
Pepsi Cola Pepsi Cola Diet Coke Coke Classic Coke Classic
Diet Coke Pepsi Cola Coke Classic Diet Coke Coke Classic
Coke Classic Coke Classic Coke Classic Coke Classic Pepsi Cola
a) Construya una tabla de la distribución de frecuencias
b) Construir una grafica de barras y un diagrama de pastel
c) ¿Qué porcentaje de las ventas tienen Pepsi Cola y Coke Classic?
14. En una empresa el personal se distribuye de acuerdo con su actividad desarrollada en la misma, como
se indica a continuación:
Actividad Porcentaje
Profesional 8%
Técnico 10%
Operario 70%
Ayudante 10%
Aseo 2%
Construya un gráfico circular para ilustrar la situación

15. Los datos que se muestran a continuación son los cargos (en dólares) por los servicios de electricidad,
agua y gas durante el mes de julio del 2010 para una muestra de 50 apartamentos de 3 habitaciones
en la Molina
96 171 202 178 147 102 153 197 127 82
157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 150 154 130 143 187 166 139 149

14
108 119 183 151 114 135 191 137 129 158
Elaborar.

a) Una tabla de distribución de frecuencias


b) Un histograma y un polígono de frecuencias
c) Un histograma porcentual
d) Una ojiva
Determinar

a) El porcentaje de apartamentos cuyo gasto no llega a 139 dólares


b) El porcentaje de apartamentos cuyo gasto es mayor á igual a 158 dólares
c) El porcentaje de apartamentos cuyo gasto es al menos 120 dólares, pero no mayor de 196
dólares
d) El porcentaje de apartamentos con gastos menores de 135 dólares
e) El porcentaje de apartamentos con gastos de 186 dólares o mas
f) El porcentaje de apartamentos con gastos entre 140 y 184 dólares

Medidas Posición
Introducción
Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje,
por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene
una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se
obtiene, y cuán variadas son esas calificaciones. En otras palabras, para que una calificación tenga
significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios
estadísticos.
La medida de tendencia central se refiere al punto medio de una distribución y sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba. El propósito de las medidas
de tendencia central es mostrar en qué lugar se ubica la persona promedio o típica del grupo. Sirve como
un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico, como
un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones o
como un método para comparar los resultados medios obtenidos por dos o más grupos.

1 Medidas de tendencia central


Las medidas de tendencia central también llamadas medidas de posición, son medidas estadísticas que
pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se
encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media,
mediana y moda.
1.1 La Media Aritmética
Comúnmente conocida como media o promedio. Es aquella medida que se obtiene al dividir la suma de
todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma
de un conjunto de datos dividida por el número total de dichos datos.
Se representa por medio de una letra una 𝑥̅ cuando se trabaja con una parte de la población (muestra) y
con 𝜇 cuando se trabaja con toda la población.
𝑥1 +𝑥2 +𝑥3 +⋯+𝑥𝑛 𝑥1 +𝑥2 +𝑥3 +⋯+𝑥𝑁
𝑥̅ = 𝑛
, media muestral ; 𝜇= 𝑁
, media poblacional

Donde: "𝑛" es tamaño de la muestra y "𝑁" es el tamaño de la población

15
Ejemplo 1
En la práctica calificada de Matemática, un alumno tiene las siguientes notas: 10, 15, 08, 16. Se observa
que el número total de datos es 4 ( 𝑛 = 4), entonces su nota promedio de práctica será.
10 + 15 + 08 + 16
𝑥̅ = = 12.25
4
Media para datos agrupados
Cuando la muestra tiene muchos datos o el tamaño de la muestra es demasiado grande, es más
conveniente agrupar en una tabla de frecuencias y luego calcular la media aritmética; esta agrupación se
puede hacer de manera simple o por intervalos.
a) Datos agrupados de modo simple.
𝑥𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖
𝑥1 𝑛1 𝑥1 𝑛1
𝒙𝟏 𝒏𝟏 + 𝒙𝟐 𝒏𝟐 + 𝒙𝟑 𝒏𝟑 + ⋯ + 𝒙𝒏 𝒏𝒏
𝑥2 𝑛2 𝑥2 𝑛2 ̅=
𝒙
𝑥3 𝑛3 𝑥3 𝑛3 𝒏𝟏 + 𝒏𝟐 + ⋯ + 𝒏𝒏

𝑥𝑛 𝑛𝑛 𝑥𝑛 𝑛𝑛
b) Datos agrupados por intervalos
𝑥𝑖−1 − 𝑥𝑖 𝑦𝑖 𝑛𝑖 𝑦𝑖 𝑛𝑖
𝒚𝟏 𝒏𝟏 +𝒚𝟐 𝒏𝟐 +𝒚𝟑 𝒏𝟑 +⋯+𝒚𝒏 𝒏𝒏
𝑥0 − 𝑥1 𝑦1 𝑛1 𝑦1 𝑛1 ̅=
𝒙 ; Media
𝒏𝟏 +𝒏𝟐 +⋯+𝒏𝒏
𝑥1 − 𝑥2 𝑦2 𝑛2 𝑦2 𝑛2
𝑥2 − 𝑥3 𝑦3 𝑛3 𝑦3 𝑛3 𝒙𝒊−𝟏 + 𝒙𝒊
𝒚𝒊 = ; Marca de clase
𝟐
𝑥𝑛−1 − 𝑥𝑛 𝑦𝑛 𝑛𝑛 𝑦𝑛 𝑛𝑛
Donde 𝑦𝑖 representa la marca de clase y que 𝑓𝑖 es la frecuencia absoluta simple que representa la
cantidad de veces que se repite.
Ejemplo 2
La siguiente tabla muestra las edades de los 75 alumnos del curso de estadística, se pide calcular la edad
promedio de dichos alumnos.
Edad de los alumnos(𝑥𝑖 ) cantidad de alunos (𝑛1 )
17 5
18 15
19 20
20 25
21 10
Solución
𝑥𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖
75 + 270 + 380 + 500 + 210
17 5 75 𝑥̅ =
5 + 15 + 20 + 25 + 10
18 15 270 1435
𝑥̅ = = 19.13
19 20 380 75
20 25 500 La edad promedio es de 19.13 años
21 10 210

Observación
Si el conjunto de datos es demasiado grande, como por ejemplo calcular la edad promedio de los
estudiantes de la UNAC que son aproximadamente 10 mil, o edad promedio de los escolares de la Región
Callao, el cálculo por este método sería muy tedioso, por lo que podemos optar aplicar programas como
el EXCEL o SPSS que simplifica en segundos nuestro trabajo.

1.2 La Mediana (Me)

16
Es el puntaje que se ubica en el centro de una distribución y representaremos por Me. Es el valor
central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras,
la Mediana agrupa el 50% de los datos antes y 50% de los datos después. Según el número de valores que
se tenga se pueden presentar dos casos:
 Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de
datos.
 Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales
(los valores centrales se suman y se dividen por 2).
Ejemplo 1
Para obtener la mediana de los números 13, 15, 9, 6, 4, 12, 11, primero tenemos que ordenarlos en
forma ascendente: 4, 6, 9, 11, 12, 13, 15, entonces Me = 11, que viene a ser el termino central de
las datos.
Ejemplo 2
El siguiente cuadro muestra las edades de un grupo de alumnos
12 15 14 15 16 15 17 18 16 19 16 17 15 15 17
18 19 14 15 17 16 18 17 19 17 23 16 17 18 19
se pide determinar la media y la mediana.
Solución
ordenanda en una tabla de frecuencioas se tiene
𝑥𝑖 𝑛𝑖 Ni 𝑥𝑖 𝑛𝑖 ℎ𝑖 𝑃𝑖 P*i
12 1 1 12 0.03 3.33% 3.33%
14 2 3 28 0.07 6.67% 6.67
15 6 9 90 0.20 20.00% 26.67
16 5 14 80 0.17 16.67% 43.33
17 7 21 119 0.23 23.33% 66.67
18 4 25 72 0.13 13.33% 80.00
19 4 29 76 0.13 13.33% 93.33
23 1 30 23 0.03 3.33% 96.67
total 30 500
Medida Formula Observaciones
Donde 𝑥𝑖 se refiere a todo y cada uno de los elementos de la
∑ 𝑥𝑖 𝑛𝑖 500 muestra y 𝑛 es el número total de elementos en la muestra y
Media 𝑥̅ = = = 16.66
𝑛 30 𝑛𝑖 se refiere a la frecuencia de la clase.

Se ubica en la tabla el primer valor de frecuencia acumulada


30
= 15 = 𝑇𝑐 ∶ término central mayor a la posición calculada, si ese valor es mayor, entonces
2 la mediana es la clase correspondiente al mismo. Si el valor
Mediana entonces 𝑀𝑒 = 𝑇𝑐 = 17 es igual a la posición, entonces se suman el valor anterior más
el valor obtenido y se divide entre 2.

1.3 La Moda (Mo)


Es el valor que más se repite en un conjunto de datos. Dicho conjunto puede ser uni modal cuando existe
un solo dato con mayor frecuencia, bimodal cuando haya dos datos con la misma frecuencia. Para hallar
la moda, se construye el histograma de frecuencias.
Ejemplo 1
Del conjunto de datos que se muestra: 2, 4, 5, 5, 5, 7, 8, 8, 9, 12
El dato 5 se repite 3 veces y el resto de datos menos de 3 veces. Por lo tanto la moda es 5.
Se trata de una distribución unimodal, pues hay un solo dato que se repite mayor cantidad de veces.
Ejemplo 2

17
Del conjunto de datos que se muestra: 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 , 4, 4
El dato 5 y el dato 4 se repiten 3 veces, lo que implica que hay dos modas, se trata entonces de una
distribución bimodal. Por lo tanto las modas son: Mo=5 y Mo=4
Ejemplo 3
En el siguiente cuadro la edad de los 30 alumnos con sus respectivas frecuencias, determine la moda.
frecuencia 1 2 6 5 7 4 4 1
edad 12 14 15 16 17 18 19 23
Solución
Si hacemos un recuento en la columna de frecuencia, se observa que 7 es la que tiene mayor frecuencia.
Por lo tanto la moda es: Mo=17. Se trata entonces de una distribución unimodal.
De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil, porque se
usa en procesos y técnicas estadísticas más complejas. Sin embargo, cuando en una distribución se
presentan casos cuyos datos tengan puntajes son muy bajos o muy altos respecto al resto del grupo,
entonces es recomendable utilizar la mediana o la moda (Porque dadas las características de la media,
esta es afectada por los valores extremos).
La media es considerada como la mejor medida de tendencia central, por las siguientes razones:
 Los puntajes contribuyen de manera proporcional al hacer el cómputo de la media.
 Es la medida de tendencia central más conocida y utilizada.  
Las medias de dos o más distribuciones pueden ser fácilmente promediadas mientras que las medianas y
las modas de las distribuciones no se promedian.
2) Medidas de Tendencia no Central
Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que
no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la
muestra en tramos iguales. Estas medidas son: Cuartiles, Deciles y Percetiles.

2.1 Cuartiles (Q)


Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro
tramos iguales, en los que cada uno de ellos concentra el 25% del total del conjunto de datos de la
distribución.

Ejemplo
Considere el siguiente conjunto de datos: 2, 5, 6, 3, 7, 4, 9 y determine los cuartiles.
Solución
Ordenando de menor a mayor se tiene los cuartiles
Cuartil 1: Q1=3, cuartil 2: Q2=5 y cuartil 3: Q3=7
2.2 Deciles (Di)
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos
iguales, en los que cada uno de ellos concentra el 10% del total del conjunto de datos de la distribución.
2.3 Percentiles (Pi)

18
Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien
tramos iguales, en los que cada uno de ellos concentra el 1% del total del conjunto de datos de la
distribución.
Ejemplo 1
Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos. Los
deciles y percentiles se calculan de igual manera, aunque harían falta distribuciones con mayor número
de datos.
𝑥𝑖 𝑛𝑖 𝑁𝑖 ℎ𝑖 𝐻𝑖
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

1º cuartil: es el valor 1,22 cm, ya que por debajo de ella se sitúa el 25% de la frecuencia (tal como se puede
ver en la columna de la frecuencia relativa acumulada).
2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se sitúa otro 25% de la frecuencia.
3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de la frecuencia.
Además, por encima suya queda el restante 25% de la frecuencia.
Atención: cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en el
ejemplo en los tres cuartiles) la medida de posición no central sería realmente una de las repeticiones.

Medidas de Dispersión o de variabilidad

Introducción

En todos los casos cuando se propone hacer un estudio de una población o una muestra, se va a necesitar
más información que la obtenida con las medidas de posición (tendencia central o no central). Debido a
esto se necesita encontrar las medidas de variación, las cuales sirven para medir el grado en que los datos
de una muestra o población tienden a concentrarse o alejarse respecto a aun valor central llamado Media
aritmética o promedio aritmético. Además, esta medida nos resulta útil para comparar la variabilidad de
varias muestras o poblaciones bajo estudio.

19
El despreciar la existencia de la variación, puede conducir a decisiones incorrectas, es más, entregar el
sólo promedio aritmético estaríamos en muchos casos desinformando en lugar de informar. De ahí, la
importancia de apropiarnos de los conceptos de medidas dispersión o de variabilidad como:
La desviación típica, el rango, el rango intercuartílico, el coeficiente de variación entre otras.

Medidas de Dispersión
Estudia la distribución de los valores de la serie de datos de la muestra, analizando si estos se encuentran
más o menos concentrados, o más o menos dispersos. entre más grande sea el grado de dispersión,
menores uniformidades tendrán los datos (sinónimo de heterogeneidad) y por lo tanto menor
representatividad o confiabilidad del promedio de tendencia central o localización por haber sido
obtenido de datos dispersos. Por el contrario, si este valor es pequeño (respecto a la unidad de medida)
entonces hay una gran uniformidad entre los datos. Cuando es cero quiere decir que todos los datos son
iguales.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:

1. Rango (R)
Mide la amplitud de los valores de la muestra. Es la distancia entre el valor máximo y el valor mínimo de
la muestra.
R = 𝑋𝑚𝑎𝑥 – 𝑋𝑚𝑖𝑛

Si ordenamos el conjunto de datos de la muestra bajo estudio en forma ascendente de la siguiente forma:
𝑥1 ; 𝑥2 ; 𝑥3 ; 𝑥4 ; … … … … … … … 𝑥𝑛−1 ; 𝑥𝑛

𝑋𝑚𝑎𝑥 = 𝑥𝑛
{ Entonces R=𝑥𝑛 − 𝑥1
𝑋𝑚𝑖𝑛 = 𝑥1

2. Rango Intercuartil (RI)


El rango intercuartílico RI (o rango intercuartil) es una estimación estadística de la dispersión de una
distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida
se eliminan los valores extremadamente alejados. El rango intercuartílico es altamente recomendable
cuando la medida de tendencia central utilizada es la mediana (ya que este estadístico es insensible a
posibles irregularidades en los extremos).
RI = 𝑄3 − 𝑄1

3. Varianza (𝑉𝑎𝑟(𝑥) = 𝑆𝑥 )
Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de la
diferencia al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha
repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
Para datos tabulados:
∑(𝑥𝑖 − 𝑥̅ )2 𝑛𝑖 ∑ 𝑛𝑖 (𝑥𝑖 )2
𝑎) 𝑉𝑎𝑟(𝑥) = ó 𝑏) 𝑉𝑎𝑟(𝑥) = − 𝑥̅ 2
𝑛 𝑛
Donde 𝑥𝑖 son los datos de la muestra
Para datos tabulados por intervalos:

20
∑(𝑌𝑖 −𝑥̅ )2 𝑛𝑖 ∑(𝑌𝑖 )2 𝑛𝑖
𝑎) 𝑉𝑎𝑟(𝑥) = 𝑛
ó 𝑏) 𝑉𝑎𝑟(𝑥) = 𝑛
− 𝑥̅ 2 ;

Donde 𝑌𝑖 son las marcas de clase

Desviación típica: Se calcula como raíz cuadrada de la varianza.

𝜎𝑥 = √𝑣𝑎𝑟(𝑥)

4) Coeficiente de variación de Pearson:

√𝑣𝑎𝑟(𝑥)
𝐶𝑉 = 𝑥100
𝑥̅
Ejemplo 1
se mide la estatura de los 30 alumnos de un colegio obteniendo la tabla adjunta. y se pide calcular las
medidas de dispersión.
𝑛𝑖 1 4 4 2 1 2 3 3 4 3 3
Variable: 𝑥𝑖 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30

Solución
(Valor) 𝑛𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖 𝑥𝑖 2
1,20 1 1.20 1.44
1,21 4 4.80 5.8564
1,22 4 4.88 5.9536
1,23 2 2.46 3.0258
1,24 1 1.24 1.5376
1,25 2 2.50 3.125
1,26 3 3.78 4.7628
1,27 3 3.81 4.8387
1,28 4 5.12 6.5536
1,29 3 3.87 4.9923
1,30 3 3.9
5.07
total
30 37.6 5.8564

1.- Rango:
Xmax –Xmin → Rango = 1,30 - 1.20 = 10cm.
2. Varianza:
37.6
Observamos que 𝑥̅ = = 1.253
30
∑(𝑥𝑖 −𝑥̅ )2 𝑛𝑖
Aplicando la fórmula: 𝑉𝑎𝑟(𝑥) = 𝑛
⟹ 𝑉𝑎𝑟(𝑥) = 0.001
3.- Desviación típica: 𝜎𝑥 = √0.001 = 0.032
0.032
4.- Coeficiente de variación de Pearson: 𝐶𝑉 = 1.253 = 0.0255

Ejemplo 2
Calcule las medidas de dispersión para la tabla adjunta.
ni 1 2 4 10 16 8 4
𝑥𝑖−1 − 𝑥𝑖 [26 − 34[ [34 − 42[ [42 − 50[ [50 − 58[ [58 − 66[ [66 − 74[ [74 − 82[

21
Solución
Frecuencias
Variable
absolutas
𝑥𝑖−1 − 𝑥𝑖 Yi ni Ni niYi 𝑛𝑖 𝑌𝑖 2
[26 − 34[ 30 1
1 30 900
[34 − 42[ 34 2
3 68 2312
[42 − 50[ 38 4
7 152 5776
[50 − 58[ 42 10
17 420 17640
[58 − 66[ 46 16
33 736 33856
[66 − 74[ 50 8
41 400 20000
[74 − 82[ 54 4
45 216 11664
total 45
2022 92148

1.- Rango: Xmax – Xmin → Rango = 82 - 26 = 26cm.


2022
2.- Varianza: Observamos que 𝑥̅ = = 44.93
45

Aplicando la fórmula:
∑(𝑥𝑖 −𝑥̅ )2 𝑛𝑖 92148
𝑉𝑎𝑟(𝑥) = = = 2047.73 ⟹ 𝑉𝑎𝑟(𝑥) = 2047.73
𝑛 45

3.- Desviación típica: 𝜎𝑥 = √2047.73 = 45.25


45.25
4.- Coeficiente de variación de Pearson: 𝐶𝑉 = 44.93 = 1.007

Propiedades de la varianza
1. 𝑉𝑎𝑟(𝑥) ≥ 0 → 𝜎𝑥 ≥ 0
2. 𝑉𝑎𝑟(𝑏) = 0 donde b es constante
3. Sea 𝑌 = 𝑥𝑖 ± 𝑏 entonces 𝑉𝑎𝑟(𝑌) = 𝑉𝑎𝑟(𝑥)
4. Sea 𝑌 = 𝑎𝑥𝑖 entonces 𝑉𝑎𝑟(𝑌) = 𝑎2 𝑉𝑎𝑟(𝑥)

Medidas de concentración y Asimetría

1. Grado de concentración
Mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la
muestra.
Para medir el grado de concentración de una distribución de una frecuencia se puede usar varios
indicadores, entre ellos el índice de Gini (IG).

22
∑ 𝑝𝑖−𝑞𝑖 𝑁 𝑥1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥1 𝑛𝑖
𝐼𝐺 = ∑ 𝑝𝑖
; Donde 𝑝𝑖 = ( 𝑖) 100 y 𝑞𝑖 = ( ) 100
𝑛 𝑥1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥𝑛 𝑛𝑛

Observación
a. Si IG=0, entonces la concentración es mínima
b. Si IG=1, entonces la concentración es máxima

Ejemplo 1:

La siguiente tabla muestra los sueldos de los empleados de una empresa (en dólares). Calcule el IG

Sueldos en dólares Nº de trab.


𝑥𝑖 𝑛𝑖 𝑁𝑖 𝑛𝑖𝑥𝑖 𝑝𝑖 𝑞𝑖
200 10
300 12
400 8
500 5
600 3
700 1
800 1

Solución
𝑛1
𝑝1 = 𝑛
=
𝑁2
𝑝2 = 𝑛
=
𝑁3
𝑝3 = 𝑛
=
𝑥1 𝑛1
𝑞1 = =
𝑥1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥𝑛 𝑛𝑛
𝑥1 𝑛1 +𝑥2 𝑛2
𝑝6 = 𝑥 =
1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥𝑛 𝑛𝑛
𝑥1 𝑛1 +𝑥2 𝑛2 +𝑥3 𝑛3
𝑝7 = =
𝑥1 𝑛1 +𝑥2 𝑛2 +⋯+𝑥𝑛 𝑛𝑛

2. Asimetría
La asimetría es la medida que indica la simetría de la distribución de una variable respecto a la media
aritmética, sin necesidad de hacer la representación gráfica. Los coeficientes de asimetría indican si
hay el mismo número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
 Asimetría negativa: la cola de la distribución se alarga para valores inferiores a la media, la mayor
cantidad de datos están a la derecha de la media.
 Simétrica: Existe el mismo número de datos a la izquierda y la derecha de la media. En este caso,
coinciden la media, la mediana y la moda. La distribución se adapta a la forma de la campana de
Gauss, o distribución normal.
 Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media, la mayor
cantidad de datos están a la izquierda de la media.

23
𝑀𝑒 < 𝑋̅ < 𝑀𝑜 𝑋̅ = 𝑀𝑒 = 𝑀𝑜 𝑀𝑜 < 𝑀𝑒 < 𝑋̅

Para medir el nivel de asimetría se utiliza las siguientes fórmulas:

Coeficiente de Asimetría de Fisher


El coeficiente de asimetría de Fisher evalúa la proximidad de los datos a su media. Cuanto mayor sea la
suma (𝑥𝑖 − 𝑥̅ )3 , mayor será la asimetría.
1
(∑(𝑥𝑖 − 𝑥̅ )3 𝑛𝑖)
𝐶𝐴𝐹 = 𝑛
√{𝑣𝑎𝑟(𝑥)}3
Coeficiente de Asimetría de Pearson
El coeficiente de asimetría de Pearson mide la diferencia entre la media y la moda respecto a
la dispersión del conjunto de datos. Este procedimiento, menos usado, lo emplearemos solamente en
distribuciones unimodales y poco asimétrica.
̅ − 𝑀𝑂
𝑋
𝐶𝐴𝑃 =
𝑆
Coeficiente de Asimetría de Bowley
El coeficiente de asimetría de Bowley toma como referencia los cuartiles para determinar si la
distribución es simétrica o no. Para aplicar este coeficiente, se supone que el comportamiento de la
distribución en los extremos es similar.
𝑄3 − 2𝑄2 + 𝑄1
𝐶𝐴𝐵 =
𝑄3 − 𝑄1
Ejemplo 1.- Calcular el coeficiente de asimetría del sueldo de los trabajadores de la empresa
COSMOS
Sueldos en dólares Nº de trab.
Xi ni nixi (𝑥𝑖 − 𝑥̅ )2 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )3 𝑛𝑖
200 10 2000 272250 -44921250
300 12 3600 50700 -3295500
400 8 3200 9800 343000
500 5 2500 91125 12301875
600 3 1800 165675 38933625
700 1 700 112225 37595375
800 1 800 189225 82312875
40 14600 891000 123270000
Solución
1 1 1 1
𝑥̅ = ∑ 𝑥𝑖 𝑛𝑖 = (14600) = 365 ; 𝑣𝑎𝑟(𝑥) = (∑(𝑥𝑖 − 𝑥̅ )2 𝑛𝑖 = (891000)
40 40 𝑛 40
= 22275

24
1 1
(∑(𝑥𝑖 − 𝑥̅ )3 𝑛𝑖) = (123270000) = 308175
𝑛 40
Usando el coeficiente de asimetría de Fisher
1 1
𝑛 (∑(𝑥𝑖 − 𝑥̅ )3 𝑛𝑖) 𝑛 (∑(𝑥𝑖 − 𝑥̅ )3 𝑛𝑖) 3081750
𝐴𝐹 = = = = 0.9269 > 0
√{𝑣𝑎𝑟(𝑥)} 3 √{22275} 3 3324501.77
Indica que la distribución de los datos es asimétrica positiva, respecto al promedio, los datos no están
distribuidos equitativamente, la mayor cantidad de datos están a la izquierda pero cercano a la media, y
una cantidad pequeña están muy distante de la media.

14
12
10 12
8 10
6 8
4 5
2 3 1 1
0
200 300 400 500 600 700 800

3. Curtosis o apuntamiento (K)


El coeficiente de analiza el grado de concentración que presentan los valores de los datos alrededor
media, de manera que a mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva
y eta definida por la fórmula.
1
[∑(𝑥𝑖 − 𝑥̅ )4 𝑛𝑖]
𝐾= 𝑛 −3
(𝑉𝑎𝑟(𝑥))2

Se definen 3 tipos de distribuciones según su grado de curtosis:


1.- Distribución Mesocúrtica
Presenta un grado de concentración medio alrededor de los valores centrales de la Variable (el mismo
que presenta una distribución normal). Entonces K=0

2. Distribución Leptocúrtica
Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
K>0
4. Distribución Platicúrtica:
Presenta un reducido grado de concentración alrededor de los valores centrales de la variable. K < 0

25
Leptucurtica

Mesocurtica

Platicurtica

Ejemplo 1.- Calcular el coeficiente de Curtosis del sueldo de los trabajadores de la empresa COSMOS
Sueldos en dólares Nº de trabajad.
𝑥𝑖 𝑛𝑖
200 10
300 12
400 8
500 5
600 3
700 1
800 1
300 12
400 8
500 5
Solución
𝑥𝑖 𝑛𝑖 𝑛𝑖𝑥𝑖 (𝑥𝑖 − 𝑥̅ )2 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )4 𝑛𝑖
200 10 2000 272250 7412006250
300 12 3600 50700 214207500
400 8 3200 9800 12005000
500 5 2500 91125 1660753125
600 3 1800 165675 9149401875
700 1 700 112225 12594450625
800 1 800 189225 35806100625
891000 66848925000

2000 + 3600 + 3200 + 2500 + 1800 + 700 + 800


𝑥̅ = = 365
10 + 12 + 8 + 5 + 3 + 1 + 1

∑(𝑥𝑖 − 𝑥̅ )2 𝑛𝑖 891000
𝑉𝑎𝑟(𝑥) = ⟹ 𝑉𝑎𝑟(𝑥) = = 22.275
𝑛 40
1
[∑(𝑥𝑖 − 𝑥̅ )4 𝑛𝑖] 66848925000
𝐾= 𝑛 −3 ⟹ 𝐾= − 3 = 0368 ∴ 𝐾 = 0368
(𝑉𝑎𝑟(𝑥))2 40(22275)(22275)

26
Distribución Bidimensional
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de
cada elemento de la población: por ejemplo: peso y altura de un grupo de estudiantes; superficie y precio
de las viviendas de una ciudad; potencia y velocidad de una gama de coches deportivo.

X/Y y1 y2 ..... ym-1 ym


x1 n1,1 n1,2 … n1,m-1 n1,m
x2 n2,1 n2,2 … n2,m-1 n2,m
..... …… …… .. …. …..
xn-1 nn-1,1 nn-1,2 … nn-1,m-1 nn-1,m
Xn nn,1 nn,2 … nn,m-1 nn,m

Covarianza
La covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias respecto a
sus medias. Es el dato básico para determinar si existe una dependencia entre ambas variables y además
es el dato necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o
la recta de regresión
𝑖=𝑛
1 ∑𝑖=𝑛
𝑖=𝑖 𝑥𝑖 𝑦𝑖
𝐶𝑜𝑣(𝑥, 𝑦) = (∑(𝑦𝑖 − 𝑦̅)(𝑥𝑖 − 𝑥̅ )) 𝐶𝑜𝑣(𝑥, 𝑦) = − 𝑥̅ 𝑦̅
𝑛 𝑛
𝑖=

Ejemplo 1
Dos jueces X e Y asignaron separadamente a los 10 finalistas del concurso las siguientes puntuaciones
X 3 10 9 1 2 4 6 5 8 7
Y 3 8 10 4 1 2 5 6 7 9
Halle la covarianza dada por los jueces bajo el supuesto de que emitieran su juicio con absoluta
independencia indicando así el signo de la dependencia.
Solución
Xi Yi XiYi X2i Y2i
3 3 9 9 9 55 55
𝑥̅ = ; 𝑦̅ =
10 8 80 100 64 10 10
9 10 90 81 100 ∑𝑖=𝑛
𝑖=𝑖 𝑥𝑖 𝑦𝑖 385
1 4 4 1 16 𝐶𝑜𝑣(𝑥; 𝑦) = −𝑥
̅𝑦̅= − (5.5)(5.5) = 6.95
𝑛 10
2 1 2 4 1
4 2 8 16 4
6 5 30 36 25
5 6 3 25 36
8 7 56 64 49
7 9 63 49 81
55 55 345 385 385

Coeficiente de Correlación lineal (r)


En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación
entre sí, el coeficiente de correlación lineal o coeficiente de Pearson, mide el grado de intensidad de
esta posible relación entre las variables.

27
𝐶𝑜𝑣(𝑥, 𝑦)
𝑟= donde −1≤𝑟 ≤1
𝑆𝑥 ∗ 𝑆𝑦
 Si 𝑟 > 0 la relación es positiva, la recta tiene pendiente positiva o tiene relación directa.
 Si 𝑟 < 0 la relación es Negativa, la recta tiene pendiente negativa o tiene relación inversa.
 Si 𝑟 está cercano a -1 o +1, la relación entre las variables es fuerte.
 si 𝑟 está cercano al cero, la relación entre las variables es débil.
Ejemplo 2
Halle el coeficiente de correlación del ejemplo 1
Solución
𝑛
1 385
𝑆𝑥 = √𝑣𝑎𝑟(𝑥) = √ ∑ 𝑥𝑖2 𝑛𝑖 − (𝑥̅ )2 = √ − 30.25 = √8.25 = 2.87
𝑛 10
𝑖=1

𝑛
1 385
𝑆𝑦 = √𝑣𝑎𝑟(𝑦) = √ ∑ 𝑦𝑖2 𝑛𝑖 − (𝑦̅)2 = √ − 30.25 = √8.25 = 2.87,
𝑛 10
𝑖=1

Cov(x, y) 6.95
Además por ejemplo 1, 𝐶𝑜𝑣(𝑥; 𝑦) = 6.95 entonces 𝑟= = = 0.843
Sx ∗ Sy 2.87 ∗ 2.87
Se concluye que la correlación entre las dos variables es fuerte, la variable independiente influye
fuertemente sobre la variable dependiente.

Tipos de relación entre las variables

Relación Determinista
Conocido el valor de 𝑋, el valor de 𝑌 queda perfectamente establecido. Son del tipo: 𝑦 = 𝑓 (𝑥)
Ejemplo:
La relación existente entre la temperatura en grados centígrados (𝑥) y grados Fahrenheit (𝑦 ) es
𝑦 = 1,8𝑥 + 32

Relación No determinista
Conocido el valor de X, el valor de Y no queda perfectamente establecido. Son del tipo
𝑦 = 𝑓 (𝑥) + 𝑢.
Donde "𝑢" es una perturbación desconocida (variable aleatoria)
Ejemplo
Se tiene una muestra del volumen de producción (𝑥) y el costo total (𝑦 ) asociado a un producto en un
grupo de empresas. Existe relación pero no es exacta.

Lineal
Cuando la función 𝑓 (𝑥) es lineal, 𝑓 (𝑥) = 𝛽1 + 𝛽2𝑥
Si β2 > 0 hay relación lineal positiva.
Si β2 < 0 hay relación lineal negativa
Observación
Si se analiza la estatura y el peso de los alumnos de una clase es muy posible que exista relación entre
ambas variables: mientras más alto sea el alumno, mayor será su peso. Este coeficiente se aplica cuando
la relación que puede existir entre las variables es lineal (es decir, si representáramos en un gráfico o en

28
un diagrama de dispersion, los pares de valores de las dos variables que forman la nube de puntos se
aproximaría a una recta).
En el gráfico adjunto se muestra los tipos de relaciones que se pueden presentar
y y

x x

Relación lineal Relación cuadrática


y y

x x

Relación exponencial Sin Relación

Regresión lineal Simple


Uno de los aspectos más relevantes de la Estadística es el análisis de la relación o dependencia entre
variables. Frecuentemente resulta de interés conocer el efecto que una o varias variables pueden causar
sobre otra, e incluso predecir en mayor o menor grado valores en una variable a partir de otra.
Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra
variable Y.
X: Variable independiente o explicativa o exógena
Y: Variable dependiente o respuesta o endógena
El objetivo es obtener estimaciones razonables de Y para distintos valores de X a partir de una muestra
de 𝑛 pares de valores (𝑥1 , 𝑦1 ), . . . , (𝑥𝑛 , 𝑦𝑛 ).
Por ejemplo
 Estudiar cómo influye la estatura del padre sobre la estatura del hijo.
 Estimar el precio de una vivienda en función de su superficie.
 Aproximar la calificación obtenida en una materia según el número de horas de estudio semanal.
 Prever el tiempo de computación de un programa en función de la velocidad del procesador.
En este Tema abordaremos el modelo de regresión lineal, que tiene lugar cuando la dependencia es de
tipo lineal, y daremos respuesta a dos cuestiones básicas:
 ¿Es significativo el efecto que una variable X causa sobre otra Y?
 ¿Es significativa la dependencia lineal entre esas dos variables?
De ser así, utilizaremos el modelo de regresión lineal simple para explicar y predice la variable
dependiente (Y) a partir de valores observados en la independiente (X).

29
Para ello, el coeficiente de correlación lineal o coeficiente de Pearson, nos permite determinar si
efectivamente existe relación entre las dos variables. Una vez que se concluye que sí existe relación, la
regresión nos permite definir la recta que mejor se ajusta a esta nube de puntos.
Ecuación de la recta Regresión lineal o Recta de Ajuste

𝐿 ∶ 𝑦 = 𝛽1 + 𝛽2 𝑥
Donde:
𝑦 : es la variable dependiente
𝑥 : es la variable independiente
𝐶𝑜𝑣(𝑥, 𝑦)
𝛽2 =
𝑣𝑎𝑟(𝑥)
𝛽1 = 𝑦̅ − 𝛽̂2 𝑥̅
y y Relación lineal negativa
Relación lineal positiva

x x

Ejemplo 1
Determine la recta de ajuste para la siguiente tabla de datos
x 1 2 2 3 4 4 5 6
y 2 3 4 4 4 6 5 7
Donde 𝑥 es la variable independiente y 𝑦 la variable dependiente.
Solución
Calculando la covarianza, la varianza y la media de la variable dependiente se tiene:
𝐶𝑜𝑣(𝑥, 𝑦) = 2.8392 ; 𝑣𝑎𝑟(𝑥) = 2.1093 ; 𝑥̅ = 3.375 y 𝑦̅ = 4.375
Luego
𝐶𝑜𝑣(𝑥, 𝑦) 2.1093
𝛽2 = = = 0.8490566 ⟹ 𝛽2 = 0.8490566
𝑣𝑎𝑟(𝑥) 2.484375

𝛽̂1 = 𝑦̅ − 𝛽̂2 𝑥̅ = 4.375 − (0.8490566)(3.375)


𝛽1 = 4.375 − 2.86556604 = 1.50943396 ⟹ 𝛽1 = 1.50943396
La recta de regresión o la recta de ajuste es

𝐿 ∶ 𝑦 = 𝛽̂1 + 𝛽̂2 𝑥 ⟺ 𝐿 ∶ 𝑦 = 1.50943396 + 0.8490566𝑥

30
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7

Ejemplo 2
El dueño de una empresa que vende carros desea determinar si hay relación lineal entre los años de
experiencia de sus vendedores y la cantidad de carros que venden. Los siguientes datos representan los
años de experiencia (𝑥) y las unidades de carros vendidas al año (𝑦), de 10 vendedores de la empresa.
𝑥 3 4 6 7 8 12 15 20 22 26
𝑦 9 12 16 19 23 27 34 37 40 45
Solución
Calculando la covarianza, la varianza y la media de la variable dependiente se tiene:
𝐶𝑜𝑣(𝑥, 𝑦) = 88.94 ; 𝑣𝑎𝑟(𝑥) = 59.01 ; 𝑥̅ = 12.3 y 𝑦̅ = 26.2
Luego
𝐶𝑜𝑣(𝑥, 𝑦) 88.94
𝛽2 = = = 1.507202 ⟹ 𝛽2 = 1.507202
𝑣𝑎𝑟(𝑥) 59.01

𝛽̂1 = 𝑦̅ − 𝛽̂2 𝑥̅ = 26.2 − (1.507202)(12.3)


𝛽1 = 26.2 − 18.5385846 = 7.6614154
𝛽1 = 7.6614154
La recta de regresión o la recta de ajuste es

𝐿 ∶ 𝑦 = 𝛽̂1 + 𝛽̂2 𝑥 ⟺ 𝐿 ∶ 𝑦 = 7.6614154 + 1.507202𝑥


50
45
40
35
30
25
20
15
10
5
0
0 5 10 15 20 25 30

Ejemplo 3 (tarea)
Un a c o mp añ ía d es e a h a ce r p r ed i c cion e s d el va l or an u a l d e su s ve n ta s t otal e s en ci e rto p a í s a
p arti r d e la r el ac ión d e é st a s y la r en t a n a ci on al. Pa ra in v e sti gar l a r e lac ión cu en t a con lo s
si gu ien t es d at os :

31
𝑥 189 190 208 227 239 252 257 274 293 308 316
𝑦 402 404 412 425 429 436 440 447 458 469 469
Donde 𝑥 representa la renta nacional en millo nes de soles y 𝑦representa las ventas de
la compañía en miles de soles en el periodo que va de 1990 hasta el 2000 (ambos
inclusive). Se pide determinar:
a) La recta de regresión de Y sobre X
b) el coeficiente de correlación lineal e interprétalo
c) Si en 2001 la renta nacional del país fue de 235 millones de soles, ¿Cuál será la
predicción para las ventas de la compañía en este año)

Probabilidad
1. Introducción
Antes de entrar a detallar el concepto de probabilidad, veamos algunas definiciones previas que se
usaran en el cálculo de probabilidad.
1.1 Experimento
Es el proceso que induce a que ocurra una y sólo una de varias posibles observaciones. Estos
experimentos pueden ser: Experimentos Deterministas y no Deterministas.
1.2 Experimentos deterministas
Son los experimentos de los que podemos predecir el resultado antes de que se
realicen.
Ejemplos
 Si dejamos caer una piedra desde una ventana sabemos, sin lugar a dudas, que
la piedra bajará.
 Si la arrojamos hacia arriba, sabemos que subirá durante un determinado
intervalo de tiempo; pero después bajará.

1.3 Experimentos no deterministas (aleatorios)


Son aquellos en los que no se puede predecir el resultado, ya que éste depende
del az ar.
Ejemplos
 Si lanzamos una moneda no sabemos de antemano si saldrá cara o sello.
 Si lanzamos un dado tampoco podemos determinar el resultado que vamos a
obtener.

1.4 Suceso o Evento


Es cada uno de los resultados posibles de un Experimento .
Ejemplos
 Al lanzar una moneda que salga cara.
 Al lanzar un dado que se obtenga 4.

1.5 Espacio Muestral “Ω”

32
Es el conjunto de to dos los posibles resultados de un experimento aleatorio, lo
representaremos por “ Ω”.
Ejemplo
 Espacio muestral de lanzar una moneda: Ω = {C, S}.
 Espacio muestral de lanzar un dado: Ω = {1, 2, 3, 4, 5, 6}.
1.6 Suceso Aleatorio
Es cualquier subconjunto del espacio muestral.

Ejemplo
 Al tirar un dado, un suceso sería que saliera par, otro, obtener múltiplo de 3, y
otro, sacar 5.
 Una bolsa contiene bo las blancas y negras. Se extraen sucesivamente tres bolas.
Luego del experimento.
1. El espacio muestral es:
Ω = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}
2. El suceso A = {extraer tres bolas del mismo color} es:
A = {(b,b,b); (n, n,n)}
3. El suceso B = {extraer al menos una bola blanca} es:
B= {(b,b,b ); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}
4. El suceso C = {extraer una sola bola negra} es:
C = {(b,b,n); (b,n,b); (n,b,b)}

1.7 Tipos de Sucesos


Suceso elemental
Es cada uno de los elementos que forman parte del espacio muestral, La unión de todos los sucesos
elementales conforman el espacio muestral
Ejemplo
1. Tirando un dado un suceso elemental es sacar 5.

2. Al lanzar dos monedas, un suceso elemental es que salga dos caras


Suceso compuesto
Es cualquier subconjunto del espacio muestral.
Ejemplo
Tirando un dado un suceso compuesto sería que saliera par, otro, obtener múltiplo de 3.

Suceso seguro
El Suceso seguro, está formado por todos los posibles resultados del experimento (es decir, por el
espacio muestral).
Ejemplo
1. Tirando un dado obtener una puntuación que sea menor que 7.
2. Al lanzar una moneda obtener cara o sello

Suceso imposible
Suceso imposible (∅) es el que no tiene ningún elemento, o el suceso nunca ocurre.

33
Ejemplo
1. Tirando un dado obtener una puntuación igual a 7.
2. Al lanzar una moneda, esperar que salga el numero 10

Clasificación de los Sucesos


Sucesos compatibles
Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común (la intersección es
diferente de vacío), es decir, pueden ocurrir juntos al mismo tiempo.
Ejemplo
Si A es un suceso sacar puntuación par al tirar un dado y B es obtener múltiplo de 3; A y B son compatibles
porque el 6 es un suceso elemental común.
Sucesos incompatibles o mutuamente excluyentes
Dos sucesos, A y B, son incompatibles cuando no tienen ningún elemento en común, o cuando no pueden
ocurrir juntos al mismo tiempo.
Ejemplo
1. Si A es sacar puntuación “par” al tirar un dado y B es obtener “impar”, A y B son incompatibles.
Pues 𝐴 = {2,4,6} y 𝐵 = {1,3,5} entonces 𝐴 ∩ 𝐵 = ∅ (vacío)
2. Gozar de buena salud y estar enfermo son eventos incompatibles. pues una persona que está
enferma no
puede estar gozando de buena salud al mismo tiempo.

Sucesos independientes
Dos sucesos, A y B, son independientes cuando la probabilidad de que suceda A no se ve afectada porque
haya sucedido o no B.
Ejemplo
 Al lazar dos dados los resultados son independientes.
 El resultado de lanzar dos monedas también son independientes
 El suceso estatura de los alumnos de una clase y el color del pelo son independientes: el que
un alumno sea más o menos alto no va a influir en el color de su cabello, ni viceversa.

Sucesos dependientes
Dos sucesos, A y B, son dependientes cuando la probabilidad de que suceda A se ve afectada porque haya
sucedido o no B.
Ejemplo
 Extraer dos cartas de una baraja, sin reposición, son sucesos dependientes.
 Estudiar una asignatura para un examen y obtener la calificación de dicho examen son eventos
dependientes.
Suceso contrario
El suceso contrario a 𝐴 es otro suceso que se realiza cuando no se realiza 𝐴, Se denota por 𝐴̅.
Ejemplo
 Son sucesos contrarios sacar par e impar al lanzar un dado.
 Detectar en el control de calidad un producto defectuoso y un producto bueno son sucesos contrarios.
Operación con sucesos

UNION INTERSECCION

34
CONMUTATIVA 𝐴∪𝐵 =𝐵∪𝐴 𝐴∩𝐵 =𝐵∩𝐴
ASOCIATIVA 𝐴 ∪ (𝐵 ∪ 𝐶) = (𝐴 ∪ 𝐵) ∪ 𝐶 𝐴 ∩ (𝐵 ∩ 𝐶) = (𝐴 ∩ 𝐵) ∩ 𝐶
IDEMPOTENTE 𝐴∪𝐴 =𝐴 𝐴∩𝐴=𝐴
SIMPLIFICACION 𝐴 ∪ (𝐵 ∩ 𝐴) = 𝐴 𝐴 ∩ (𝐵 ∪ 𝐴) = 𝐴
DISTRIBUTIVA 𝐴 ∪ (𝐵 ∩ 𝐶) = (𝐴 ∪ 𝐵) ∩ (𝐴 ∪ 𝐶) 𝐴 ∩ (𝐵 ∪ 𝐶) = (𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶)
ELEMENTO NEUTRO 𝐴∪Φ=𝐴 𝐴∩ 𝛀 = 𝛀
ABSORCION 𝐴∪𝛀=𝛀 𝐴∩ Φ = Φ
LEYES DE MORGAN ̅̅̅̅̅̅̅
𝐴 ∪ 𝐵 = 𝐴̅ ∩ 𝐵̅ ̅̅̅̅̅̅̅
𝐴 ∩ 𝐵 = 𝐴̅ ∪ 𝐵̅
PROPIEDADES 𝐴 ∩ 𝐵̅ = 𝐴 −( 𝐴 ∩ 𝐵) = 𝐴 − 𝐵
𝐴 ∩ 𝐴̅ = Φ
Ejemplo
1. Sea el espacio muestral Ω = {1,2,3,4,5,6,7} y Sean los sucesos 𝐴 = {1,3,5} y 𝐵 = {2,3,7},
determine los eventos:
a) 𝐴 ∪ 𝐵 b). 𝐴 ∩ 𝐵 c). 𝐴̅ ∩ 𝐵̅
Solución
𝐴 ∪ 𝐵 = {1,3,5} ∪ {2,3,7} = {1,2,3,5,7}
𝐴 ∩ 𝐵 = {1,3,5} ∩ {2,3,7} = {3}
𝐴̅ ∩ 𝐵̅ = ̅̅̅̅̅̅̅
𝐴 ∪ 𝐵 = {4, 6}
2. Un ingeniero eléctrico tiene en su mano dos cajas de resistores, cada una con cuatro de éstos. Los
resistores de la primera caja están etiquetados con 10 Ω (ohms), pero, de hecho, sus resistencias son
de 9, 10, 11 y 12 Ω. Los resistores de la segunda caja tienen la etiqueta de 20 Ω, pero sus resistencias
son de 18, 19, 20 y 21 Ω. El ingeniero elige un resistor de cada caja y determina la resistencia de cada
uno. Sea A el evento para el cual el primer resistor tiene una resistencia mayor a 10, sea B el evento
en el que el segundo resistor tiene una resistencia menor a 19 y sea C el evento en el cual la suma de
las resistencias es igual a 28. Determine un espacio muestral para este experimento y especifique los
subconjuntos que corresponden a los eventos A, B y C.
Solución
Un buen espacio muestral es el conjunto de pares ordenados en el que el primer elemento representa
la resistencia del primer resistor y el segundo elemento constituye la del segundo resistor. Se denotará
a este espacio muestral con Ω
Ω = {(9, 18), (9, 19), (9, 20), (9, 21), (10, 18), (10, 19), (10, 20), (10, 21), (11, 18), (11, 19), (11, 20), (11, 21), (12,
18), (12, 19), (12, 20), (12, 21)}
Los eventos A, B y C están dados por
A = {(11, 18), (11, 19), (11, 20), (11, 21), (12, 18), (12, 19), (12, 20), (12, 21)}
B = {(9, 18), (10, 18), (11, 18), (12, 18)} y C = {(9, 19), (10, 18)}
3. En base al ejemplo 2, determine 𝐵 ∪ 𝐶 y 𝐴 ∩ 𝐵̅
Solución
 El evento 𝐵 ∪ 𝐶 contiene todos los resultados que pertenecen a B o a C, o a ambos. Por tanto,
𝐵 ∪ 𝐶 = {(9, 18), (10, 18), (11, 18), (12, 18), (9, 19)}
 El evento 𝐴 ∩ 𝐵̅ contiene los resultados en el espacio muestral que no pertenecen a B. De ahí
que el evento 𝐴 ∩ 𝐵̅ contenga los resultados que pertenecen a 𝐴 y no pertenecen a 𝐵. Por
consiguiente,
 𝐴 ∩ 𝐵̅ = {(11, 19), (11, 20), (11, 21), (12, 19), (12, 20), (12, 21)}

35
4. Con referencia al ejemplo 2, si se realiza el experimento:
a) ¿es posible que los eventos A y B ocurran al mismo tiempo?
b) ¿Qué pasa con B y C? ¿A y C?
c) ¿Qué par de eventos es mutuamente excluyente?
Solución
a. Si el resultado es (11, 18) o (12, 18), entonces tanto el evento A como el B ocurren.
b. Si el resultado es (10, 18), entonces ocurren los eventos B y C.
c. Es imposible que ocurran al mismo tiempo A y C, ya que estos eventos son mutuamente
excluyentes al no tener ningún resultado en común.
d. Los eventos A y C ; B y C son mutuamente excluyentes, ya que no tienen elementos en común
5. En una reunión tenemos 20 personas, algunas de las cuales llevan gafas. Determinar por qué
resultados está formado el suceso "ser mujer y no llevar gafas” o “llevar gafas", y no ser hombre,.
Solución
Necesitamos definir, en primer lugar, cuáles son nuestros resultados posibles.
Por ejemplo, podemos suponer los eventos:
𝐻 = { 𝑠𝑒𝑟 ℎ𝑜𝑚𝑏𝑟𝑒} ; 𝑀 = { 𝑠𝑒𝑟 𝑚𝑢𝑗𝑒𝑟} ; 𝐺 = {𝑙𝑙𝑒𝑣𝑎𝑟 𝑔𝑎𝑓𝑎𝑠} y 𝑁𝐺 = {𝑛𝑜 𝑙𝑙𝑒𝑣𝑎𝑟 𝑔𝑎𝑓𝑎𝑠}
En este caso, nuestro espacio muestral está formado por:
Ω = {(𝐻; 𝐺); (𝐻, 𝑁𝐺); (𝑀, 𝐺); (𝑀, 𝑁𝐺), }
Sea el evento “ser mujer y no llevar gafas” 𝐴1 = {(𝑀, 𝑁𝐺)}
Sea el evento “llevar gafas” 𝐴2 = {((𝐻; 𝐺), (𝑀, 𝐺)}, que pueden ser hombres que llevan gafas o mujeres
que llevan gafas
Entonces, el suceso unión de "ser mujer y no llevar gafas" o "llevar gafas" está formado por,
𝐴1 ∪ 𝐴2 = {(𝑀, 𝑁𝐺) ; (𝐻; 𝐺); (𝑀, 𝐺)}
̅ = 𝑀 , es en otras palabras es “ser Mujer”, su complemento.
El evento no ser hombre es entonces: 𝐻

Ejercicios interactivos de tipos de suces os

1) Un o d e l o s su ce s o s el e m en ta l e s q u e s e ob t i en e al ex tra er tr e s b ol a s d e u n a u r n a con d o s
b ola s roja s y u n a n e gr a e s.. ..
a. Sac ar n e gra , ro ja, roja
b . Sac ar al m en o s u n a b o la b lan ca
c. Sac ar n e gra , ro ja, n e gra .
2) Un su c es o c o mp u e sto d e l an za r u n d ad o e s. ..
a. Sac ar u n 3
b . Sac ar u n n ú m ero men or q u e 3
c. Sac ar d o s 3
3) Un su c es o i mp o sib le d e lan za r u n d ad o e s q u e s alg a u n n ú m er o q u e ...
a. Se a m en or q u e 6
b . No se a p a r n i i mp a r
c. Se a may o r o ig u al a 6
4) E s u n su c e so s egu ro q u e al l an za r d o s d ad o s la s u ma d e la s p u n tu a cion e s ob te n id a s s ea …
a. m en o r q u e 1 2.
b . u n n ú me ro n atu r al.
c. u n n ú me ro p ar.
5) Al lan z ar u n d ad o s on su ce s o s c om p at ib l e s . ..
a. sa car p ar e i mp a r.
b . sa car m ú lt ip l o d e 2 y m ú ltip lo d e 3.

36
c. sa car m ú lt ip l o d e 3 y m ú ltip lo d e 5.
6) Son su c e so s i n co mp atib l e s q u e a l l an za r d o s d ad os la su ma d e la s p u n tu aci on e s se a…
a. p ar e i mp ar
b . p ar y mú ltip lo d e 2.
c. p ar y mú ltip lo d e 5.
7) Son su c e so s i n d e p en d i e n te s ...
a. lan za r d o s d ad o s.
b . la ext ra cc ión d e u n a s eg u n d a c art a ( s in r ep os i ci ón ) d e u n a b a raja .
c. el A DN d e u n h ij o y el d e su p ad r e.
8) E s u n s u c e so d ep en d i en te ...
a. la p u n t u ac ión ob t en id a al l an za r u n s e gu n d o d a d o.
b . el col or ob t en id o a l s ac ar u n a se gu n d a b ola ( si n rep o s ic ión ) d e u n a u r n a con 3 b ola s
roja s y 2 v er d e s .
c. el s e xo d e u n s e gu n d o h ijo.
a. Un su c es o y su con tra ri o s on : a ) Co mp atib l e s b ) In co mp at ib l e s y c)
N.A
2 Probabilidad

2.1 Enfoques para asignar probabilidades


Conviene analizar dos perspectivas para asignar probabilidades: los enfoques objetivo y subjetivo. La
probabilidad objetiva se subdivide en a) probabilidad clásica y b) probabilidad empírica.
2.2 Probabilidad clásica (Regla de Laplace)
La probabilidad clásica parte del supuesto de que los resultados de un experimento son igualmente
posibles. De acuerdo con el punto de vista clásico, la probabilidad de un evento que se está llevando a
cabo se calcula dividiendo el número de resultados favorables entre el número de posibles resultados:
número de resultados favorables
𝑃(𝐴) =
número de casos totales

Ejemplos 1
Hallar la probabilidad de que al lanzar dos monedas al aire salgan dos caras.
Solución
Casos posibles, es el espacio muestral es Ω ={𝐶𝐶, 𝐶𝑆, 𝑆𝐶, 𝑆𝑆}; tiene 6 elementos
Casos favorables: {𝐶𝐶} , en este caso el evento tiene un elemento. Entonces la
1
probabilidad que salga 2 caras es: 𝑃(𝐶𝐶) = 4

Ejemplos 2
Calcular la proba bilidad de que al echar un dado al aire, salga un número par.

Solución
Casos posibles: {1, 2, 3, 4, 5, 6}, Casos favorables: {2, 4, 6} L uego,
3
𝑃(𝑝𝑎𝑟) = 6 = 0.5

Ejemplos 3
En un salón de clases hay 8 estudiantes mujeres y 7 estudiantes varones. Si el profesor escoge al azar un
estudiante de su salón, ¿cuál es la probabilidad de que el estudiante escogido sea un varón?

37
Solución
Sea el evento “E” es escoger un estudiante al azar. En total hay 15 estudiantes, pero como se quiere
escoger un varón, entonces hay 7 casos favorables, Por lo tanto:
7
𝑃(𝐸) =
15

2.2 Probabilidad Empírica


Se llama probabilidad empírica, a aquella que se determina en forma experimental y calcula después que
haya ocurrido el experimento, La probabilidad de que un evento ocurra representa una fracción de los
eventos similares que sucedieron en el pasado.

número de veces que el evento ocurra


𝑃(𝐴) =
número total de observaciones
Ejemplos 2
El 1 de febrero de 2003 explotó el transbordador espacial Columbia. Éste fue el segundo desastre en 113
misiones espaciales de la NASA. Con base en esta información, ¿cuál es la probabilidad de que una futura
misión concluya con éxito?
Solución
Casos favorables del evento: número de veces que el vuelo se realice con éxito; en este
caso es 111.
Casos totales es, número de vuelos que se realiza, sea con éxito o fracaso, en este caso
es 113.
111
𝑃(é𝑥𝑖𝑡𝑜) = = 0.98
113

2.3 Axiomas de la probabilidad

1. La probabilidad es positiva y menor o igual que 1.


0 ≤ 𝑃(𝐴) ≤ 1
2. La probabilidad del suceso seguro es 1.
𝑃(𝛺) = 1
3. Si A y B son incompatibles, es decir 𝐴 ∩ 𝐵 ≠ ∅ entonces:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

2.4 Propiedades de la probabilidad


1. La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la probabilidad del
suceso contrario es:
𝑃(𝐴̅ ) = 1 − 𝑃(𝐴)
2. Probabilidad del suceso imposible es cero.
𝑃(∅) = 0
3. La probabilidad de la unión de dos sucesos es la suma de sus probabilidades restándole la
probabilidad de su intersección.
𝑃(𝐴 ∪ 𝐵 ) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵 )

38
4. Si un suceso está incluido en otro, su probabilidad es menor o igual a la de éste.
𝐴 ⊂ 𝐵 entonces 𝑃(𝐴) ≤ 𝑃(𝐵)
5. Si 𝐴1 , 𝐴2 , . . . , 𝐴𝐾 son incompatibles dos a dos (𝐴1 ∩ 𝐴2 ∩ … .∩ 𝐴𝐾 = ∅) entonces:
𝑃(𝐴1 ∪ 𝐴2 ∪ … . 𝐴𝑘 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + 𝑃(𝐴𝑘 )
6. Si el espacio Muestral “Ω” es finito y un suceso es {𝐴1 , 𝐴2 , … . 𝐴𝑘 } entonces:
𝑃( Ω) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + 𝑃(𝐴𝑘 )

Ejemplos 1
¿Cuál es la probabilidad de sacar par, al tirar un dado?
Solución
El espacio muestral es Ω = {1,2,3,4,5,6} y el evento que sale par es 𝐴 = {2,4,6}
1 1 1 3
𝑃(𝐴) = 𝑃(2 ∨ 4 ∨ 6) = 𝑃(2) + 𝑃(4) + 𝑃(6) = + + = = 0.5
6 6 6 6
Ejemplos 2
Los eventos 𝐴 y 𝐵 son mutuamente excluyentes. Suponga que 𝑃(𝐴) = 0.30 y 𝑃 (𝐵) = 0.20. ¿Cuál es
la probabilidad de que ocurran ya sea 𝐴 𝑜 𝐵? ¿Cuál es la probabilidad de que ni 𝐴 ni 𝐵 sucedan?
Soluci ón
Se pide: 𝑃(𝐴 ∪ 𝐵) y 𝑃(𝐴̅ ∩ 𝐵̅)
 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = 0.3 + 0.2 − 0 = 0.5
 𝑃(𝐴̅ ∩ 𝐵̅) = 𝑃(𝐴
̅̅̅̅̅̅̅
∪ 𝐵) = 1 − 𝑃(𝐴 ∪ 𝐵) = 1 − 0.5 = 0.5

Ejemplos 3
Un estudio de 200 empresas de publicidad reveló los siguientes ingresos después de impuestos:
Ingreso después de impuestos Número de empresas
Menos de $1millón 102
De $1 millón a $20 millones 61
$20 millones o más 37

a) ¿Cuál es la probabilidad de que una empresa de publicidad seleccionada al azar tenga un ingreso
después de impuestos menores a $1 millón?
b) ¿Cuál es la probabilidad de que una empresa de publicidad seleccionada al azar tenga un ingreso
después de impuestos entre $1 millón y $20 millones?
c) Un ingreso de $20 millones o más?
Soluci ón
Consideremos los siguientes eventos después de pagar el impuesto:
𝐴 = {𝑖𝑛𝑔𝑟𝑒𝑠𝑜 𝑚𝑒𝑛𝑜𝑠 𝑑𝑒 $1 𝑚𝑖𝑙𝑙𝑜𝑛 } , 𝐵 = {𝑖𝑛𝑔𝑟𝑒𝑠𝑜 𝑒𝑛𝑡𝑟𝑒 $1 𝑦 $20 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠}
𝐶 = {𝑖𝑛𝑔𝑟𝑒𝑠𝑜 𝑑𝑒 $20 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑜 𝑚á𝑠}
102
𝑃(𝐴) = = 0.51
200
31
𝑃(𝐵) = = 0.155
200
102
𝑃(𝐶) = = 0.185
200

39
Ejemplos 4
Una encuesta que llevó a cabo la American Automobile Association (AAA) reveló que el año pasado 60%
de sus miembros hicieron reservaciones en líneas aéreas. Dos de ellos fueron seleccionados al azar. ¿Cuál
es la probabilidad de que ambos hicieran reservaciones el año pasado?
Sol ución
La probabilidad de que el primero haya hecho una reservación el año pasado es de 0.60, que se expresa
por 𝑃(𝑅1 ) = 0.60, donde 𝑅1 representa que el primer miembro hizo una reservación.
La probabilidad de que el segundo miembro elegido haya hecho una reservación es también de 0.60, así
que 𝑃(𝑅2 ) = 0.60. Como el número de miembros de la AAA es muy grande, se supone que 𝑅1 y 𝑅2 son
independientes. En consecuencia, de acuerdo con la fórmula de eventos independientes, la probabilidad
de que ambos hayan hecho una reservación es:
𝑃(𝑅1 ∩ 𝑅2 ) = 𝑃(𝑅1 )𝑥𝑃(𝑅2 ) = 0.6𝑥0.6 = 0.36
Ejemplos 5
Una muestra de 2000 conductores con licencia revelo la siguiente cantidad de violaciones al límite de
velocidad.
Número de violaciones Número de conductores
0 1910
1 48
2 18
3 12
4 9
5 a más 5

a. ¿En qué consiste el experimento?


b. ¿Cuál es la probabilidad de que un conductor haya cometido dos violaciones al límite de
velocidad?
c. ¿Cuál es la probabilidad de que no haya cometido infracción alguna?
b. ¿Cuál es la probabilidad de que hayan cometido entre 1 y 4 violaciones inclusive?
Sol ución
a) El experimento consiste en medir el número de infracciones de los conductores
18
b) sea 𝐴 = {𝑐𝑜𝑛𝑑𝑢𝑐𝑡𝑜𝑟 𝑐𝑜𝑚𝑒𝑡𝑖𝑜 2 𝑣𝑖𝑜𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠} , entonces 𝑃(𝐴) = 2000 = 0.009
1910
c) sea 𝐵 = {𝑐𝑜𝑛𝑑𝑢𝑐𝑡𝑜𝑟 𝑛𝑜 𝑐𝑜𝑚𝑒𝑡𝑖𝑜 𝑣𝑖𝑜𝑙𝑎𝑐𝑖𝑜𝑛 𝑎𝑙𝑔𝑢𝑛𝑎} , entonces 𝑃(𝐵) = = 0.955
2000

d) Que hayan cometido entre 1 y 4 violaciones inclusive, estos eventos son mutuamente excluyentes
𝑃(1 ∪ 2 ∪ 3 ∪ 4) = 𝑃(1) + 𝑃(2) + 𝑃(3) + 𝑃(4)
48 18 12 9
𝑃(1 ∪ 2 ∪ 3 ∪ 4) = + + +
2000 2000 2000 2000
𝑃(1 ∪ 2 ∪ 3 ∪ 4) = 0.0435

Ejemplos 6
En un proceso que fabrica latas de aluminio, la probabilidad de que una lata tenga alguna fisura en su
costado es de 0.02, la de que otra la tenga en la tapa es de 0.03 y de que una más presente una fisura en
el costado y en la tapa es de 0.01. ¿Cuál es la probabilidad de que al elegir una lata en forma aleatoria
tenga una fisura? ¿Cuál es la probabilidad de que no la tenga?
Sol ución

40
 Probabilidad de que al elegir una lata en forma aleatoria tenga una fisura
Se tiene que
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜) = 0.02,
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎) = 0.03 y
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜 𝑦 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎) = 0.01.
Usando la fórmula
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜 𝑜 𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎)
= 𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜) + 𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎)
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜 𝑦 𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎) = 0.02 + 0.03 - 0.01
𝑃(𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑠𝑡𝑎𝑑𝑜 𝑦 𝑓𝑖𝑠𝑢𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑝𝑎) = 0.04
 Probabilidad de que no la tenga
Para determinar la probabilidad de que una lata no tenga ninguna fisura, se calcula
𝑃(𝑛𝑖𝑛𝑔𝑢𝑛𝑎 𝑓𝑖𝑠𝑢𝑟𝑎) = 1 – 𝑃(𝑓𝑖𝑠𝑢𝑟𝑎) = 1 – 0.04 = 0.96
Ejemplos 7
Un producto está compuesto de cuatro piezas. La probabilidad de que la primera sea defectuosa es 2 de
cada 1000, segunda sea defectuosa es 4 de cada 1000, tercera sea defectuosa es 7 de cada 1000 y
finalmente que la cuarta sea defectuosa es 1 de cada 1000.
a. Calcular la probabilidad que el producto tenga alguna pieza defectuosa.
b. Calcular la probabilidad de ninguno de los cuatro productos tengas piezas defectuosas.
c. Calcular la probabilidad de que el primer y el tercer el producto tengan piezas defectuosas.
Sol ución
Consideremos los eventos:
2
𝐴1 = {𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑝𝑖𝑒𝑧𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎} Entonces 𝑃(𝐴1 ) = 1000 = 0.002
4
𝐴2 = {𝑙𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑎 𝑝𝑖𝑒𝑧𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎} Entonces 𝑃(𝐴1 ) = 1000 = 0.004
72
𝐴3 = {𝑙𝑎 𝑡𝑒𝑟𝑐𝑒𝑟𝑎 𝑝𝑖𝑒𝑧𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎} Entonces 𝑃(𝐴1 ) = 1000 = 0.007
1
𝐴4 = {𝑙𝑎 𝑐𝑢𝑎𝑟𝑡𝑎 𝑝𝑖𝑒𝑧𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎} Entonces 𝑃(𝐴1 ) = 1000 = 0.001
a. La probabilidad de que el producto tenga alguna pieza defectuosa es la probabilidad de la unión de los
cuatro eventos. Dichos eventos son incompatibles, por lo tanto.
𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ 𝐴4 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + 𝑃(𝐴3 ) + 𝑃(4) = 0.002 + 0.004 + 0.007 + 0.001 = 0.014
b. Sea 𝐴̅ evento que ninguno de los cuatro productos tienen piezas defectuosas, entonces
𝑃(𝐴) = 1 − 𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ 𝐴4 ) = 1 − 0.014 = 0.986
c. la probabilidad de que el primer y el tercer el producto tengan piezas defectuosas es:
𝑃(𝐴1 ∪ 𝐴3 ) = 𝑃(𝐴1 ) + 𝑃(𝐴3 ) = 0.001 + 0.007 = 0.008

Ejercicios interactivos de propiedades de la probabilidad

1. Son sucesos equiprobables....


a) obtener múltiplo de 2 o de 3 al tirar un dado .
b) obtener rojo o verde al extraer una bola de una urna con tres bolas rojas, dos
verdes y una negra.
c) obtener par o impar al lanzar un dado.

41
2. La probabilidad de un suceso más la de su contrario es ...
a) 1 b) 0 c) Depende del suceso en cuestión.
3. La probabilidad del suceso seguro es ...
a) menor que 1. b) igual a 1 . c) mayor que 1.
4. La probabilidad de obtener dos caras al lanzar una moneda ...
a) está comprendida entre 0 y 1 b) 0 c)1
5. ¿Cuál de estas probabilidades es mayor que 1?
a) Que al lanzar un dado salga múltiplo de 1 o de 2 o de 3 o de 4 o de 5 o de 6.
b) Que un hijo tenga madre c) Ninguna pro babilidad es mayor que 1.
6. Una probabilidad puede ser negativa ...
a) cuando un suceso es totalmente imposible c) Nunca.
b) Depende de las circunstancias.
7. Si la probabilidad de que salga cara en un moneda trucada es de 0.57 entonces la
probabilidad de que salga cruz es de ...
a) 0.5 b) 0.43 c) con tan pocos datos no se puede determinar.
8. Un amigo me dijo que lanzó una moneda 10 000 veces y obtuvo 9 990 caras. Esto
es ...
a) imposible b) normal c) improbable .
9. Hemos lanzado una moneda 48 veces, lo más probable es que en el próximo
lanzamiento salga ...
a) Cara b) Sello c) No es más probable ni una opción ni la otra.
10. Si la probabilidad de que en Perú nazca una niña es de 0 .52 entonces la
probabilidad de que nazca niño es de ...
a) 0.48 b)0.50 c) Depende del caso.

Probabilidad condicionada

La probabilidad de que ocurra un suceso A si ha ocurrido el suceso B se denomina Probabilidad


condicionada y se define
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴/𝐵) = ; 𝑃(𝐵) ≠ 0
𝑃(𝐵)
Ejemplo 1
Si A y B son dos sucesos tales que:

P[A]  0,4 P[B / A]  0,25 P[B']  0,75

Calcula P[A  B] y P[A  B].


Solución
𝑃(𝐵′ ) = 1 − 𝑃(𝐵) ⟹ 𝑃(𝐵) = 1 − 𝑃(𝐵′ ) = 1 − 0.75 = 0.25 ⟺ 𝑃(𝐵) = 0.25
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

Ejemplo 2
Sabiendo que: P[A]  0,5 P[B']  0,6 P[A'  B']  0,25
Calcula P[A  B] y P[A / B].

42
Ejemplo 3

Teniendo en cuenta que A y B son dos sucesos tales que:

P[A']  0,5 P[A  B]  0,12 P[A  B]  0,82

a ¿Son independientes A y B?

b Calcula P[B' / A].

Ejemplo 4
De dos sucesos A y B sabemos que:

P[A']  0,48 P[A  B]  0,82 P[B]  0,42

a ¿Son A y B independientes?

b ¿Cuánto vale P[A / B]?

Ejemplo 5
Se sabe que el 50% de los egresados de Contabilidad trabajan y que el 10% trabaja y estudia Posgrado.
¿Cuál es la probabilidad de que un egresado de Contabilidad que trabaja estudia Posgrado?
Solución
Sean los eventos:
𝐴 = {egresados que estudian Posgrado} ; 𝐵 = {egresados que trabajan} y
𝐴 ∩ 𝐵 = {𝑒𝑔𝑟𝑒𝑠𝑎𝑑𝑜𝑠 𝑞𝑢𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛 𝑦 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛 𝑃𝑜𝑠𝑔𝑟𝑎𝑑𝑜 }
𝑃(𝐴 ∩ 𝐵) 0.10
𝑃(𝐴/𝐵) = = = 0.20
𝑃(𝐵) 0.50
Regla de Multiplicación
𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) = 𝑃(𝐴1 )𝑃(𝐴2 /𝐴1 )𝑃(𝐴3 /(𝐴1 ∩ 𝐴2 )
Llamado principio de las probabilidades compuestas y especialmente útil para aquellas situaciones en que
las probabilidades condicionadas son más fáciles de obtener que las probabilidades de las intersecciones.
Ejemplo 2:
Se sabe por estudios previos que el 0,1% de la población tiene problemas vasculares. Un estudio sobre
individuos con problemas vasculares revela que el 20% de ellos son placas de ateroma. Si el 10% de los
individuos con placas de ateroma están expuestos a muerte súbita por desprendimiento de trombos.
¿Qué probabilidad tiene un individuo cualquiera de estar expuesto a muerte súbita por desprendimiento
de trombos de una placa de ateroma?
Solución
Consideremos los eventos:

43
A1 = {problemas vasculares} ; A2 = {placas de ateroma}
A3 = {expuesto a muerte súbita por desprendimiento de trombos}
𝑃(𝐴1 ) = 0,001 ; 𝑃(𝐴2 |𝐴1 ) = 0,20; 𝑃(𝐴3 |𝐴1 ∩ 𝐴2 ) = 0,1
𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) = 0,001 𝑥 0,20 𝑥 0,1 = 0,000002
Ejemplo 3
Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen al azar 3 bolas.
Calcular la probabilidad de que la primera sea azul, y las otras dos verdes.
Solución
Definimos:
A1 = {la 1ª bola es azul}; A2 = {la 2ª bola es verde}; A3 = {la 3ª bola es verde}
Aplicando la definición de probabilidad, puesto que hay 10 bolas y 2 son verdes: 𝑃(𝐴1 ) = 2/10
Si la primera bola extraída es azul, en la urna quedan 9 bolas, 5 de ellas verdes: 𝑃(𝐴2 /𝐴1 ) = 5/9
Si la primera bola extraída es azul y la segunda verde, en la urna queda 8 bolas; la probabilidad de que
salga la bola verde, dado que ya salieron un azul y un verde es: 𝑃(𝐴3 /𝐴1 ∩ 𝐴2 ) = 4/8
2 5 4 1
𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) = 𝑃(𝐴1 )𝑥𝑃(𝐴2 )𝑥𝑃(𝐴3 ) = 𝑥 𝑥 = = 0.05
10 9 8 18
Ejemplo 4
Un Taller sabe que por término medio acuden: por la mañana tres automóviles con problemas Eléctricos,
ocho con problemas de Mecánicos y tres con problemas chapa, y por la tarde dos automóviles con
problemas Eléctricos, tres con problemas de Mecánicos y uno con problemas chapa.
Mediante la tabla de doble entrada, calcule:
a. Porcentaje de automóviles que acuden por la tarde
b. Porcentaje de automóviles que acuden con problemas Mecánicos
c. Calcule la probabilidad de que un automóvil con problemas eléctricos, acuda por la mañana
Solución

M: Mañana T: Tarde
Me: Problemas mecánicos 8 3 11
E: Problemas Eléctricos 3 2 5
CH: Problemas de chapa 3 1 4
14 6 20
6
a. 𝑃(𝑇) = = 0.3
20
11
𝑏. 𝑃(𝑀𝑒) = = 0.55
20
𝑃(𝑀 ∩ 𝐸) 3/20
𝑐. 𝑃(𝑀/𝐸) = = = 0.6
𝑃(𝐸) 5/20

Sucesos independientes
Dos sucesos son independientes si y sólo si
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵)
Si dos sucesos son independientes
𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴)𝑥𝑃(𝐵)
𝑃(𝐴/𝐵) = = = 𝑃(𝐴)
𝑃(𝐵) 𝑃(𝐵)
Del mismo modo
𝑃(𝐵 ∩ 𝐴) 𝑃(𝐵)𝑥𝑃(𝐴)
𝑃(𝐵/𝐴) = = = 𝑃(𝐵)
𝑃(𝐴) 𝑃(𝐴)

44
Esta propiedad coincide más con la idea intuitiva de independencia y algunos textos la dan como
definición. Hay que notar, sin embargo, que ambas definiciones no son estrictamente equivalentes.

Regla de la probabilidad total


Se llama partición a un conjunto de sucesos 𝐴𝑖 tales que
𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ . . .∪ 𝐴𝑛 = Ω 𝑑𝑜𝑛𝑑𝑒 𝐴𝑖 ∩ 𝐴𝑗 = Φ , 𝑖 ≠ 𝑗
Es decir un conjunto de sucesos mutuamente excluyentes y que cubren todo el espacio muestral.

Si un conjunto de sucesos 𝐴𝑖 forman una partición del espacio muestral y para cualquier otro suceso B se
cumple:
𝑃(𝐵) = 𝑃(𝐴1 )𝑃(𝐵/𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵/𝐴2 ) + 𝑃(𝐴3 )𝑃(𝐵/𝐴3 ) +…………….+ 𝑃(𝐴𝑛 )𝑃(𝐵/𝐴𝑛 )

Ejemplo 1
La prevalencia de infarto cardíaco para hipertensos es del 0,3% y para no hipertensos del 0,1%. Si la
prevalencia de hipertensión en una cierta población es del 25% ¿Cuál es la prevalencia del infarto en esa
población?
Solución
Consideremos los eventos:
A1 = {ser hipertenso} A2 = {no serlo} estos sucesos constituyen una partición; B = {padecer infarto}
Datos:
Probabilidad de padecer infarto dado que es hipertenso: P (B|A1) = 0,003
Probabilidad de padecer infarto dado que no es hipertenso: P (B|A2) = 0,001
Probabilidad de tener hipertensión: P (A1) = 0,25; entonces
la probabilidad de no tener hipertensión es P (A2) = 0,75
Por la propiedad
𝑃(𝐵) = 𝑃(𝐴1 )𝑃(𝐵/𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵/𝐴2 )
P (B) = 0, 25 x 0.003+ 0,75 x 0,001 = 0,0015

Teorema de Bayes
Si los sucesos 𝐴𝑖 son una partición y B un suceso tal que 𝑃(𝐵) ≠ 0, entonces

𝑃(𝐵/𝐴𝑖 )𝑃(𝐴𝑖 )
𝑃(𝐴𝑖 /𝐵) =
𝑃(𝐴1 )𝑃(𝐵/𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵/𝐴2 ) + 𝑃(𝐴3 )𝑃(𝐵/𝐴3 ) + ⋯ . + 𝑃(𝐴𝑛 )𝑃(𝐵/𝐴𝑛 )

𝑃(𝐵/𝐴𝑖 )𝑃(𝐴𝑖 )
𝑃(𝐴𝑖 /𝐵) =
𝑃(𝐵)

45
Ejemplo 1
Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-positivo de 0,05 y falso-negativo
de 0,10. Una mujer con una probabilidad pre-prueba de padecer la enfermedad de 0,15 tiene un resultado
negativo con la misma. Calcular la probabilidad de que no esté enferma.
Solución
Sean los eventos:
NE = {la mujer no está enferma}, + = {el resultado de la prueba es positivo} y
- = {el resultado de la prueba es negativo}. La pregunta pide P(NE|-).
Los datos que se dan son
𝑃(+|𝑁𝐸) = 0,05 ; 𝑃(−|𝐸) = 0,10 y 𝑃(𝐸) = 0,15.
Del primero se deduce que 𝑃(−|𝑁𝐸) = 0,95 y del último 𝑃(𝑁𝐸) = 0,85
Por lo tanto aplicando el teorema de Bayes

𝑃(−/𝑁𝐸)𝑥𝑃(𝑁𝐸)
𝑃(𝑁𝐸/−) =
𝑃(−/𝑁𝐸)𝑥𝑃(𝑁𝐸) + 𝑃(−/𝐸)𝑥𝑃(𝐸)

0.95𝑥0.85
𝑃(𝑁𝐸/−) =
0.95𝑥0.85 + 0.10𝑥0.15

𝑃(𝑁𝐸/−) = 0.982

Ejemplo 2
En un pueblo hay 100 jóvenes; 40 de los chicos y 35 de las chicas juegan al tenis. El total de chicas en el
pueblo es de 45. Si se elige un joven de esa localidad al azar:
a) ¿Cuál es la probabilidad de que sea chico?
b) Si se sabe que juega al tenis, ¿cuál es la probabilidad de que sea chica?
c) ¿Cuál es la probabilidad de que sea un chico que no juegue al tenis?
Solución
Se debe hacer una tabla de doble entrada, completando los datos que faltan:
Chicos Chicas
Juegan al Tenis 40 35 75
No Juegan al Tenis 15 10 25
55 45 100
y es así como se obtienen los siguientes resultados:
55
𝑃(𝑐ℎ𝑖𝑐𝑜) = = 0.55
100
35
𝑃(𝑐ℎ𝑖𝑐𝑎/𝑡𝑒𝑛𝑖𝑠) = = 0.47
75
15
𝑃(𝑐ℎ𝑖𝑐𝑎 ∩ 𝑁𝑜 𝑡𝑒𝑛𝑖𝑠) = = 0.15
100

Ejemplo 3

En un viaje organizado por Europa para 120 personas, 48 de los que van saben hablar inglés, 36 saben
hablar francés, y 12 de ellos hablan los dos idiomas. Se escoge a uno de los viajeros al azar.
a) ¿Cuál es la probabilidad de que hable alguno de los dos idiomas?
b) ¿Cuál es la probabilidad de que hable francés, sabiendo que habla inglés?

46
c) ¿Cuál es la probabilidad de que solo hable francés?
Solución
De igual manera se debe hacer una tabla de doble entrada, completando los datos que faltan:

Hablan Francés (𝐹) No hablan Francés (𝐹̅ )


Hablan Inglés (I) 12 36 48
No hablan Inglés (𝐼 )̅ 24 48 72
36 84 120
Consideremos los eventos:
𝐼 = {𝑠𝑎𝑏𝑒𝑛 ℎ𝑎𝑏𝑙𝑎𝑟 𝑖𝑛𝑔𝑙𝑒𝑠} , 𝐵 = {𝑠𝑎𝑏𝑒𝑛 ℎ𝑎𝑏𝑙𝑎𝑟 𝐹𝑟𝑎𝑛𝑐𝑒𝑠} y 𝐼 ̅ = {𝑛𝑜 𝑠𝑎𝑏𝑒𝑛 ℎ𝑎𝑏𝑙𝑎𝑟 𝐼𝑛𝑔𝑙𝑒𝑠}
a) Tenemos que hallar 𝑃(𝐼 ∪ 𝐹)
𝑃(𝐼 ∪ 𝐹) = 𝑃(𝐼) + 𝑃(𝐹) − 𝑃(𝐼 ∩ 𝐹)
48 + 36 − 12 72
𝑃(𝐼 ∪ 𝐹) = = = 0.6
120 120
b) Tenemos que hallar 𝑃(𝐹/𝐼)
𝑃(𝐹 ∩ 𝐼) 12
𝑃(𝐹/ 𝐼 ) = = = 0.25
𝑃(𝐼) 48
c) Tenemos que hallar 𝑃(𝐹 ∩ ̅𝐼 )
24
𝑃(𝐹 ∩ ̅𝐼 ) = = 0.2
120

Ejemplo 4
Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se realizan
correcciones faciales, un 35% implantes mamarios y el restante en otras cirugías correctivas. Se sabe
además, que son de género masculino el 25% de los que se realizan correcciones faciales, 15% implantes
mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al azar, determine:
a) Determine la probabilidad de que sea de género masculino
b) Si resulta que es de género masculino, determine la probabilidad que se haya realizado una cirugía
de implantes mamarios.
Solución
Se definen los sucesos:
F: pacientes que se realizan cirugías faciales
M: pacientes que se realizan implantes mamarios
O: pacientes que se realizan otras cirugías correctivas
H: pacientes de género masculino
m: pacientes de género femenino
Haciendo el diagrama del árbol

47
0.25 H
F
0.75 M
0
0.2
0.15 H
0.35 M
0.85 M

0 .4 5 0.40 H
O
0.60 M

La probabilidad de que sea de género masculino se refiere a un problema de probabilidad total, ya que es
el suceso condicionado y las cirugías los condicionantes. Dicho valor será:
𝑃(𝐻) = 𝑃(𝐹)𝑥𝑃(𝐻/𝐹) + 𝑃(𝑀)𝑥𝑃(𝐻/𝑀) + 𝑃(𝑂)𝑥𝑃(𝐻/𝑂)
𝑃(𝐻) = 0.20𝑥0.25 + 0.35𝑥0.15 + 0.45𝑥0.40 ⟹ 𝑃(𝐻) = 0.28
Como el suceso condicionado ha ocurrido entonces se aplica el teorema de Bayes, luego, el valor de la
probabilidad será
𝑃(𝑀)𝑥𝑃(𝐻/𝑀)
𝑃(𝑀/𝐻) =
𝑃(𝐹)𝑥𝑃(𝐻/𝐹) + 𝑃(𝑀)𝑥𝑃(𝐻/𝑀) + 𝑃(𝑂)𝑥𝑃(𝐻/𝑂)

035𝑥0.15
𝑃(𝑀/𝐻) = ⟹ 𝑃(𝑀/𝐻) = 0.19
0.20𝑥0.25 + 0.35𝑥0.15 + 0.45𝑥0.40
Ejemplo 5
Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso que le da a cada
equipo es de 25% al primero, 35% el segundo en y 40% el tercero. Se sabe que los aparatos tienen
probabilidades de error de 1%, 2% y 3% respectivamente. Un paciente busca el resultado de una ecografía
y observa que tiene un error. Determine la probabilidad de que se ha usado el primer aparato.

Solución:
Se definen los sucesos:
A1 : seleccionar el primer aparato
A2 : seleccionar el segundo aparato
A3 : seleccionar el tercer aparato
E: seleccionar un resultado con error
Se puede observar que la pregunta es sobre determinar la probabilidad de que un examen errado sea del
primer aparato, es decir, ya ha ocurrido el error. Por lo tanto, debemos recurrir al teorema de Bayes.
Primero hallemos la probabilidad de que los aparatos tengan error.
𝑃(𝐸) = 𝑃(A1 )𝑥𝑃(𝐸/A1 ) + 𝑃(A2 )𝑥𝑃(𝐸/A2 ) + 𝑃(A3 )𝑥𝑃(𝐸/A3 )
𝑃(𝐸) = 0.25𝑥0.01 + 0.35𝑥0.02 + 0.40𝑥0.03
𝑃(𝐸) = 0.0215
Ahora, la probabilidad de que el error haya sido por la maquina A1
𝑃(A1 )𝑥𝑃(𝐸/A1 )
𝑃(A1 /𝐸) =
𝑃(𝐸)
0.25𝑥0.01
𝑃(A1 /𝐸) =
0.0215
𝑃(A1 /𝐸) = 0.116 o 11.6%

Distribución Binomial
Una distribución Binomial o de Bernoulli tiene las siguientes características:
1. En cada prueba del experimento, solo son posibles 2 resultados: éxito o fracaso

48
2. La probabilidad de éxito es constante, es decir, que no varía de una prueba a otra. se
representa por 𝑝
3. La probabilidad de fracaso también es constante, se representa por 𝑞 = 1 − 𝑝
4. El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
5. La variable aleatoria Binomial, X expresa el número de éxitos obtenidos en las 𝑛 pruebas. por
tanto los valores que puede tomar X son: 0, 1, 2,3,…., n.
La distribución Binomial se expresa por B(n, p) y su probabilidad se calcula mediante la fórmula
𝑛
𝑃(𝑋 = 𝑘) = ( ) 𝑝𝑘 𝑞𝑛−𝑘
𝑘
La media 𝜇 = 𝑛𝑝
La varianza 𝑆𝑥 = 𝑛𝑝𝑞
Ejemplo 1
La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores ya
han leído. Un grupo de 4 amigos son aficionados a la lectura.
a) ¿cuál es la probabilidad de que en el grupo hayan leído la novela 2 personas?
b) ¿y como máximo 2?
Solución
𝑛=4 ; 𝑝 = 0.8 → 𝑞 = 0.2
4𝑥3
a) 𝑃(𝑋 = 2) = (42)(0.8)2 (0.2)4−2 = 2
(0.64)(0.04) = 0.1536

b) 𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)


4 4 4
𝑃(𝑋 ≤ 2) = ( ) (0.8)0 (0.2)4−0 + ( ) (0.8)1 (0.2)4−1 + ( ) (0.8)2 (0.2)4−2
0 1 2
4𝑥3𝑥2𝑥1 4𝑥3𝑥2𝑥1 4𝑥3𝑥2𝑥1
𝑃(𝑋 ≤ 2) = (0.8)0 (0.2)4 + (0.8)1 (0.2)4−1 + (0.8)2 (0.2)4−2
4𝑥3𝑥2𝑥1 3𝑥2𝑥1 2𝑥1𝑥3𝑥2𝑥1
𝑃(𝑋 ≤ 2) = 0.0016 + 4(0.08)(0.008) + 3(0.64)(0.04)
(𝑋 ≤ 2) = 0.1808

Ejemplo 3
La pr o babi l i dad de qu e u n a rtí cu l o p r o du ci do p o r u n a fá b r i ca s e a d e f ec tu os o
e s 0 .0 2. S e en vi ó u n ca r gam en t o d e 10 .0 00 a rtí cu l os a u n o s al mac en e s . Hal l ar
el nú m e r o e sp e rad o de a rtí cu l o s d e f e ctu o s os , l a va ri an z a y l a d e svi a ci ón tí pi ca .

Solución
𝑛 = 10000 ; 𝑝 = 0.02 → 𝑞 = 0.98
La media 𝜇 = 𝑛𝑝 = 10000(0.02) = 200
La varianza 𝑆𝑥 = 𝑛𝑝𝑞 = 10000(0.02)(0.98) = 196

Ejemplo 3 (tarea)
En pruebas realizadas a un amortiguador, para automóvil se encontró que el 20% presentan
fuga de aceite. si se instalan 20 de estos amortiguadores, halle la probabilidad de que:

a) 4 salgan defectuosos

49
b) más de 5 tengan fuga de aceite
c) de 3 a 6 amortiguadores salgan defectuosos
d) determine el promedio y la desviación de amortiguadores con defectos.

Distribución normal
Una Variable aleatoria continua X sigue una distribución Normal de madia μ y desviación típica σ, y
se designa por N(μ, σ), si se cumplen las siguientes condiciones :
1. La variable puede tomar cualquier valor: (-∞, +∞)
2. La función de densidad, es la expresión en términos de ecuación matemática de
la curva de Gauss:

1 −1 𝑥−𝜇 2
( )
𝑓(𝑥) = 𝑒 2 𝜎
𝜎√2𝜋

 El campo de exi stenci a es cualquier valor real, es decir, ( -∞, +∞).


 Es simétrica respecto a la media µ.
 Tiene un máximo en l a media µ.
 Crece hasta la media µ y decrece a partir de ella.
 En los puntos µ − σ y µ + σ presenta puntos de inflexión.
 El eje de abscisas es una asíntota de la curva.
 El área del recinto determinado por la función y el eje de abscisas es igual a la
unidad.
 Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a 0.5 a
la izquierda y otra igual a 0.5 a la derecha .

La probabilidad equivale al área encerrada bajo la curva.


 𝑃(𝜇 − 𝜎 < 𝑋 ≤ 𝜇 + 𝜎) = 0.6826 = 68.26%
 𝑝(𝜇 − 2𝜎 < 𝑋 ≤ 𝜇 + 2𝜎) = 0.954 = 95.4 %
 𝑝(𝜇 − 3𝜎 < 𝑋 ≤ 𝜇 + 3𝜎) = 0.997 = 99.7%

50
Distribución normal estándar, o tipificada o reducida

Es aquella que tiene por media el valor cero , μ = 0 , y por desviación típica la unidad, σ
=1 y se denota por N ( 0, 1)

Su función de densidad es:


1 𝑥2
𝑓(𝑥) = 𝑒− 2
𝜎√2𝜋

La probabilidad de la variable X dependerá del área del recinto sombreado en la figura . Y


para calcularla utilizaremos una tabla.
Tipificación de la variable
Para poder utilizar la tabla tenemos que transformar la variable X que sigue una
distribución N(μ, σ) en otra variable Z que siga una distribución N(0, 1).

𝑥−𝜇
𝑍=
𝜎

Tabla de la curva normal (0, 1)


La tabla nos da las probabilidades de 𝑃 (𝑧 ≤ 𝑘), siendo 𝑧 la variable tipificada.
Estas probabilidades nos dan la función de distribución 𝛷(𝑘).

𝛷(𝑘) = 𝑃(𝑧 ≤ 𝑘)

Búsqueda en la tabla de valor de k

Unidades y décimas en la columna de la izquierda y Centésimas en la fila de arriba.

1. P (Z ≤ a)

P(Z ≤ 1.47) = 0.9292

2. P(−b < Z ≤ −a ) = P(a < Z ≤ b )

P(−1.47<Z≤−0.45) = P( 0.45 <Z ≤ 1.47)


=P(Z ≤ 1.47)−P(Z ≤ 0.45) = 0.9292 − 0.6736 = 0.2556

3. P(−a<Z≤b ) = P(Z≤ b) − [ 1 − P(Z ≤ a)]

51
P(-1.47 < Z ≤ 0.45) = P(Z ≤ 0.45) − [ 1 − P(Z ≤ 1.47)]
= 0.6736 − (1 − 0.9292) = 0.6028

p = K
Nos encontramos con el caso i nverso a los anteriores, conocemos el valor de la
probabilidad y se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la
tabla el valor que más se aproxime a K .
p = 0.75Z ≤ 0.68
Para calcul ar l a vari able X nos vamos a la fórmula de la tipificación.
(X - μ)/σ = 0.68X = μ + 0.68 σ

Ejemplo
Dada una distribución normal estándar con µ = 30 y σ = 6, encuentre:
a) P (Z<k)= 0.0427
Φ (k) = 0.0427 entonces k = -1.72
b) P (Z>k)= 0.2946
Φ (k) = 1- 0.2946 = 0.7054
Luego k =0.54
c) P (-0.93<Z<k)= 0.7235
Φ (k) = 0.7235 + Φ(-0.93 ) = 0.8997
Luego k = 1.28
Ejemplo
Dada la variable X normalmente distribuida con media 18 y desviación estándar 2.5, encuentre:
a) P(X<15)= ¿?
b) El valor de k tal que P(X < k)= 0.2236
c) El valor de k tal que P(X > k)= 0.1814
d) P(17<X<21)
Solución
𝑋−𝜇 15 − 𝜋
𝑃(𝑋 < 15) = 𝑃 ( < )
𝜎 𝜎
15 − 18
𝑃(𝑋 < 15) = 𝑃 (𝑍 < )
2.5
𝑃(𝑋 < 15) = 𝑃(𝑍 < −1.20)
𝑃(𝑋 < 15) = 0.1151
b) El valor de 𝑘 tal que 𝑃(𝑋 < 𝑘) = 0.2236
𝛷( 𝑍 ) = 0.2236 ⟹ 𝑍 = −0.76
𝑘 = 𝑍𝜎 + µ = (−0.76)(2.5) + 18
𝑘 = 16.10

c) El valor de 𝑘 tal que 𝑃(𝑋 > 𝑘) = 0.1814


1 − 𝛷( 𝑍 ) = 0.1814 ⟹ 𝛷( 𝑍 ) = 0.8186 𝑍 = 0.91
k = Zσ + µ = (0.91)(2.5) + 18 = 20.28

52
d) P(17<X<21)
P(17 < X < 21) = Φ[(21 – 18)/2.5 ] - Φ[(17 – 18)/2.5 ]
= Φ[1.20 ] - Φ[-0.40 ] = 0.8849 – 0.3446 =0.5404

53

Vous aimerez peut-être aussi