Estadística Nº2 - Distribución de Frecuencias, Probabilidades y Distribución de Probabilidad

Distribución de Frecuencias
Una distribución de frecuencias es una tabla en la que un

conjunto de datos, se divide en un número adecuado de clases
(categorías), se presenta también el número de unidades
pertenecientes a cada clase.
Distribución de frecuencias según variable discreta
Para obtener una tabla de distribución de frecuencias cuando la variable

es discreta se procede de la siguiente manera:
a) Se identifica la variable en estudio
b) Se ordenan los datos en forma ascendente o descendente
c) Se calculan los elementos de la tabla o distribución de frecuencias.
Ejemplo
Los siguientes datos corresponden al número
de errores ortográficos registrados en 30
jóvenes, durante un control :
2 0 4 4 1 4 0 3 2 0 0 1 11 0 1 2 4
3 11152 2 5 4 0 40
Obtenga una tabla de distribución de

frecuencias
Xi fi Fi hi Hi
0 7 7 23,3 23,3
1 8 15 26,7 50,0
2 5 20 16,7 66,7
3 2 22 6,7 73,3
4 6 28 20,0 93,3
5 2 30 6,7 100,0
------- -------
Total 30 100,0
Donde:
Xi : Observación
fi : Frecuencia simple
Fi : Frecuencia acumulada
hi : Frecuencia relativa
Hi : Frecuencia relativa acumulada
Distribución de frecuencias según variable
continua
Para obtener una tabla de distribución de

frecuencias cuando la variable es continua
se procede de la siguiente manera:
a) Se identifica la variable en estudio

b) Determinar el número de clases o
intervalos (m)
m = 1+3.32 log n
Se recomienda que
c)Determinar la amplitud o recorrido
A = V. Máximo - V. mínimo
d) Determinar el ancho o longitud del intervalo
de clase
A
c 
m
e)Determinar los límites o intervalos de clase
[ Li-1 , Li > ó < Li-1 , Li ]
f) Determinar las marcas de clase
g)Calcular las frecuencias absolutas simples,

relativas, acumuladas, etc.
Las siguientes son medidas de la resistencia a
rompimiento (en onzas) de una muestra de 40
hilos de lino.
32,5 15,2 35,4 21,3 28,4 21,2 28,3 27,1

25,0 32,7 27,3 33,7 29,4 21,9 29,3 20,6
29,5 21,8 37,5 33,5 25,4 34,1 27,5 29,6
22,2 26,9 24,6 28,9 24,8 28,1 26,9 29,5
17,3 29,6 22,7 34,6 30,2 29,0 26,8 31,3
Construya una tabla de distribución de

frecuencias.
a) X: Resistencia en onzas en hilos de
lino....
b) m=1+3,32log(40) aprox. m=6
c) A = V. Max – V.Min
A = 37,5 – 15,2
A = 22,3
d) =3,72
Redondeado por exceso  c = 3,8
Luego la Tabla de Distribución de

frecuencias es:
Límite xi fi Fi hi Hi
[ >
15,2 - 19,0 17,1 2 2 2/40 2/40
19,0 - 22,8 20,9 7 9 7/40 9/40
22,8 - 26,6 24,7 4 13 4/40 13/40
26,6 - 30,4 28,5 18 31 18/40 31/40
30,4 - 34,2 32,3 6 37 6/40 37/40
34,2 - 38,0 36,1 3 40 3/40 1
MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN
I.Para datos sin agrupar.- Dado un conjunto de n medidas u

observaciones x1,x2,....xn , podemos describir el centro,
medio o lugar central de diferentes formas:
a)Media Aritmética (x ) .- Si tenemos un conjunto de n

mediciones x1,x2,....xn, la media aritmética es el promedio de
las mediciones:
n
x i
x  i 1
n
Ejemplo
Las siguientes 11 observaciones corresponden al contenido de
sólidos en el agua en partes por millón (ppm):
4520 4570 4520 4490 4570 4500 4520 4520
4521 4540 4500 4590
La media aritmética para estas 11 observaciones es:
Aprox. 4531 ppm
b) Mediana.- Si tenemos un conjunto de n mediciones
x1,x2,....xn, la mediana es aquel valor que no es superado
ni supera a más de la mitad de las n observaciones
dispuestas según su magnitud ya sea creciente o
decreciente
Del ejemplo anterior:
4490 4500 4500 4520 4520 4520 4520 4540 4570

4570 4590
Tenemos que la mediana es: 4520 ppm

c) Moda.- Es el valor que con más frecuencia
se presenta en un conjunto de observaciones.
Del ejemplo anterior tenemos que la moda es:
Mo=4520 ppm
PROPIEDADES DE LA MEDIA ARITMÉTICA
b) MEDIANA (Me).- Para calcular la mediana en una tabla
de una distribución de frecuencias, consideramos la
siguiente fórmula:
(n / 2 - Fi-1 )
Me = Li + C
f me
Donde:
Li: Límite inferior de la clase que contiene a la mediana

n: Número total de observaciones
Fi-1: Frecuencia absoluta acumulada de la clase anterior
a la que contiene a la mediana (clase mediana *)
Fme: Frecuencia absoluta de la clase que contiene a la
mediana
C: Amplitud de la clase que contiene a la mediana.
* Es la primera clase cuya frecuencia absoluta

acumulada excede a n/2
II.Para datos agrupados.-
a) MEDIA ARITMETICA (Xi) .- Si la
distribución de frecuencias que se dispone
corresponde a una clasificación con intervalos,
se aplica la siguiente fórmula:
m
_
x
i 1
i fi
X
m
f i 1
i
Donde:
m: Número de clases o intervalos
xi: Marca de clase
fi: Frecuencia absoluta simple
c) MODA (Mo).- En una tabla o distribución de
frecuencias es aproximadamente la marca de
clase o punto medio de la clase que tiene la
mayor frecuencia absoluta simple.
También podemos hacer uso de la siguiente

fórmula:
1
Mo  Li  c
1   2
Donde:
 1  f i  f i 1
 2  f i  f i 1
Li: Límite inferior de la clase modal

C:Ancho de intervalo
Del ejemplo datos de resistencia en
onzas, la clase modal es la cuarta clase
por tener la mayor frecuencia absoluta
simple. La moda es:
18  4
Mo  26,6  3,8  28,6 onzas
18  4  18  6
MEDIDAS DE POSICIÓN RELATIVA
-Cuartiles
-Deciles
-Percentiles
REGLA PARA EL CALCULO DE PERCENTILES DE LA
MUESTRA
1. Ordenar las observaciones de menor a mayor
2. Determine el producto np
3. np no es un entero, redondéelo al entero
inmediato posterior y determine el valor ordenado
correspondiente. si np es un entero digamos k,
calcule la media de las observaciones ordenadas
k-ésima y (k+1) ésima.
Ejemplo 22
Las siguientes son 20 determinaciones de la emisión
diaria (en toneladas) de óxido de azufre de una
planta industrial.
15,8 26,4 17,3 11,2 23,9 24,8 18,7 13,9 9,0
13,2 12,7 9,8 6,2 14,7 17,5 26,1 12,8 28,6
17,6 23,7
Obtenga los cuartiles y percentiles 95, 65 y 85
Ordenando los datos:
6,2 9,0 9,8 11,2 12,7 12,8 13,2 13,9
14,7 15,8 17,3 17,5 17,6 18,7 23,7 23,9
24,8 26,1 26,4 28,6
P95 =????
np = 20(95/100) = 19
P95 = (26,4+28,6) / 2 =27,5 toneladas.

Si los datos se encuentran agrupados
(distribución de frecuencias), podemos hacer
uso de la siguiente fórmula:
kn
( - Fi-1 )
Pk = Li + 100 C
f pk
Del ejemplo 11 . Calcule el P85 e interprete el
resultado obtenido.
Límite xi fi Fi hi Hi
[ >
15,2 - 19,0 17,1 2 2 feb-40 feb-40
19,0 - 22,8 20,9 7 9 jul-40 sep-40
22,8 - 26,6 24,7 4 13 abr-40 13/40
26,6 - 30,4 28,5 18 31 18/40 31/40
30,4 - 34,2 32,3 6 37 jun-40 37/40
34,2 - 38,0 36,1 3 40 mar-40 1
La clase correspondiente al P85 es la clase cuya

frecuencia absoluta acumulada excede a kn/100,
esto es 85x40/100 = 34 (quinta clase).
Reemplazando, tenemos:
34  31
p85  30,4  ( )3,8  32,3 onzas
6
MEDIDAS DE DISPERSION O VARIABILIDAD
Como su mismo nombre lo indica miden la dispersión o
variabilidad de los datos u observaciones en la muestra.
I) MEDIDAS DE DISPERSION PARA DATOS NO

AGRUPADOS
a) Amplitud Total (A).- Se define como la diferencia entre el

valor máximo y mínimo .
A=V.max - V.min.
b) Desviación Media (DM).- Medida de dispersión que
se puede utilizar en aquellas distribuciones en las que
la medida de tendencia central más significativa haya
sido la media.
x
_
i - x
DM = i 1
n
Varianza Muestral:

_
( xi  x) 2
S2 = i 1
n 1
o también
n _2
 x2 i  nx
S 2 = i 1
n 1
Desviación Estándar
n
(x
_
i  x) 2
S = i 1
n 1
O también
n _2
i 1
x2 i  nx
S =
n 1
Coeficiente de variación (CV).- Es una medida de
dispersión relativa, está exenta de unidades y se expresa
en %. Se usa para comparar las dispersiones de dos
distribuciones diferentes.
S
CV = . 100
_
x
Ejemplo 26
Consideremos las medidas tomadas con un
micrómetro del diámetro de un cojinete, cuya
media es 3,92 mm y desviación estándar de
0,015 mm, mientras que las medidas tomadas
con otro micrómetro de la longitud de un
resorte sin extender tienen una media de 1,54
pulgadas y una desviación estándar de 0,008
pulgadas. ¿ Cuál de estos dos instrumentos
de medición es relativamente más preciso?
CVc = 0,015 . 100 = 0,38%

3,92
CVr = 0,008 . 100 = 0,52%

1,54
II) MEDIDAS DE DISPERSION PARA DATOS
AGRUPADOS
a) Varianza muestral para datos agrupados

m

_
( xi  x) 2 f i
S2 = i 1
n 1
O también
m _2
 x 2 i fi  n x
S 2 = i 1
n 1
b) Desviación media para datos agrupados.
x
_
i - x fi
DM = i 1
m
f
i=1
i
Ejercicio
La siguiente información corresponde al tiempo de

oxidación – inducción ( en minutos) para varios
tipos de aceite comercial:
87 102 130 160 180 195 132 145 210 105
145 153 87 93 99 119 129 138
construya un diagrama de caja y comente
Medidas de Forma de la Distribución
Medidas de Asimetría.- Las medidas de asimetría
indican la deformación horizontal de las
distribuciones de frecuencia.
a) Una distribución de frecuencias simétrica, se

caracteriza por tener la forma de una campana,
además de ser unimodal, coinciden la media,
mediana y moda, es decir: 
x  Me  Mo
b)Una distribución de frecuencias es
considerada asimétrica positiva o sesgada a la
derecha, si: 
x  Me  Mo
c) Una distribución es considerada asimétrica
negativa o sesgada a la izquierda si:

x  Me  Mo
El coeficiente de asimetría se puede calcular de la
siguiente manera: 3( x  Me)
CAs 
s
Si:
CAs = 0 La distribución es simétrica
CAs < 0 La distribución es asimétrica

negativa o sesgada a la Izquierda
CAs > 0 La distribución es asimétrica

positiva o sesgada a la derecha
Medidas de Apuntamiento o Curtosis .- Una
medida de curtosis indica la deformación vertical
de una distribución de frecuencias.
Donde
k1 
 i i /n
f ( x  x ) 4
m4
3  4 3
s4 s
m4: Momento de orden 4

s: Desviación estándar
Si:
k1 > 0 La curva es Leptocúrtica
k1 = 0 La curva es Mesocúrtica
k1 < 0 La curva es Platicúrtica

PROBABILIDAD
CONCEPTOS BÁSICOS
1 Experimento.- término utilizado en la teoría de la
probabilidad para describir virtualmente cualquier proceso
cuyos resultados no se conocen de antemano con
certeza.
Ejemplos.
En un experimento en el cual una moneda es lanzada 10
veces, el experimentador podría estar interesado en
determinar la probabilidad de obtener al menos 6 caras.
Medir la concentración de oxígeno disuelto en un río

contaminado.
 observar la fracción de insectos que mueren por

acción de un insecticida nuevo.
2. ESPACIO MUESTRAL Y EVENTO.- Es la
colección de todos los posibles resultados de un
experimento, en tanto que un evento es un subconjunto del
espacio muestral.
Ejemplos:
sea el experimento “lanzamiento de un dado”
S = { 1,2,3,4,5,6 }
Un inversionista planea escoger dos de las cinco

oportunidades de inversión que le han recomendado.
Sean : A,B,C,D,E las cinco oportunidades de inversión
S = { AB, AC, AD, AE, BC, BD, BE, CD, CE, DE }

Un experimento consiste en preguntar a cuatro jóvenes, si
fuman.
Sea: F = fuma N = No fuma
S = { FFFF , FFFN , FFNF , FNFF , NFFF , FFNN , FNFN , FNNF ,

NFFN , NFNF , NNFF , FNNN , NFNN , NNFN , NNNF, NNNN }
Eventos Compuestos.- En muchas situaciones
puede considerarse que un evento es una
composición de dos o más eventos distintos. Tales
eventos se denominan compuestos y pueden
formarse de dos maneras:
 La unión de dos eventos A y B : EL evento que
ocurre si A o B o ambas ocurren en una sola
realización del experimento y se denota .
 La intersección de dos eventos A y B es el
evento que ocurre si tanto A como B en una sola
realización del experimento y se denota .
Ejemplo
Dos profesores y tres asistentes graduados son
responsables de la supervisión de un laboratorio de
Química, y al menos un profesor y un asistente
graduado deben estar presentes siempre.
a) empleando dos coordenadas de tal manera que
(1,3), por ejemplo, represente el evento en el que un
profesor y tres asistentes graduados están
presentes, trace un diagrama de puntos en el que
aparezcan los puntos correspondientes al espacio
muestral.
a) Describa textualmente los eventos
representados por B = {(1,3), (2,3)}
b) C = {(1,1), (2,2)} D = {(1,2) ,(2,1)}
DEFINICIÓN CLÁSICA DE PROBABILIDAD
Condiciones:
i) El espacio muestral de todos los posibles
resultados es finito
ii) Los resultados el espacio muestral deben ser
igualmente probables
n( A)
Definimos a P(A) como: P( A) 
n( S )
Donde A es el evento formado por n(A) resultados

del espacio muestral y el número total de resultados
posibles es n(S).
DEFINICIÓN AXIOMATICA
Las definiciones son empíricas o experimentales,
deduciéndose leyes o propiedades de la probabilidad en
forma lógica o computacional, bajo ciertas suposiciones
denominados axiomas de probabilidad.
La probabilidad de un evento A, se define como el
número P(A), que cumple los siguientes axiomas:
P(S )  1


0  P ( A)  1
 Si A y B son dos eventos mutuamente excluyentes,
tenemos que
A B  , P( A  B)  P( A)  P( B)
ALGUNAS REGLAS DE CONTEO
Ejemplo
Un investigador realizó un estudio para la
preparación del catalizador en la conversión de
monoetanolamina (MEA) a etilendiamina (EDA),
una sustancia que se utiliza comercialmente en
jabones. Se escogió el plan experimental inicial a
modo de examinar cuatro metales (Fe, Co, Ni y
Cu) y cuatro clases de soporte para el catalizador
(baja acidéz, alta acidez, poroso y alta área
superficial)
¿Cuántas combinaciones metal-soporte posibles

hay en este experimento?
a)Regla de multiplicación.- Se tienen k conjuntos
de elementos , n1 en el primer conjunto, n2 en el
segundo conjunto,.....y nk en el k-ésimo conjunto.
Supongamos que se desea formar una muestra
de k elementos tomando un elemento de cada
uno de los k conjuntos. El número de muestras
distintas que pueden formarse es:
n1n2n3....nk
Ejemplo
Un restaurante ofrece 3 sopas diferentes, 5
carnes, 4 postres y 4 tipos de bebida ¿De
cuántas formas podemos ordenar una comida
consistentes de una sopa, una carne, un postre
y una bebida?
Solución.
3 x 5 x 4 x 4 = 240 formas
b)Regla de Permutaciones.- Si se van a
extraer n elementos de un conjunto de N
elementos y a organizar los n elementos
en un orden definido, el número de
resultados distintos es:
N!
P 
N
( N  n)!
n
Ejemplo
¿De cuántas maneras diferentes se
puede realizar una primera, segunda y
tercera selección entre 12 empresas
arrendadoras de equipos para
construcción?
1320
12! 12!
P312    12 x11x10 
(12  3)! 9!
c) Regla de Particiones.- Si se van a repartir los elementos
de un conjunto de N elementos entre k grupos
compuestos por n1, n2,....nk elementos (n1+n2+...+nk =N),
el número de resultados distintos es:
N!
n1 ! n 2 !......n k !
Ejemplo.
Se le suministran drogas a 8 animales de la
siguiente forma: Tipo A a tres de ellos, tipo
B a otros tres y tipo C a los dos restantes.
Luego se coloca cada uno de los animales
en una de las 8 diferentes cajas adyacentes
para su observación, si los animales solo se
distinguen en base al tipo de droga
recibida. ¿De cuántas formas diferentes
pueden ser colocadas?
8!
 560
3!3!2!
d)Regla de combinaciones.- Si se van a
extraer n elementos de un conjunto de N
elementos sin importar el orden de los n
elementos, el número de resultados
distintos es:
N!
( )
N
n!( N  n)!
n
Ejemplo
¿Cuántos helados de dos sabores
diferentes nos pueden servir en una
heladería que tiene el siguiente surtido
de sabores: Chocolate, vainilla, fresa y
coco.
Solución
4!
( )
4
6
2!(4  2)!
2
PROBABILIDAD CONDICIONAL
Utilizaremos P(A / B) para representar la

probabilidad del evento A dado que ocurre el
evento B. Para dos eventos cualesquiera A y B en
un espacio muestral S, tales que P(B) > 0 (p(B)
 0). La probabilidad del evento A dado el evento
B, se define por :
P( A  B)
P( A / B) 
P( B)
Ejemplo 44
Se seleccionan dos semillas aleatoriamente
una por una de una bolsa que contiene 10
semillas de flores rojas y 5 de flores
blancas. Determine la probabilidad de :
a) que la primera semilla sea blanca
b) que la primera semilla sea roja
c) La segunda semilla sea blanca si la
primera fue roja
Rpta . a) P(B)=5/15 b) P( R )=10/15
c)P(B/R) = 5/14
Ejemplo 45
Una persona lanza una moneda 3 veces ¿Cuál s
probabilidad de obtener tres caras dada que salió por lo
menos una cara?
Sol
S = { (c,c,c) (c,s,c) (c,s,s) (s,c,s) (s,s,c) (s,c,c) (c,c,s)
(s,s,s)}
A={(c,c,c)}
B={ (c,c,c) (c,s,c) (c,s,s) (s,c,s) (s,s,c) (s,c,c) (c,c,s)}
1
P( A  B) 1
P( A / B)   8 
P( B) 7/8 7
Ejemplo
Se tienen dos cajas, la caja 1 contiene dos

fichas blancas y cuatro rojas, la caja 2 contiene
8 fichas blancas y cuatro rojas. Se selecciona
una caja al azar y luego se extrae una ficha al
azar. Hallar la probabilidad de que la ficha
extraída sea blanca.
P(B)=1/2 x 2/6 + ½ x 8/12
P(B)=0,5
Eventos Independientes
Los eventos son independientes si la ocurrencia

de B no altera la probabilidad de que haya
ocurrido A, es decir los eventos A y B son
independientes si:
P ( A / B )  P ( A)
si los eventos A y B son independientes también

se cumple que:
P( B / A)  P( B)
Ejemplo 47
Considere el experimento de lanzar un dado balanceado,
A: Observar un número par
B: Observar un número menor o igual que 4
¿Son independientes los eventos A y B?
Solución
S = {1, 2, 3, 4 ,5 , 6} A  B  {( 2,4)}
A = { 2, 4, 6}
B = {1, 2, 3, 4 }
P ( A  B )  P ( A) P ( B)
2 3 4
 x
6 6 6
1 1

3 3
REGLA DE BAYES
Es considerado un caso especial de la
probabilidad condicional, se aplica cuando se
desea calcular la probabilidad condicional de un
evento que ocurrió primero dado lo que ocurrió
después.
Sea A1, A2,....An eventos mutuamente
excluyentes y B un evento observado, luego P( A / B)
i
para i=1,2,...n es:
P( Ai  B) P( Ai ) P( B / Ai )
P( Ai / B)  
P( B) P( A1 ) P( B / A1 )  P( A2 ) P( B / A2 )  ......  P( An ) P( B / An )
Ejemplo 49
Una fábrica tiene tres máquinas A,B y C produciendo
las mismas piezas para televisores a color. La máquina
A produce 60% de las piezas con un 95% de ellas
perfectas, la máquina B produce 30% con 80%
perfectas y la máquina C produce 10% con 65%
perfectas. Si se selecciona una pieza al azar. ¿Cuál es
la probabilidad de que esta sea defectuosa? Y si es
defectuosa. ¿Cuál es la probabilidad de que haya sido
producida por la máquina A?
P(d)=0,60 x 0,05 +0,30 x 0,20 + 0,10 x 0,35
P(d) = 0,125
0,60 x0,05
P( A / d )   0,24
0,60 x0,05  0,30 x0,20  0,10 x0,35
DISTRIBUCIONES DE PROBABILIDAD PARA
VARIABLES DISCRETAS
 Existen sólo dos resultados posibles para
cada ensayo “éxito o fracaso”
 La probabilidad de un éxito es la misma
para cada ensayo
 Existen n ensayos donde n es una constante
 Los n ensayos son independientes.
Los ensayos que satisfacen estos supuestos se
llaman ensayos de Bernoulli.
La distribución de probabilidad para una variable
aleatoria Binomial está dada por:
n x n x
f ( x)  b( x; n, p)   
 x p ( q )
 
para x=0,1,2....n
Donde:
p: Probabilidad de éxito para cada ensayo
q = 1-p : Probabilidad de fracaso
n: número de pruebas
X: Número de éxitos en n pruebas
La media y varianza la definimos por:

  np
 2
 npq
Ejemplo
Se dice que el 75% de los accidentes en una planta
se atribuyen a errores humanos, determine la
probabilidad de que se atribuyan a errores humanos
dos de los cuatro próximos accidentes:
n x n x
f ( x)  b( x; n, p)   
 x p ( q )
 
n=4
x=2
p = 0,75
f (2) = ?
q = 0,25
Ejemplo.
Suponga que un vendedor a domicilio de un
determinado producto
Llevará a cabo 10 entrevistas en forma
independiente.por experiencias anteriores cree
que puede efectuar 1 venta por cada 5
entrevistas. ¿Cuál es la probabilidad de que haga
dos o más ventas?
p =1/5 P( x  2)  1  p( x  2)  1  ( f (1)  f (0))
q = 4/5
n=10
= ?
Ejemplo
Un estudiante responde al azar 10 preguntas, cada pregunta contien
5 respuestas de las cuales 1 sólo es la respuesta correcta.Calcule
La probabilidad de que el estudiante conteste correctamente:
a) Menos de 3 preguntas
b) Más de 4 preguntas
c) De 2 a 4 preguntas
n =10
p =1/5
q=4/5
a) p( x  3)  f (0)  f (1)  f (2)

b) p( x  4)  1  p( x  4)  1  ( f (0)  f (1)  f (2)  f (3)  f (4))
c) p(2  x  4)  f (2)  f (3)  f (4)
Ejemplo.
Un examen consiste de 20 preguntas donde c/u
tiene cuatro respuestas de las cuales sólo una es
correcta. Un estudiante que no ha estudiado el
curso contesta el examen al azar.
a)¿Cuál es el número esperado de respuestas
correctas?
b)¿Cuál es la probabilidad de que acierte al menos
una respuesta?
c)¿Cuál es la probabilidad de que todas sean
incorrectas?
d)¿Cuál es la probabilidad de que acierte por lo
menos 5?
n=20
p=1/4
q=3/4
a) E(x)==np
b) p( x  1)  1  P( X  1)  1  f (0)
c) f (0)
d ) p( x  5)
DISTRIBUCIÓN MULTINOMIAL
La distribución binomial es un caso particular de
la distribución multinomial. Muchos
experimentos producen observaciones de una
variable cualitativa con más de dos posibles
resultados
Ejemplo
Supongamos que cierto microscopio T se fabrica en
una de cinco líneas de producción distintas, A, B, C,
D o E. A fin de comparar las proporciones de
microscopios defectuosos que se pueden atribuir a
las cinco líneas de producción, todos los
microscopios defectuosos detectados por los
ingenieros de control de calidad se clasifican
diariamente según la línea en la que se produjeron.
Cada microscopio es una unidad experimental y
la observación es una letra que identifica la
línea de producción en la que se produjo.
Evidentemente la línea de producción es una
variable cualitativa. EL experimento que
acabamos de mencionar se denomina
experimento multinomial
Características:
 El experimento consiste en n pruebas
idénticas
 Existen k resultados posibles de cada
prueba
 Las probabilidades de los k resultados
son denotados por p1, p2...pk se mantienen
constantes a lo largo de todos las pruebas
donde p1+p2+...+pk=1
 Las pruebas son independientes
 Las variables aleatorias de interés
son x1,x2,.....xk en cada una de las k
categorías de clasificación.
La distribución de probabilidad multinomial
está dada por:
n!
f ( x1 x2 ....xk )  x1 x 2 xk
p1 p2 ....... pk
x1! x2!.....xk !
Donde:
p1  p2  .....  pk  1
n  x1  x2  .....  xk 
número de pruebas
número de ocurrencias del resultado k en n pruebas
xk :
La media y la varianza de la variable aleatoria multinomial xk son
respectivamente:
 k 2  npk (1  pk )
k  npk
DISTRIBUCIÓN HIPERGEOMETRICA
Cuando se extrae una muestra de una población finita,

constituida por éxitos y fracasos, tal es el caso de
observaciones referentes a un lote de piezas defectuosas
o sin defectos, los supuestos de un experimento
Binomial se satisfacen siempre que el elemento extraído
para ser observado, se reincorpore a la población antes
de hacerse la segunda observación. Este método de
muestreo se denomina muestreo con reemplazo. Sin
embargo en la práctica usualmente utilizamos el muestreo
sin reemplazo, esto es seleccionar aleatoriamente n
elementos diferentes de N elementos de la población.
Consideremos una población de N unidades, de los
cuales “a” poseen ciertas características y “N-a” no la
poseen. Si se hacen “n” extracciones al azar, sin
reemplazo entre la población, cada extracción es
subsecuente es dependiente y la probabilidad de éxito
cambia en cada extracción. En estas condiciones si
deseamos obtener x unidades del tipo “a”( éxitos) en la
muestra al azar de tamaño “n”, el número de éxitos en
este caso se llama variable hipergeométrica .
Media y varianza
na( N  n)( N  a)
 2
N ( N  1)
2
 a 
  n 
 N 
Ejemplo
Una urna contiene 12 fichas de las cuales tres están
premiadas. Si una persona selecciona
aleatoriamente 5 fichas al azar ¿Cuál es la
probabilidad de que 3 de las fichas seleccionadas
estén premiadas?
 3  9 
  
P=3 Pc=9
12
f (3)   3  2 
12 
 ?
3 2
5  
5
Ejemplo
Un embarque de 120 alarmas contra robo
contiene 5 defectuosas. Si tres de estas
alarmas se seleccionan aleatoriamente y se
le envían a un cliente. Determine la
probabilidad de que el cliente reciba una en
mal estado.
DISTRIBUCIÓN DE POISSON
Proporciona un modelo para la
frecuencia relativa del número de “eventos
poco comunes” que ocurren en una
unidad de tiempo, área, volumen, etc.
Como por ejemplo el ejemplo el número
de accidentes fatales por mes en una
planta de producción, el número de
defectos visibles en un diamante, etc.
Entre otras características tenemos:
 La probabilidad de un evento que ocurra en
una unidad de tiempo, área o volumen es la misma
para todas las unidades
 El número de eventos que ocurren en una
unidad de tiempo, área o volumen es independiente
del número de los que ocurren en otras unidades.
 El número medio (o esperado ) de eventos en
cada unidad se denota por la letra griega lambda ,
.
La distribución de probabilidad para una variable
aleatoria e Poisson está dada por:
, x=0,1,2,3,.....
Donde
 e
x 
f ( x) 
x!
: es el número medio de eventos en una unidad de
tiempo, área o volumen
 =2.71828......
La media y la varianza de una variable aleatoria de

Poisson son, respectivamente
   
2
Ejemplo
El número de averías semanales de una
computadora es una v.a que tiene una
distribución de Poisson con =0.4 ¿Cuál
es la probabillidad de que la computadora
trabaje sin averías durante dos sesiones
consecutivas.
DISTRIBUCIÓN BINOMIAL NEGATIVA
En muchos casos nos interesará medir el
tiempo transcurrido antes de que ocurra un
evento, por ejemplo el tiempo que un cliente
debe esperar en una cola para ser atendido ,
el tiempo que tarda en fallar un equipo, etc.
Para esta aplicación consideramos cada
unidad de tiempo como una prueba de
bernoulli que puede tener como resultado
un éxito o un fracaso. A diferencia de los
experimentos binomiales en los que x es
el total de éxitos, la variable de interés
ahora es el número de pruebas (unidades
de tiempo) hasta que se observa el a-
ésimo éxito.
La distribución de probabilidad para la variable
aleatoria x está dada por:
 x  1 a x  a
f ( x)    p q x=a,a+1,a+2....
 a  1
Donde:
p:Probabilidad de éxito
q:1-p
x:Número de pruebas hasta que se observa el x-ésimo éxito
Media y varianza
a aq
   2
2
p p
Ejemplo
Un fabricante utiliza fusibles en un
sistema electrónico, los fusibles se
compran en lotes grandes y se prueban
secuencialmente hasta que se observa
el primer fusible defectuoso. Suponga
que el lote contiene el 10% de fusibles
defectuosos.
a)¿Qué probabilidad hay de que el
primer fusible defectuoso sea uno de
los primeros cinco fusibles probados.?
DISTRIBUCIÓN GEOMÉTRICA
Es un caso especial de la distribución de
probabilidad negativa, cuando “a” es igual a 1.
La distribución de probabilidad para una
variable aleatoria geométrica está dada por:
(x=1,2.....)
f ( x)  g ( x; p)  pq x 1
Donde x número de ensayos hasta que se
observa el primer éxito
Media y varianza
q 1
  2
2

p p
VARIABLES ALEATORIAS CONTINUAS
Se dice que una variable aleatoria es continua

cuando el conjunto de posibles valores es todo
un intervalo de números. Muchas variables
aleatorias que se observan en la vida real
constituyen claros ejemplos de variables
aleatorias continuas: El tiempo de espera X ( en
minutos) para culminar un trabajo, la velocidad
de un automóvil, la cantidad de alcohol en la
sangre de una persona, la intensidad de la luz
solar a una hora determinada, el pH de un
compuesto químico, etc.
La Distribución de Probabilidad o función de
densidad de probabilidad de una variable
aleatoria continua X, es una función f(x), tal que
la probabilidad de que X tome un valor en el
intervalo [a,b] esta dada por dada por:
b
p(a  x  b)   f ( x)dx
a
Area bajo la curva de f(x) entre a y b.
Para que f(x) sea una función de densidad, debe
satisfacer las siguientes condiciones:


f ( x)  0  x


f ( x)dx  1
Proposición:
Si X es una variable aleatoria continua, para
dos números cualesquiera a y b con a < b
tenemos:
p ( a  x  b)  p ( a  x  b)  p ( a  x  b)  p ( a  x  b)
Función de Distribución Acumulativa
Sea F(x) la función de distribución acumulativa para una variable
aleatoria continua X
x
F ( x)  P( X  x)   f (t )dt

Si X es una variable aleatoria continua, para
dos números cualesquiera a y b con a < b
tenemos:
b
p(a  x  b)  a
f ( x)dx  F (b)  F (a)
La función de densidad para una variable aleatoria X,

también está dada por:
F ( x)
f ( x) 
d ( x)
Valor esperado y varianza para variables
aleatorias continuas
Media de una densidad de probabilidad
Varianza de una densidad de probabilidad
  E ( x   )    ( x   ) f ( x)dx   x f ( x)dx   2
  2
2 2 2
 

  E ( x)   xf ( x)dx

Sea  0 x  0
 x2
F ( x)   0 x  2
 4
 1 2 x
Calcule:
a) P( x  1)
b) P(0,5  x  1)
c)
P ( x  0,5)
ALGUNAS DISTRIBUCIONES
CONTINUAS
1. Distribución de Probabilidad Normal
La función de densidad normal o Gaussiana fue
propuesta por Gauss (1777-1855), constituye el modelo
adecuado para distribuciones de frecuencias de datos
en diversas áreas científicas. La variable aleatoria
normal posee una función de densidad con dos  , 2
parámetros .
La distribución de probabilidad normal está dada por:
La distribución de probabilidad normal está dada por:
....... (*)
1   x  
f ( x)  e ( x   ) / 2 2
2
 2
Una notación muy utilizada para la distribución normal es:
X  N ( , 2 )
que se lee: “la variable aleatoria X se distribuye

normalmente con media y varianza .   2
Distribución Normal Estandar
Si Z es una variable aleatoria que tiene una
distribución normal con media  =0 y varianza
2 =1, entonces z se llama variable aleatoria normal
estándar, su función de densidad es.
1 z2 / 2
f ( z)  e   z  
2
Para calcular P(a  x  b) cuando x es una variable
aleatoria normal con parámetros  ,  2 debemos
evaluar
b
1

( x   ) 2 / 2 2
 dx
a 2
Como podemos observar la evaluación de esta
integral no se puede calcular por los métodos
elementales de integración por lo que basados en
el siguiente teorema:
“ Si X es una variable aleatoria con distribución
normal con media  y varianza  , entonces es
2
una variable aleatoria con distribución normal

estándar”. Por lo que la expresión se ha evaluado
y tabulado para ciertos valores de a y b, en tablas
cuyo manejo veremos a continuación.
x
z

Ejemplo
La altura en centímetros de las plantas de maíz
en una milpa están aproximadamente
normalmente distribuidas, con   180 y   20 ,
¿Cuál es la probabilidad de que una planta de
maíz seleccionada al azar de esta milpa tenga
una altura
a)Entre 160 y 200?
b)Mayor que 170?
c)Menor que 150?
Aproximación de la Distribución Binomial mediante la
Distribución Normal.
Cuando n es muy grande, los cálculos de las probabilidades

binomiales resultan laboriosos, en la obtención de los
coeficientes binomiales y potencias de p y q. La
distribución normal resulta una buena aproximación de las
distribuciones binomiales cuando n es grande y p no
necesariamente pequeño
k  0,5  np k  0,5  np
i) p( X  k )  p(  z )
npq npq
k  0,5  np
ii ) p( X  k )  p( z  )
npq
k  0,5  np
iii ) p( X  k )  p( z  )
npq
k  0,5  np
iv ) p( X  k )  p( z  )
npq
k  0,5  np
v) p( X  k )  p( z  )
npq
Ejemplo
Un fabricante vende lámparas en cajas de
1000. ¿Cuál es la probabilidad de que
alguna caja contenga no más del 1% de
lámparas defectuosas, si se considera el
proceso de producción como un
experimento Binomial con p=1% (la
probabilidad de que alguna lámpara sea
defectuosa)?
1. Distribución de probabilidad uniforme
Suponiendo que se selecciona al azar un número x,
representado por un punto en el intervalo a  x  b . La
función de densidad de x, se representa
1
por un rectángulo donde la altura bes a , para
asegurar que el área debajo del rectángulo sea igual a
1.
Una variable aleatoria de este tipo se denomina
variable uniforme y su función de densidad es:
a b
Una variable aleatoria de este tipo se
denomina variable uniforme y su función
de densidad es:
 1
 si a  x  b
f ( x)   b  a

 0 en otro caso
Donde:
ab (b  a ) 2
 2 
2 12
EJEMPLO
Una compañía manufacturera ha inventado una máquina
con gran eficiencia de combustible que combina el
lavado a presión con la limpieza a vapor. La máquina
está diseñada para suministrar siete galones de
limpiador por minuto a 1000 libras por pulgada
cuadrada para el lavado a presión. En realidad la
máquina suministra una cantidad aleatoria entre 6,5 y
7,5 galones por minuto suponga que x, la cantidad de
limpiador suministrado es una variable aleatoria
uniforme con densidad de probabilidad.
a)Calcule la media y desviación estándar
b)Calcule la probabilidad de suministrar más de 7,2
galones de limpiador por minuto.
DISTRIBUCIONES MUESTRALES
Se denomina distribución muestral de un estadígrafo
o estadístico a la distribución de probabilidad de los
valores posibles que pueden ser tomados por dicho
estadígrafo o estadístico, obtenidos a partir de
muestras del mismo tamaño, que han sido extraídos
aleatoriamente de una población.
Pasos para construir una distribución muestral:
a) Dada una población finita, discreta, de tamaño
N, se extraen aleatoriamente todas las muestras
de tamaño n. Si el muestreo es con reemplazo el
número de muestras posibles es Nn y para
muestreos sin reemplazo e ignorando el orden
el numero de muestras es  N 
n
 
b)Se calcula el estadígrafo de interés para cada
muestra
c)Se construye una tabla de valores del
estadígrafo de interés con sus respectivas
probabilidades.
d)Se calculan los parámetros de la distribución.
Se tiene una población conformada por
los dígitos 5,7,8 y 9 cuya media es 7,25 y
varianza 2,1875. Determine todas las
muestras de tamaño 2 sin reemplazo e
ignorando el orden de la población.
Obtenga la distribución muestral de la
media.
INFERENCIA ESTADÍSTICA
Nos proporciona un conjunto de métodos para llegar a

conclusiones y tomar decisiones respecto a los
parámetros de una población basada en la
información de una muestra.
La inferencia estadística nos permite resolver dos
problemas fundamentales:
 Estimación de parámetros poblacionales a
partir de estadígrafos muestrales conocidos.
 Toma de decisiones estadísticas acerca de
hipótesis establecidas sobre la población.
1.1 Estimación Puntual.- Es un valor numérico,
que nos sirve para estimar el parámetro de la
población.
En un estudio de contaminación del aire realizado en
una estación experimental de 8 muestras diferentes de
aire, se obtuvieron los siguientes montos de materia
orgánica suspendido soluble en benceno (en
microorganismos por metro cúbico):
x1 x2 x3 x4 x5 x6 x7 x8
2,2 1,8 3,1 2,0 2,4 2,0 2,1 1,2
Calcule el estimador puntual para la media de la

población
1.1 Estimación por intervalos
Consiste en encontrar dos valores
numéricos Li (límite inferior) y Ls (límite
superior) que definen un intervalo y se
espera con un cierto grado de
seguridad que el intervalo en mención
contenga al parámetro poblacional.
Intervalo de confianza para  cuando la varianza
poblacional es desconocida y la muestra pequeña
x  t / 2,( n1) (s / n )    x  t / 2,( n1) (s / n )
El valor adecuado de t depende tanto de (n-1), que se

conoce como número de grados de libertad (v), como del
grado de confianza requerido.

Intervalo de confianza para cuando la varianza
poblacional es conocida
AL 95 % DE CONFIANZA
x  1,96( / n )    x  1,96( / n )
AL 99 % DE CONFIANZA
x  2,58( / n )    x  2,58( / n )

Intervalo de confianza para cuando la
varianza poblacional es desconocida y la
muestra pequeña
x  t / 2,( n1) (s / n )    x  t / 2,( n1) (s / n )

Otros usos de los límites de confianza
Los límites de confianza se pueden utilizar
como una prueba para detectar errores
sistemáticos. (errores que surgen de
procedimientos, aparatos o también de
sesgos humanos, como por ejemplo el
lavado incompleto de un precipitado en un
análisis gravimétrico, el error producido por
el indicador en un análisis volumétrico,
algún grado de astigmatismo en el analista
podría provocar errores en la lectura de
instrumentos u otras observaciones, etc.
1.2 Contraste de Hipótesis
 El contraste de hipótesis ayuda al
investigador a tomar una decisión en torno a una
población examinando una parte de ésta
(muestra)
 Una hipótesis se define simplemente como
una afirmación acerca de una o más
poblaciones.
 Supuesto básico: Los datos de la muestra
son aleatorios y provienen de una población
distribuida normalmente.
 Hipótesis estadística. Es una suposición
que se plantea respecto a un problema o
población.
COMPONENTES DE UNA PRUEBA DE HIPÓTESIS
A)HIPÓTESIS
A1)Hipótesis Nula (Ho).- Es la hipótesis de la no
diferencia y se define como Ho, se establece con
el propósito de ser rechazada.
A2)Hipótesis Alternativa (Ha).- Es la hipótesis que

propone el investigador, se designa con H1.
Cuando se acepta H1, se dice que los resultados
fueron significativos.
B)Nivel de significación.- Se designa por , también
es conocido por p, por convención se utiliza =0,05
si este valor es más pequeño resulta mejor.
C)Distribución Muestral.- Es una distribución
teórica, definida anteriormente.
Prueba Bilateral
Ho:    0
H1:   0
Pruebas unilaterales
Unilateral de cola izquierda
Ho:    0
H1:   0
Unilateral de cola derecha

Ho:    0
H1:   0
E)Conclusión.- Es dar un resultado entendible,
de modo que toda persona pueda
comprenderlo.
Contraste de hipótesis para la media de una población

a1)Cuando la varianza poblacional es conocida
a2) muestras grandes n>= 30 y varianza poblacional desconocida
x
z

n
b)cuando la varianza poblacional es desconocida y n<30
x
t 
s
n
Ejemplo
Se ha realizado un experimento muy costoso para
evaluar un nuevo proceso que produce diamantes
sintéticos, con el nuevo proceso se han generado seis
diamantes con pesos: 0,46 0,61 0,52 0,48 0,57 y
0,54 quilates. Un estudio de los costos del proceso
indica que el peso debe ser mayor que 0,6 quilates,
para que el proceso rinda utilidades ¿Presentan los
pesos observados evidencia de que el peso medio de
los diamantes producidos por el nuevo proceso es
superior a 0,6 quilates?
REGRESIÓN LINEAL SIMPLE
El análisis de Regresión, nos permite establecer la
forma de relación entre variables. Estudia la
relación funcional entre las variables y=f(x) o
x=f(y), de modo que se pueda predecir el valor de
una en base a las otras u otra.
Por convención la variable que se va a predecir se
denomina variable dependiente y aquellas que
forman parte de loa predicción se denominan
variables o variable independiente.
Se denomina regresión lineal de y en x a una

función lineal, de la forma:
Y=a+bx

Estadística Nº2 - Distribución de Frecuencias, Probabilidades y Distribución de Probabilidad

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estadística Nº2 - Distribución de Frecuencias, Probabilidades y Distribución de Probabilidad

Transféré par

Droits d'auteur :

Formats disponibles

Distribución de Frecuencias

Una distribución de frecuencias es una tabla en la que un

Distribución de frecuencias según variable discreta

Para obtener una tabla de distribución de frecuencias cuando la variable

Obtenga una tabla de distribución de

Para obtener una tabla de distribución de

a) Se identifica la variable en estudio

[ Li-1 , Li > ó < Li-1 , Li ]

f) Determinar las marcas de clase

g)Calcular las frecuencias absolutas simples,

32,5 15,2 35,4 21,3 28,4 21,2 28,3 27,1

Construya una tabla de distribución de

b) m=1+3,32log(40) aprox. m=6

Redondeado por exceso  c = 3,8

Luego la Tabla de Distribución de

I.Para datos sin agrupar.- Dado un conjunto de n medidas u

a)Media Aritmética (x ) .- Si tenemos un conjunto de n

Del ejemplo anterior:

4490 4500 4500 4520 4520 4520 4520 4540 4570

Tenemos que la mediana es: 4520 ppm

Del ejemplo anterior tenemos que la moda es:

Li: Límite inferior de la clase que contiene a la mediana

* Es la primera clase cuya frecuencia absoluta

También podemos hacer uso de la siguiente

Li: Límite inferior de la clase modal

P95 = (26,4+28,6) / 2 =27,5 toneladas.

La clase correspondiente al P85 es la clase cuya

I) MEDIDAS DE DISPERSION PARA DATOS NO

a) Amplitud Total (A).- Se define como la diferencia entre el

CVc = 0,015 . 100 = 0,38%

CVr = 0,008 . 100 = 0,52%

a) Varianza muestral para datos agrupados

La siguiente información corresponde al tiempo de

a) Una distribución de frecuencias simétrica, se

CAs = 0 La distribución es simétrica

CAs < 0 La distribución es asimétrica

CAs > 0 La distribución es asimétrica

m4: Momento de orden 4

k1 < 0 La curva es Platicúrtica

Medir la concentración de oxígeno disuelto en un río

 observar la fracción de insectos que mueren por

Un inversionista planea escoger dos de las cinco

S = { AB, AC, AD, AE, BC, BD, BE, CD, CE, DE }

S = { FFFF , FFFN , FFNF , FNFF , NFFF , FFNN , FNFN , FNNF ,

Donde A es el evento formado por n(A) resultados

¿Cuántas combinaciones metal-soporte posibles

Utilizaremos P(A / B) para representar la

Se tienen dos cajas, la caja 1 contiene dos

Los eventos son independientes si la ocurrencia

si los eventos A y B son independientes también

La media y varianza la definimos por:

a) p( x  3)  f (0)  f (1)  f (2)

Cuando se extrae una muestra de una población finita,

La media y la varianza de una variable aleatoria de

Se dice que una variable aleatoria es continua

La función de densidad para una variable aleatoria X,

que se lee: “la variable aleatoria X se distribuye

una variable aleatoria con distribución normal

Cuando n es muy grande, los cálculos de las probabilidades

Nos proporciona un conjunto de métodos para llegar a

2,2 1,8 3,1 2,0 2,4 2,0 2,1 1,2

Calcule el estimador puntual para la media de la

x  t / 2,( n1) (s / n )    x  t / 2,( n1) (s / n )