Académique Documents
Professionnel Documents
Culture Documents
2 0 4 4 1 4 0 3 2 0 0 1 11 0 1 2 4
3 11152 2 5 4 0 40
0 7 7 23,3 23,3
1 8 15 26,7 50,0
2 5 20 16,7 66,7
3 2 22 6,7 73,3
4 6 28 20,0 93,3
5 2 30 6,7 100,0
------- -------
Total 30 100,0
Donde:
Xi : Observación
fi : Frecuencia simple
Fi : Frecuencia acumulada
hi : Frecuencia relativa
Hi : Frecuencia relativa acumulada
Distribución de frecuencias según variable
continua
Se recomienda que
c)Determinar la amplitud o recorrido
A = V. Máximo - V. mínimo
d) Determinar el ancho o longitud del intervalo
de clase
A
c
m
e)Determinar los límites o intervalos de clase
c) A = V. Max – V.Min
A = 37,5 – 15,2
A = 22,3
d) =3,72
x i
x i 1
n
Ejemplo
Las siguientes 11 observaciones corresponden al contenido de
sólidos en el agua en partes por millón (ppm):
4520 4570 4520 4490 4570 4500 4520 4520
4521 4540 4500 4590
La media aritmética para estas 11 observaciones es:
Aprox. 4531 ppm
b) Mediana.- Si tenemos un conjunto de n mediciones
x1,x2,....xn, la mediana es aquel valor que no es superado
ni supera a más de la mitad de las n observaciones
dispuestas según su magnitud ya sea creciente o
decreciente
Mo=4520 ppm
PROPIEDADES DE LA MEDIA ARITMÉTICA
b) MEDIANA (Me).- Para calcular la mediana en una tabla
de una distribución de frecuencias, consideramos la
siguiente fórmula:
(n / 2 - Fi-1 )
Me = Li + C
f me
Donde:
_
x
i 1
i fi
X
m
f i 1
i
Donde:
m: Número de clases o intervalos
xi: Marca de clase
fi: Frecuencia absoluta simple
c) MODA (Mo).- En una tabla o distribución de
frecuencias es aproximadamente la marca de
clase o punto medio de la clase que tiene la
mayor frecuencia absoluta simple.
18 4
Mo 26,6 3,8 28,6 onzas
18 4 18 6
MEDIDAS DE POSICIÓN RELATIVA
-Cuartiles
-Deciles
-Percentiles
REGLA PARA EL CALCULO DE PERCENTILES DE LA
MUESTRA
1. Ordenar las observaciones de menor a mayor
2. Determine el producto np
3. np no es un entero, redondéelo al entero
inmediato posterior y determine el valor ordenado
correspondiente. si np es un entero digamos k,
calcule la media de las observaciones ordenadas
k-ésima y (k+1) ésima.
Ejemplo 22
Las siguientes son 20 determinaciones de la emisión
diaria (en toneladas) de óxido de azufre de una
planta industrial.
15,8 26,4 17,3 11,2 23,9 24,8 18,7 13,9 9,0
13,2 12,7 9,8 6,2 14,7 17,5 26,1 12,8 28,6
17,6 23,7
Obtenga los cuartiles y percentiles 95, 65 y 85
Ordenando los datos:
6,2 9,0 9,8 11,2 12,7 12,8 13,2 13,9
14,7 15,8 17,3 17,5 17,6 18,7 23,7 23,9
24,8 26,1 26,4 28,6
P95 =????
np = 20(95/100) = 19
kn
( - Fi-1 )
Pk = Li + 100 C
f pk
Del ejemplo 11 . Calcule el P85 e interprete el
resultado obtenido.
Límite xi fi Fi hi Hi
[ >
15,2 - 19,0 17,1 2 2 feb-40 feb-40
19,0 - 22,8 20,9 7 9 jul-40 sep-40
22,8 - 26,6 24,7 4 13 abr-40 13/40
26,6 - 30,4 28,5 18 31 18/40 31/40
30,4 - 34,2 32,3 6 37 jun-40 37/40
34,2 - 38,0 36,1 3 40 mar-40 1
Reemplazando, tenemos:
34 31
p85 30,4 ( )3,8 32,3 onzas
6
MEDIDAS DE DISPERSION O VARIABILIDAD
Como su mismo nombre lo indica miden la dispersión o
variabilidad de los datos u observaciones en la muestra.
A=V.max - V.min.
b) Desviación Media (DM).- Medida de dispersión que
se puede utilizar en aquellas distribuciones en las que
la medida de tendencia central más significativa haya
sido la media.
x
_
i - x
DM = i 1
n
Varianza Muestral:
_
( xi x) 2
S2 = i 1
n 1
o también
n _2
x2 i nx
S 2 = i 1
n 1
Desviación Estándar
n
(x
_
i x) 2
S = i 1
n 1
O también
n _2
i 1
x2 i nx
S =
n 1
Coeficiente de variación (CV).- Es una medida de
dispersión relativa, está exenta de unidades y se expresa
en %. Se usa para comparar las dispersiones de dos
distribuciones diferentes.
S
CV = . 100
_
x
Ejemplo 26
Consideremos las medidas tomadas con un
micrómetro del diámetro de un cojinete, cuya
media es 3,92 mm y desviación estándar de
0,015 mm, mientras que las medidas tomadas
con otro micrómetro de la longitud de un
resorte sin extender tienen una media de 1,54
pulgadas y una desviación estándar de 0,008
pulgadas. ¿ Cuál de estos dos instrumentos
de medición es relativamente más preciso?
_
( xi x) 2 f i
S2 = i 1
n 1
O también
m _2
x 2 i fi n x
S 2 = i 1
n 1
b) Desviación media para datos agrupados.
x
_
i - x fi
DM = i 1
m
f
i=1
i
Ejercicio
Donde
k1
i i /n
f ( x x ) 4
m4
3 4 3
s4 s
Si:
k1 > 0 La curva es Leptocúrtica
k1 = 0 La curva es Mesocúrtica
S = { 1,2,3,4,5,6 }
P(S ) 1
0 P ( A) 1
Si A y B son dos eventos mutuamente excluyentes,
tenemos que
A B , P( A B) P( A) P( B)
ALGUNAS REGLAS DE CONTEO
Ejemplo
Un investigador realizó un estudio para la
preparación del catalizador en la conversión de
monoetanolamina (MEA) a etilendiamina (EDA),
una sustancia que se utiliza comercialmente en
jabones. Se escogió el plan experimental inicial a
modo de examinar cuatro metales (Fe, Co, Ni y
Cu) y cuatro clases de soporte para el catalizador
(baja acidéz, alta acidez, poroso y alta área
superficial)
n1n2n3....nk
Ejemplo
Un restaurante ofrece 3 sopas diferentes, 5
carnes, 4 postres y 4 tipos de bebida ¿De
cuántas formas podemos ordenar una comida
consistentes de una sopa, una carne, un postre
y una bebida?
Solución.
3 x 5 x 4 x 4 = 240 formas
b)Regla de Permutaciones.- Si se van a
extraer n elementos de un conjunto de N
elementos y a organizar los n elementos
en un orden definido, el número de
resultados distintos es:
N!
P
N
( N n)!
n
Ejemplo
¿De cuántas maneras diferentes se
puede realizar una primera, segunda y
tercera selección entre 12 empresas
arrendadoras de equipos para
construcción?
1320
12! 12!
P312 12 x11x10
(12 3)! 9!
c) Regla de Particiones.- Si se van a repartir los elementos
de un conjunto de N elementos entre k grupos
compuestos por n1, n2,....nk elementos (n1+n2+...+nk =N),
el número de resultados distintos es:
N!
n1 ! n 2 !......n k !
Ejemplo.
Se le suministran drogas a 8 animales de la
siguiente forma: Tipo A a tres de ellos, tipo
B a otros tres y tipo C a los dos restantes.
Luego se coloca cada uno de los animales
en una de las 8 diferentes cajas adyacentes
para su observación, si los animales solo se
distinguen en base al tipo de droga
recibida. ¿De cuántas formas diferentes
pueden ser colocadas?
8!
560
3!3!2!
d)Regla de combinaciones.- Si se van a
extraer n elementos de un conjunto de N
elementos sin importar el orden de los n
elementos, el número de resultados
distintos es:
N!
( )
N
n!( N n)!
n
Ejemplo
¿Cuántos helados de dos sabores
diferentes nos pueden servir en una
heladería que tiene el siguiente surtido
de sabores: Chocolate, vainilla, fresa y
coco.
Solución
4!
( )
4
6
2!(4 2)!
2
PROBABILIDAD CONDICIONAL
1
P( A B) 1
P( A / B) 8
P( B) 7/8 7
Ejemplo
Solución
S = {1, 2, 3, 4 ,5 , 6} A B {( 2,4)}
A = { 2, 4, 6}
B = {1, 2, 3, 4 }
P ( A B ) P ( A) P ( B)
2 3 4
x
6 6 6
1 1
3 3
REGLA DE BAYES
Es considerado un caso especial de la
probabilidad condicional, se aplica cuando se
desea calcular la probabilidad condicional de un
evento que ocurrió primero dado lo que ocurrió
después.
Sea A1, A2,....An eventos mutuamente
excluyentes y B un evento observado, luego P( A / B)
i
para i=1,2,...n es:
P( Ai B) P( Ai ) P( B / Ai )
P( Ai / B)
P( B) P( A1 ) P( B / A1 ) P( A2 ) P( B / A2 ) ...... P( An ) P( B / An )
Ejemplo 49
Una fábrica tiene tres máquinas A,B y C produciendo
las mismas piezas para televisores a color. La máquina
A produce 60% de las piezas con un 95% de ellas
perfectas, la máquina B produce 30% con 80%
perfectas y la máquina C produce 10% con 65%
perfectas. Si se selecciona una pieza al azar. ¿Cuál es
la probabilidad de que esta sea defectuosa? Y si es
defectuosa. ¿Cuál es la probabilidad de que haya sido
producida por la máquina A?
P(d)=0,60 x 0,05 +0,30 x 0,20 + 0,10 x 0,35
P(d) = 0,125
0,60 x0,05
P( A / d ) 0,24
0,60 x0,05 0,30 x0,20 0,10 x0,35
DISTRIBUCIONES DE PROBABILIDAD PARA
VARIABLES DISCRETAS
Existen sólo dos resultados posibles para
cada ensayo “éxito o fracaso”
La probabilidad de un éxito es la misma
para cada ensayo
Existen n ensayos donde n es una constante
Los n ensayos son independientes.
Los ensayos que satisfacen estos supuestos se
llaman ensayos de Bernoulli.
La distribución de probabilidad para una variable
aleatoria Binomial está dada por:
n x n x
f ( x) b( x; n, p)
x p ( q )
para x=0,1,2....n
Donde:
p: Probabilidad de éxito para cada ensayo
q = 1-p : Probabilidad de fracaso
n: número de pruebas
X: Número de éxitos en n pruebas
n =10
p =1/5
q=4/5
a) E(x)==np
b) p( x 1) 1 P( X 1) 1 f (0)
c) f (0)
d ) p( x 5)
DISTRIBUCIÓN MULTINOMIAL
La distribución binomial es un caso particular de
la distribución multinomial. Muchos
experimentos producen observaciones de una
variable cualitativa con más de dos posibles
resultados
Ejemplo
Supongamos que cierto microscopio T se fabrica en
una de cinco líneas de producción distintas, A, B, C,
D o E. A fin de comparar las proporciones de
microscopios defectuosos que se pueden atribuir a
las cinco líneas de producción, todos los
microscopios defectuosos detectados por los
ingenieros de control de calidad se clasifican
diariamente según la línea en la que se produjeron.
Cada microscopio es una unidad experimental y
la observación es una letra que identifica la
línea de producción en la que se produjo.
Evidentemente la línea de producción es una
variable cualitativa. EL experimento que
acabamos de mencionar se denomina
experimento multinomial
Características:
El experimento consiste en n pruebas
idénticas
Existen k resultados posibles de cada
prueba
Las probabilidades de los k resultados
son denotados por p1, p2...pk se mantienen
constantes a lo largo de todos las pruebas
donde p1+p2+...+pk=1
Las pruebas son independientes
Las variables aleatorias de interés
son x1,x2,.....xk en cada una de las k
categorías de clasificación.
La distribución de probabilidad multinomial
está dada por:
n!
f ( x1 x2 ....xk ) x1 x 2 xk
p1 p2 ....... pk
x1! x2!.....xk !
Donde:
p1 p2 ..... pk 1
n x1 x2 ..... xk
número de pruebas
número de ocurrencias del resultado k en n pruebas
xk :
La media y la varianza de la variable aleatoria multinomial xk son
respectivamente:
k 2 npk (1 pk )
k npk
DISTRIBUCIÓN HIPERGEOMETRICA
na( N n)( N a)
2
N ( N 1)
2
a
n
N
Ejemplo
Una urna contiene 12 fichas de las cuales tres están
premiadas. Si una persona selecciona
aleatoriamente 5 fichas al azar ¿Cuál es la
probabilidad de que 3 de las fichas seleccionadas
estén premiadas?
3 9
P=3 Pc=9
12
f (3) 3 2
12
?
3 2
5
5
Ejemplo
Un embarque de 120 alarmas contra robo
contiene 5 defectuosas. Si tres de estas
alarmas se seleccionan aleatoriamente y se
le envían a un cliente. Determine la
probabilidad de que el cliente reciba una en
mal estado.
DISTRIBUCIÓN DE POISSON
Proporciona un modelo para la
frecuencia relativa del número de “eventos
poco comunes” que ocurren en una
unidad de tiempo, área, volumen, etc.
Como por ejemplo el ejemplo el número
de accidentes fatales por mes en una
planta de producción, el número de
defectos visibles en un diamante, etc.
Entre otras características tenemos:
La probabilidad de un evento que ocurra en
una unidad de tiempo, área o volumen es la misma
para todas las unidades
El número de eventos que ocurren en una
unidad de tiempo, área o volumen es independiente
del número de los que ocurren en otras unidades.
El número medio (o esperado ) de eventos en
cada unidad se denota por la letra griega lambda ,
.
La distribución de probabilidad para una variable
aleatoria e Poisson está dada por:
, x=0,1,2,3,.....
Donde
e
x
f ( x)
x!
: es el número medio de eventos en una unidad de
tiempo, área o volumen
=2.71828......
p p
Ejemplo
Un fabricante utiliza fusibles en un
sistema electrónico, los fusibles se
compran en lotes grandes y se prueban
secuencialmente hasta que se observa
el primer fusible defectuoso. Suponga
que el lote contiene el 10% de fusibles
defectuosos.
a)¿Qué probabilidad hay de que el
primer fusible defectuoso sea uno de
los primeros cinco fusibles probados.?
DISTRIBUCIÓN GEOMÉTRICA
Es un caso especial de la distribución de
probabilidad negativa, cuando “a” es igual a 1.
La distribución de probabilidad para una
variable aleatoria geométrica está dada por:
(x=1,2.....)
f ( x) g ( x; p) pq x 1
Donde x número de ensayos hasta que se
observa el primer éxito
Media y varianza
q 1
2
2
p p
VARIABLES ALEATORIAS CONTINUAS
b
p(a x b) f ( x)dx
a
Area bajo la curva de f(x) entre a y b.
Para que f(x) sea una función de densidad, debe
satisfacer las siguientes condiciones:
f ( x) 0 x
f ( x)dx 1
Proposición:
Si X es una variable aleatoria continua, para
dos números cualesquiera a y b con a < b
tenemos:
p ( a x b) p ( a x b) p ( a x b) p ( a x b)
Función de Distribución Acumulativa
Sea F(x) la función de distribución acumulativa para una variable
aleatoria continua X
x
F ( x) P( X x) f (t )dt
Si X es una variable aleatoria continua, para
dos números cualesquiera a y b con a < b
tenemos:
b
p(a x b) a
f ( x)dx F (b) F (a)
F ( x)
f ( x)
d ( x)
Valor esperado y varianza para variables
aleatorias continuas
Media de una densidad de probabilidad
Varianza de una densidad de probabilidad
E ( x ) ( x ) f ( x)dx x f ( x)dx 2
2
2 2 2
E ( x) xf ( x)dx
Sea 0 x 0
x2
F ( x) 0 x 2
4
1 2 x
Calcule:
a) P( x 1)
b) P(0,5 x 1)
c)
P ( x 0,5)
ALGUNAS DISTRIBUCIONES
CONTINUAS
1. Distribución de Probabilidad Normal
La función de densidad normal o Gaussiana fue
propuesta por Gauss (1777-1855), constituye el modelo
adecuado para distribuciones de frecuencias de datos
en diversas áreas científicas. La variable aleatoria
normal posee una función de densidad con dos , 2
parámetros .
La distribución de probabilidad normal está dada por:
La distribución de probabilidad normal está dada por:
....... (*)
1 x
f ( x) e ( x ) / 2 2
2
2
Una notación muy utilizada para la distribución normal es:
X N ( , 2 )
1 z2 / 2
f ( z) e z
2
Para calcular P(a x b) cuando x es una variable
aleatoria normal con parámetros , 2 debemos
evaluar
b
1
( x ) 2 / 2 2
dx
a 2
Como podemos observar la evaluación de esta
integral no se puede calcular por los métodos
elementales de integración por lo que basados en
el siguiente teorema:
“ Si X es una variable aleatoria con distribución
normal con media y varianza , entonces es
2
x
z
Ejemplo
La altura en centímetros de las plantas de maíz
en una milpa están aproximadamente
normalmente distribuidas, con 180 y 20 ,
¿Cuál es la probabilidad de que una planta de
maíz seleccionada al azar de esta milpa tenga
una altura
a)Entre 160 y 200?
b)Mayor que 170?
c)Menor que 150?
Aproximación de la Distribución Binomial mediante la
Distribución Normal.
a b
Una variable aleatoria de este tipo se
denomina variable uniforme y su función
de densidad es:
1
si a x b
f ( x) b a
0 en otro caso
Donde:
ab (b a ) 2
2
2 12
EJEMPLO
Una compañía manufacturera ha inventado una máquina
con gran eficiencia de combustible que combina el
lavado a presión con la limpieza a vapor. La máquina
está diseñada para suministrar siete galones de
limpiador por minuto a 1000 libras por pulgada
cuadrada para el lavado a presión. En realidad la
máquina suministra una cantidad aleatoria entre 6,5 y
7,5 galones por minuto suponga que x, la cantidad de
limpiador suministrado es una variable aleatoria
uniforme con densidad de probabilidad.
a)Calcule la media y desviación estándar
b)Calcule la probabilidad de suministrar más de 7,2
galones de limpiador por minuto.
DISTRIBUCIONES MUESTRALES
Se denomina distribución muestral de un estadígrafo
o estadístico a la distribución de probabilidad de los
valores posibles que pueden ser tomados por dicho
estadígrafo o estadístico, obtenidos a partir de
muestras del mismo tamaño, que han sido extraídos
aleatoriamente de una población.
Pasos para construir una distribución muestral:
a) Dada una población finita, discreta, de tamaño
N, se extraen aleatoriamente todas las muestras
de tamaño n. Si el muestreo es con reemplazo el
número de muestras posibles es Nn y para
muestreos sin reemplazo e ignorando el orden
el numero de muestras es N
n
b)Se calcula el estadígrafo de interés para cada
muestra
c)Se construye una tabla de valores del
estadígrafo de interés con sus respectivas
probabilidades.
d)Se calculan los parámetros de la distribución.
Se tiene una población conformada por
los dígitos 5,7,8 y 9 cuya media es 7,25 y
varianza 2,1875. Determine todas las
muestras de tamaño 2 sin reemplazo e
ignorando el orden de la población.
Obtenga la distribución muestral de la
media.
INFERENCIA ESTADÍSTICA
x1 x2 x3 x4 x5 x6 x7 x8
AL 95 % DE CONFIANZA
x 1,96( / n ) x 1,96( / n )
AL 99 % DE CONFIANZA
x 2,58( / n ) x 2,58( / n )
Intervalo de confianza para cuando la
varianza poblacional es desconocida y la
muestra pequeña
H1: 0
Pruebas unilaterales
Unilateral de cola izquierda
Ho: 0
H1: 0
H1: 0
E)Conclusión.- Es dar un resultado entendible,
de modo que toda persona pueda
comprenderlo.
x
z
n
b)cuando la varianza poblacional es desconocida y n<30
x
t
s
n
Ejemplo
Se ha realizado un experimento muy costoso para
evaluar un nuevo proceso que produce diamantes
sintéticos, con el nuevo proceso se han generado seis
diamantes con pesos: 0,46 0,61 0,52 0,48 0,57 y
0,54 quilates. Un estudio de los costos del proceso
indica que el peso debe ser mayor que 0,6 quilates,
para que el proceso rinda utilidades ¿Presentan los
pesos observados evidencia de que el peso medio de
los diamantes producidos por el nuevo proceso es
superior a 0,6 quilates?
REGRESIÓN LINEAL SIMPLE
El análisis de Regresión, nos permite establecer la
forma de relación entre variables. Estudia la
relación funcional entre las variables y=f(x) o
x=f(y), de modo que se pueda predecir el valor de
una en base a las otras u otra.
Por convención la variable que se va a predecir se
denomina variable dependiente y aquellas que
forman parte de loa predicción se denominan
variables o variable independiente.
Y=a+bx