Académique Documents
Professionnel Documents
Culture Documents
Estadstica
Descriptiva
Martnez Stone Claudia Montserrat
Origen de la
Estadstica
En su origen, la estadstica surge como
una disciplina enfocada a conocer los
recursos del Estado mediante su
cuantificacin, de ah su nombre.
Posteriormente con la diversificacin de
sus aplicaciones, se dio por llamar
estadsticas a las tablas en las que se
codifica la informacin, extendindose
este nombre a la disciplina en general de
recopilar, ordenar, analizar e interpretar
informacin cuantitativa.
Definiciones de Estadstica
Noreau de Jonneis (1847).- "La
Estadstica es la ciencia de los hechos
sociales, expresados en trminos
numricos".
Romeln (1863).-"La Estadstica describe
las caractersticas de la sociedad
humana a base de observaciones
metodolgicas y de enumeraciones de
fenmenos similares".
Definiciones de Estadstica
Arthur Bowley (1901).- "La Estadstica
es la ciencia de los promedios, la
ciencia de los grandes nmeros".
Mtodo Estadstico
Identificacin y definicin del
problema.
Formulacin de objetivos e
hiptesis.
Recopilacin de la informacin.
Organizacin y aplicacin de las
herramientas estadsticas.
Anlisis e interpretacin.
Conclusiones.
Toma de decisiones.
ESTADSTICA
Poblacin, se
refiere a una
totalidad, es decir,
al conjunto de
todos los
elementos que la
conforman, o, a
todos los valores
que puede tomar
la variable en
estudio
Muestra, parte
representativa
de la
poblacin, o un
subconjunto
de ella
VARIABLE
Elemento de inters que puede
tomar valores diferentes.
Cuantitativa;
es aquella
cuyos valores
se pueden
expresar como
cantidades
numricas
Cualitativa; solo
puede clasificarse
pero no medirse, no
proporciona
informacin
cuantificable, se
refiere solamente a
las caractersticas de
la variable
VARIABLES
CUANTITATIVAS
Continuas, pueden asumir
cualquier valor dentro de un cierto
intervalo, caracterizndose porque
pueden ser decimales e infinitas
EJEMPLOS DE VARIABLES
CONTINUAS
Precio de una accin en
una muestra de varios
das.
Peso de cajas de fruta
empacadas para su
exportacin.
Velocidad de un
automvil en ciertos
tramos de una carretera.
El tiempo de duracin de
5,000 lmparas
incandescentes.
DISCRETAS
Nmero de autos
vendidos en un mes por
una agencia.
Nmero de cuadernos
utilizados al semestre
por un estudiante.
Nmero de puntos
anotados en un juego
de baloncesto.
Nmero de personas
que asisten cada
semana a los servicios
religiosos de cierto
templo.
SERIES DE TIEMPO:
Aquellas cuya informacin
muestra un orden cronolgico o
una evolucin temporal de la
variable.
VARIABLES
CUANTITATIVAS
SERIES DE CORTE TRANSVERSAL:
Aquellas cuya informacin se toma en un
mismo momento del tiempo entre diferentes
miembros de una poblacin o lugares.
SERIE DE CLASES Y
FRECUENCIAS O DE
DATOS AGRUPADOS
SERIE DE
FRECUENCIAS
SERIE
SIMPLE
SERIE ESTADSTICA
Serie Simple
Como su nombre lo indica, es la ms
sencilla, y se define como:
Conjunto de datos ordenados
de manera ascendente o
descendente, que miden las
variaciones de un fenmeno
o variable
Serie o Distribucin de
Frecuencias
CONJUNTO DE DATOS ORDENADOS QUE
MIDEN LOS CAMBIOS EN UN
FENMENO O VARIABLE,
RELACIONNDOLOS O PONDERNDOLOS
CON SU FRECUENCIA
Frecuencia, es el nmero de veces que un trmino
o valor que adopta una variable se repite o existe en
una serie estadstica; se representa como y f.
SERIE DE CLASES Y
FRECUENCIAS
CONJUNTO DE DATOS ORDENADOS,
AGRUPADOS EN SUBCONJUNTOS QUE
MIDEN LOS CAMBIOS DEL FENMENO
O VARIABLE Y RELACIONNDOLOS CON
SU FRECUENCIA
Clase, es un subconjunto de algunas observaciones de la variable,
cercanos unos a otros, de acuerdo con sus caractersticas.
Intervalo de clases, es el rango de valores encontrados dentro de
una clase.
Intervalo de Clase
1. Buscamos el valor ms pequeo o el
primer valor en una serie ordenada
previamente (frontera inferior) y el
valor ms grande (frontera superior).
2. Calculamos el rango o recorrido de la
serie (Rango = F. Sup. F. Inf.).
3. Dividimos el rango entre el nmero
de clases que se desea tener.
Intervalo de clase =
Rango
Nmero de clases que se desean
EJEMPLO:
Los siguientes datos se refieren a la
duracin en horas de 40 focos tomados
por el departamento de control de
calidad de su fbrica.
Serie Simple
n
1
2
3
4
5
6
7
8
9
10
xi
54
54
62
62
62
66
66
66
66
66
n
11
12
13
14
15
16
17
18
19
20
xi
73
73
73
73
73
73
73
73
73
78
n
21
22
23
24
25
26
27
28
29
30
xi
78
78
78
78
78
78
78
83
83
83
n
31
32
33
34
35
36
37
38
39
40
xi
83
83
83
90
90
90
96
96
96
107
SERIE O DISTRIBUCIN DE
FRECUENCIAS
xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
yac
2
5
10
19
27
33
36
39
40
yrel.
2/40=0.050
3/40=0.075
5/40=0.125
9/40=0.225
8/40=0.200
6/40=0.150
3/40=0.075
3/40=0.075
1/40=0.025
40/40=1.00
%
5.0
7.5
12.5
22.5
20.0
15.0
7.5
7.5
2.5
100.0
Rango
Nmero de clases que se desean
53
8.83
6
Ejercicios de Aplicacin
Representacin Grfica
Nos permite observar
rpidamente el comportamiento
de la serie estadstica.
Histograma
Polgono de frecuencias
Ojiva
Grfica por sectores
Grfica de Pareto
Histograma
DURACION DE FOCOS
100
50
DATO
40
37
34
31
28
25
22
19
16
13
10
0
1
HORAS
150
Histograma de
Frecuencias
y FRECUENCIA
DURACION DE FOCOS
10
5
0
54
62
66
73
78
83
Xi HORAS
90
96
107
Histograma de
Frecuencias
DURACION DE FOCOS
FRECUENCIA
20
15
10
5
0
58.41
67.25
Polgono de Frecuencias
DURACION DE FOCOS
FRECUENCIAS
10
8
6
4
2
0
54
62
66
73
78
HORAS
83
90
96
107
Ojiva
FRECUENCIA
ACUMULADA
DURACION DE FOCOS
50
40
30
20
10
0
54
62
66
73
78
HORAS
83
90
96
107
Grfica de Sectores
DURACION DE FOCOS
96
8%
90
8%
107
3%
54
5%
62
8%
66
13%
83
14%
73
22%
78
19%
INFORMACIN
CUALITATIVA
Se representa grficamente
por:
Histogramas
Grficas de Pareto
Grficas de Sectores
Histograma
ENCUESTA DE CALIDAD
MALA
SUFICIENTE
REGULAR
BUENA
EXCELENTE
0
10
15
Grfica de pareto
FRECUENCIA
ENCUESTA DE CALIDAD
16
14
12
10
8
6
4
2
0
Grfica de Sectores
ENCUESTA DE CALIDAD
MALA
7%
SUFICIENTE
15%
EXCELENTE
24%
REGULAR
20%
BUENA
34%
DATOS BIVARIADOS
Se obtienen cuando se miden dos
variables en una sola unidad
experimental.
Cuando se miden ms de dos
variables se denominan
multivariados.
Representacin grfica:
Grficas de barras
Grficas de lnea
Grficas de rea
Grfica de Barras
800
600
COSTOS
400
INGRESOS
200
0
1995 1996 1997 1998 1999 2000
Grfica de Lneas
800
PESOS
600
400
200
0
1995
1996
1997
1998
1999
AO
COSTOS
INGRESOS
2000
Grfica de Barras
PESOS
1500
1000
500
0
1995
1996
1997
1998
1999
AO
COSTOS
INGRESOS
2000
GRFICA DE BARRAS
100%
80%
60%
40%
20%
0%
1995
1996
1997
1998
1999
AO
COSTOS
INGRESOS
2000
Grfica de reas
800
600
400
200
0
1995
1996
1997
1998
AO
INGRESOS
COSTOS
1999
2000
Ejercicios de Aplicacin
Histograma
Polgono
Grfica de Sectores
Ejemplo 1: Precios de
Automviles
20,197
20,372
17,454
20,591
24,453
14,266
15,021
25,683
27,872
16,587
20,169
32,851
16,281
21,285
21,324
21,609
25,670
12,546
12,935
16,873
22,251
22,277
21,533
24,443
16,889
17,004
14,357
17,155
16,688
20,657
23,613
17,203
20,765
22,783
23,661
29,277
17,642
18,981
21,052
22,799
15,263
33,625
14,399
14,968
17,356
18,442
18,722
16,331
19,817
17,633
17,962
19,845
23,285
24,896
26,076
29,492
15,890
18,740
21,571
22,449
25,337
17,642
20,613
21,220
27,655
19,442
14,891
23,237
17,445
18,556
18,639
21,296
Medidas de Tendencia
Central
Las medidas de tendencia central
se usan para buscar el valor
central de la serie o distribucin
estadstica. Son:
la media,
la mediana y
la moda.
Media
Es el valor central, terico y exacto
que representa el centro de una serie
estadstica.
Puede ser:
Aritmtica
Geomtrica
Armnica
Propiedades de la
Media
Propiedades de la Media
Media Aritmtica
Es un nmero tal que si sumamos
tantas veces como trminos tenga
la serie estadstica, su suma no
se altera.
Es lo que se conoce como promedio
simple, se calcula:
n
xi
i 1
MEDIA ARITMTICA
Sea la sucesin cuyos trminos son:
x1, x2, x3 ... xn.
Designando con
a la media aritmtica
obtenemos:
x + x + x + x + x + x = x 1+ x2 + x3 +...+ xn
Por lo tanto: para una serie simple:
nx = x1+ x2 + x3 +...+ xn
n
Despejando la x queda la frmula:
xi
i 1
MEDIA ARITMTICA
EJEMPLO SERIE SIMPLE
Duracin de 40 focos ...
n
1
2
3
4
5
6
7
8
9
10
xi
54
54
62
62
62
66
66
66
66
66
n
11
12
13
14
15
16
17
18
19
20
xi
73
73
73
73
73
73
73
73
73
78
n
21
22
23
24
25
26
27
28
29
30
n
31
32
33
34
35
36
37
38
39
40
n = 40
xi = 3,068
xi
78
78
78
78
78
78
78
83
83
83
xi
i 1
3,068
76.7
40
xi
83
83
83
90
90
90
96
96
96
107
MEDIA ARITMTICA
SERIE DE FRECUENCIAS
Las frecuencias
nos indican
cuntas veces se
repiten los datos,
por lo que la
suma de Y, nos
indica el total de
datos.
xiy
x
y
i 1
MEDIA ARITMTICA
EJEMPLO SERIE DE FRECUENCIAS
Duracin de 40 focos ...
xi
y
xiy
54
2
108
62
3
186
66
5
330
73
9
657
78
8
624
83
6
498
90
3
270
96
3
288
107
1
107
40
3,068
y = 40
xiy = 3,068
n
xiy 3,068
x
76.7
y 40
i 1
MEDIA ARITMTICA
SERIE DE CLASES Y FRECUENCIAS
Dado que ahora la variable
agrupa a un subconjunto de
valores (datos), es
necesario, representarla con
la marca de clase xim.
Marca de clase, valor
representativo de los datos
que se agrupan en la clase,
se calcula con la media
aritmtica de los lmites de
cada clase.
FRMULAS
L. inf . L. sup .
xim
2
n
ximy
x
y
i 1
MEDIA ARITMTICA
EJEMPLO SERIE DE
CLASES Y FRECUENCIAS
Duracin de 40 focos ...
xi
De 54 a 62.82
De 62.83 a 71.66
De 71.67 a 80.49
De 80.50 a 89.32
De 89.33 a 98.16
De 98.17 a 107
y
5
5
17
6
6
1
40
xim
58.41
67.25
76.08
84.91
93.75
102.59
n
y = 40
ximy = 3,096.15
ximy
292.05
336.23
1,293.36
509.46
562.47
102.59
3,096.16
ximy 3,096.16
x
77.40
40
y
i 1
Ejercicios Media
2.-Determinar el salario medio por hora pagado a carpinteros que obtuvieron los
siguientes pagos por hora:
$15.40, $20.10, $18.75, $22.76, $20.67, $18.00
MEDIANA
Valor central que divide una serie estadstica
en dos partes exactamente iguales.
Es un valor real central exacto.
Es tambin una medida de posicin.
Para calcular la mediana, necesitamos primero ubicar el
lugar en dnde se encuentra, ya que esta dems es una
medida de posicin, lo cual se logra determinando su
nmero de orden:
Serie simple
n 1
# orden Md
2
# orden
y 1
Md
2
MEDIANA
Duracin de 40 focos ...
n 1 40 1
# orden Md
20.5 21
2
2
xi
yac
54
62
66
73
2
3
5
9
78
27
83
90
96
107
SUMA
6
3
3
1
40
33
36
39
40
2
5
10
19
Md = 78
MEDIANA
SERIE DE CLASES Y FRECUENCIAS
y
Md Li 2
Yac
Fi
(i )
Donde:
Md.=Mediana
Li = Lmite inferior de la clase que contiene a la mediana;
y = Nmero de trminos suma de las frecuencias
yac = Frecuencia acumulada de la clase anterior a la que
contiene la mediana.
Fi = Frecuencia de la clase que tiene a la mediana.
i = Amplitud del intervalo de la clase que contiene la Md.
MEDIANA
SERIE DE CLASES Y FRECUENCIAS
Duracin de 40 focos ...
Clase
mediana
xi
yac
De 54 a 62.82
De 62.83 a 71.66
5
5
10
De 71.67 a 80.49
17
27
De 80.50 a 89.32
33
De 89.33 a 98.16
De 98.17 a 107
1
40
39
40
# orden
y 1 40 1
Md
20.5 21
2
40
yac
10
Md Li 2
(i ) 71 .67 2
8.83 76 .86
Fi
17
Ejercicios Mediana
1.- Una muestra de personas solteras, que recibe pagos por seguro social, revelo los siguientes
ingresos mensuales:
$426, $299, $290, $687, $480, $439, y $565
Cual es la mediana de los ingresos?
Cuntas observaciones estn por debajo de la mediana? cuntas por arriba?
2.- El nmero de paros laborales en la industria automotriz para meses seleccionados son:
10, 14, 8 y 0
Cul es la mediana del nmero de paros?
Cuntas observaciones estn por debajo de la mediana? Cuntas por arriba?
Cul es el valor modal de los paros en el trabajo?
6, 0,
3- El contador en jefe de una empresa, quiere preparar un informe acerca de las cuentas pro cobrar
de la compaa. A continuacin, se presenta una distribucin de frecuencias que muestra la
cantidad sobresaliente
Cantidad
Frecuencia
$
0 a $2000
4
$2000 a $4000
15
$4000 a $6000
18
$6000 a $8000
10
$8000 a $10,000
4
$10,000 a $12,000
3
MODA
Es el valor de mxima frecuencia.
Es el trmino que ms aparece o se repite
en una distribucin.
En la serie simple y la distribucin de
frecuencias, no existe frmula para
determinarla, sino que se obtiene mediante
la observacin de la frecuencia ms alta o
del trmino que ms veces se repite.
MODA
En el caso de la serie de clases y frecuencias
se utiliza una frmula de interpolacin:
donde:
d1
Mo. Li
(i)
d1 d 2
MODA
Duracin de 40 focos ...
Clase
modal
xi
de 54 a 62.82
de 62.83 a 71.66
de 71.67 a 80.49
de 80.50 a 89.32
de 89.33 a 98.16
de 98.17 a 107
SUMA
y
5
5
17
6
6
1
40
yac
5
10
27
33
39
40
d
12
1
Mo. Li
(i ) 71 .67
8.83 76 .28
d d
12 11
1
2
Ejercicio Moda
Frecuencia
15
33
19
7
11
4
1
MEDIDAS DE DISPERSIN
RANGO O RECORRIDO
Es la medida de dispersin ms sencilla, y
nos indica el campo de variacin del
Rango, definida como la diferencia entre el
mayor y el menor de los valores
observados.
Esta medida, no refleja en modo alguno la
forma de la distribucin.
Rango= Valor Max. Valor Min.
DESVIACIN MEDIA
Se define como la suma de las
desviaciones en trminos absolutos de
los datos que integran la serie, respecto
a la media, entre el nmero de trminos
de la serie.
Serie simple
xi x
D.M .
n
Serie de frecuencias
xi x
D.M .
y
Desviacin Media
Serie de Frecuencias
Xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
(Xi-Xm)
-22.7
-14.7
-10.7
-3.7
1.3
6.3
13.3
19.3
30.3
I Xi-Xm I
22.7
14.7
10.7
3.7
1.3
6.3
13.3
19.3
30.3
I Xi-Xm I y
45.4
44.1
53.5
33.3
10.4
37.8
39.9
57.9
30.3
352.6
Xi X y 352.6
D.M .
8.815
40
y
Desviacin Media
Serie de clases y Frecuencias
Xi
Xim
De 54.00 a 62.82 58.41
De 62.83 a 71.66 67.25
De 71.67 a 80.49 76.08
De 80.50 a 89.32 84.91
De 89.33 a 98.16 93.75
De 98.17 a107.00 102.59
SUMA
y
5
5
17
6
6
1
40
(Xim-Xm)
-19.00
-10.16
-1.33
7.50
16.34
25.18
I Xim-Xm I I Xim-Xm I y
19.00
94.98
10.16
50.78
1.33
22.53
7.50
45.03
16.34
98.07
25.18
25.18
336.56
Xim X y 336.56
D.M .
8.414
40
y
DESVIACIN MEDIA
RELATIVA
SERIE DE
FRECUENCIAS
DM
DMR
100
X
8.815
DMR
100
76.7
DMR 11.49%
DM
SERIE
DE
DMR
100
CLASES YX
FRECUENCIAS
8.414
DMR
100
77.41
DMR 10.87%
DESVIACIN ESTNDAR ()
DESVIACIN ESTNDAR ()
2
(
Xi
X
)
Serie de frecuencias
(( xim X )
y
y)
Serie simple
(( Xi X )
y
y)
Serie de clases y
frecuencias
COEFICIENTE DE VARIACIN
Se define como la razn porcentual
entre la desviacin estndar y la
media aritmtica:
C .V . * 100
X
DESVIACIN ESTNDAR
SERIE DE FRECUENCIAS ( )
Xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
(Xi-Xm)
-22.7
-14.7
-10.7
-3.7
1.3
6.3
13.3
19.3
30.3
(Xi-Xm)^2
515.29
216.09
114.49
13.69
1.69
39.69
176.89
372.49
918.09
(Xi-Xm)^2y
1030.58
648.27
572.45
123.21
13.52
238.14
530.67
1117.47
918.09
5,192.40
2
y
(
Xi
X
)
5,192.4
11.39
40
y
DESVIACIN ESTNDAR ( )
SERIE DE CLASES Y FRECUENCIAS
Xi
Xim
De 54.00 a 62.82 58.41
De 62.83 a 71.66 67.25
De 71.67 a 80.49 76.08
De 80.50 a 89.32 84.91
De 89.33 a 98.16 93.75
De 98.17 a107.00 102.59
SUMA
y
5
5
17
6
6
1
40
y( xim X )
y
4,924.7
11.10
40
Coeficiente de
Variacin
SERIE DE
FRECUENCIAS
CV 100
X
11.39
CV
100
76.7
CV 14.85%
SERIE
DE
CV 100
X
CLASES
Y
FRECUENCIAS
11.10
CV
100
77.41
CV 14.33%
REGLA EMPRICA:
Para
una
distribucin
de
frecuencias
simtrica
de
campana, cerca de 68% de las
observaciones estar dentro de
X
1 de la media (); cerca de
95%
de
las
observaciones
estar dentro de 2 de la
media (); alrededor de 99.7%
estar dentro de 3 de la
media ().
Teorema de Chebyshev
Para
cualquier
conjunto
de
observaciones,
la
proporcin
mnima de valores que est dentro
de k desviaciones estndar desde
la media es al menos 1 - 1/k , donde
k2 es una constante mayor que 1.
Ejercicios Dispersin
1. El reporte anual de la empresa A, dio los siguientes rendimientos de capital para los accionistas,
en un periodo de 5 aos pasados: 13.2, 5.0, 10.2, 17.5 y 12.9.
a) Calcular la amplitud de variacin, la media aritmtica, la desviacin media y la desviacin estndar
2. La Empresa B, report los siguientes rendimientos del capital para los accionistas, para cinco aos
pasados: 4.3, 4.9, 7.2, 6.7 y 11.6.
a) Calcular la amplitud de variacin, la media aritmtica, la desviacin media y la desviacin
estndar.
b) Comparar los rendimientos de la empresa B con los de la empresa A del ejercicio anterior
3. A cada persona que se presenta como aspirante a un trabajo de ensamble en una empresa
mueblera, se le aplica un examen de aptitudes mecnicas. Una parte de la prueba consiste en
ensamblar un armario basndose en instrucciones numeradas. En la siguiente distribucin de
frecuencias se tiene una muestra de los tiempos que necesitaron 42 personas para ensamblar un
armario.
Tiempo
(En minutos)
2a4
4a6
6a8
8 a 10
10 a 12
12 a 14
Nmero
4
8
14
9
9
2
ASIMETRA
Nos indica la
tendencia o sesgo de
Se puede determinar
la serie estadstica.
comparando las
medidas de tendencia
central.
Indica la
desproporcionalidad
entre los valores
distribuidos
alrededor de la
Se puede medir
media ya sea que
mediante los
Coeficientes de
tiendan a los valores
Pearson o el Mtodo ms pequeos, a los
de momentos.
ms grandes, o si se
distribuyen
proporcionalmente.
ASIMETRA
SESGO CERO
Moda = Mediana = Media
ASIMETRA POSITIVA
Sesgo a la derecha:
Mo<Md<Xm
ASIMETRA NEGATIVA
Sesgo a la izquierda:
Xm<Md<Mo
ASIMETRIA
COEFICIENTES DE PEARSON
Nos dan una medida relativa del sesgo.
3 X Md
A1
X Mo
A2
Criterios de
clasificacin
A = 0 Simetra
A > 0 Asimetra
positiva
A < 0 Asimetra
negativa
ASIMETRIA
COEFICIENTES DE PEARSON
(Serie de frecuencias)
3 X Md 3 76.7 78
A1
0.3424
11.39
A1 Asimetra
A2
X Mo
A2 Asimetra
Negativa
76.7 73
0.3248
11.39
Positiva
ASIMETRIA
COEFICIENTES DE PEARSON
(Serie de clases y
frecuencias)
3 X Md 3 77.47 76.86
A1
0.1649
11.10
A1 Asimetra
A2
Positiva
X Mo 77.47 76.28
0.1072
A2 Asimetra
11.10
Positiva
ASIMETRIA
MTODO DE MOMENTOS
Se mide en el
tercer
momento.
xi
x
n
Corresponde Serie de
al promedio frecuencias
de las
desviacione
s elevadas
al cubo.
M3
xim
x
y
Serie
simple
xi
x y
y
3
Serie de
clases y
frecuencias
ASIMETRIA
MTODO DE MOMENTOS
Coeficiente de
Asimetra
M3
A 3
Criterios de
clasificacin
A = 0 Simetra
A > 0 Asimetra
positiva
A < 0 Asimetra
negativa
Asimetra
(Serie de Frecuencias)
Xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
(Xi-Xm)
-22.7
-14.7
-10.7
-3.7
1.3
6.3
13.3
19.3
30.3
(Xi-Xm)^3
-11,697.08
-3,176.52
-1,225.04
-50.65
2.20
250.05
2,352.64
7,189.06
27,818.13
(Xi-Xm)^3y
-23,394.17
-9,529.57
-6,125.22
-455.88
17.58
1,500.28
7,057.91
21,567.17
27,818.13
18,456.24
Asimetra
18,456.24
461.41
M
461.41; A
0.3123
11.39
40
Positiva
3
Asimetra
(Serie de Clases y Frecuencias)
Xi
Xim
De 54.00 a 62.82 58.41
De 62.83 a 71.66 67.25
De 71.67 a 80.49 76.08
De 80.50 a 89.32 84.91
De 89.33 a 98.16 93.75
De 98.17 a107.00 102.59
SUMA
y
5
5
17
6
6
1
40
5,163.76
M3
129.09;
40
129.09
A
0.0944
3
11.10
Asimetra Positiva
KURTOSIS
Indica la desproporcionalidad horizontal
entre los valores distribuidos alrededor
de la media ya sea que tiendan a
concentrarse alrededor de la media, a
estar dispersos, o si se distribuyen
equitativamente alrededor de la media.
Se clasifican en:
Leptokrticas,
Mesokrticas y
Platikrticas
LEPTOKURTICA
Curvas apuntadas
con alta
concentracin
MESOKURTICA
PLATIKURTICA
Curvas
dispersas y aplanadas
KURTOSIS
Leptokrtica
Mesokrtica
Platikrtica
KURTOSIS
Se mide en el
cuarto
momento.
Corresponde al
promedio de las
desviaciones
elevadas a la
cuarta
potencia.
M4
Xi X
Serie de
frecuencias
M4
Xim X
y
M4
Serie
simple
Xi X
y
Serie de
clases y
frecuencias
Coeficiente de Kurtosis
M4
K 4 3
CRITERIOS DE
CLASIFICACIN
K=0 Mesokrtica
K>0 Leptokrtica
K<0 Platikrtica
KURTOSIS
(Serie de frecuencias)
Xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
52,520.98
A
3 0.1206
2,100,839.27
4
M4
52,520.98
11.39
40
Curva Leptokurtica
KURTOSIS
(Serie de clases y frecuencias)
Xi
Xim
De 54.00 a 62.82 58.41
De 62.83 a 71.66 67.25
De 71.67 a 80.49 76.08
De 80.50 a 89.32 84.91
De 89.33 a 98.16 93.75
De 98.17 a107.00 102.59
SUMA
M4
y
5
5
17
6
6
1
40
1,553,734.62
38,843.37
40
38,843.37
A
3 0.4413
4
11.10
Curva Platikurtica
Ejercicios de aplicacin
Caso 1
Una Compaa de plomera, que fue fundada hace 40 aos ha crecido hasta
ms de 500 empleados actualmente. Se esta considerando el asunto de
varios puestos dentro de la compaa donde tiene a hombres y mujeres
desarrollando el mismo trabajo pero recibiendo una retribucin diferente.
Para investigar, recolecto la siguiente informacin. Suponga que usted tiene
la tarea de escribir un informe resumiendo la situacin.
Sueldo Anual
(Miles de dlares)
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
Mujeres
2
0
3
1
17
4
17
24
8
21
3
7
0
3
Hombres
Caso 2
En una reunin de ventas de una compaa, se le pregunt al ejecutivo en jefe cul
era la poltica de la compaa acerca de las comisiones pagadas a sus representantes
de ventas. La empresa vende artculos deportivos a dos mercados importantes. Hay
40 representantes de ventas que tratan directamente con clientes grandes y 30
personas de ventas que se dedican al menudeo.
Se solicito la elaboracin de un informe, comparando las comisiones ganadas el ao
pasado por las dos partes del equipo de ventas. La informacin se presenta a
continuacin. Existe diferencia? Asegrese de incluir informacin en el informe
respecto a la dispersin y tendencia central en los dos grupos.
Comisiones
354 87
1105434
1738526
Probabilidad
Mide la posibilidad de ocurrencia de algn
fenmeno o variable, basndose en la
observacin de sus eventos anteriores.
La teora de probabilidades tiene su origen
en los juegos de azar, al tomar su mecnica.
Se refiere a los posibles resultados de un
experimento o evento que forman el conjunto
universo, pero no conocemos lo que
suceder con certeza hasta que ocurre.
Experimento; forma
de observacin directa
en la que se conocen
los factores que influyen
en su resultado, se
basa en la experiencia.
Aleatorio; que
tiene que ver
con el azar.
Espacio Muestral;
contiene todos los posibles resultados de
un experimento aleatorio, se representa
por S (U ), se conoce tambin como
Conjunto Universo en el que cada
elemento es un punto muestral o evento.
S 1,2,3,4,5,6
Variable Aleatoria
Discreta; Sus valores
se interrumpen
o separan, es finita
Variable Aleatoria
Continua; Sus valores
posibles no se
interrumpen, es
infinita
Variable Aleatoria;
Funcin real valorada
definida en el espacio
de muestra. Se da
cuando se conoce su
espacio muestral en
forma total y
exhaustiva, y se conoce
adems la probabilidad
de ocurrencia de cada
punto contenido en el
espacio muestral
Definiciones de
Probabilidad
Matemtica o terica
Como frecuencia relativa
Teora Clsica de la
Probabilidad
Teora Estadstica o
Subjetiva de la
Probabilidad
Teora Axiomtica de la
probabilidad
PROBABILIDAD
MATEMTICA O TERICA
Es aquella en la que podemos contar
exactamente todas las formas diferentes
en las que un evento puede o no
suceder, y que adems podemos
suponer que todas las formas posibles
ocurrirn sobre bases igualmente
probables
PROBABILIDAD COMO
FRECUENCIA RELATIVA
Si contamos el numero de veces en que se
presenta un evento en un numero n de
experimentos aleatorios, determinamos su
frecuencia absoluta que simbolizamos con f.
En tanto que el cociente f/n, que establece la razn
entre la frecuencia de ocurrencia del evento y el
total de experimentos se le denomina
frecuencia relativa
EJEMPLO
Lanzamos 20 veces un dado y anotamos
sus resultados:
Resultado
1
2
3
4
5
6
Suma
Frecuencia
Absoluta
2
3
4
5
3
3
20
Frecuencia Relativa o
Probabilidad
2/20 = 0.10
3/20 = 0.15
4/20 = 0.20
5/20 = 0.25
3/20 = 0.15
3/20 = 0.15
20/20 = 1
TEORA CLSICA DE LA
PROBABILIDAD
Si un experimento da lugar a n
eventos mutuamente excluyentes e
igualmente probables, en los que r
se consideran xitos, entonces, la
probabilidad de tener un evento
exitoso es:
P=r/n
TEORA ESTADSTICA O
SUBJETIVA DE LA PROBABILIDAD
TEORA AXIOMTICA DE LA
PROBABILIDAD
1 ) 0 P( A ) 1
2 ) P( S ) 1
3 ) P( ) 0
4 ) P( Ac ) 1 P( A )
REGLA DE ADICIN
Especial
P AB P A P B
P AB P A P B P AB
REGLA DE
MULTIPLICACIN
Especial
P AB P A P B
Cuando A y B son eventos independientes
General
P AB P A P B / A ; y A>0
P AB P B P A / B ; y B>0
Principio de
independencia
PROBABILIDAD CONDICIONAL
Es la probabilidad de ocurrencia
de B dependiendo de la
ocurrencia de A
(Principio de independencia)
PRINCIPIO DE INDEPENDENCIA
Regla:
Sea un evento cualquiera del espacio
muestral S, con P(x) > 0.
La probabilidad de que ocurra un evento B
cuando A ya ha ocurrido, se le llama
probabilidad condicional o principio de
independencia.
P( A B)
P ( B / A)
P( A)
Ejercicios Probabilidad
1.- Una tienda de departamentos, vende camisas deportivas en 3 tallas, (pequea,
mediana y grande), en tres modelos (a cuadros, estampada y de franjas) y con dos
largos de manga (corta y larga)
Manga Corta
Modelo
Talla
Pequea
Mediana
Grande
Total
Cuadros
4
9
3
16
Estampada
3
8
7
18
Franjas
5
12
9
26
Total
12
29
19
60
Manga Larga
Modelo
Talla
Pequea
Cul es la
probabilidad
Mediana
Grande
estampada?
Total
Cuadros
3
de 10
que
4
17
la
Estampada
2
camisa vendida
5
2
9
sea
Franjas
3
mediana
8
8
19
Total
8
de manga
23
14
45
larga y
TEOREMA DE BAYES
Se refiere a la probabilidad condicional; se usa
para reformular un conjunto de probabilidades a
priori; para un conjunto de probabilidades a
posteriori.
Su reformulacin se basa en informacin adicional
que se puede obtener de registros pasados o
muestras
Ejercicios de Probabilidad
1.- En un programa de capacitacin para el personal del rea administrativa
en la empresa Claremont Enterprises, 80% de los capacitados son mujeres,
y 20% varones. El 90% de las mujeres asisti a una universidad, y 78% de
los varones tambin.
Una persona del programa se selecciona al azar. cul es la probabilidad de
que un empleado seleccionado sea una mujer dado que no asisti a una
universidad?
4.- El comisario de la polica, clasifica como delitos por edad (en aos) del malhechor, y su el crimen
es con violencia o no. Segn se muestra a continuacin, al comisario se le informo de un total de 150
delitos cometidos durante el pasado ao.
Edad (en aos)
Tipo de delito
Menos de
20
40
40 o mas
Total
Con violencia
27
41
14
82
Sin violencia
12
34
22
68
Total
39
75
36
150
5.- Una persona que vive en Los ngeles, realiza viajes frecuentes de consultora a Washington, D.C.,
50% de las veces viaja en la aerolnea 1, 30% en la aerolnea 2 y 20% en la aerolnea 3. Para la
aerolnea 1, los vuelos llegan con un retraso a Washington D.C., el 30% de las veces, para la aerolnea
2, 25% de las ocasiones tienen retraso y en la aerolnea 3, 40% de las veces.
Cul es la probabilidad de que en un viaje cualquiera, el vuelo haya llegado retrasado a
Washington
y este haya sido por la aerolnea 3?
DISTRIBUCIN DE
PROBABILIDAD
Conjunto de probabilidades asociadas a la
frecuencia con que ocurre cada elemento de
la variable aleatoria
Asociacin entre el valor que toma la variable
aleatoria y su probabilidad de ocurrencia.
Distribuciones de
Probabilidad:
P(x)
Se ubica en el
cuadrante (++) del
plano cartesiano
Discre
ta
Es entera, finita y
positiva
S=
1
Nace en el origen y
termina en n donde
corta el eje de las
abscisas y completa el
rea bajo la curva
Su rea bajo la curva
Distribuciones de
Probabilidad:
Contnua
P(x)
S1
Se localiza en los
cuadrantes (+,+) y
(+,-) del plano
cartesiano
No es finita y puede
ser decimal.
Nace en - y va
hasta , nunca corta
X el eje de las x
Su rea bajo la
curva tiende a 1
Distribuciones de
Probabilidad Discretas
ESPERANZA MATEMTICA
Es la media probabilstica, y se refiere al valor
medio que se espera que ocurra.
Es el valor esperado que divide en el centro en 2
partes iguales a una distribucin de probabilidades.
E ( x ) X i P xi
Distribuciones de
Probabilidad Discretas
ESPERANZA MATEMTICA, CARACTERISTICAS:
Distribuciones de
Probabilidad Discretas
ESPERANZA MATEMTICA, PROPIEDADES:
3. Si x y Y son variables aleatorias independientes:
= E(X) E(Y)
E(XY)
Distribuciones de
Probabilidad Discretas
VARIANZA
Es la media del
cuadrado de las
desviaciones de las
mediciones respecto
de su media, mide la
variabilidad promedio
de la Distribucin de
probabilidad:
V x E xi
xi P x
2
E xi
2
Distribuciones de
Probabilidad Discretas
Momentos superiores:
Distribuciones de
Probabilidad Discretas
Tercer momento:
M x i P x
3
Distribuciones de
Probabilidad Discretas
Tercer momento:
M3
A 3
Coeficiente de asimetra
Distribuciones de
Probabilidad Discretas
Cuarto momento:
M x i P x
4
Distribuciones de
Probabilidad Discretas
M4
C 4 3
Cuarto momento:
Coeficiente de curtosis
METODOS DE CONTEO Y
COMBINATORIOS
Sirven para conocer los arreglos de posibles objetos en
uno o varios conjuntos, los principales son permutaciones
y combinaciones.
n!
n Pr
n r !
n!
nCr
r! n r !
Distribucin Binomial de
Probabilidades
Es la distribucin de probabilidad de los
posibles resultados de un experimento
aleatoria repetido n veces en ocasiones
sucesivas, en el cual los resultados son
independientes entre s y mutuamente
excluyentes, es decir, no puede ocurrir ms
de uno en cada intento.
Caractersticas de un
Experimento Binomial:
El experimento consta de n pruebas idnticas
Cada prueba tiene solo 2 resultados posibles p (xito) y q
(fracaso). Variables dicotmicas
La probabilidad de tener xito en una sola prueba es igual a p
y permanece constante de prueba a prueba.
La probabilidad del fracaso es q = (1 p).
Todas las pruebas son independientes
La variable aleatoria bajo estudio es x, el nmero de xitos
observados en n pruebas
P( x )
n n x
x
q
p
x
Dnde:
n = Nmero total de elementos (muestra o
intentos repetidos)
x = Nmero de xitos que se busca
p = Probabilidad de xito
q = Probabilidad de fracaso
Propiedades de la
Distribucin Binomial
2 = Var = npq
npq
138
= E(x) = np
a) Cul es la probabilidad de que las seis cartas lleguen a su destino dentro de los
dos das?
b) Cul es la probabilidad de que exactamente 5 lleguen dentro de dos das?
c) Cul es la probabilidad de que menos de 2 cartas lleguen dentro de dos das?
d) Determinar la media y la desviacin estndar de las cartas que llegan en el periodo
Distribucin de Poisson
e
P( x )
x!
x
PROPIEDADES:
2 =
Distribucin de Poisson
Condiciones de Aplicacin:
1.- Que la ocurrencia o no ocurrencia de un evento
en un intervalo de tiempo o espacio dado, sea
independiente de su ocurrencia o no en otros
intervalos de tiempo o espacio.
2.- Que la amplitud del intervalo de tiempo o espacio
se pueda elegir lo suficientemente pequea para que
la probabilidad de que ocurran 2 ms eventos
dentro de un mismo intervalo sea prcticamente nula.
Distribucin de Poisson
Condiciones de Aplicacin:
3.- Que incrementando o disminuyendo la amplitud
del intervalo de tiempo o espacio en una magnitud fija
y finita, el intervalo aumente o disminuya
proporcionalmente a la probabilidad de ocurrencia del
evento dado.
4.- Que al aumentar o disminuir en forma continua el
intervalo de tiempo o espacio por valores
infinitesimales, aumente o disminuya la probabilidad
del evento dado en forma continua.
Distribucin
Hipergeomtrica
Arreglo sistemtico asociado a dos resultados, xito o
fracaso en un proceso caracterizado por la reduccin
del espacio de muestra y el cambio correspondiente en
las probabilidades de intento a intento.
La principal aplicacin de la distribucin de
probabilidad hipergeomtrica se presenta al extraer
muestras sin reemplazo de un universo finito.
P x
N1
N N1
n x
N
n
Muestras
posibles
tamao n
Donde:
N = Poblacin
N1= Subconjunto de N, elementos con la
caracterstica que denota xito
n = Tamao de la muestra
x = Variable, (nmero de xitos en la muestra)
Distribucin Hipergeomtrica
Propiedades:
N1
np ; donde p N
npq
N n
N 1
; N
donde
1
p
N
Factor de Correccin
N n
N n
npq
N 1
N 1
El factor de correccin es una aproximacin al
100%, para aproximar el clculo a la realidad.
Distribucin Hipergeomtrica
Ejercicio:
Se sabe que, en un hospital con 52 enfermos, 19 requieren
ser intervenidos quirrgicamente. Si se toma una muestra
al azar de 10 personas, Cul es la probabilidad de que 2
requieran ciruga?
Donde:
N = 52 enfermos es la Poblacin
N1= 19 requiriendo ciruga Subconjunto de N, elementos con la
caracterstica que denota xito (por ser lo que se pregunta)
n = 10 Tamao de la muestra
x = 2 Variable, (nmero de xitos en la muestra)
P x
N1
P ( x 2)
N N1
nx
N
19
52 19
10 2
52
10
17113,884,156
(15,820,024,220)
0.1501
F x
f x dx
S1
-
DISTRIBUCIN NORMAL
ESTANDARIZADA
Sus propiedades en trminos probabilsticos son:
= 0; = 1
Donde:
Z = rea bajo la curva
= Media poblacional
= Desviacin estndar
X = Valor individual
N = Poblacin
Caractersticas de la
Curva Normal
Distribucin Normal
Ejercicio
El promedio de ingresos anuales de un
profesionista especializado en determinada
empresa es de 34,000 dlls, con una desviacin
estndar de 2,000 dlls.
S1
Distribucin Normal
Ejercicio
a) Cul es el porcentaje de las personas que ganan
ms de 35,000
dlls?
S1
.5
.5
=34,000 x= 35000
X= 35,000
= 34,000
= 2,000
35,000 34,000
Z
2000
Z 0.5
Se busca 0.5,
En la 1er columna
Z se busca la unidad
y la Primera dcima
y en el 1er rengln,
se busca el segundo
decimal.
La Tabla de
Distribucin Normal
Z Estandarizada, es
simtrica, por lo que
al obtener un
nmero negativo, se
buscar igual, es
decir, en trminos
absolutos.
(Esta tabla est en el
Archivo de Word,
Distribucin Normal
Ejercicio
b) Cul es la probabilidad de elegir una
X dlls?
persona, que gane entre 33,500 y 35,000
.5
.5
Z1= ?
X1= 33,000
= 34,000
= 2,000
Z1
Z2
Z2= ?
X2= 35,000
= 34,000
= 2,000
33,000 34,000
Z1
2000
Z1 0.5
35,000 34,000
Z2
2000
Z 2 0.5
Distribucin Normal
Ejercicio
.5
.5
x =34,500 x = 35,600
Z1
1
35,600 34,000
Z1
2000
Z1 0.80
34,500 34,000
Z2
2000
Z 2 0.25
Z2
Z1= ?
Z2= ?
X1= 35,600 X2= 34,500
= 34,000 = 34,000
= 2,000 = 2,000
Distribucin Normal
Ejercicio
d) En qu intervalo de ingresos se encuentra el 96%
de los profesionistas?
.5
.5
.48 .48
x1
96%
Z= 2.06
X1= ?
= 34,000
= 2,000
X Z
X 34,000 2.06(2000)
Z= 2.06
X2= ?
= 34,000
= 2,000
Se busca 96% 2=
0.48 dentro de la
tabla
Se elige el nmero
entero el primero
que se pase.
Se buscan las
coordenadas.
La
Tabla de Distribucin
Normal Z estandarizada,
es simtrica, por lo que
el valor de las
coordenadas,
multiplicado por , se
sumara y restar a la
media.
Esta tabla est en el Archivo de
Word, anexo .
1.- El tiempo promedio que recorre una persona para llegar de su casa al trabajo es de 24
min con una desviacin estndar de 3.8 min.