Vous êtes sur la page 1sur 41

1

UCV/FACES/EAC
Estadsticas I
Medidas de Dispersin y Variabilidad
Prof. Leonardo Simmons
Prof. Leonardo Simmons Estadsticas I -05
2
PENSAMIENTO ESTADISTICO Y VARIABILIDAD
Segn vimos anteriormente el pensamiento estadstico es la filosofa de
aprender y emprender acciones basada en los siguientes principios:
Todo ocurre en un sistema de procesos interconectados
La variacin existe en todos los procesos
Entender y reducir la variabilidad es la clave del xito

Conclusin:
Estudiar, medir, entender y reducir la variabilidad de los procesos de negocio
de las empresas es vital para la salud stas y por lo tanto se constituye en la
razn de ser de todo aquel que este a cargo de tales procesos.

Prof. Leonardo Simmons Estadsticas I -05
3
MEDIDAS DE VARIABILIDAD
Una medida de tendencia central (media, mediana, modo) representa a la
correspondiente distribucin de datos de una variable y nos informa acerca
de la tendencia de la misma, sin embargo, estas medidas no nos informan
nada respecto a la variabilidad o dispersin existente entre los distintos
valores de la variable y la medida de tendencia.
Por ejemplo, las siguientes series de salarios en Bs. tiene igual media
aritmtica:
Serie A: 2500, 2800, 3000, 3300, 3500 Media = Bs. 3020
Serie B: 1000, 1500, 1600,4000, 7000 Media = Bs. 3020
Sin embargo son bien distintas.

Cuan representativa es una media de tendencia central?
Cul de dos o mas distribuciones de datos de una misma variable es mas o
menos dispersa respecto a una medida de tendencia central?
Prof. Leonardo Simmons Estadsticas I -05
4
MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad tienen por objeto medir la magnitud de los
desvos de los valores de la variable con respecto al valor central de la
distribucin, o sea, las medidas de variabilidad definen cuan semejante o
cuan distinto son cada uno de los valores, de la variable con respecto al valor
central.
Las medidas de variabilidad son tambin medidas del grado de
representatividad de las medidas de tendencia central.
La variabilidad es la caracterstica mas importante de la distribucin, ya que
se constituye en un eficaz test de validacin referido al nivel de significacin
de las medidas de centralizacin
Las distintas medidas de variabilidad que estudiaremos sern:

Rango Intercuartilico (Q)
Coeficiente de Variacin (CV)

Rango o Recorrido (R)
Desviacin Media (D)
Desviacin Tpica o Estndar (S , o)
Varianza (S
2
, o
2
)

Prof. Leonardo Simmons Estadsticas I -05
5
MEDIDAS DE VARIABILIDAD RANGO O RECORRIDO
Definicin:
El recorrido o Rango de una variable es la diferencia entre sus valores
extremos:


Caractersticas del rango o recorrido:
Solo suministra informacin de los extremos de la variable
Informa sobre la distancia entre el mnimo y el mximo valor observado
Se limita su uso a una informacin inicial


min max
X X R
x
=
X
min
X
ma
x
R
x
Prof. Leonardo Simmons Estadsticas I -05
6
MEDIDAS DE VARIABILIDAD DESVIACION MEDIA
Definicin:
Es la media aritmtica de los valores absolutos de las desviaciones entre los
valores de la variable y una medida de tendencia central. Entonces,
identificamos tres (3) posibles desviaciones medias:
Desviacin Media respecto a la Media:


Desviacin Media respecto a la Mediana:


Desviacin Media respecto al Modo:
n
f x x
D
k
i
i i
x

=

=
1
n
f M x
D
k
i
i e i
M
e

=

=
1
n
f M x
D
k
i
i o i
M
o

=

=
1
Prof. Leonardo Simmons Estadsticas I -05
7
x
1
x x
1
x
k
x x
k

x
MEDIDAS DE VARIABILIDAD DESVIACION MEDIA
La Desviacin Media da cuenta de la distancia promedio que existe entre los
valores de la variable (x
1
, x
2
, ..x
k
) y la medida de tendencia central, por
ejemplo la media aritmtica
x
Prof. Leonardo Simmons Estadsticas I -05
8
Por ejemplo: Dada la siguiente distribucin de frecuencia del precio de un
producto de consumo masivo (no regulado).
Bs Me Bs x 00 , 6 y 93 , 5 = =
MEDIDAS DE VARIABILIDAD DESVIACION MEDIA
Precio (Bs) No.Ofertas
2 4 15,72 16,00
4 6 11,58 12,00
6 10 0,70 0,00
8 7 14,49 14,00
10 3 12,21 12,00
30 54,70 54,00
i i
f X x
i e i
f M x
Bs
n
f x x
D
k
i
i i
x
82 , 1
30
70 , 54
1
= =

=
Bs
n
f M x
D
k
i
i e i
M
e
80 , 1
30
00 , 54
1
= =

=
En promedio los precios distan en 1,82 Bs del precio promedio
Prof. Leonardo Simmons Estadsticas I -05
9
Otro ejemplo: Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10
materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al
alumno ms idneo para representar al colegio en un torneo a nivel nacional.
El nmero de preguntas buenas por materia se muestra a continuacin:
MEDIDAS DE VARIABILIDAD DESVIACION MEDIA
Materia Carlos Pedro Juan
1 2 7 5
2 9 2 6
3 10 2 5
4 2 6 5
5 3 6 5
6 1 3 5
7 9 6 4
8 9 7 5
9 1 6 6
10 4 5 4
SOLUCIN
Lo primero que analizaremos es la media de los puntajes para cada uno de los
alumnos, con el fin de determinar el alumno con mayor promedio de preguntas
buenas.

Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen
responden en promedio 5 preguntas correctas por prueba. Cul sera entonces
el indicador diferenciador entre los alumnos?.

Complementemos el anlisis anterior calculando la desviacin media:

Carlos muestra una desviacin media de 3,9 indicando que los datos se alejan en
promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variacin
(2,9), siendo Juan el que menos variacin presenta con 0,9 preguntas tanto por
arriba como por debajo de la media aritmtica. Se recomienda al colegio elegir
como ganador en este caso a Juan, presenta resultados ms constantes que los
otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una
variacin muy baja (rondando entre 4 y 6).
Prof. Leonardo Simmons Estadsticas I -05
10
MEDIDAS DE VARIABILIDAD DESVIACION TIPICA
Definicin:
La desviacin tpica o desviacin estndar mide la dispersin de los
valores de una variable respecto a su media aritmtica y se basa en la
propiedad de sta que dice que:
- La suma de los cuadrados de los desvos respecto de la media aritmtica es
un mnimo, es decir:


Tomando esta propiedad en consideracin calcularemos la desviacin tpica
o estndar de la poblacin de una variable, a la cual denotaremos con la
letra o (sigma), con la siguiente expresin:




x C f C x f x x
k
i
i i
k
i
i i
= <

= =
) ( ) (
1
2
1
2
l poblaciona tpica desviacin
) (
1
2
N
f x
k
i
i x i
x

=

=

o
Prof. Leonardo Simmons Estadsticas I -05
11
MEDIDAS DE VARIABILIDAD DESVIACION TIPICA
Cuando estamos analizando una muestra a la desviacin tpica o estndar la
denotamos con la letra S y se determina con la siguiente expresin:



La desviacin estndar es una medida del grado de dispersin de los datos
respecto al promedio. Dicho de otra manera, la desviacin estndar es
simplemente el "promedio" o variacin esperada con respecto de la media
aritmtica.
Si S
x
0 indica que los valores estn cerca de la media (poca dispersin)
Si S
x
+ indica que los valores estn lejos de la media (mucha dispersin)
La desviacin tpica, al igual que la media y la varianza, es un ndice muy
sensible a los valores extremos.
Nota: El trmino desviacin estndar fue incorporado a la estadstica por Karl Pearson en 1894.

muestral tpica desviacin
1
) (
1
2

=

=
n
f x x
S
k
i
i i
x
Prof. Leonardo Simmons Estadsticas I -05
12
MEDIDAS DE VARIABILIDAD DESVIACION TIPICA
Se demuestra que:
para la poblacin



Y para la muestra:




2
1
2
x
k
i
i i
x
N
f x
o =

=
1 ) 1 (
2
1
2

=

=
n
x
n n
f x
S
k
i
i i
x
Prof. Leonardo Simmons Estadsticas I -05
13
MEDIDAS DE VARIABILIDAD DESVIACION TIPICA
Ejemplo: La siguiente tabla corresponde a la distribucin de frecuencias de
una muestra de los espesores en pulgadas, de recipientes de acero
producidos por cierto proceso:
pulg 005 , 0
49
96 , 15
1 50
) 319 , 0 (
1
) (
1
2
1
2
= =

=

= =
k
i
i i
k
i
i i
x
f x
n
f x x
S
Espesores en pulg No.Piezas x xf (x-Media)
2
f
0.306 - 0.310 3 0,308 0,924 0,0004
0.310 - 0.314 5 0,312 1,560 0,0003
0.314 - 0.318 5 0,316 1,580 0,0001
0.318 - 0.322 22 0,320 7,040 0,0000
0.322 - 0.326 14 0,324 4,536 0,0003
0.326 - 0.330 1 0,328 0,328 0,0001
50 15,968 0,0011
El proceso produce una pieza de espesor promedio 0,319 pulgadas con una
variacin de 0,005 pulgadas
Prof. Leonardo Simmons Estadsticas I -05
14
MEDIDAS DE VARIABILIDAD VARIANZA
Definicin:
Definimos varianza a la media de los cuadrados de las desviaciones respecto
a la media, es decir, la varianza es el cuadrado de la desviacin tpica, por lo
tanto:






En el ejemplo anterior:
S
2
x
= (0,005 pulg)
2
= 0,000025 pulg
2

Muestral) (Varianza
1
) (
) (
l) Poblaciona (Varianza
) (
) (
1
2
2
1
2
2

= =

= =

=
=
n
f x x
S x Var
N
f x
x Var
k
i
i i
x
k
i
i x i
x

o
Prof. Leonardo Simmons Estadsticas I -05
15
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
1. La desviacin tpica y la varianza de una variable son estadsticos
positivos, es decir, S
x
> 0 y Var(x) = S
2
x
> 0
2. la varianza de una constante por una variable es igual al cuadrado de la
constante por la varianza de la variable, es decir:
Var(cX) = c
2
Var(X) = c
2
S
2
x
En consecuencia la desviacin tpica de una constante por una variable
ser:
S
cx
= \c\S
x
3. La varianza de la suma de una variable ms una constante es igual a la
varianza de la variable, es decir:
Var(X + c) = Var(X) = S
2
x

En consecuencia: S
x+c
= S
x
Nota: La varianza de una constante es igual a cero; Var(C) = 0
Prof. Leonardo Simmons Estadsticas I -05
16
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
4. Si x y son variables estadsticamente independientes entonces:
4. Var (x y) = Var (x) + Var (y) = S
2
x
+ S
2
y
, por lo tanto
5.


6. Var (ax + by+ c) = a
2
Var(x)+b
2
Var(y)= a
2
S
2
x
+ b
2
S
2
y
, por lo tanto:



5. Si x y son variables que no son estadsticamente independientes
entonces:
Var(xy) = Var(x) + Var(y) 2Cov(x,y), donde Cov(x,y) es la Covarianza
(*) entre x y mide la magnitud de la asociacin entre las dos variables y
se determina por:
y x
y x
S S S
2 2
+ =

y x
c by ax
S b S a S
2 2 2 2
+ =
+ +
Prof. Leonardo Simmons Estadsticas I -05
17
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
muestral) a (Covarianz
1
) )( (
) , (
l) Poblaciona a (Covarianz
) )( (
) , (
1
1


= =

= =

=
=
n
y y x x
S y x Cov
N
y x
y x Cov
k
i
xy
k
i
y x
xy

o
Nota (*): El concepto de covarianza se ampliar cuando abordemos el tema de las medidas de
asociacin entre dos variables
5. Si y S
1
2
, S
2
2
,S
r
2
representan las medias aritmticas y las
varianzas de r muestras de tamao n
1
, n
2
, n
r
de la misma variable
entonces la varianza de la unin de las r-muestras ser la media de las
varianzas ms la varianza de las medias, es decir:
r
X X X ,.... ,
2 1


=
= =
=

+ =
r
i
i
r
i
i i
r
i
i
n n
n
X X n
n
S n
S
i
1
1
2
1
2
2
donde
) (
Prof. Leonardo Simmons Estadsticas I -05
18
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
Si las r-muestras fuesen del mismo tamao entonces:

) (
1
2
1
2
2
r
X X
r
S
S
r
i
i
r
i
i

= =

+ =
Si las r-muestras fuesen del mismo tamao y tuviesen la misma media entonces:

r
S
S
r
i
i

=
=
1
2
2
Prof. Leonardo Simmons Estadsticas I -05
19
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
Ejemplo (1): Hallar la media del nmero de establecimientos hoteleros que
hay en las distintas Comunidades Autnomas de Espaa. Despus, con ayuda
de la desviacin tpica, comenta si esta media es representativa de todas las
comunidades autnomas.

CC.AA. N establecimientos
hoteleros
Andaluca 2.266
Aragn 712
Asturas (Principado de) 620
Baleares (Islas) 1.483
Canarias 532
Cantabria 496
Castilla y Len 1.452
Castilla-La Mancha 842
Catalua 2.713
Comunidad Valenciana 1.019
Extremadura 418
Galicia 1.526
Madrid (Comunidad de) 1.242
Murcia (Regin de) 209
Navarra (C. Foral de) 150
Pas Vasco 396
Rioja (La) 117
Ceuta y Melilla 36
ientos Establecim 14 , 731
N
) x - (x
ientos Establecim 902
18
1 i
2
i
x
18
1
= =
= =

=
=
o

N
x
i
i
x
Se trata de la poblacin de establecimientos en Espaa
distribuido en las 18 Comunidades Autnomas de ese pas,
luego:

Como la desviacin tpica es muy alta, esto me indica que los
datos reales se diferencian mucho de la media, luego el dato de
la media no es representativo.
Prof. Leonardo Simmons Estadsticas I -05
20
TEOREMA DE CHEBYSHEV
Teorema de Chebyshev (Desigualdad de Chebyshev):
Para cualquier distribucin estadstica de datos de una variable (muestra o
poblacin), la proporcin () mnima de los valores que se encuentran dentro
de k desviaciones estndares desde la media es al menos 1 1/k
2
, donde k
es una constante mayor que 1.
X
o k
x
o k
x
+
x

1-1/k
2
K>1
P.ej: La distribucin de contribuciones al SSO tiene media Bs. 51.54 y desviacin
estndar Bs. 7.51; Qu porcentaje de contribuyentes como mnimo aportan entre la
media ms o menos 3.5 veces la desviacin:
1-1/k
2
= 1 1/(3.5)
2
=0.92 o sea 92%
Prof. Leonardo Simmons Estadsticas I -05
21
REGLA EMPIRICA
Regla Emprica o Regla Normal:
Para distribuciones simtricas o en forma de campana (Normales), se
cumple que:
X
o
x
o +
x
x

68% de los datos


X
o 2
x
o 2 +
x
x

95% de los datos


X
o 3
x
o 3 +
x
x

99,7% de los datos


Prof. Leonardo Simmons Estadsticas I -05
22
MEDIDAS DE VARIABILIDAD RANGO INTERCUARTIL
Definicin:
El rango intercuartil es una medida de variabilidad adecuada cuando la
medida de posicin central empleada ha sido la mediana y l se define como
la diferencia entre el Tercer Cuartil (Q
3
) y el Primer Cuartil (Q
1
), es
decir: R
Q
= Q
3
- Q
1





A la mitad del rango intercuartil se le conoce como Desviacin Cuartil
(D
Q
):
D
Q
= R
Q
/2= (Q
3
- Q
1
)/2


Q
1
25% 25%
Q
2
Q
3
50%
Prof. Leonardo Simmons Estadsticas I -05
23
DIAGRAMA DE CAJA
El Rango Intercuartil se usa para construir los Diagramas de Caja que
sirven para visualizar la variabilidad de una variable y comparar distribuciones
de la misma variable; adems de ubicar valores extremos:
X
max
X
min
Q
3
Q
1
Q
2
Q
3
+1.5 R
Q
Q
1
-1.5 R
Q
x
Dist. A Dist. B Dist. C
Prof. Leonardo Simmons Estadsticas I -05
24
DIAGRAMA DE CAJA
Distribucin simtrica o en forma de campana
(Normal), se cumple que:
|X
min
-Q
1
| =|X
max
-Q
3
|
|Q
2
-Q
1
| =|Q
2
-Q
3
|
Q
2
= X
Distribucin asimtrica negativa se cumple que:
X < Q
2
=M
e
< M
o
Distribucin asimtrica positiva se cumple que:
X > Q
2
=M
e
> M
o
Prof. Leonardo Simmons Estadsticas I -05
25
COEFICIENTE DE DE VARIACION
Definicin:

El coeficiente de variacin permite comparar la dispersin entre dos
poblaciones distintas e incluso, comparar la variacin producto de dos
variables diferentes (que pueden provenir de una misma poblacin).

Estas variables podran tener unidades diferentes, por ejemplo, podremos
determinar si los datos tomados al medir el volumen de llenado de un envase
de cierto lquido varan ms que los datos tomados al medir la temperatura
de el liquido contenido en el envase al salir al consumidor. El volumen los
mediremos en centmetros cbicos y la temperatura en grados centgrados.

El coeficiente de variacin elimina la dimensionalidad de las variables y tiene
en cuenta la proporcin existente entre una medida de tendencia y la
desviacin tpica o estndar.
Prof. Leonardo Simmons Estadsticas I -05
26
COEFICIENTE DE VARIACION
Coeficiente de variacin (Cv): Equivale a la razn entre la media aritmtica y
la desviacin tpica o estndar.



Si envs de la media aritmtica se emplea la mediana, obtendremos el
coeficiente de variacin mediana:



P.ej: se han tomado los pesos y las estaturas de los alumnos de una seccin
hallndose que:
X = 68 Kg , S
x
= 8 Kg; y = 1,70 mts, S
y
= 0,61 mts
en cul de los dos aspectos los estudiantes son ms homogneos?

CVx = 8/68*100=11,7% mientras que CVy = 0,61/1,70*100 = 39,5%
Hay mayor homogeneidad (menor variacin) en los pesos
100 =
X
S
CV
x
x
100 =
e
x
x
M
S
CV
e M
Prof. Leonardo Simmons Estadsticas I -05
27
TIPIFICACION DE VARIABLES
Sea X la variable que toma los valores X
1
, X
2
, ..X
k
, de media X y desviacin
estndar S
x
entonces si tomamos cualquier valor de X, digamos X
i
, la
diferencia de dicho valor con la media (X
i
- X ) mide la distancia entre estos
dos valores y si dividimos tal diferencia entre la desviacin tpica,
obtendremos las cantidad de desviacin tpicas que dista X
i
de la media. Si
definimos la variable Z como:




Se demuestra que Z = 0 y S
z
= 1 independientemente de los estadsticos de
la variable X.
A la variable Z la llmanos variable estandarizada o tipificada y se cumple que
Z no tiene unidades y siempre Z = 0 y S
z
= 1 y Z pertenece a (- , + )

....k i
S
X X
Z
x
i
1 ; =

=
Z= (X-X)/S
x X, X, S
x

Z, Z=0, S
z
=1
Tipificacin
Prof. Leonardo Simmons Estadsticas I -05
TIPIFICACION DE VARIABLES
X
1
X
2
X
k
X
Z
1
=(X
1
-X)/S
x
Z
2
=(X
2
-X)/S
x
Z
1
Z
2
Z=0

Z=(X

- X)/S
x
=0

+
Z
k
=(X
k
-X)/S
x
X

z

Prof. Leonardo Simmons Estadsticas I -05
29
TIPIFICACION DE VARIABLES
La interpretacin de Z es como sigue:
Si Z
1
= 1,2 indicara que X
1
es 1,2 desviaciones tpicas mayor que la media de
X; es decir si X
i
> X entonces Z
i
> 0
Si Z
1
= -0.5 indicara que X
1
esta a 0,5 o desviaciones tpicas a la izquierda
de la media de X; es decir si X
i
< X entonces Z
i
< 0
El valor tipificado o estandarizado de la media de la variable siempre ser o
cero:

0 =

=
x
x
S
X X
Z
Prof. Leonardo Simmons Estadsticas I -05
30
TIPIFICACION DE VARIABLES
Uso de la Tipificacin o Estandarizacin:
P.ej.: Dos estudiantes uno de Contadura (A) y el otro de Administracin (B) obtienen
las siguientes notas:
A: 12 ptos en Auditoria
B: 14 Ptos en Investigacin de Operaciones
Los estadsticos para las clases respectivas fueron:
Clase de A: Nota promedio de Auditora X
A
= 13 ptos con S
A
= 6 ptos
Clase de B: Nota promedio de IO X
B
= 15 ptos con S
B
= 5 ptos

Evidentemente no se pueden comparar directamente las notas de los dos estudiantes
porque el rendimiento de sus respectivas clases es diferente. La comparacin habr de
hacerse a travs de la variable tipificada:
Para A: ZA = (12 - 13)/6 = 1/6
Para B: ZB = (14 15)/5 = -1/5




Se aprecia que la calificacin del alumno A es mejor en relacin a su clase, que la del
alumno B en relacin a la suya
0 -1 -2 -3 3 2 1
Z
A
=1/5
Z
B
=-1/6
z
Prof. Leonardo Simmons Estadsticas I -05
31
TIPIFICACION DE VARIABLES

P.ej.: Una empresa que posee una fabrica en el pas A y otra en B ha realizado una
encuesta relativa al porcentaje que de su sueldo gastan sus empleados por concepto
de alimentacin, obtenindose los siguientes datos:






El porcentaje reportado por los gerentes de produccin de ambos pases fueron:
Gte. Produccin A: 32%
Gte. Produccin B: 42%

Respecto a la realidad econmica de cada pas, cual de ellos se podra decir que gasta
menos en alimentacin?

Tratndose de realidades distintas, la comparacin habr de hacerse a travs de la
variable tipificada:
Para pas A: Z = (42 - 30)/12 = 1
Para pas B: Z = (32 20)/6 = 2
Pas Media Desv. Tpica
A 20% 6%
B 30% 12%
Prof. Leonardo Simmons Estadsticas I -05
32
TIPIFICACION DE VARIABLES

Se aprecia que el gerente del pas A, no obstante las apariencias numricas, en
proporcin gasta menos en alimentacin respecto a la realidad econmica de su pas
que lo que gasta el gerente del pas B respecto a la suya
0 -1 -2 -3 3 2 1
GTE. Pas A
Z=2
GTE. Pas B
Z=1
Realidad
Econmica
Media
z
Prof. Leonardo Simmons Estadsticas I -05
33
DETECCION DE VALORES ATIPICOS CON Z

SI UNA DISTRIBUCIN ES APROXIMADAMENTE Normal entonces segn la
regla emprica aproximadamente el 99.7% de los datos estn comprendidos
en el intervalo
x
3o
x
por lo tanto en la escala estandarizada (Z) ese
intervalo se convierte en [-3, 3]. Luego todo valor de X cuyo valor
estandarizado este fuera del anterior intervalo se puede considerar atipico.

0 -1 -2 -3 3 2 1
z
Atpicos
Atpicos
Prof. Leonardo Simmons Estadsticas I -05
34
MEDIDAS DE ASIMETRIA
Definicin:

Adems de la posicin (tendencia) y la dispersin de un conjunto de datos, es
comn usar medidas de forma en la descripcin. Una de estas medidas es
una estadstica que busca expresar la simetra ( o falta de ella ) que
manifiestan los datos, denominada coeficiente de asimetra.

Para saber si una distribucin de frecuencias es simtrica, hay que precisar
con respecto a qu. Un buen candidato es la mediana ya que divide a la
distribucin de frecuencias en dos partes de igual rea (50-50). Podemos
basarnos en ella para, de forma natural, decir que una distribucin de
frecuencias es simtrica si el lado derecho de la grfica (histograma o
polgono de frecuencias (a partir de la mediana) es la imagen por un espejo
del lado izquierdo
Prof. Leonardo Simmons Estadsticas I -05
35
MEDIDAS DE ASIMETRIA
Coeficiente de Asimetra basado en los tres cuartiles (Yule-Bowley) :
Si una distribucin es simtrica, es claro que deben haber tantas
observaciones entre la que deja por debajo de s las tres cuartas partes de la
distribucin y la mediana, como entre la mediana y la que deja por debajo de
s un quarto de todas las observaciones. De forma abreviada esto es,
Q
3
Q
2
= Q
2
Q
1
Una pista para saber si una distribucin de frecuencias es asimtrica positiva
es cuando:
Q
3
Q
2
> Q
2
Q
1

Prof. Leonardo Simmons Estadsticas I -05
36
MEDIDAS DE ASIMETRIA
Por analoga, si es asimtrica negativa, se tendr:

Q
3
Q
2
< Q
2
Q
1


Para quitar dimensionalidad al problema, utilizamos como ndice de asimetra
la cantidad:





Coeficiente de Asimetra basado en el momento central de tercer
orden:
Si la distribucin fuese asimtrica positiva, las cantidades , con p
impar positivas estaran muy aumentadas al elevarse a p. Esta propiedad nos
indica que un ndice de asimetra posible consiste en tomar p=3 y definir:

1 1
2 2
1 2 3
1 3
1 2 3
+ s s
+
=

+
=
Q
Q
Q
A
R
Q Q Q
Q Q
Q Q Q
A
) (
p
i
X X
Prof. Leonardo Simmons Estadsticas I -05
37
MEDIDAS DE ASIMETRIA






Apoyndonos en este ndice, diremos que hay asimetra positiva si A
3
>0, y
que la asimetra es negativa si A
3
<0.

Otros Coeficientes de Asimetra:
Basndonos en que si una distribucin de frecuencias es simtrica y
unimodal, entonces la media, la mediana y la moda coinciden, podemos
definir otras medidas de asimetra, como:



Diremos que hay asimetra positiva si A>0 y negativa si A<0

1 1 ,
) (
3
3
1
3
3
+ s s

=
A
S
n
X X
A
x
k
i
i


x
o
S
M X
A

=


) ( 3
x
e
S
M X
A

=
Prof. Leonardo Simmons Estadsticas I -05
38
MEDIDAS DE ASIMETRIA
P.ej: Los das-calle de la poblacin de cuentas x cobrar de una firma se
distribuyen de la siguiente forma:







Das No.Cuentas x F
7 -- 9 4 8 4
9 -- 11 18 10 22
11 -- 12 14 11,5 36
12 -- 13 27 12,5 63
13 -- 14 42 13,5 105
14 -- 15 31 14,5 136
15 -- 17 20 16 156
17 -- 19 1 18 157
157

x
= 13,15 das
o
x
= 1,94 das
M
e
= Q
2
=13,4 das
Q
1
= 12,1 das
Q
3
=14,4 das

Lo que nos dice que aproximadamente en un rango
de (Q
3
-Q1) = 14,4-12,1 = 2,3 das se encuentra el
50% central del total de observaciones. Adems:
A
Q
= -0,09
Este resultado nos indica que existe una ligera
asimetra a la izquierda (negativa). Un resultado
similar se obtiene si observamos que la distribucin
de frecuencias es unimodal, siendo M
o
= 13,6 das y


0,21 =

=
x
o x
M
A
o

Prof. Leonardo Simmons Estadsticas I -05


39
MEDIDAS DE FORMA KURTOSIS (CURTOSIS)
Definicin:

En estadstica, la Kurtosis (Curtosis) es una medida de lo
"picudo"(concentrada en torno a la media) de la distribucin de frecuencia de
una variable cuantitativa. Una mayor curtosis implica que la mayor parte de la
varianza (variacin) es debida a desviaciones infrecuentes en los extremos,
que se oponen a desviaciones comunes de medidas menos pronunciadas.

La curtosis se determinar a partir del momento central de cuarto orden, esto
es :



Se cumple que:
Si K < 0, la distribucin es menos apuntada de lo normal Platicrtica
Si K = 0, la distribucin tiene un apuntamiento normal Mesocrtica
Si k > 0, la distribucin es ms apuntada de lo normal - Leptocrtica
4
) ( X X
i

3
) (
4
1
4

=
x
k
i
i i
nS
f X X
k
Prof. Leonardo Simmons Estadsticas I -05
40
MEDIDAS DE FORMA KURTOSIS (CURTOSIS)
Curtosis Negativa Curtosis nula Curtosis Positiva
Platicrtica


Mesocrtica


Leptocrtica


En el ejemplo de los das-calle de la poblacin de cuentas x cobrar de una
firma, el calculo de la curtosis resulta igual a:

K = +0,094 lo que implica que dicha distribucin tiene un apuntamiento casi
normal.
Prof. Leonardo Simmons Estadsticas I -05
41
TAREA No.5
1. Tmese unos minutos de su tiempo y lea detenidamente el siguiente
articulo: VARIACIN, GERENCIA, Y EL DR. W. EDWARDS DEMING
Por: Brian L. Joiner y Marie A. Gaudard.
JOINER ASSOCIATES INC.
Quality Progress, Diciembre de 1990.
Compilacin, desarrollo y traduccin libre: por Rogelio Carrillo Penso
http://sev.cuao.edu.co/mipymes/Documentos/Calidad/VariacionGerenciayDeming.pdf

2. Ingrese a la pgina de la Fundacin Polar y lea los fascculos 20 y 21 de
la serie El Mundo de Las Matemticas, que trata de la variabilidad
estadstica:
http://www.fundacionempresaspolar.org/matematica2/index.html

3. Resolver del libro Estadstica para Administracin y Economa Anderson
8va. Edicin , capitulo 3, los ejercicios del 15 al 26 (pag. 88 al 89); 31
al 37 (pag. 94 al 95); 42 al 46 (pag.98 al 99)

Vous aimerez peut-être aussi