Vous êtes sur la page 1sur 15

MEDIDAS DESCRIPTIVAS

A. MEDIDAS DE POSICION
1. Media aritmtica
2. Media aritmtica ponderada
3. Mediana
4. Moda
5. Cuantiles

B. MEDIDAS DE DISPERSION
I. Medidas de dispersin absolutas
1. Rango
2. Desviacin tpica
3. Varianza

II. Medidas de dispersin relativa


Coeficiente de variacin

C. MEDIDAS DE ASIMETRIA Y KURTOSIS

Chiclayo, Enero 2017


1

INTRODUCCIN

La naturaleza de los datos permite, en muchos casos, cierto tipo de anlisis a partir de los grficos de la distribucin.
Sin embargo, tambin es necesario considerar resmenes numricos que permitan tener una mejor idea de la manera
como los datos estn distribuidos a lo largo de la recta. Estas caractersticas numricas se llaman estadgrafos.

Algunas de estas medidas dependen de todas las observaciones y son muy sensibles a las fluctuaciones de stas;
otras sin embargo, no dependen de todas las observaciones, siendo resistentes ante los cambios de los valores
extremos.

La mayor parte de los conjuntos de datos muestran a agruparse alrededor de un valor central. Estos valores, que de
alguna manera tipifican al conjunto, se llaman medidas de posicin. Entre estas medidas se tiene: la media aritmtica,
la mediana, la moda y los cuantiles.

Adems de las medidas de tendencia central estn las medidas que indican la dispersin que se produce en torno de
la media de los datos. Entre estas medidas se tiene: la varianza, la desviacin estndar, el coeficiente de variacin.

La manera como estn distribuidos los datos de un conjunto puede resumirse en lo que se llama la asimetra y el
apuntamiento de la curva que los describe.

A. MEDIDAS DE TENDENCIA CENTRAL:

1. MEDIA ARITMTICA O PROMEDIO:


La medida de tendencia central con la cual probablemente est usted ms familiarizado es la media aritmtica; se
conoce tambin como media o promedio; se representa como x y se conoce como "x barra".
Aunque la media es una excelente medida de resumen de una serie de datos, stos deben seguir una distribucin
aproximadamente normal.
A la media se le llama "el centro de gravedad" de una distribucin de frecuencias. Esto significa que la media acta
como el punto de apoyo en una balanza, como se ve en la figura.

Fig: La media es el centro de gravedad de la distribucin

Simbologa:

Tamao
Media aritmtica
(nmero de datos)
Muestra n x : media muestral
Poblacin N : media poblacional

n
a. Datos no agrupados
x x2 ... xn x i
x 1 i 1
n n
Se lee as: la media es igual a la suma de las xs dividido por n.

Estadstica Lic. Jessica Oliva G.


2

Ejemplo 1: La siguiente tabla muestra el nmero de reclamos y quejas presentadas por clientes de una tienda
a lo largo de una semana. Si se elige al azar un da de la semana cuntos reclamos se espera tener?

Da de la semana Lun Mar Mier Jue Vier Sab


Reclamos / da 8 10 5 12 10 15
n

x i
8 10 5 12 10 15 60
x i 1
10 reclamos
n 6 6

Interpretacin: Se espera que los clientes de esta tienda realicen 10 reclamos por da.

b. Datos agrupados en tablas de frecuencias


m

y n y 2 n 2 ... y m n m y n
i 1
i i
y 1 1 ; yi : marca de clase i
n n
Ejemplo 2: La distribucin de frecuencias siguiente, representa los puntajes obtenidos en una evaluacin del
desempeo, aplicado al personal tcnico de una empresa. Si se elige al azar un tcnico Qu puntaje se
espera que tenga en su evaluacin de desempeo?

Marca de clase Nmero de


Desempeo (puntos)
(yi) tcnicos (ni)
11 - 16 14 4
16 - 21 19 8
21 - 26 24 15
26 - 31 29 23
31 - 36 34 10
Total 60

14(4) 19(8) 24(15) 29(23) 34(10) 1575


y 26.3
60 60

Interpretacin: Se espera que el tcnico elegido al azar tenga un puntaje de 26.3 en su evaluacin de desempeo.

Ventajas y desventajas de la media aritmtica


Ventajas:
1. Es un concepto familiar a la mayora de las personas e intuitivamente claro.
2. Es nica para cada conjunto de datos.
3. Es posible comparar medias de diferentes muestras.

Desventajas:
1. Puede verse afectada por los valores extremos.
2. Si la muestra es grande y los datos no estn agrupados, su clculo es tedioso.
3. Si los datos estn agrupados en clases con extremos abiertos, no es posible calcular la media

Nota: La media aritmtica como estadgrafo de posicin de una distribucin, proporciona una idea de la posicin
de los valores alrededor de la media, La media es un promedio, por tanto no significa:
i) Que todos los valores observados resultan ahora ser iguales.
ii) Que la media se ubica exactamente en el centro de la distribucin, excepto si la distribucin es simtrica.
Entonces, la media aritmtica en general no divide a la distribucin.

Ejercicio: En una pequea empresa de 10 trabajadores se hizo una prueba de razonamiento y otra de habilidad. Se
obtuvieron las siguientes calificaciones.

Razonamiento 48 38 65 56 16 55 28 62 32 48
Habilidad 36 18 54 47 21 56 68 70 72 38

En cul prueba se espera que tengan mayores resultados los trabajadores?

Estadstica Lic. Jessica Oliva G.


3

y
2. MEDIA ARITMTICA PONDERADA ( p )
Se denomina media ponderada de un conjunto de nmeros al resultado de multiplicar cada uno de los nmeros
por un valor particular para cada uno de ellos, llamado su peso (factor de ponderacin) y obteniendo a continuacin
la media aritmtica del conjunto formado por los productos anteriores.
Se utiliza la media ponderada cuando no todos los elementos componentes de los que se pretende obtener la
media tienen la misma importancia.
m

w1 n1 w2 n 2 ... wm n m w n
i 1
i i
yp m
m
; Wi = factor de ponderacin

w
i 1
i w
i 1
i

Ejemplo 3: Una empresa comercializadora de computadoras personales dispone 3 vendedores, cada uno de los
cuales cobran diferente comisin por computadora vendida, y realiza diferente nmero de ventas. Cul es la
comisin que se espera que cobre un vendedor por computadora vendida?

Nmero de Comisin por


Vendedor computadoras venta ($) 8(20) 10(30) 12(40) 940
yp $31.3
vendidas (wi) (ni) 30 30
Pedro 8 20
Juan 10 30 Interpretacin: Se espera que el vendedor cobre una
Pablo 12 40 comisin de $31.3 por computadora vendida.

3. LA MEDIANA O EL VALOR MEDIANO: Me


Es la medida que divide en dos subconjuntos a los datos, de tal manera que 50% de los datos es menor a la
mediana y el otro 50% es mayor a la mediana.
La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o
decreciente, el valor que divide en dos partes la muestra.

a. Datos no agrupados:

a.1 Nmero Impar de datos, la mediana es el valor del elemento intermedio.

Me = xn 1 / 2

Ejemplo 4: Los siguientes datos se refieren al nmero de clientes atendidos durante los ltimos 9 das en una
tienda. 14, 12, 7, 17, 10, 13, 15, 10, 12

Me
Primero se ordenan los datos:
7, 10, 10, 12, 12 13, 14, 15, 17

Interpretacin: Durante 5 das se atendieron a menos de 12 clientes y durante 5 das se atendieron a ms de


12 clientes.

a.2 Nmero Par de datos, la mediana es igual al promedio de los valores centrales
xn / 2 xn / 2 1
Me =
2
Ejemplo 5: 14, 26, 12, 20, 25, 26, 34, 36, 10

10 12 14 20 25 26 34 36

Me: (20+25)/2 = 22.5

Estadstica Lic. Jessica Oliva G.


4

b. Datos agrupados en tablas de frecuencias:


n
2 N i 1
Me l i c
ni

Donde:
Li : lmite inferior del intervalo mediano
c : amplitud del intervalo mediano
ni : frecuencia del intervalo mediano
Ni-1 : frecuencia acumulada antes del intervalo mediano

Para determinar el intervalo mediano se debe calcular el valor de n/2 y ubicar en la columna de frecuencias
acumuladas la frecuencia que supera al valor de n/2, en ese lugar se ubicar el intervalo mediano.

Ejemplo 6: La tabla siguiente muestra la experiencia profesional (aos) del personal tcnico que labora en una
empresa.

Experiencia
N de tcnicos
profesional Ni 35 16
(aos)
(ni) Me 7 4 10.2
aos
24
0 - 3 4 4
3 - 7 12 16
Interpretacin: El 50% de los profesionales tcnicos que
7 - 11 24 40 laboran en esta empresa tienen una experiencia laboral
11 - 15 16 56 igual o menor a 10 aos 2 meses. El otro 50% de los
15 - 19 10 66 profesionales tiene una experiencia laboral igual o mayor
19 - 23 4 70 a 10 aos y 2 meses.
Total 70

Ventajas y desventajas de la mediana

Ventajas
La mediana es ms recomendable que la media aritmtica, cuando:
1. La mediana no est afectada por los valores extremos como sucede con la media.
2. Se puede determinar para datos cualitativos, susceptibles de ordenarse de acuerdo a rangos, calificaciones o
categoras.

Desventajas
1. Como valor central, se debe ordenar primero la serie de datos.
2. Para una serie amplia de datos no agrupados, el proceso de ordenamiento de los datos demanda tiempo y
usualmente provoca equivocaciones.

4. LA MODA O VALOR MODAL: Mo


La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite, es la nica medida
de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin de ningn
clculo.
Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la
misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o polimodal segn el
caso

a. Datos no agrupados
- El conjunto: 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 13 tiene la moda Mo = 9.
- El conjunto: 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos modas, 4 y 7; es una distribucin bimodal
- El conjunto: 3, 5, 8, 10, 12, 16, 18 no tiene moda.

Estadstica Lic. Jessica Oliva G.


5

b. Datos agrupados en tablas de frecuencias

1
Mo l i c
1 2
Donde:
1 : frecuencia de la clase modal menos la frecuencia de la clase anterior
2 : frecuencia de la clase modal menos la frecuencia de la clase siguiente

Ejemplo 7: La tabla siguiente muestra los errores de facturacin durante un mes, en una empresa
comercializadora.

Errores de
Das
facturacin 6
03 Mo 3 4 5.4
6
6 4
37 12
7 11 8 Interpretacin: Durante un mes, el nmero ms frecuente de errores
11 15 3 de facturacin en esta empresa comercializadora es de 5.
15 19 1
Total 30

Ventajas y desventajas de la moda


Ventajas
1. Se puede utilizar tanto para datos cualitativos como cuantitativos.
2. No se ve afectada por los valores externos.

Desventajas
1. No tiene un uso tan frecuente como la media.
2. Muchas veces no existe moda (distribucin amodal)
3. En otros casos la distribucin tiene varias modas, lo que dificulta su interpretacin.

RELACION ENTRE LA MEDIA, MEDIANA Y MODA

1. En una distribucin de frecuencias simtricas cuya representacin grfica es


acampanada y adems unimodal: coinciden exactamente en el mismo valor;
media, mediana y moda.

x = Me = Mo

2. Si la distribucin es ms alargada para valores grandes de la variable (asimetra a la derecha o positiva)

Mo < Me < x

3. Si la distribucin es ms alargada para valores pequeos de la variable (asimetra


a la izquierda o negativa)

x < Me < Mo

Estadstica Lic. Jessica Oliva G.


6

5. LOS CUANTILES
Cuando los valores ordenados de una variable han de ser divididos en grupos homogneos en cuanto al tamao,
se suelen utilizar los cuantiles.
Los cuantiles ms usados en el anlisis estadstico son: cuartiles, deciles y percentiles. Los cuantiles se usan
frecuentemente para describir el comportamiento de una poblacin. Los valores se dan a menudo en tanto por
ciento.

a. Datos no agrupados

Percentiles
Un percentil da informacin acerca de cmo se distribuyen los valores sobre el intervalo, desde el menor hasta el
mayor. El percentil se define como sigue:

El p-simo percentil es un valor tal que por lo menos p por ciento de las observaciones son
menores o iguales que este valor y por lo menos (100 p) por ciento de las observaciones
son mayores o iguales que este valor.

Para calcular del p-simo percentil se aplica el siguiente mtodo

1 Ordenar los datos de manera ascendente


p
2 Calcule un ndice i n , en donde p es el percentil de inters y n es la cantidad de observaciones.
100
3 Si i no es entero, el valor entero inmediato mayor que i indica la posicin del p-simo percentil.

Si i es entero, el p-simo percentil es el promedio de los valores de los datos ubicados en los lugares i e i+1

Ejemplo 8: Se tienen los siguientes valores 27, 25, 20, 15, 30, 34, 28 y 25. Encuentre el percentil 50 y 85

Se ordena: 15 20 25 25 27 28 30 34

Para calcular el percentil 50

p 50
Se calcula i n = 8 4
100 100

15 20 25 25 27 28 30 34
P50
P50 = (25 + 27) / 2 = 26

Para calcular el percentil 85

p 85
Se calcula i n = 8 6.8 7
100 100 P85

15 20 25 25 27 28 30 34

Cuartiles
Con frecuencia se dividen los datos en cuatro partes, cada una con aproximadamente la cuarta parte, o el 25% de
las observaciones. A los puntos de divisin se les llama Cuartiles y se definen como sigue.

Q1 = primer cuartil, o percentil 25


Q2 = segundo cuartil, o percentil 50 (tambin la mediana)
Q3 = tercer cuartil, o percentil 75

Estadstica Lic. Jessica Oliva G.


7

b. Datos agrupados en tablas de frecuencias


Se realiza de modo similar al clculo de la mediana. Si queremos encontrar el p-simo percentil de orden p,
p
procedemos a localizar el intervalo que contiene el dato n .
100

( p / 100 )n N i 1
Pp li c
ni
Donde:
[li ls) : el intervalo que contiene dicho percentil
c : la amplitud del intervalo
ni : frecuencia del intervalo
Ni-1 : frecuencia acumulada antes del intervalo

Ejemplo 9: Los siguientes datos es el nmero de piezas fabricadas por 110 de trabajadores en una semana.
a. Cul es la cantidad de piezas como mximo que fabrica el 25% de trabajadores con menor produccin?
b. Cul es la cantidad de piezas como mnimo que fabrica el 25% de trabajadores con mayor produccin?

N de piezas N de
Ni
fabricadas trabajadores
20 25 5 5
25 30 7 12
30 35 9 21
35 40 14 35 P25
40 45 20 55
45 50 26 81
50 55 18 99 P75
55 60 11 110
Total 110

a. Se calcular el primer cuartil, tomamos P = 25

p 25
Calculamos n = 110 27.5
100 100

27.5 21
P25 35 5 43.1
14
El 25% de trabajadores con menor produccin fabrican como mximo 43.1 piezas.

b. Se calcular el tercer cuartil, tomamos P = 75

p 75
Calculamos n = 110 82.5
100 100

82.5 81
P75 50 5 50.4
18
El 25% de trabajadores con mayor produccin fabrican como mnimo 43.1 piezas.

Estadstica Lic. Jessica Oliva G.


8

B. MEDIDAS DE DISPERSIN:

Las medidas de posicin central son los valores que de una manera condensada representan una serie de datos,
pero realmente no son suficientes para caracterizar una distribucin de frecuencia. Para describir una distribucin
de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersin o variabilidad de
los datos, es decir, su alejamiento de las medidas de posicin central. Estas medidas de posicin central no tienen
ningn valor si no se conoce como se acercan o se alejan esos valores con respecto al promedio, en otras palabras
es conocer cmo se dispersan o varan esos valores con respecto al promedio de una distribucin de frecuencia.

La dispersin o variabilidad se entiende como el hecho de que los valores de una serie difieran uno de otro, es
decir, como se estn dispersando o distribuyendo en la distribucin. De acuerdo con esto es necesario encontrar
una medida que indique hasta qu punto los valores de una variable estn dispersos en relacin con el valor tpico.
Las medidas de variabilidad son nmeros que expresan la forma en que los valores de una serie de datos cambian
alrededor de una medida de posicin central la cual por lo general es la media aritmtica.

Se llama Variacin o Dispersin de los datos, el grado en que los valores de una distribucin o serie numrica
tienden a acercarse o alejarse alrededor de un promedio. Cuando la dispersin es baja indica que la serie de
valores es relativamente homognea mientras que una variabilidad alta indica una serie de valores heterognea.

Cuando los valores observados de una serie estn muy concentrados alrededor del promedio, se dice que ese
promedio es o ser muy representativo; pero si estn muy dispersos con relacin al promedio, es decir muy
esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la serie o distribucin,
puesto que no representan adecuadamente los datos individuales de esa distribucin. Es importante obtener una
medida que indique hasta qu punto las observaciones de una serie de valores estn variando en relacin con el
valor tpico de la serie.

Las medidas de dispersin se clasifican en dos grandes grupos:


I. Las Medidas de Dispersin Absolutas
II. Las Medidas de Dispersin Relativas

I. MEDIDAS DE DISPERSIN ABSOLUTAS

1. Rango o recorrido (R)


Algo que responde a la identificacin de la dispersin de los datos de una muestra es el rango, el cual se define
como la diferencia entre el dato mayor menos el dato menor de un conjunto de datos. Su obtencin es sumamente
sencilla, sin embargo se considera que no es una medida muy significativa, su aplicacin es ms til en la llamada
estadstica no paramtrica. Una expresin para el rango puede ser vista como:

Rango x max x min

2. La Desviacin Tpica o Estndar


Es la medida de dispersin ms utilizada en las investigaciones por ser la ms estable de todas, ya que para su
clculo se utilizan todos los desvos con respecto a la media aritmtica de las observaciones, y adems, se
toman en cuenta los signos de esos desvos. Se le designa con la letra castellana S cuando se trabaja con una
muestra y con la letra griega minscula (Sigma) cuando se trabaja con una poblacin. Es importante destacar
que cuando se hace referencia a la poblacin l nmero de datos se expresa con N y cuando se refiere a la
muestra l nmero de datos se expresa con n. La desviacin tpica se define como:
La raz cuadrada positiva del promedio aritmtico de los cuadrados de los desvos de las observaciones con
respecto a su media aritmtica.
Es una medida de bastante precisin, que se encarga de medir el promedio de la dispersin de las observaciones
de una muestra estadstica. Las influencias de las fluctuaciones del azar, al momento de seleccionar la muestra
la afectan muy poco. Le da gran significacin a la media aritmtica de la serie de valores. Es siempre una cantidad
positiva.

Estadstica Lic. Jessica Oliva G.


9

a) Datos no agrupados

n xi2 xi
n

(x x) 2
2
i
s
s i 1
n(n 1)
n 1
Es importante recordar que cuando se trabaja con la frmula para datos no agrupados y se trata de una
muestra se utilizar como denominador n1, para corregir el sesgo, pero si en la muestra n 50, entonces
se utilizar n, simplemente.

b) Datos agrupados en tablas de frecuencias


Para calcular la desviacin tpica en datos agrupados existen varios criterios en relacin a la correccin del
sesgo que se produce al tomar una muestra, en este estudio se considerar la frmula que corrige el sesgo
de aquellas muestras en estudio; sin embargo, cuando n sea mayor que 50, no es necesario tal correccin.
Existen muchas frmulas matemticas para calcular la desviacin tpica, queda a juicio del estudiante utilizar
la frmula que l considere ms fcil, siempre y cuando su aplicacin sea valedera.

( y i y ) 2 ni y n 2

s y 2
i ni i i

n 1 s n
n 1
3. VARIANZA
Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviacin tpica; viene
expresada con las mismas letras de la desviacin tpica pero elevada al cuadrado, as S2 y 2. Las frmulas para
calcular la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las respectivas races, las
cuales desaparecen al estar elevados el primer miembro al cuadrado.

yn
y n
2
2 i i
i i
s2 n
n 1

Ejemplo 10: El tcnico responsable del funcionamiento de una empaquetadora automtica, la ajust en principio,
para 450 gr. Media hora despus del principio de la produccin se apartaron 10 paquetes para verificar su peso.
Los resultados son:

Peso (gr) 448 450 453 451 447 449 446

a. Calcular Rango
b. Calcular la desviacin tpica

Solucin:
a. R x max x min 453 446 = 7gr

n xi2 xi
b. Para calcular la desviacin tpica utilizaremos la siguiente frmula: 2

s
n(n 1)
n = 7; x i 3144 ; x 2
i 1412140

Reemplazando:
7 1412140 3144
2

s 2.41gr
7(7 1)

Estadstica Lic. Jessica Oliva G.


10

Ejemplo 11: Calcular la varianza y la desviacin estndar de la resistencia a la tensin, en libras por pulgada
cuadrada (psi), de 80 muestras de una nueva aleacin de aluminio y litio.

Resistencia a la
tensin yi ni yi ni yi2 yi2ni
(psi)
70 90 80 2 160 6400 12800
90 110 100 3 300 10000 30000
110 130 120 6 720 14400 86400
130 150 140 14 1960 19600 274400
150 170 160 22 3520 25600 563200
170 190 180 17 3060 32400 550800
190 - 210 200 10 2000 40000 400000
210 230 220 4 880 48400 193600
230 250 240 2 480 57600 115200
80 13080 254400 2226400

Como el tamao de muestra es mayor a 50 no es necesario utilizar la correccin n-1


Entonces reemplazando en la frmula tenemos:

y n 2
13080 2
y ni 2
i
n
i i
2226400
80
s 33.13 psi
n 80

II. MEDIDAS DE DISPERSIN RELATIVAS


COEFICIENTE DE VARIACIN
Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las dispersiones absolutas de los
trminos de la muestra. Las medidas, tomadas en esas condiciones, sern de utilidad, slo cuando se trata de
analizar una sola muestra; pero, cuando hay que establecer comparaciones entre distintas muestras, ser necesario
expresar tales medidas en valores relativos, que pueden ser proporciones o porcentajes.

Las medidas de dispersin relativas permiten comparar grupos de series distintas en cuanto a su variacin,
independientemente de las unidades en que se midan las diferentes caractersticas en consideracin. Generalmente
las medidas de dispersin relativas se expresan en porcentajes, facilitando as el estudio con medidas procedentes
de otras series de valores. La dispersin relativa viene a ser igual a la dispersin absoluta dividida entre el promedio.
Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de variacin de Pearson, este
es un ndice de variabilidad sin dimensiones, lo que permite la comparacin entre diferentes distribuciones de
frecuencias, medidas en diferentes unidades. El coeficiente de variacin de Pearson se designa con las letras CV.
s
La frmula matemtica es: CV 100
x
Ejemplo 12: Un fabricante de tubos de televisin dispone de dos tipos de tubos, A y B. Los tubos tienen una duracin
media de 1495 h. y 1875 h. respectivamente. Las desviaciones tpicas son 280 para A y 310 para B. Determinar qu
tubo presenta mayor dispersin absoluta y cul presente mayor dispersin relativa.

Podemos decir directamente que el tipo B presenta mayor dispersin absoluta, ya que la desviacin tpica es una
medida de dispersin.
Para ver la dispersin relativa debemos calcular el Coeficiente de Variacin de Pearson (CV):

Tipo de Tubo x s CV CV (%)


A 1495 280 0.187 18.7
B 1875 310 0.165 16.5

Estadstica Lic. Jessica Oliva G.


11

Por tanto, ser el tubo A el que presente mayor dispersin relativa en su duracin.

C. ESTADIGRAFOS DE ASIMETRA Y KURTOSIS:

Coeficiente de Asimetra: En estadstica se dice que una distribucin de datos es simtrica si se le puede doblar a
lo largo de un eje vertical de una manera tal que coincidan los dos lados de la distribucin. Las distribuciones que no
tienen simetra con respecto al eje vertical se les llama sesgada o asimtrica. Una distribucin sesgada a la derecha
tiene una cola prolongada del lado derecho de la distribucin y una cola ms corta del lado izquierdo de la misma;
esta asimetra se le denomina positiva, cuando la cola de la distribucin del lado izquierdo es ms larga que la del
lado derecho, entonces la asimetra es negativa.

En una distribucin simtrica la media, la mediana y la moda son iguales. La simetra se mide por medio del
coeficiente de asimetra. Una distribucin simtrica tiene un coeficiente de asimetra igual a cero.
Cuando una distribucin de frecuencia es asimtrica, la media, la mediana y la moda se alejan una de otra, es decir,
las tres medidas de posicin son diferente; mientras ms se separe la media de la moda, mayor es la asimetra. Si la
distribucin de frecuencia es asimtricamente negativa, la cola de la curva de distribucin se encuentra hacia los
valores ms pequeos de la escala de las X y si la distribucin es asimtricamente positiva la cola de la distribucin
se ubica hacia los valores ms grandes de la escala de las X.

Karl Pearson un estudioso de la estadstica designo el coeficiente de asimetra con las letras SK y determin la
frmula para su clculo, al cual se le denomin primer coeficiente de asimetra de Pearson

( X Mo)
SK1
S

Se tiene otro coeficiente de asimetra utilizando la mediana que se le denomina segundo coeficiente de asimetra de
Pearson, este es ms preciso que el primero

3( X Md )
SK 2
S
Arthur Bowley otro estudioso de la estadstica determin que el coeficiente de asimetra se poda calcular por medio
de los cuartiles y utiliz el coeficiente de asimetra por medio de cuartiles (SKq), y la frmula es

Q1 Q3 2Q2
SK q
Q3 Q1
En donde, Q1, Q2 y Q3 son los cuartiles 1, 2 y 3 respectivamente. El valor de SKq vara entre 1 y 1; segn Bowley
una distribucin de frecuencia con un coeficiente de asimetra igual a 0.1, se considera como ligeramente asimtrica
y con un valor mayor 0.3 se le considera marcadamente asimtrica.
Si en una serie de valores la X Me Mo, entonces la distribucin de frecuencia presenta una curva asimtrica
positiva; si la X =Me = Mo = 0, la curva de la distribucin es simtrica; y si la distribucin presenta una curva en la
que el Mo Me X , entonces se dice que la curva de la distribucin asimtrica negativa.
S la curva de una distribucin de frecuencia es sesgada, la media tratar de ubicarse hacia el extremo o lado opuesto,
de la serie de valores, donde se concentran los datos. Es bueno hacer referencia que en una asimetra positiva la
X Me y en una asimetra negativa la X Me.

Estadstica Lic. Jessica Oliva G.


12

Mo < Me < = Me = Mo < Me < Mo

Considerar la asimetra de una curva de frecuencia marcadamente o ligeramente asimtrica, es un asunto de criterio
del investigador, puesto que no existen reglas rgidas establecidas que determinen las lneas divisorias o parmetros
entre ligeramente o marcadamente asimtrica; sin embargo cuando la mayora de los datos de una distribucin de
frecuencia se ubican en los extremos mayores o menores de las variables se puede afirmar con certeza que la curva
de la distribucin es marcadamente asimtrica.

Algunos investigadores como Arthur Bowley determinaron que si se aplica el SK q y ese coeficiente de asimetra
obtenido es menor que 0.3 (sin considera el signo) se puede afirmar que la curva de la distribucin es ligeramente
asimtrica, en caso contrario la curva de la distribucin sera marcadamente asimtrica.
Otros investigadores utilizan el coeficiente de asimetra segn los momentos (SK m) para tales efectos, pero no existe
criterio en cual ha de ser el coeficiente especifico que marque el lmite entre ligera y marcadamente.

Sin embargo, en este estudio se considerar que un coeficiente de asimetra segn los momentos comprendido entre
0.30 SK 0.30, sera un buen lmite para considerar una curva de distribucin como ligeramente asimtrica, de
lo contrario sera marcadamente asimtrica. El SK es el coeficiente de asimetra de mayor precisin y confiabilidad,
puesto que este, utiliza para su clculo todos los valores de la serie de datos.

Es bueno afirmar que cuando el coeficiente de asimetra de una curva de distribucin es marcadamente asimtrico
no se puede utilizar la media aritmtica como medida de tendencia central, puesto que esta es afectada altamente
por los valores extremos de una serie de datos, en su lugar es recomendable utilizar la mediana como medida de
posicin.

Coeficiente de Kurtosis: Es el grado de apuntamiento o altura de la curva de una distribucin de frecuencia. La


finalidad de la Kurtosis es determinar si la distribucin de los trminos de una serie de valores responde a una curva
normal o no. Se utiliza para observar el promedio o posicin de la distribucin, as como la media, la mediana y la
moda, se puede en esta observar la asimetra, el grado de concentracin de los datos, en fin, para observar en forma
general el comportamiento de una serie de datos en una distribucin de frecuencia. Por medio de la Kurtosis se
determinar si la distribucin de frecuencia es demasiado puntiaguda, normal o muy achatada.
El grado de apuntamiento o altura de una curva de distribucin se determina por medio del coeficiente de Kurtosis,
el cual se calcula utilizando el momento cuatro de una serie de valores con respecto a su media aritmtica. La Kurtosis
se designa con la letra K y la frmula de clculo es:

0.5( P75 P25 )


K
P90 P10
Tomando en cuenta la Kurtosis el K de una curva de distribucin puede ser: Mesocrtica, Platicrtica y Leptocrtica.

Mesocrticas.- Es aquella curva de una distribucin de frecuencia que no es ni muy alta ni muy achatada, es la
llamada curva normal.
La curva Mesocrtica tiene un coeficiente de Kurtosis igual a tres, es decir, K = 0.263

Estadstica Lic. Jessica Oliva G.


13

Leptocrtica.- Es aquella curva de la distribucin que presenta un apuntamiento o altura relativamente ms alta que
la curva Mesocrtica, en esta los datos se encuentran ms concentrados alrededor del mximo valor. El coeficiente
de Kurtosis para curva Leptocrtica es mayor de tres, es decir, K 0.263

Platicrtica.- Es la curva de una distribucin de frecuencia que presenta un achatamiento ms pronunciado que la
Mesocrtica, encontrndose los datos ms dispersos alrededor del mximo valor de la distribucin. En esta curva el
coeficiente de Kurtosis es menor de tres, es decir, K 0.263

1 PLATIKURTICA 2 MESOKURTICA 3 LEPTOKURTICA

Ejemplo 13: El jefe en control industrial de una empresa somete a un test de fiabilidad 100 dispositivos electrnicos
idnticos y anota su duracin (tiempo hasta el fallo en horas). La recogida de datos lleva a la distribucin de frecuencias
siguiente:

N de El jefe de control de calidad desea saber si la duracin de los dispositivos


Duracin (horas)
dispositivos se encuentra por debajo de la duracin esperada, adems desea tener
0 200 34 la informacin si la duracin de los dispositivos est alrededor de la
200 400 18 duracin promedio para informar al jefe de fabricacin de los dispositivos
400 600 16 que realice una inspeccin.
600 800 13
800 1000 10
1000 1200 6
1200 1400 2
1400 1600 1
Total 100

Calculamos el coeficiente de asimetra (puede utilizarse cualquier frmula) y el coeficiente Kurtosis.

x 456 Me = 377.778 Mo = 136 s = 353.927

( X Mo) (456 136)


SK1 0.904
S 353 .927

3( X Md ) 3(456 377.778)
SK 2 0.663
S 353.927

El coeficiente de asimetra nos indica que el tiempo de duracin de los dispositivos sigue una distribucin
marcadamente positiva; es decir que el tiempo de duracin de los dispositivos est por debajo del tiempo
esperado.

Estadstica Lic. Jessica Oliva G.


14

P10 = 58.824 P25 = 147.059 P75 = 707.692 P90 = 980

0.5( P75 P25 ) 0.5(707.692 147.059)


K 0.304
P90 P10 980 58.824

El coeficiente de Kurtosis nos indica que el tiempo de duracin de los dispositivos sigue una distribucin
leptocrtica o apuntada; es decir que el tiempo de duracin de los dispositivos estn muy cerca del tiempo
promedio.

REFERENCIAS BIBLIOGRFICAS

- ANDERSON D., SWEENEY D., WILLIANS T.: Estadstica para Administracin y Economa. 1era Ed.
International Thomson. Editores, S.A. Mxico. 1999.
- BERENSON M., LEVINE D.: Estadstica Bsica en Administracin: conceptos y aplicaciones. 6ta Ed.
Printice Hall Hispanoamericana S.A. Mxico 1996.
- DEVORE J.: Probabilidad y estadstica para ingeniera y ciencias. 4ta. Ed. International Thomson
Editores, S.A. Mxico. 1998
- MENDENHALL W., TERRY S.: Probabilidad y estadstica para ingeniera y ciencias. 4ta Ed. Printice Hall
Hispanoamericana S.A. Mxico. 1997.

Estadstica Lic. Jessica Oliva G.

Vous aimerez peut-être aussi