Académique Documents
Professionnel Documents
Culture Documents
A. MEDIDAS DE POSICION
1. Media aritmtica
2. Media aritmtica ponderada
3. Mediana
4. Moda
5. Cuantiles
B. MEDIDAS DE DISPERSION
I. Medidas de dispersin absolutas
1. Rango
2. Desviacin tpica
3. Varianza
INTRODUCCIN
La naturaleza de los datos permite, en muchos casos, cierto tipo de anlisis a partir de los grficos de la distribucin.
Sin embargo, tambin es necesario considerar resmenes numricos que permitan tener una mejor idea de la manera
como los datos estn distribuidos a lo largo de la recta. Estas caractersticas numricas se llaman estadgrafos.
Algunas de estas medidas dependen de todas las observaciones y son muy sensibles a las fluctuaciones de stas;
otras sin embargo, no dependen de todas las observaciones, siendo resistentes ante los cambios de los valores
extremos.
La mayor parte de los conjuntos de datos muestran a agruparse alrededor de un valor central. Estos valores, que de
alguna manera tipifican al conjunto, se llaman medidas de posicin. Entre estas medidas se tiene: la media aritmtica,
la mediana, la moda y los cuantiles.
Adems de las medidas de tendencia central estn las medidas que indican la dispersin que se produce en torno de
la media de los datos. Entre estas medidas se tiene: la varianza, la desviacin estndar, el coeficiente de variacin.
La manera como estn distribuidos los datos de un conjunto puede resumirse en lo que se llama la asimetra y el
apuntamiento de la curva que los describe.
Simbologa:
Tamao
Media aritmtica
(nmero de datos)
Muestra n x : media muestral
Poblacin N : media poblacional
n
a. Datos no agrupados
x x2 ... xn x i
x 1 i 1
n n
Se lee as: la media es igual a la suma de las xs dividido por n.
Ejemplo 1: La siguiente tabla muestra el nmero de reclamos y quejas presentadas por clientes de una tienda
a lo largo de una semana. Si se elige al azar un da de la semana cuntos reclamos se espera tener?
x i
8 10 5 12 10 15 60
x i 1
10 reclamos
n 6 6
Interpretacin: Se espera que los clientes de esta tienda realicen 10 reclamos por da.
y n y 2 n 2 ... y m n m y n
i 1
i i
y 1 1 ; yi : marca de clase i
n n
Ejemplo 2: La distribucin de frecuencias siguiente, representa los puntajes obtenidos en una evaluacin del
desempeo, aplicado al personal tcnico de una empresa. Si se elige al azar un tcnico Qu puntaje se
espera que tenga en su evaluacin de desempeo?
Interpretacin: Se espera que el tcnico elegido al azar tenga un puntaje de 26.3 en su evaluacin de desempeo.
Desventajas:
1. Puede verse afectada por los valores extremos.
2. Si la muestra es grande y los datos no estn agrupados, su clculo es tedioso.
3. Si los datos estn agrupados en clases con extremos abiertos, no es posible calcular la media
Nota: La media aritmtica como estadgrafo de posicin de una distribucin, proporciona una idea de la posicin
de los valores alrededor de la media, La media es un promedio, por tanto no significa:
i) Que todos los valores observados resultan ahora ser iguales.
ii) Que la media se ubica exactamente en el centro de la distribucin, excepto si la distribucin es simtrica.
Entonces, la media aritmtica en general no divide a la distribucin.
Ejercicio: En una pequea empresa de 10 trabajadores se hizo una prueba de razonamiento y otra de habilidad. Se
obtuvieron las siguientes calificaciones.
Razonamiento 48 38 65 56 16 55 28 62 32 48
Habilidad 36 18 54 47 21 56 68 70 72 38
y
2. MEDIA ARITMTICA PONDERADA ( p )
Se denomina media ponderada de un conjunto de nmeros al resultado de multiplicar cada uno de los nmeros
por un valor particular para cada uno de ellos, llamado su peso (factor de ponderacin) y obteniendo a continuacin
la media aritmtica del conjunto formado por los productos anteriores.
Se utiliza la media ponderada cuando no todos los elementos componentes de los que se pretende obtener la
media tienen la misma importancia.
m
w1 n1 w2 n 2 ... wm n m w n
i 1
i i
yp m
m
; Wi = factor de ponderacin
w
i 1
i w
i 1
i
Ejemplo 3: Una empresa comercializadora de computadoras personales dispone 3 vendedores, cada uno de los
cuales cobran diferente comisin por computadora vendida, y realiza diferente nmero de ventas. Cul es la
comisin que se espera que cobre un vendedor por computadora vendida?
a. Datos no agrupados:
Me = xn 1 / 2
Ejemplo 4: Los siguientes datos se refieren al nmero de clientes atendidos durante los ltimos 9 das en una
tienda. 14, 12, 7, 17, 10, 13, 15, 10, 12
Me
Primero se ordenan los datos:
7, 10, 10, 12, 12 13, 14, 15, 17
a.2 Nmero Par de datos, la mediana es igual al promedio de los valores centrales
xn / 2 xn / 2 1
Me =
2
Ejemplo 5: 14, 26, 12, 20, 25, 26, 34, 36, 10
10 12 14 20 25 26 34 36
Para determinar el intervalo mediano se debe calcular el valor de n/2 y ubicar en la columna de frecuencias
acumuladas la frecuencia que supera al valor de n/2, en ese lugar se ubicar el intervalo mediano.
Ejemplo 6: La tabla siguiente muestra la experiencia profesional (aos) del personal tcnico que labora en una
empresa.
Experiencia
N de tcnicos
profesional Ni 35 16
(aos)
(ni) Me 7 4 10.2
aos
24
0 - 3 4 4
3 - 7 12 16
Interpretacin: El 50% de los profesionales tcnicos que
7 - 11 24 40 laboran en esta empresa tienen una experiencia laboral
11 - 15 16 56 igual o menor a 10 aos 2 meses. El otro 50% de los
15 - 19 10 66 profesionales tiene una experiencia laboral igual o mayor
19 - 23 4 70 a 10 aos y 2 meses.
Total 70
Ventajas
La mediana es ms recomendable que la media aritmtica, cuando:
1. La mediana no est afectada por los valores extremos como sucede con la media.
2. Se puede determinar para datos cualitativos, susceptibles de ordenarse de acuerdo a rangos, calificaciones o
categoras.
Desventajas
1. Como valor central, se debe ordenar primero la serie de datos.
2. Para una serie amplia de datos no agrupados, el proceso de ordenamiento de los datos demanda tiempo y
usualmente provoca equivocaciones.
a. Datos no agrupados
- El conjunto: 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 13 tiene la moda Mo = 9.
- El conjunto: 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos modas, 4 y 7; es una distribucin bimodal
- El conjunto: 3, 5, 8, 10, 12, 16, 18 no tiene moda.
1
Mo l i c
1 2
Donde:
1 : frecuencia de la clase modal menos la frecuencia de la clase anterior
2 : frecuencia de la clase modal menos la frecuencia de la clase siguiente
Ejemplo 7: La tabla siguiente muestra los errores de facturacin durante un mes, en una empresa
comercializadora.
Errores de
Das
facturacin 6
03 Mo 3 4 5.4
6
6 4
37 12
7 11 8 Interpretacin: Durante un mes, el nmero ms frecuente de errores
11 15 3 de facturacin en esta empresa comercializadora es de 5.
15 19 1
Total 30
Desventajas
1. No tiene un uso tan frecuente como la media.
2. Muchas veces no existe moda (distribucin amodal)
3. En otros casos la distribucin tiene varias modas, lo que dificulta su interpretacin.
x = Me = Mo
Mo < Me < x
x < Me < Mo
5. LOS CUANTILES
Cuando los valores ordenados de una variable han de ser divididos en grupos homogneos en cuanto al tamao,
se suelen utilizar los cuantiles.
Los cuantiles ms usados en el anlisis estadstico son: cuartiles, deciles y percentiles. Los cuantiles se usan
frecuentemente para describir el comportamiento de una poblacin. Los valores se dan a menudo en tanto por
ciento.
a. Datos no agrupados
Percentiles
Un percentil da informacin acerca de cmo se distribuyen los valores sobre el intervalo, desde el menor hasta el
mayor. El percentil se define como sigue:
El p-simo percentil es un valor tal que por lo menos p por ciento de las observaciones son
menores o iguales que este valor y por lo menos (100 p) por ciento de las observaciones
son mayores o iguales que este valor.
Si i es entero, el p-simo percentil es el promedio de los valores de los datos ubicados en los lugares i e i+1
Ejemplo 8: Se tienen los siguientes valores 27, 25, 20, 15, 30, 34, 28 y 25. Encuentre el percentil 50 y 85
Se ordena: 15 20 25 25 27 28 30 34
Para calcular el percentil 50
p 50
Se calcula i n = 8 4
100 100
15 20 25 25 27 28 30 34
P50
P50 = (25 + 27) / 2 = 26
p 85
Se calcula i n = 8 6.8 7
100 100 P85
15 20 25 25 27 28 30 34
Cuartiles
Con frecuencia se dividen los datos en cuatro partes, cada una con aproximadamente la cuarta parte, o el 25% de
las observaciones. A los puntos de divisin se les llama Cuartiles y se definen como sigue.
( p / 100 )n N i 1
Pp li c
ni
Donde:
[li ls) : el intervalo que contiene dicho percentil
c : la amplitud del intervalo
ni : frecuencia del intervalo
Ni-1 : frecuencia acumulada antes del intervalo
Ejemplo 9: Los siguientes datos es el nmero de piezas fabricadas por 110 de trabajadores en una semana.
a. Cul es la cantidad de piezas como mximo que fabrica el 25% de trabajadores con menor produccin?
b. Cul es la cantidad de piezas como mnimo que fabrica el 25% de trabajadores con mayor produccin?
N de piezas N de
Ni
fabricadas trabajadores
20 25 5 5
25 30 7 12
30 35 9 21
35 40 14 35 P25
40 45 20 55
45 50 26 81
50 55 18 99 P75
55 60 11 110
Total 110
p 25
Calculamos n = 110 27.5
100 100
27.5 21
P25 35 5 43.1
14
El 25% de trabajadores con menor produccin fabrican como mximo 43.1 piezas.
p 75
Calculamos n = 110 82.5
100 100
82.5 81
P75 50 5 50.4
18
El 25% de trabajadores con mayor produccin fabrican como mnimo 43.1 piezas.
B. MEDIDAS DE DISPERSIN:
Las medidas de posicin central son los valores que de una manera condensada representan una serie de datos,
pero realmente no son suficientes para caracterizar una distribucin de frecuencia. Para describir una distribucin
de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersin o variabilidad de
los datos, es decir, su alejamiento de las medidas de posicin central. Estas medidas de posicin central no tienen
ningn valor si no se conoce como se acercan o se alejan esos valores con respecto al promedio, en otras palabras
es conocer cmo se dispersan o varan esos valores con respecto al promedio de una distribucin de frecuencia.
La dispersin o variabilidad se entiende como el hecho de que los valores de una serie difieran uno de otro, es
decir, como se estn dispersando o distribuyendo en la distribucin. De acuerdo con esto es necesario encontrar
una medida que indique hasta qu punto los valores de una variable estn dispersos en relacin con el valor tpico.
Las medidas de variabilidad son nmeros que expresan la forma en que los valores de una serie de datos cambian
alrededor de una medida de posicin central la cual por lo general es la media aritmtica.
Se llama Variacin o Dispersin de los datos, el grado en que los valores de una distribucin o serie numrica
tienden a acercarse o alejarse alrededor de un promedio. Cuando la dispersin es baja indica que la serie de
valores es relativamente homognea mientras que una variabilidad alta indica una serie de valores heterognea.
Cuando los valores observados de una serie estn muy concentrados alrededor del promedio, se dice que ese
promedio es o ser muy representativo; pero si estn muy dispersos con relacin al promedio, es decir muy
esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la serie o distribucin,
puesto que no representan adecuadamente los datos individuales de esa distribucin. Es importante obtener una
medida que indique hasta qu punto las observaciones de una serie de valores estn variando en relacin con el
valor tpico de la serie.
a) Datos no agrupados
n xi2 xi
n
(x x) 2
2
i
s
s i 1
n(n 1)
n 1
Es importante recordar que cuando se trabaja con la frmula para datos no agrupados y se trata de una
muestra se utilizar como denominador n1, para corregir el sesgo, pero si en la muestra n 50, entonces
se utilizar n, simplemente.
( y i y ) 2 ni y n 2
s y 2
i ni i i
n 1 s n
n 1
3. VARIANZA
Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviacin tpica; viene
expresada con las mismas letras de la desviacin tpica pero elevada al cuadrado, as S2 y 2. Las frmulas para
calcular la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las respectivas races, las
cuales desaparecen al estar elevados el primer miembro al cuadrado.
yn
y n
2
2 i i
i i
s2 n
n 1
Ejemplo 10: El tcnico responsable del funcionamiento de una empaquetadora automtica, la ajust en principio,
para 450 gr. Media hora despus del principio de la produccin se apartaron 10 paquetes para verificar su peso.
Los resultados son:
a. Calcular Rango
b. Calcular la desviacin tpica
Solucin:
a. R x max x min 453 446 = 7gr
n xi2 xi
b. Para calcular la desviacin tpica utilizaremos la siguiente frmula: 2
s
n(n 1)
n = 7; x i 3144 ; x 2
i 1412140
Reemplazando:
7 1412140 3144
2
s 2.41gr
7(7 1)
Ejemplo 11: Calcular la varianza y la desviacin estndar de la resistencia a la tensin, en libras por pulgada
cuadrada (psi), de 80 muestras de una nueva aleacin de aluminio y litio.
Resistencia a la
tensin yi ni yi ni yi2 yi2ni
(psi)
70 90 80 2 160 6400 12800
90 110 100 3 300 10000 30000
110 130 120 6 720 14400 86400
130 150 140 14 1960 19600 274400
150 170 160 22 3520 25600 563200
170 190 180 17 3060 32400 550800
190 - 210 200 10 2000 40000 400000
210 230 220 4 880 48400 193600
230 250 240 2 480 57600 115200
80 13080 254400 2226400
y n 2
13080 2
y ni 2
i
n
i i
2226400
80
s 33.13 psi
n 80
Las medidas de dispersin relativas permiten comparar grupos de series distintas en cuanto a su variacin,
independientemente de las unidades en que se midan las diferentes caractersticas en consideracin. Generalmente
las medidas de dispersin relativas se expresan en porcentajes, facilitando as el estudio con medidas procedentes
de otras series de valores. La dispersin relativa viene a ser igual a la dispersin absoluta dividida entre el promedio.
Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de variacin de Pearson, este
es un ndice de variabilidad sin dimensiones, lo que permite la comparacin entre diferentes distribuciones de
frecuencias, medidas en diferentes unidades. El coeficiente de variacin de Pearson se designa con las letras CV.
s
La frmula matemtica es: CV 100
x
Ejemplo 12: Un fabricante de tubos de televisin dispone de dos tipos de tubos, A y B. Los tubos tienen una duracin
media de 1495 h. y 1875 h. respectivamente. Las desviaciones tpicas son 280 para A y 310 para B. Determinar qu
tubo presenta mayor dispersin absoluta y cul presente mayor dispersin relativa.
Podemos decir directamente que el tipo B presenta mayor dispersin absoluta, ya que la desviacin tpica es una
medida de dispersin.
Para ver la dispersin relativa debemos calcular el Coeficiente de Variacin de Pearson (CV):
Por tanto, ser el tubo A el que presente mayor dispersin relativa en su duracin.
Coeficiente de Asimetra: En estadstica se dice que una distribucin de datos es simtrica si se le puede doblar a
lo largo de un eje vertical de una manera tal que coincidan los dos lados de la distribucin. Las distribuciones que no
tienen simetra con respecto al eje vertical se les llama sesgada o asimtrica. Una distribucin sesgada a la derecha
tiene una cola prolongada del lado derecho de la distribucin y una cola ms corta del lado izquierdo de la misma;
esta asimetra se le denomina positiva, cuando la cola de la distribucin del lado izquierdo es ms larga que la del
lado derecho, entonces la asimetra es negativa.
En una distribucin simtrica la media, la mediana y la moda son iguales. La simetra se mide por medio del
coeficiente de asimetra. Una distribucin simtrica tiene un coeficiente de asimetra igual a cero.
Cuando una distribucin de frecuencia es asimtrica, la media, la mediana y la moda se alejan una de otra, es decir,
las tres medidas de posicin son diferente; mientras ms se separe la media de la moda, mayor es la asimetra. Si la
distribucin de frecuencia es asimtricamente negativa, la cola de la curva de distribucin se encuentra hacia los
valores ms pequeos de la escala de las X y si la distribucin es asimtricamente positiva la cola de la distribucin
se ubica hacia los valores ms grandes de la escala de las X.
Karl Pearson un estudioso de la estadstica designo el coeficiente de asimetra con las letras SK y determin la
frmula para su clculo, al cual se le denomin primer coeficiente de asimetra de Pearson
( X Mo)
SK1
S
Se tiene otro coeficiente de asimetra utilizando la mediana que se le denomina segundo coeficiente de asimetra de
Pearson, este es ms preciso que el primero
3( X Md )
SK 2
S
Arthur Bowley otro estudioso de la estadstica determin que el coeficiente de asimetra se poda calcular por medio
de los cuartiles y utiliz el coeficiente de asimetra por medio de cuartiles (SKq), y la frmula es
Q1 Q3 2Q2
SK q
Q3 Q1
En donde, Q1, Q2 y Q3 son los cuartiles 1, 2 y 3 respectivamente. El valor de SKq vara entre 1 y 1; segn Bowley
una distribucin de frecuencia con un coeficiente de asimetra igual a 0.1, se considera como ligeramente asimtrica
y con un valor mayor 0.3 se le considera marcadamente asimtrica.
Si en una serie de valores la X Me Mo, entonces la distribucin de frecuencia presenta una curva asimtrica
positiva; si la X =Me = Mo = 0, la curva de la distribucin es simtrica; y si la distribucin presenta una curva en la
que el Mo Me X , entonces se dice que la curva de la distribucin asimtrica negativa.
S la curva de una distribucin de frecuencia es sesgada, la media tratar de ubicarse hacia el extremo o lado opuesto,
de la serie de valores, donde se concentran los datos. Es bueno hacer referencia que en una asimetra positiva la
X Me y en una asimetra negativa la X Me.
Considerar la asimetra de una curva de frecuencia marcadamente o ligeramente asimtrica, es un asunto de criterio
del investigador, puesto que no existen reglas rgidas establecidas que determinen las lneas divisorias o parmetros
entre ligeramente o marcadamente asimtrica; sin embargo cuando la mayora de los datos de una distribucin de
frecuencia se ubican en los extremos mayores o menores de las variables se puede afirmar con certeza que la curva
de la distribucin es marcadamente asimtrica.
Algunos investigadores como Arthur Bowley determinaron que si se aplica el SK q y ese coeficiente de asimetra
obtenido es menor que 0.3 (sin considera el signo) se puede afirmar que la curva de la distribucin es ligeramente
asimtrica, en caso contrario la curva de la distribucin sera marcadamente asimtrica.
Otros investigadores utilizan el coeficiente de asimetra segn los momentos (SK m) para tales efectos, pero no existe
criterio en cual ha de ser el coeficiente especifico que marque el lmite entre ligera y marcadamente.
Sin embargo, en este estudio se considerar que un coeficiente de asimetra segn los momentos comprendido entre
0.30 SK 0.30, sera un buen lmite para considerar una curva de distribucin como ligeramente asimtrica, de
lo contrario sera marcadamente asimtrica. El SK es el coeficiente de asimetra de mayor precisin y confiabilidad,
puesto que este, utiliza para su clculo todos los valores de la serie de datos.
Es bueno afirmar que cuando el coeficiente de asimetra de una curva de distribucin es marcadamente asimtrico
no se puede utilizar la media aritmtica como medida de tendencia central, puesto que esta es afectada altamente
por los valores extremos de una serie de datos, en su lugar es recomendable utilizar la mediana como medida de
posicin.
Mesocrticas.- Es aquella curva de una distribucin de frecuencia que no es ni muy alta ni muy achatada, es la
llamada curva normal.
La curva Mesocrtica tiene un coeficiente de Kurtosis igual a tres, es decir, K = 0.263
Leptocrtica.- Es aquella curva de la distribucin que presenta un apuntamiento o altura relativamente ms alta que
la curva Mesocrtica, en esta los datos se encuentran ms concentrados alrededor del mximo valor. El coeficiente
de Kurtosis para curva Leptocrtica es mayor de tres, es decir, K 0.263
Platicrtica.- Es la curva de una distribucin de frecuencia que presenta un achatamiento ms pronunciado que la
Mesocrtica, encontrndose los datos ms dispersos alrededor del mximo valor de la distribucin. En esta curva el
coeficiente de Kurtosis es menor de tres, es decir, K 0.263
Ejemplo 13: El jefe en control industrial de una empresa somete a un test de fiabilidad 100 dispositivos electrnicos
idnticos y anota su duracin (tiempo hasta el fallo en horas). La recogida de datos lleva a la distribucin de frecuencias
siguiente:
3( X Md ) 3(456 377.778)
SK 2 0.663
S 353.927
El coeficiente de asimetra nos indica que el tiempo de duracin de los dispositivos sigue una distribucin
marcadamente positiva; es decir que el tiempo de duracin de los dispositivos est por debajo del tiempo
esperado.
El coeficiente de Kurtosis nos indica que el tiempo de duracin de los dispositivos sigue una distribucin
leptocrtica o apuntada; es decir que el tiempo de duracin de los dispositivos estn muy cerca del tiempo
promedio.
REFERENCIAS BIBLIOGRFICAS
- ANDERSON D., SWEENEY D., WILLIANS T.: Estadstica para Administracin y Economa. 1era Ed.
International Thomson. Editores, S.A. Mxico. 1999.
- BERENSON M., LEVINE D.: Estadstica Bsica en Administracin: conceptos y aplicaciones. 6ta Ed.
Printice Hall Hispanoamericana S.A. Mxico 1996.
- DEVORE J.: Probabilidad y estadstica para ingeniera y ciencias. 4ta. Ed. International Thomson
Editores, S.A. Mxico. 1998
- MENDENHALL W., TERRY S.: Probabilidad y estadstica para ingeniera y ciencias. 4ta Ed. Printice Hall
Hispanoamericana S.A. Mxico. 1997.