Vous êtes sur la page 1sur 35

MEDIDAS DE CENTRALIZACION O DE POSICION

Son medidas estadsticas de resumen que expresan o representan


una tendencia central o una posicin.
Entre las principales tenemos:
Supongamos que tomamos una muestra de n datos estadsticos
de una variable X:
a) Media aritmtica:

X= Xi
n

b) Mediana (Me): Es una medida de tendencia central que divide


a los datos estadsticos ordenados en forma ascendente o
descendente en 2 partes iguales, 50% a la izquierda o menor
que la mediana y el 50% a la derecha o mayor que la mediana.
JUAN MANUEL ANTON PEREZ

Si n es impar: Me = Xj (Xj es el valor central).


Si n es par: Me = Xj + Xj+1
2
(Xj y Xj+1 son los valores centrales).
La mediana no es sensible a los valores extremos, como sucede con la
media aritmtica, dado que depende nicamente de los valores
centrales. De existir valores extremos que difieren considerablemente
del resto, la mediana es ms representativa que la media aritmtica,
dado que localiza o se ubica mejor en el centro de la distribucin de
datos.

JUAN MANUEL ANTON PEREZ

Mg. J.M. ANTON

c) Moda: Es el valor ms frecuente.

Si una distribucin no tiene moda, se le denomina


distribucin a modal.

Si tiene una moda se le denomina distribucin unimodal.

Si tiene 2 modas se le denomina distribucin bimodal.

Si tiene n modas se le denomina distribucin n modal.


Cuando los datos son de variable cualitativa, la medida
descriptiva ms adecuada es la moda.
La moda de datos cualitativos es aquella categora que se
repite con ms frecuencia o se presenta en un porcentaje
mayor.

JUAN MANUEL ANTON PEREZ

Mg. J.M. ANTON

RELACION ENTRE MEDIA, MEDIANA Y


MODA
En una distribucin unimodal, si la distribucin es simtrica;
entonces, la media, mediana y moda son iguales.
Si en una distribucin unimodal, la media, mediana y moda son
diferentes por lo menos de dos en dos, entonces, la distribucin
es asimtrica o sesgada.
Si al distribucin es asimtrica y Mo< Me< X se dice que es
sesgada a la derecha. La distribucin presenta una larga cola hacia
la derecha.
Si la distribucin es asimtrica y X < Me < Mo, se dice que es
sesgada a la izquierda. La distribucin presenta una larga cola
hacia la izquierda.
JUAN MANUEL ANTON PEREZ

3-26

Distribucin simtrica
sesgo cero

moda = mediana = media

JUAN MANUEL ANTON PEREZ

3-27

Distribucin con Asimetra Positiva


sesgo a la derecha: media y mediana se encuentran a la
derecha de la moda.

moda < mediana < media


JUAN MANUEL ANTON PEREZ

3-28

Distribucin con asimetra negativa


Sesgo a la izquierda: media y mediana estn a la izquierda de
la moda.

media < mediana < moda


JUAN MANUEL ANTON PEREZ

d) Cuartiles (Qi): Dividen a los datos estadsticos ordenados


de menor a mayor (ascendente) o de mayor a menor
(descendente) en 4 partes iguales.
Para calcular un cuartil, hay que determinar primero su
ubicacin o posicin como se indica:
Qi : i*(n+1)/4, i = 1,3
25%

25%

Q1

25%

Q2

25%

Q3

Q4

Nota: si i (n+1)/4 no es entero, hacemos una interpolacin


lineal entre los dos valores correspondientes a las dos
observaciones entre las cuales se encuentra la fraccin.
JUAN MANUEL ANTON PEREZ

e) Deciles (Di): Dividen a los datos estadsticos ordenados de


menor a mayor (ascendente) o de mayor a menor
(descendente) en 10 partes iguales.
Para calcular una decil, hay que determinar primero su
ubicacin como se indica:
Di : i*(n+1)/10,
10% 10%

D1

10%

D2

D3

i = 1,9

10% 10% 10% 10% 10%

D4

D5

D6

D7

10%

D8

10%

D9 D
10

Nota: si i (n+1)/10 no es entero, hacemos una interpolacin


lineal entre los dos valores correspondientes a las dos
observaciones entre las cuales se encuentra la fraccin.
JUAN MANUEL ANTON PEREZ

f) Percentiles (Pi): Dividen a los datos estadsticos ordenados


de menor a mayor (ascendente) o de mayor a menor
(descendente) en 100 partes iguales.
Para calcular una percentil, hay que determinar primero su
ubicacin como se indica:
Pi : i*(n+1)/100,
P1 P2

P50

i = 1,99
P99 P100

Nota: Si i (n+1)/100 no es entero, hacemos una interpolacin


lineal entre los dos valores correspondientes a las dos
observaciones entre las cuales se encuentra la fraccin.
Los cuartiles, deciles y percentiles se denominan en trminos
generales centiles o cuantilas, los mismos que slo existen
para datos estadsticos cuantitativos.
JUAN MANUEL ANTON PEREZ

Mg. J.M. ANTON

MEDIDAS DE DISPERSIN
En una investigacin cientfica, es insuficiente el reporte de solo
medidas de posicin. Es necesario completamentar dicha
informacin con alguna medida de variabilidad; esto permitir al
investigador tener un mayor y mejor conocimiento sobre la
distribucin estadstica de la variable o las variables de estudio.
Entre las principales medidas de dispersin tenemos:
a) Rango (R): mide la amplitud del recorrido de la variable
cuantitativa o numrica que se estudia. Se calcula restando al
mximo valor o limite superior (Ls) el menor valor o limite
inferior (Li):
R= Ls - Li
JUAN MANUEL ANTON PEREZ

Mg. J.M. ANTON

b) Varianza (S2): llamada tambin variancia, mide el grado de


variabilidad de los datos estadsticos respeto al promedio
aritmtico. Para el caso de una muestra aleatoria se le denota
por S2 y su clculo es:

S2 = (Xi - X) 2
n-1

Donde n es el tamao de muestra

JUAN MANUEL ANTON PEREZ

Mg. J.M. ANTON

c) Desviacin Estndar: llamada tambin desviacin tpica o


error tpico mide el grado de dispersin de los datos
estadsticos respecto al promedio aritmtico. Su clculo es la
raz cuadrada de la varianza. Para el caso de una muestra
aleatoria de tamao n se tiene:

S=

S2 = (Xi - X) 2
n-1

Tiene las mismas unidades de la variable.

JUAN MANUEL ANTON PEREZ

d) Coeficiente de variacin (CV): Llamado tambin


dispersin relativa, es una medida de variabilidad relativa, libre
de unidades y generalmente expresado en porcentajes.
Es ideal cuando se compara la variabilidad de los datos
estadsticos de 2 o ms poblaciones expresados en distintas
unidades.
Entonces, cuando las medias o varianzas (o desviaciones
estndar) de dos o ms poblaciones difieren notablemente o
estn expresadas en distintas unidades, diremos que es ms
homognea la distribucin que tiene menor coeficiente de
variacin o ms heterognea la que tiene mayor coeficiente de
variacin. Se define como:

C.V = S/X * 100%


JUAN MANUEL ANTON PEREZ

Mg. J.M. ANTON

Ejemplo: El jefe de Control de Calidad de una empresa


productora de chorizo, toma 32 muestras de este producto
preparado el mismo da bajo las mismas condiciones y de la
misma calidad, luego las pone bajo refrigeracin a una misma
temperatura, y observa su vida til o tiempo de conservacin.
Los resultados fueron los sgtes en das:
13 10 12 13 18 14 14 12
16 14 13 17 12 16 15 18
10 16 12 14 13 13 15 17
16 14 13 15 10 17 12 14

Calcular el interpretar: X, Mo, Me, Q3, D6, P11, P95, R,


S2, S, CV
JUAN MANUEL ANTON PEREZ

Para calcular la X y la Mo no necesitamos ordenar los datos.


a) X = (13+10+12+ ... + 14)/32 = 14 das
Se estima que la vida til promedio del chorizo en refrigeracin
producido por la empresa es de 14 das.
b) Mo = 13 das, Mo = 14 das.
La vida til del chorizo bajo refrigeracin ms frecuente fue de
13 y de 14 das.
Ahora ordenemos los datos de menor a mayor:
10 10 - 10 12 12 12 12 12
13 13 - 13 13 - 13 - 13 14 - 14
14 1 4 - 1 4 -14 15 15 15 - 16
16 16 16 17 17 - 17 18 18
c) Como n = 32 es par, entonces: Me = (Xj + Xj+1)/2
j = 16, j+1 = 17
Me = (14 + 14 )/2 = 14
JUAN MANUEL ANTON PEREZ

El 50% de las muestras de chorizo tuvieron una vida til bajo


refrigeracin menor o igual a 14 das.
d) Q3 : 3*(32+1)/4 = 24.75 = 24+0.75
El valor que est en la posicin 24 es 16, al igual que el valor que
est en la posicin 25, y su diferencia es 16 16 = 0 y 0.75 x 0 =
0; por lo tanto el Q3 = 16.
El 75% de las muestras de chorizo tuvieron una vida til bajo
refrigeracin inferior o igual a 16 das.
e) D6 : 6*(32+1)/10 = 19.20 = 19+0.20
El valor que esta en la posicin 19 es 14, al igual que el valor que
est en la posicin 20, y su diferencia es 14 14 = 0 y 0.20 (0) =
0 ; por lo tanto el D6= 14.
El 40% de las muestras de chorizo tuvieron una vida til bajo
refrigeracin mayor a 14 das.
JUAN MANUEL ANTON PEREZ

Mg. J.M. ANTON

f) P11 : 11*(32+1)/100 = 3.63 = 3+ 0.63


El valor que est en la posicin 3 es 10 y el valor que est en la
posicin 4 es 12, y su diferencia es 12 10 =2 y 0.63 x 2 = 1.26;
por lo tanto el P11 = 10 + 1.26
P 11 = 11.26 das.
Se estima que el 89% del chorizo producido por la empresa tiene
una vida til superior a 11.26 das.
g) P95 : 95*(32+1)/100 = 30.40 = 30 + 0.40
El valor que est en la posicin 30 es 17 y el valor que est en la
posicin 31 es 18, y su diferencia es 18 17 = 1 y 0.40*1 = 0.40;
por lo tanto el P95 = 17+0.40
P 95 = 17.40 das.
El 95% de las muestras de chorizo tuvieron una vida til bajo
refrigeracin inferior o igual a 17.40 das

JUAN MANUEL ANTON PEREZ

MEDIDAS DE CENTRALIZACIN O
DE POSICION Y DISPERSION
Los datos estadsticos pueden presentarse sin tabular o tabulados
en cuadros estadsticos; an cuando los datos de las variables de
estudio en una investigacin cientfica se presentan en cuadros
estadsticos, se presentan tambin los modelos estadsticos de
centralizacin o de posicin y de dispersin para datos sin
tabular o sin agrupar.
I Para Datos sin Tabular o sin Agrupar
Se denominan datos estadsticos sin tabular o sin agrupar
aquellos que aparecen uno a continuacin de otro, sin figurar en
un cuadro estadstico.

JUAN MANUEL ANTON PEREZ

II. Para datos tabulados o agrupados


Se denomina datos tabulados o agrupados a aquellos que
aparecen por categoras en cuadros estadsticos.
Medidas de centralizacin o de posicin
Son medidas estadsticas de resumen que expresan o representan
una tendencia central o una posicin.
Entre las principales tenemos:
Supongamos que tomamos una muestra de n datos
estadsticos de un variable cuantitativa X agrupados en
categoras puntuales o intervalos de clase.

JUAN MANUEL ANTON PEREZ

a) Media Aritmtica: X = yi*ni/n , donde:


yi: puntos medios o marcas de clase de los intervalos de clase.
ni = fi: frecuencias absolutas simple.
b) Moda (Mo): es el valor ms frecuente.

Mo= Linf +

nj nj-1
nj nj-1+ nj nj+1

*C

nj: mayor frecuencia absoluta


nj-1: frecuencia absoluta simple inmediatamente anterior a nj:
nj+1: frecuencia absoluta simple inmediatamente posterior a nj
C: amplitud del intervalo que contiene la moda
Linf: limite inferior del intervalo que contiene a la moda
JUAN MANUEL ANTON PEREZ

c) Mediana (Me): divide a los datos estadsticos ordenados


en 2 partes iguales.

Me = Linf +

n/2 Nj-1
Nj Nj - 1

*C

Linf: limite inferior del intervalo que contiene a la mediana


Nj : frecuencia absoluta acumulada correspondiente al
intervalo que contiene a la mediana.
Nj-1: frecuencia absoluta acumulada inmediatamente anterior a
Nj.
C: amplitud del intervalo que contiene a la mediana
JUAN MANUEL ANTON PEREZ

d) Cuartil (Qi): divide a los datos estadsticos ordenados en 4


partes iguales.

Qi= Linf +

i*n/4 Nj-1
Nj Nj - 1

*C

Nj : frecuencia absoluta acumulada correspondiente al


intervalo que contiene al Qi.
Nj-1: frecuencia absoluta acumulada inmediatamente anterior
a Nj.
Linf: limite inferior del intervalo que contiene a Qi
C: amplitud del intervalo que contiene a Qi

JUAN MANUEL ANTON PEREZ

e) Decil (Di) : divide a los datos estadsticos ordenados en 10


partes iguales

Di= Linf +

i*n/10 Nj-1
Nj Nj - 1

*C

Nj : frecuencia absoluta acumulada correspondiente al


intervalo que contiene al decil Di
Nj-1: frecuencia absoluta acumulada inmediatamente
anterior a Nj.
C: amplitud del intervalo que contiene a Di
Linf: limite inferior del intervalo que contiene al Di
JUAN MANUEL ANTON PEREZ

f) Percentil (Pi) : divide a los datos estadsticos ordenados en


100 partes iguales

Pi= Linf + i*n/100 Nj-1


*C
Nj Nj - 1
Nj : frecuencia absoluta acumulada correspondiente al
intervalo que contiene al Pi
Nj-1: frecuencia absoluta acumulada inmediatamente
anterior a Nj.
C: amplitud del intervalo que contiene a Pi
Linf: limite inferior del intervalo que contiene al Pi
JUAN MANUEL ANTON PEREZ

Medidas de Dispersin
a) Rango ( R ): R= Ls Li
Ls : limite superior del ltimo intervalo
Li. limite inferior del primer intervalo
b) Varianza:
S2 =

(yi X)2 *ni


n-1

yi: puntos medios de los intervalos de clase


ni: frecuencias absolutas simples
n: tamao de la muestra
X : media
JUAN MANUEL ANTON PEREZ

c) Desviacin Estndar: S =

S=

S2

(yi X)2 *ni


n-1

yi: puntos medios de los intervalos de clase


ni: frecuencias absolutas simples
n: tamao de la muestra
X : media
Ejemplo: se presenta nuevamente el stgs. cuadro estadstico
JUAN MANUEL ANTON PEREZ

CUADRO N 02
Distrito de Nueva Arica Provincia de Chiclayo
Familias segn Gasto Mensual en Alimentacin.
Enero - marzo 2005
Gasto Mensual S/. [ ,

Yi

Total

ni

hi%

190

100.00

Ni

300 - 400

350

19

10.00

19

400 - 500

450

32

16.84

51

500 - 650

575

57

30.00

108

650 - 800

725

41

21.58

149

800 - 1000

900

28

14.74

177

1000 - 1200

1100

13

6.84

190

P26, R, S2, S y Calcular e interpretar la X, Mo, Me, Q1, D9, CV


JUAN MANUEL ANTON PEREZ

a) X = (350*19+450*32+.... + 1100*13)/190 = S/. 647,63


Se estima que el gasto mensual promedio en alimentacin por
parte de las familias del distrito de Nueva Arica Chiclayo es
de S/. 647,63.
b) nj = 57, nj+1 = 41, nj-1 = 32, Linf = 500, C= 150
Mo= 500 +

57 32
57 32+ 57 41

Mo= 500 +

25
25 + 16

*150

*150

Mo= S/ 591,46
Se infiere que el gasto mensual en alimentacin ms frecuente por
parte de las familias del distrito de Nueva Arica- Chiclayo es de S/.
591,46
JUAN MANUEL ANTON PEREZ

c) n/2 = 190/2 = 95,


(650-500) = 150

Nj= 108, Nj-1 = 51 Linf = 500, C =

Me = 500 +

95 51
108 51

*150 = S/ 615,79

El 50% de las familias encuestadas manifestaron tienen un gasto


mensual en alimentacin inferior o igual a 615,79 nuevos soles.

JUAN MANUEL ANTON PEREZ

d) Q1 : 1*190/4 =47,5
C = 100

Nj= 51, Nj-1 = 19, Linf = 400,

47,5 19
51 19

Q1 = 400 +
Q1

*100 = 400 + 28,5


32

*100

= S/ 489,06

El 75% de las familias encuestadas manifestaron tener un gasto


mensual en alimentacin superior a los 489,06 nuevos soles.

JUAN MANUEL ANTON PEREZ

e) D9 : 9*190/10 =171,0
Nj= 177, Nj-1 = 149, Linf = 800,
C = 200
171 149
*200 =
D9 = 800 +
177 149
D9

= S/ 957,14

Se encontr que el 10% de las familias encuestadas manifestaron


tener un consumo en alimentacin superior a los 957,14 nuevos soles

JUAN MANUEL ANTON PEREZ

f) P26 : 26*190/100 =49,40


= 400, C = 100
P26 = 400 +

49.40 19
51 19

Nj= 51, Nj-1 = 19, Linf

*100 =

P26 = S/ 495
Se estima que el 26% de las familias del distrito de Nueva Arica Chiclayo tiene un gasto mensual en alimentacin menor o igual a los
495 nuevos soles.

JUAN MANUEL ANTON PEREZ

g) R = Ls Li = 1200 300 = 900


Se encontr que el gasto mensual en alimentacin manifestado
por las familias encuestadas varia desde 300 hasta 1200 nuevos
soles con un rango igual a 900 nuevos soles.
h) S2 = (350-647,63)2*19 + (450-647,63)2*32 +... + (1100-647,63)2*13
190

S2 = 41698,34
El grado variabilidad de los gastos mensuales en alimentacin
manifestado por las familias encuestadas respecto al gasto
mensual promedio fue de 41698,34

JUAN MANUEL ANTON PEREZ

i) S =

S2 = 41698,34

= S/. 204,20

Se infiere que el grado de dispersin de los gastos mensuales en


alimentacin de las familias del distrito de Nueva Arica Chiclayo
respecto al gasto mensual promedio es de 204,20 nuevos soles.
j) CV =

S
X

*100% =

204,20 *100% = 31,53%


647,63

Se concluye que la poblacin de familias del distrito de Nueva


Arica- Chiclayo es homognea respecto al gasto mensual en
alimentacin.

JUAN MANUEL ANTON PEREZ

Vous aimerez peut-être aussi