Vous êtes sur la page 1sur 9

1

Tema: Medidas de tendencia central, localizacin y dispersin


Saber:
1. Definir los conceptos de medidas de:
-Tendencia
central:
media,
mediana
y
moda
Localizacin:
cuartles,
decles
y
percentiles
-Dispersin: rango, varianza, desviacin estndar y desviacin media
2. Explicar el proceso del clculo de las medidas de tendencia central, localizacin y dispersin para datos
agrupados y no agrupados y su interpretacin.
3. Explicar el clculo de las medidas de tendencia central, localizacin y dispersin con software.
Hacer:
1. Determinar las medidas de tendencia central, localizacin y dispersin.
2. Interpretar las medidas de tendencia central, localizacin y dispersin.
3. Obtener las medidas de tendencia central, localizacin y dispersin de datos relacionados con su perfil
profesional, en software

4.1 Medidas de tendencia central para datos no agrupados


Recordando que los datos se pueden agrupar en clases (intervalos de datos)
llamados datos agrupados, mientras que los no agrupados no consideran clases. Darts
contos continuos y discretos respectivamente.
Las medidas de tendencia centrales representan el valor ms representativo de toda
la poblacin. Las medidas de tendencia central ms utilizadas son: media, la mediana y la
moda.
4.1.1 Media:
Es el valor promedio o simplemente promedio. Se calcula de esta manera:

Al existir valores extremos o aberrantes (outliers), la media no ser una medida


representativa del centro de la distribucin.
Ejemplo: Calcula la media de las siguientes dos muestras

Para la muestra 1:

Muestra 1

Muestra 2

15

Para la muestra 2:

4.1.2. Mediana
La mediana es el valor que se encuentra exactamente a la mitad de un conjunto de
datos ordenado. Se puede llegar a tener dos casos: Cantidad de datos par o impar.
Si el nmero de datos es impar, la mediana es el valor de en medio
Si el nmero de datos es par, la mediana es el promedio de los dos datos.
A la mediana no la afectan valores extremos o aberrantes porque solo considera la posicin
del valor central.
Ejemplo: Encuentre la mediana para las siguientes muestras
Muestra 1

10 12

15

Muestra 2

10

13

17
11

25

Para la muestra 1: Ordenamos la muestra de manera ascendente de izquierda a derecha:


8

10 12

15

17

La cantidad de nmeros es par, por tanto

Para la muestra 2: Ordenamos en forma ascendente


7

10

11 13

25

Los datos son impar y la posicin del centro es 10 (color rojo), por tanto, la media es 10

4.1.3. Moda
La moda es el valor que se repite con mayor frecuencia. Si existen dos se les
denomina bimodal. Si hay ms de dos, se denomina multimodal.
Muestra 1

-4 12

-7 -3

-5

-4 -5 -5

Muestra 2

-2

-9

-9

-8

-7

-7

Notamos que el valor que tiene mayor frecuencia es 5 con tres repeticiones,
por tanto
y se considera unimodal.
Para la muestra 2:

Al observar el diagrama, encontramos que son cuatro valores 9, -7, 5, 7 y 9 los


que tienen dos repeticiones. Por consiguiente,

4.2. Medidas de localizacin para datos no agrupados


Recordamos que la mediana divide en dos partes iguales al conjunto de datos. Pero
cuando se divide en cuatro partes se conoce como Cuartiles, en diez deciles y en cien
perciles.
Ejemplo 1: Se presentan 20 observaciones en orden del tiempo de falla, en horas, de un
material aislante elctrico:
204

228

252

300

324

444

624

720

816

912

1176

1296

1392

1488

1512

2520

2856

3192

3528

3710

Ordenamos de forma ascendente


204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856 3192 3528 3710

El conjunto son 20 datos, por tanto,


El primer cuartil debe contar con el 25% de las observaciones por debajo de l y el 75% por
encima de l.
El segundo cuartil debe tener al menos el 50% de las observaciones por debajo y encima de
l (mediana).
204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856 3192 3528 3710
2

4
Ejemplo 2: Se tiene los siguientes datos
10

11

11

12

12

13

13

13

14

15

17

18

20

El conjunto son 20 datos, por tanto,


El primer cuartil debe contar con el 25% de las observaciones por debajo de l y el 75% por
encima de l.
El segundo cuartil debe tener al menos el 50% de las observaciones por debajo y encima de
l (mediana).
10

11

11

12

12

13

13

13

14

15

17

18

20

4.3. Medidas de dispersin para datos no agrupados


Es importante analizar cun cercanos o lejanos estn los datos respecto, al valor
medio por ejemplo o cualquier otro que se necesite.
Para determinar esto se recurre a las llamadas medidas de dispersin o de
variabilidad, las medidas ms importantes son: el rango, la varianza y la desviacin
estndar.
De esta manera, si dos grupos de datos tienen el mismo centro, este centro es ms
descriptivo para el grupo que presenta menor variabilidad.
4.3.1. Rango
El rango depende de dos valores. Se calcula:
Los valores aberrantes influyen en el valor del rango.
Ejemplo: Calcula los rangos de las muestras siguientes:
Muestra 1

2 -1

Muestra 2

0 -2

6 -2
2

la principal desventaja:

1 -1

Para la muestra 1:
Para la muestra 2:
4.3.2. Varianza
La varianza es la medida de dispersin ms importante. Muestra cun alejados o
cun cercanos estn los datos respecto a la media. Si un dato est muy cerca de la media,
al elevar esa distancia al cuadrado se har ms pequea. Si el dato est muy lejos de la
media, la distancia al cuadrado entre ese dato y la media se har mayor. De esta manera
hace ms evidente si una distribucin tiene una dispersin alta o baja.
Varianza
Poblacional

Desviacin estndar

Variables

2 :
xi

varianza poblacional.
valor i del conjunto de

Muestral

datos.

N
x
n

es la media poblacional.
Nmero de datos
es la media muestral
es el tamao de la

muestra

4.3.2. Desviacin estndar


La desviacin estndar es la medida de dispersin ms utilizada, expresa el
alejamiento de los datos con respecto a la media en las mismas unidades que los datos
originales. La desviacin estndar es la raz cuadrada de la varianza.
Ejemplo: Calcula la varianza y la desviacin estndar de la muestra siguiente:
Muestra

5 5

-1 -2

Solucin: Primero se calcula la media:


Despus, calculamos la varianza muestral

La desviacin estndar es la raz cuadrada de la varianza:


Ejemplo: Se entrevist a 20 jvenes para conocer qu cantidad (en litros) de refresco de
cola beben al da. Los resultados son stos. Describe la distribucin de los datos,
analizando tanto las medidas de tendencia central como las de dispersin.
0.33

1.65

0.9

1.32

1.3

1.65

0.33

1.65

0.66

0.99

0.66

1.65

0.33

0.33

1.32

0.99

0.66

0.66

La media:

La cantidad media de refresco de cola que bebe una persona es 0.8745 litros.
La mediana: Ordenamos de manera ascendente.
0

0.33
1.32

0.33

0.33
1.32

0.33

0.66
1.32

0.66

0.66
1.65

0.66

0.99
1.65

0.99

0.99
1.65

1.65

6
Se tienen 20 datos (par) por lo que se toma los datos en la posicin 10 y 11 se calcula el
promedio y el resultado es la mediana:
las personas (50%) beben menos (o ms) de 0.8250 litros.

. La mitad de

La moda: Existen 3 modas: 0.33, 0.66 y 1.65 repitiendo 4 veces cada uno de ellos
2
0

4
0

0.33

0.33

0.99

0.99

4
0.33

0.33

0.66

0.66

0.66

0.66

4
0.99

1.32

1.32

1.32

1.65

La cantidad tpica (la que ms se repite) de refresco consumida es 0.33 litros.

Rango:
La diferencia entre la persona que ms consume refresco y
la que menos es de 1.65 litros.

Varianza muestral:

, la media es

Desviacin estndar muestral:


. La dispersin del consumo
de refresco con respecto a la cantidad media es de +/0.5592 litros. Es decir,
x=0.8745
dado la media
la cantidad de consumo se encuentra entre

0.8745+0.5592=1.4337 y 0.87450.5592=0.3153 litros.

1.65

4.4. Medidas de tendencia central para datos agrupados


El trmino datos agrupados se refiere a cuando tenemos los datos divididos por
clases y contamos nicamente con la frecuencia de cada una de ellas, es decir, tenemos
una tabla de frecuencias.
4.4.1. La media aproximada
La media aproximada se obtiene al sumar todos los productos de la frecuencia por la
marca de clase y dividir entre el total de datos, es decir,
donde
es la media aproximada. f i es la frecuencia absoluta de la clase i.
marca de clase i. n es el nmero i de observaciones.

xi

es la

4.4.2. La mediana aproximada


La marca de clase que est en la posicin n + 1, si el nmero de datos (n) es
impar.
O bien, el promedio de las marcas de clase ubicadas en los lugares

n
y
2

n
+1 , si el nmero de datos (n) es par.
2
4.4.3 La moda aproximada
Es la marca de clase con la frecuencia ms alta. Si existen dos modas se llama
bimodal y si existen ms de dos multimodal.
4.4.4. Medidas de dispersin para datos agrupados.
Tambin es importante determinar la dispersin en una distribucin de frecuencias.
Para ello se revisarn la varianza y la desviacin estndar aproximadas.
4.4.4.1 Varianza aproximada desviacin estandar
Para calcular la varianza aproximada para datos agrupados.
Varianza

Desviacin estndar

Variables

s 2a

es la varianza

aproximada.

fi

es la

frecuencia absoluta de la
clase i.

xi

de clase i.

es la marca

xa

es la

media aproximada n es
el nmero de observaciones

8
Ejemplo: Se entrevist a 20 jvenes para conocer qu cantidad (en litros) de refresco de
cola beben al da. Describe la distribucin de los datos, analizando tanto las medidas de
tendencia central como las de dispersin considerando datos agrupados.
La tabla de frecuencias es la que se muestra en la tabla
Lmites
inferiores

Lmites
superiores

Marca de
clase

fa

fr

0.33

0.165

30

0.33

0.66

0.495

20

0.66

0.99

0.825

15

0.99

1.32

1.155

15

1.32

1.65

1.485

20

Total

20

100.00

Clase

Solucin
Para la media aproximada:

este resultado indica que una persona bebe, en promedio, 0.7425


litros.
Para la mediana aproximada, dado que el nmero de muestras es de n = 20, entonces la
mediana se encuentra entre 10 y 11, esto es
Buscamos entonces en
la columna de frecuencia absoluta acumulada en donde se encuentra el 10.5
Lmites
inferiores

Clase

Lmites
superiores

Marca de
clase

fa

faa

0.33

0.165

0.33

0.66

0.495

10

0.66

0.99

0.825

13

0.99

1.32

1.155

16

1.32

1.65

1.485

20

Total

Entonces
menos (o ms) de 0.66 litros.

20

lo que indica que 50% de las personas beben

La moda, es la marca de clase con mayor frecuencia, de la tabla observamos que la clase
con mayor acumulado es la clase 1 el cual tiene una marca de clase de 0.165 litros. La
cantidad de refresco mayormente consumida es de 0.165 litros.

La varianza aproximada, de la frmula

9
De la tabla de frecuencias
Clase

Marca de clase

fa

0.165

0.495

0.825

1.155

1.485

Total

20

Realizamos primero la sumatoria quedando

Ahora sustituimos en la frmula de la varianza quedando.

La desviacin estndar aproximada slo se calcula la raz cuadrada de la varianza:


Lo que significa que la dispersin respecto al consumo
promedio de refrescos de cola es de +/ 0.5120 litros. En otras palabras, una
persona toma en promedio 0.7425 litros de refresco, pero podra tomar entre
0.5120 y 1.2570 litros.

Vous aimerez peut-être aussi