Vous êtes sur la page 1sur 8

Clase 3

Descripción de datos y propiedades de datos cuantitativos.


Conceptos básicos: Tendencia central y dispersión.

Los datos al igual que los estudiantes, se congregan alrededor de sus puntos de encuentro
favoritos. Parece que los estudiantes acuden en masa a sitios como partidos de futbol, discos,
los estacionamientos del boulevard, entre otros lugares. De igual forma, los números parecen
disfrutar de la compañía de otros números y están propensos a reunirse alrededor de un
punto central denominado medida de la tendencia central o, más comúnmente, media. Una
medida de tendencia centrar ubica e identifica el punto alrededor del cual se centran los
datos.

Un conjunto de datos puede ser descrito con un solo número. Si el profesor dice que el
promedio de la clase en el último examen fue de 95, esto indica algo. Si dice que el promedio
fue de 35, esto indica algo totalmente diferente.

Además las medidas de dispersión indican el punto hasta el cual las observaciones
individuales se esparcen alrededor de su punto central. Miden la dispersión o la variabilidad
de los datos y reflejan la tendencia de las observaciones individuales a desviarse de dicho
punto central.

Medidas de tendencia central para datos sin agrupar.


 Media aritmética. Poblacional y muestral.
 Mediana.
 Moda.
 Media ponderada.
 Media geométrica.

La media
Es la medida de tendencia central que usualmente se llama promedio.

Media poblacional
La media de una población es el parámetro µ (se pronuncia miu). Si hay N observaciones en el
conjunto de datos de la población, la media se calcula así:

Media muestral
La media de una muestra es un estadístico (se lee equis barra). Con n observaciones en el
conjunto de datos de la muestra, la media se determina así:

1

La mediana
La observación de la mitad después de que se han colocado los datos en una serie ordenada.

Se le conoce también como media posicional. La mitad de las observaciones queda debajo de
la mediana y la otra mitad queda encima de ésta.

Por ejemplo, tenemos ordenados de menor a mayor los ingresos mensuales registrados en los
últimos 5 meses (en miles de pesos):

45, 52, 56, 67, 67

La posición de la mediana se encuentra en el lugar 3 de la serie ordenada.

El valor que está en el tercer lugar es el 56, por lo tanto la mediana = 56

Cuando el número de datos es par, se promedian los valores medios.

35, 45, 52, 56, 67, 67

El tercer valor se promedia con el cuarto para obtener el valor que está en la posición 3.5

Entonces la mediana = 54

La moda
Es la observación que ocurre con mayor frecuencia. Un conjunto de datos puede tener una
sola moda, ser bimodal o multimodal o no tener ninguna moda (cuando todos los datos
ocurren con la misma frecuencia).

Ejemplo.
De una muestra de 15 trabajadores se obtuvieron la cantidad de horas extra el mes pasado.

13 12 15
6 15 13
13 10 5
7 7 12
12 9 12
Ordenando los datos…

2
5
6
7
7
9
10
12
12
12
12
13
13
13
15
15

Media 10.73
Mediana 12
Moda 12

Y si los datos se encontraran en una distribución de frecuencias…

valores Frecuencia xi * ni
5 1 5
6 1 6
7 2 14
8 0 0
9 1 9
10 1 10
11 0 0
12 4 48
13 3 39
14 0 0
15 2 30
15 161
Luego,

3
161 / 15 = 10.73333

Posición de la mediana = (15+1) /2= 8

Cuando los datos están en una distribución de frecuencias, se utiliza la frecuencia acumulada.

valores Frecuencia Frecuencia


acumulada
5 1 1
6 1 2
7 2 4
8 0 4
9 1 5
10 1 6
11 0 6
12 4 10
13 3 13
14 0 13
15 2 15
15

La media ponderada
Se utiliza cuando quiere darse diferente peso o importancia relativa a las observaciones.


Ejemplo.
Una empresa de construcción paga a sus empleados que trabajan por hora $16.50, $19.00 o
$25.00 la hora. Hay 26 empleados contratados para trabajar por hora, 14 de los cuales reciben
la tarifa de $16.50; 10 la tarifa de $19.00 y 2 con la de $25.00 ¿Cuál es la tarifa promedio por
hora que se paga a los 26 empleados?

Ejemplo.
PRODUCTO UTILIDAD POR PZ VOLUMEN DE VENTAS UTILIDAD TOTAL
Aspirina $ 2.00 50 $ 100.00
Tylenol $ 3.50 35 $ 122.50
Paracetamol $ 6.00 5 $ 30.00
$ 11.50 90 $ 252.50

$ 2.81 MEDIA PONDERADA

4
La media geométrica
Proporciona una medida precisa de un cambio porcentual promedio de una serie de números.

Donde cada valor Xi es el cambio porcentual de un periodo al otro:

La media geométrica siempre es menor o igual (nunca mayor) que la media aritmética. Todos
los datos deben ser positivos.

AÑO INGRESO FACTOR DE CRECIMIENTO


1992 $ 50,000.00 -
1993 $ 55,000.00 1.10
1994 $ 66,000.00 1.20
1995 $ 60,000.00 0.91
1996 $ 78,000.00 1.30

MG = 1.1176-1 = 0.1176 = 11.76% cambio porcentual.

Comparación entre media, mediana y moda


La media es la medida más común de tendencia central. Se presta para mayor manipulación e
interpretación algebraica. Desafortunadamente, la media se ve afectada por valores extremos
o valores atípicos y, a diferencia de la mediana, puede ser sesgada por las observaciones que
están muy por encima o muy por debajo de ésta.

Ejemplo:

4, 5, 6, 6, 7, 8

Media= 6

Mediana = 6

Moda = 6

Si la última observación fuera 80 en lugar de 8…

Media= 18

Mediana= 6

Moda= 6

5
La media se vuelve menos descriptiva o representativa de los datos.

Una medida no es mejor que otras. Un vendedor de zapatos le interesa más saber la moda de
las tallas de zapatos que vende en lugar de la media. Pero a un fabricante de puertas le
interesa más saber la estatura promedio de las personas.

Medidas de tendencia central para datos agrupados


 Media
 Mediana
 Moda

Debe tenerse en mente que los cálculos hechos utilizando datos agrupados son sólo
aproximaciones. Por tanto, las observaciones sin agrupar deben utilizarse cuando sea posible
para obtener conclusiones.

Media

f es la frecuencia o número de observaciones en cada intervalo.


MC es la marca de clase del intervalo.
n es el tamaño de la muestra (la suma de todas las frecuencias).

Mediana
El intervalo o clase donde está la mediana tiene una frecuencia acumulada mayor o igual a
⁄ .

Ya localizado el intervalo, se aplica la fórmula:


[ ]( )

LIRmd es el límite inferior real de la clase donde está la mediana.

F es la frecuencia acumulada de la clase que antecede a la mediana.

fmd es la frecuencia de la clase donde está la mediana.

c es la amplitud del intervalo.

Moda
Se buscará el intervalo modal (el que tiene más frecuencia). Ya localizado, se aplicará la
siguiente fórmula:

6
[ ]( )

LIRmo es el límite inferior real de la clase modal.

Da es la diferencia entre la frecuencia de la clase modal y la clase que la antecede.

Db es la diferencia entre la frecuencia de la clase modal y la clase que le sigue.

c es la amplitud del intervalo.

Ejemplo.
Las edades de 50 directores ejecutivos de las mejores corporaciones de EU, reportadas en la
revista Forbes en 1997 aparecen en la siguiente tabla de frecuencias.

Edades Frecuencia MC Frecuencia Frecuencia Frecuencia fMC


relativa acumulada relativa
acumulada
[50, 55) 8 52.5 16% 8 16% 420
[55, 60) 13 57.5 26% 21 42% 747.5
[60, 65) 15 62.5 30% 36 72% 937.5
[65, 70) 10 67.5 20% 46 92% 675
[70, 75) 3 72.5 6% 49 98% 217.5
[75, 80) 1 77.5 2% 50 100% 77.5
50 100% 3075
Media.

Mediana.


[ ]( )

Moda.

( )
[ ]( )
( ) ( )

7
16 15
14 13
12
10
10
Frecuencia

8
8

4 3
2 1
0
[50, 55) [55, 60) [60, 65) [65, 70) [70, 75) [75, 80)
Edades de directores ejecutivos

Vous aimerez peut-être aussi