Académique Documents
Professionnel Documents
Culture Documents
TEMA 15
MEDIDAS DE POSICIN DE UNA DISTRIBUCIN DE FRECUENCIAS
ESQUEMA:
1.
2.
3.
4.
5.
6.
7.
8.
9.
Introduccin
Definicin y clasificacin
La media aritmtica simple y ponderada. Ventajas e inconvenientes.
La media geomtrica. Ventajas e inconvenientes.
La media armnica. Ventajas e inconvenientes.
La media cuadrtica. Ventajas e inconvenientes.
La mediana.
La moda.
Los cuartiles, deciles y percentiles.
DESARROLLO:
1. INTRODUCCIN
1.1. El objeto de la ESTADSTICA DESCRIPTIVA es el estudio de colectivos numerosos, lo que significa que en cada caso se van a describir y
analizar unos determinados caracteres de uno o de diferentes colectivos y las relaciones existentes entre ellos.
Si el carcter estudiado se puede valorar mediante una medida, llamaremos variable a una indeterminada que tome como valores los
posibles resultados de la medicin. Si no es susceptible de medida, la indeterminada se llamar atributo y tomar como valores las
distintas modalidades del carcter.
Ejemplo:
a) La variable: X = nmero de hermanos de cada alumno de determinada aula, puede tomar los valores:
x1 = ningn hermano = 0; x2 = un hermano = 1; x3 = dos hermanos = 2; etc.
b) El atributo: A = color del cabello, puede tomar las siguientes modalidades:
a1 = cabello negro; a2 = cabello castao, a3 = cabello rubio, etc.
1.2. La ESTADSTICA DESCRIPTIVA estudia unos determinados caracteres o aspectos de un colectivo de personas, objetos o elementos de
naturaleza particular, incluso de existencia figurada; estos elementos homogneos constituyen la poblacin, colectivo o universo. Se
llama tamao de la poblacin estadstica al nmero de elementos que la forman, y se representa, usualmente, por la letra N.
Cuando el colectivo es excesivamente numeroso, suele tomarse una parte o subconjunto del mismo, representativo de toda la poblacin,
llamado muestra.
1.3. Los resultados numricos de las observaciones realizadas en un colectivo constituyen lo que se llama una serie estadstica y deben
presentarse ordenados y clasificados segn un criterio fijado; generalmente, estos resultados se presentan agrupados en una disposicin
rectangular, que se llama tabla estadstica.
1.4. Las distribuciones de frecuencias tratan de observar, clasificar y ordenar las repeticiones de ciertos valores de una variable o de ciertas
modalidades de un atributo (segn que el carcter estudiado sea cuantitativo o cualitativo).
1.5. 1.5.1. Se llama frecuencia absoluta al nmero de veces que se repite un valor de una variable o una modalidad de un atributo; se
representa por ni y significa que el valor xi o la modalidad ai aparece ni veces.
Es evidente que la suma de todas las frecuencias absolutas debe ser igual al nmero total de elementos de la poblacin o de la muestra
que se trate; este total, que se llama tamao se representa usualmente por N.
1.5.2. Se denomina frecuencia relativa a la razn entre la frecuencia absoluta y el total de elementos o tamao: La frecuencia relativa se
representa por fi y, con la definicin dada, es: fi = ni / N.
Evidentemente, es siempre fi 1, por ser ni N, y la suma de todas las frecuencias relativas es igual a 1.
1.5.3. Se define la frecuencia acumulada como la suma de frecuencias (absolutas o relativas) hasta un determinado valor de la variable;
no tiene sentido hablar de frecuencias acumuladas cuando se trata de un atributo, porque no se pueden sumar las modalidades.
Se exigir la ordenacin de los valores en sentido creciente o decreciente. As, en un orden creciente de valores:
Distribuciones de TIPO I: son aqullas en las que cada valor de la variable aparece una sola vez. Su tratamiento
estadstico se reduce a presentar los datos de forma ordenada:
X
x1
xk
Distribuciones de TIPO II: se tienen cuando alguno de los valores de la variable aparece ms de una vez:
X
ni
x2
x1
n1
x2
n2
..
..
xk
nk
Distribuciones de TIPO III: son las que disponen los datos en forma agrupada:
Li 1 ---- Li
L0 --- L1
L1 --- L2
..
Lk 1 --- Lk
n1
n2
..
nk
ni
Con la particularidad de que todos los intervalos son semiabiertos, cerrados a la izquierda, salvo el ltimo, que
ser cerrado en ambos extremos: [L0;L1); [L1;L2); ; [Lk 1;Lk].
Asociado a cada intervalo de clase, existe un nmero xi, llamado marca de clase, dado por: xi = (Li 1 + Li) /2 y
que corresponde al valor central del intervalo.
MEDIDAS
DE POSICIN
EN UNA
Por tanto, puede decirse que, una medida de posicin es un valor que representa o
sintetiza a toda la distribucin de frecuencias.
Las caractersticas de estas medidas es que tienen que estar definidas objetivamente a
partir de los datos de la serie y tener un significado concreto y fcil de comprender.
Las medidas de posicin podrn ser promedios (o valores medios) o no, as como de
tendencia central o no. Se puede realizar la siguiente clasificacin:
MEDIDAS
DE POSICIN
Centrales
No Centrales
Media aritmtica
Mediana
Moda
Media armnica
Media geomtrica
Media cuadrtica
Simple
Ponderada
Cuartiles
Deciles
Percentiles
k
xi
i=1
= ---------K
x =
k
(N = ni = Colectivo)
i=1
En las distribuciones de TIPO III: la media aritmtica viene dada por la frmula anterior, en
la cual los valores xi corresponden a las marcas de clase.
xi
ni
xi.ni
54
59
63
64
2
3
4
1
108
177
252
64
10
601
MEDIA ARITMTICA:
k
_
x ini
601
x = ----------- = ------ = 60,1 Kg. (peso medio)
N
10
ni
30 40
40 50
50 -- 60
3
2
5
10
Marcas de
clase
xi
35
45
55
xi.ni
105
90
275
470
a) Distribuciones de TIPO I:
wi = ponderacin
_
xi.ni.wi
xp = -----------------ni.wi
Ejemplo
Para ocupar un puesto de trabajo vacante en la recepcin-administracin de un hotel, se realizan diferentes pruebas a los aspirantes, cada una
de ellas con una importancia determinada. El resultado de las pruebas por parte de dos aspirantes es la siguiente:
Importancia
1
3
6
2
Prueba
Cultura General
Contabilidad
Idiomas
Manejo de ordenadores
Nota
ASPIRANTE 1
9
6
7
10
Nota
ASPIRANTE 2
7
5
10
4
Solucin:
Primero se calcular la media ponderada para cada aspirante y despus se compararn los resultados.
xi
9
6
7
10
ASPIRANTE 1:
Aspirante 1
wi
1
3
6
2
12
xi.wi
9
18
42
20
89
yi
7
5
10
4
_
89
xP = --------- = 7,4 puntos;
12
Aspirante 2
wi
1
3
6
2
12
ASPIRANTE 2:
yi.wi
7
15
60
8
90
_
90
yp = --------- = 7,5 puntos;
12
3.3. Propiedades
La media aritmtica cumple, entre otras, las siguientes propiedades:
(Tipo I);
k
_
( xi x ).ni = 0
i=1
(Tipos II-III)
Si se multiplican (o se dividen) todos los valores de la variable por una constante (en el caso
del cociente distinta de cero), la media queda multiplicada (o dividida) por esta constante.
Dada la variable X y siendo C = cte., la variable: Y = C. X, tiene por media:
_
_
y = C. x
_
_
Dada la variable X y siendo C = cte. (distinta de cero), la variable: Y = 1/C. X, tiene por media: y = 1/ C . x
Si a todos los valores de una variable se les suma (o resta) una constante, la media
aritmtica queda aumentada (o disminuida) en esa constante.
Dada la variable X y siendo D = cte., la variable: Y = X D , tiene por media:
_
y =
_
xD
_ _ _
z =x+y
n1
G =
n2
nk
x1 . x2. . xk
N = ni
i=1
------------------------k
ni
i=1
k
ni.log xi
i =1
G = antilog -------------------k
ni
i=1
(Tipos II-III) ;
N = ni = Colectivo
i =1
Observacin: Si todas las ni =1, obtendremos las expresiones equivalentes, aplicables a las distribuciones de Tipo I.
Ejemplo: Sea una clase de 22 nios, en los cuales, la talla se reparte del modo siguiente:
22
Talla (en cm.)
Frecuencia
100
10
120
5
125
4
140
3
Para el clculo de la media geomtrica, se suelen aplicar logaritmos decimales, de manera que:
1
1
log G = ----- [ 10. log 100 + 5. log 120 + 4 . log 125 + 3 . log 140] = ------- [45,22193] = 2,05554
22
22
H=
k
ni
1
i=1
-------------------- = --------------------k
k
( 1/xi).ni
(1/xi).ni
i=1
i=1
------------k
ni
i=1
(Tipos II-III) ;
N
H = --------------k
(1/xi)
i=1
La media armnica se utiliza cuando la variable est medida en unidades relativas, por
ejemplo, marcos/ptas., Km./h., etc., es decir, para promediar velocidades, tiempos,
rendimientos, etc.
5.2. Ventajas e Inconvenientes.5.2.1. Como ventajas, mencionaremos la intervencin en su clculo de todos los valores de la
distribucin y que, en ciertos casos, es ms representativa que la media aritmtica.
5.2.2. Como inconvenientes hay que citar la influencia de los valores pequeos, y su no
determinacin en las distribuciones con la existencia de un valor igual a cero.
Ejemplo. Un hotel ha comprado a sus clientes, en tres das de una semana, marcos alemanes a los siguientes tipos de cambio:
Tipo de cambio
X
Volumen comprado
ni
89,9
87,5
89,3
1/xi
200
300
300
0,01112347
0,011428571
0,011198208
k
N = ni
i=1
800
(1/xi). ni
2,2246941
3,428571428
3,359462486
------------------9,012728016
N
800
H = --------------------- = ---------------------- = 88,76 ptas./marco (cambio medio)
k
9,012728016
(1/xi).ni
i=1
C =
k
x i2
i=1
-----------N
(Tipo I)
C=
k
xi2. ni
i=1
------------------N
N =
(Tipos II-III)
k
ni
i=1
6.2.1. Ventajas:
6.2.2. Inconvenientes:
_
HGxC
7. MEDIANA
Definicin.- Es el valor que ocupa el lugar central de la distribucin, cuando los valores de la
variable estn ordenados en sentido creciente o decreciente.
GRUPO 1:
21
23
24
26
28
(nmero impar de valores; valores ordenados)
GRUPO 2:
20
21
22
24
28
(nmero par de valores; valores ordenados)
29
Edad mediana:
Me = 24 aos
Edad mediana:
22 + 24
Me = ----------- = 23 aos
2
Ejemplos:
A) Edades de un grupo de jvenes que han realizado
un curso para aprender a montar a caballo.
xi
ni
Ni
-------------------------------20
3
3
21
3
6
22
2
8
23
1
9
24
1
10
--10
N/2 = 10/2 = 5
Edad mediana: Me = 21 aos
N/2 = 10/2 = 5
Edad mediana:
Me = (21 + 23)/ 2 = 22 aos
N/2 Ni-1
Me = Li-1 + ai . --------------ni
N de das (ni)
3
5
8
12
2
30
Ni
5
8
16
28
30
15 - 8
N/2 = 15 Intervalo mediano: 100 ----- 150 Nmero mediano de visitantes: Me = 100 + 50. ( -------------- ) =143,75 144
8
visitantes
8. MODA
Definicin.
Si existen dos modas, la distribucin se denomina bimodal; con tres modas, trimodal, etc.
Ejemplo: Las siguientes tablas nos muestran el precio de diferentes viajes a Londres y el nmero de viajes vendidos por dos agencias de
viajes distintas, durante los meses de verano del ltimo ao.
xi
ni
PRECIO N VIAJES
---------------------------------------45.000 32
62.000 25
80.000 12
90.000 10
115.000
5
Distribucin unimodal
Mayor ni = 32 Mo = 45.000 ptas.
yi
ni
PRECIO N VIAJES
--------------------------------------45.000
20
62.000
20
80.000
8
90.000
5
115.000
1
Distribucin bimodal
Mayor ni = 20
Precios ms frecuentes
Si la distribucin est agrupada en intervalos de clase, optamos por las expresiones que a
continuacin se exponen para calcular la Moda (Mo):
a) Intervalos de IGUAL AMPLITUD:
Mayor ni Determina Li-1 Li (intervalo modal)
8
Mo = Li-1
ni+1
+ ai . -------------------ni+1 + ni-1 a =
i
Mo = Li-1
i+1
ni
N HOTELES
ni
hi = ------ai
---------------------------------------------------------------------------------------0 ---- 10
15
15/10 = 1,5
10---- 25
45
45/15 = 3
25---- 50
50
50/25 = 2
50----100
60
60/50 = 1,2
---170
Mayor hi = 3
2
Mo = 10 + 15 . ( -------------- ) = 18,57.. 19 habitaciones
2 + 1,5
9.1. Cuartiles
Son los tres valores (Q1, Q2, Q3) que dividen a la distribucin en cuatro partes iguales, es decir,
en cuatro intervalos conteniendo cada uno de ellos el 25% de los valores de la distribucin.
9.2. Deciles
Son los nueve valores (D1, D2, ., D9) que dividen a la distribucin en diez partes , de forma
que dentro de cada una estn incluidos el 10% de los valores.
9.3. Percentiles (Centiles)
Son los noventa y nueve valores (P1, P2, ..., P99) ( C1, , C99) que dividen a la distribucin en
cien partes.
9.4. Clculo
r = 1, 2, 3
CUARTILES
10
rN/10 Ni-1
Dr = Li-1 + ai . -----------------ni
Pr = Li-1 + ai .
rN/100 Ni-1
-----------------ni
r = 1, 2, , 9
DECILES
r = 1, 2, , 99
PERCENTILES ( CENTILES)
Observacin:
Q1 = P25; Q2 = Me = D5 = P50; Q3 = P75; etc.
Ejemplos:
A) Disponemos de los precios de diferentes bebidas servidas en un bar y el n de consumiciones de cada precio:
X
ni
Ni
PRECIOS
N Consumiciones
(en ptas.)
---------------------------------------------------------------------------------------------200
200
200
240
150
350
260
120
470
300
180
650
350
150
800
---------N = 800
Q1
Q2
2N/4 = 400
Q2 = 260 ptas. (el 50% de las bebidas de este bar como mximo tienen un precio de 260 ptas.)
Q3
3N/4 = 600
Q3 = 300 ptas. (este bar sirve un 75% de bebidas cuyo precio no supera las 300 ptas.)
Q1 = (200 + 240)/2 = 220 ptas. (el 25% de las bebidas ms econmicas no superan las 220 ptas.)
2N/10 = 160
D2 = 200 ptas.
D9
9N/10 = 720
D9 = 350 ptas.
P30
30N/100 = 240
P99
99N/100 = 792
B) Realizado un control de calidad en una muestra aleatoria de 200 tubos fluorescentes de un determinado tipo, para determinar su duracin
en horas de funcionamiento en condiciones prefijadas, se obtuvieron los siguientes resultados:
DURACIN
0---720
720---1440
1440---2160
2160---2880
2880---3600
3600---4320
4320---5040
5040---5760
5760---6840
6840---7200
NUMERO DE
TUBOS
1
4
9
32
56
51
34
8
3
2
Desestimando del total de la muestra el diez por ciento de los tubos con menor duracin y el cinco por ciento de aquellos que presentan
duracin mxima, determnense los valores mnimo y mximo de la duracin de los tubos restantes de la muestra.
11
Solucin:
- Para desestimar el 10% de los tubos de duracin menor, hay que calcular el primer decil: D1
- Al prescindir del 5% de la muestra con duracin mayor, es preciso determinar el percentil 95: P95
Estableciendo las frecuencias absolutas acumuladas:
LI-1 Li
DURACIN (horas funcionamiento)
0---720
720---1440
1440---2160
2160---2880
2880---3600
3600---4320
4320---5040
5040---5760
5760---6480
6480---7200
ni
N de tubos fluorescentes
1
4
9
32
56
51
34
8
3
2
200
Ni
(Frecuencias absolutas acumuladas)
1
5
14
46
102
153
187
195
198
200
D1
N/10 = 20
20 - 14
D1 = 2160 + 720 . (---------------- ) = 2.295 horas
32
P95
95N/100 = 190
190 - 187
P95 = 5040 + 720 . (---------------- ) = 5.310 horas
8
En consecuencia, el 85% de los tubos restantes, tienen una duracin comprendida entre 2.295 y 5.310 horas
BIBLIOGRAFA: