Académique Documents
Professionnel Documents
Culture Documents
Medidas de forma 2
SESGO
Cuando una curva est equilibrada, con relacin a su eje vertical, se dice que es
simtrica, cuando esto no ocurre, se dice que es asimtrica. Por lo que el grado de
asimetra se le conoce como sesgo:
Sesgo: es el grado de asimetra, o falta de simetra de una distribucin.
Cuando existe sesgo los valores observados se concentran en una sola direccin,
con respecto a un eje que pase por su centro, por lo que la distribucin tendr una
cola pronunciada. La posicin de esta cola indica en donde estn localizados los
relativamente pocos valores extremos y determina la direccin del sesgo.
La asimetra puede ser de dos tipos; negativa o positiva.
La asimetra se identifica por la direccin de la cola de la curva, cuando se encuentra
a la derecha; la asimetra es positiva, cuando est a la izquierda la asimetra es
negativa. Es decir, si la curva de frecuencias (polgono de frecuencias suavizado) de
una distribucin tiene una cola mas larga a la derecha del mximo central que a la
izquierda, entonces se dice que esta sesgada a la derecha o que tiene un sesgo
positivo. Si es al contrario se dice que est sesgada a la izquierda o que tiene sesgo
negativo.
En las distribuciones unimodales sesgadas, la media tiende a situarse con respecto a
la moda al mismo lado que la cola ms larga.
La grafica o curva de una distribucin de frecuencias unimodal, moderadamente
sesgada, presenta tres situaciones:
Elaborado por ELEAZAR GMEZ LARA
Sep-07
Medidas de forma 3
a) Simtrica: Cuando existe un valor central alrededor del cual son igualmente
probables valores mayores o valores menores. En una distribucin simtrica y
unimodal, la media, la moda y la mediana coinciden.
x = x = x
b) Asimtrica positiva: Una distribucin unimodal con una larga cola a la derecha,
indica que los valores extremos se encuentran a la derecha de distribucin de
frecuencias. En una distribucin unimodal con una larga cola a la derecha, se cumple
que la moda es menor que la mediana y sta a su vez es menor que la media.
x < x < x
c) Asimtrica negativa: Una distribucin unimodal con una larga cola a la izquierda,
dejar ver que los valores extremos se encuentran a la izquierda de la distribucin de
frecuencias. En una distribucin unimodal con una larga cola a la izquierda, se
cumple que: la media es menor que la mediana y la mediana su vez es menor que la
moda.
x < x < x
Medidas de forma 4
COEFICIENTES DE PEARSON
En las distribuciones simtricas, la media, la mediana y la moda coinciden y a medida
que la distribucin se aparta de la simetra estos valores se alejan entre s, por lo que
la moda, la mediana y la media no coinciden en las distribuciones asimtricas,
alejndose de la cima y acercndose a la cola.
La moda est mas cerca del punto ms alto, que es donde se encuentran los valores
con mayor frecuencia, por el contrario la media se encuentra mas cerca de la cola,
donde estn localizados los relativamente pocos datos con valores extremos, por esta
situacin la ms comn de las medidas de asimetra es la diferencia entre la moda y
la media que es la ms sensible a los valores extremos
Una medida relativa de asimetra se expresa simblicamente como:
sesgo = sk =
media moda ( x x )
=
s
s
Si por alguna razn la moda no se encuentra bien definida, sta se puede sustituir por
la mediana, y el sesgo se puede determinar mediante la expresin:
sesgo = sk =
3( x x)
s
la distribucin es simetrca
= 0
> 0 asimetrca positiva (cola derecha )
la distribucin es simetrca
= 0
> 0 asimetrca positiva (cola derecha)
Medidas de forma 5
f m
mx
11.5
14.5
17.5
20.5
23.5
46
87
175
123
94
-6
-3
0
3
6
Intervalo
10 - 13
13 - 16
16 - 19
19 - 22
22 - 25
4
6
10
6
4
30
(m x )2
36
9
0
9
36
f (m x ) 2
144
54
0
54
144
525
396
Tenemos que:
525
= 17.5
30
d1
4
x = Lx +
c = 16 +
3 = 17.5
4+4
d1 + d 2
x=
396
= 13.2
30
s = 13.2 = 3.63
s2 =
17.5 17.5
=0
3.63
12
10
8
6
4
2
Histograma
26.5
23.5
20.5
17.5
14.5
11.5
8.5
Poligono suavizado
Medidas de forma 6
f m
5
10
9
3
1
11.5
14.5
17.5
20.5
23.5
57.5
145.0
157.5
61.5
23.5
445.0
28
mx
4.39
1.39
1.61
4.61
7.61
(m x ) 2
f (m x ) 2
19.2972
1.9401
2.5829
21.2258
57.8686
96.4860
19.4005
23.2462
63.6773
57.8686
260.6786
445
= 15.8929
28
d1
5
x = Lx +
c = 13 +
3 = 15.5
5 +1
d1 + d 2
x=
260.6786
= 9.3039
28
s = 9.3039 = 3.0512
s2 =
Por lo que el sesgo es:
sesgo =
15.8929 15.5
= 0.1287
3.0512
Medidas de forma 7
f m
mx
3
5
7
8
12
10
9
13
17
21
25
29
27
65
119
168
300
290
-12.5333
-8.5333
-4.5333
-0.5333
3.4667
7.4667
45
(m x ) 2
157.0844
72.8178
20.5511
0.2844
12.0178
55.7511
969
f (m x ) 2
471.2533
364.0889
143.8578
2.2756
144.2133
557.5111
1 683.2000
969
= 21.5333
45
d1
4
x = Lx +
c = 23 +
4 = 25.6666
2+4
d1 + d 2
1683.2000
s2 =
= 37.40
45
s = 37.40 = 6.1155
Por lo que el sesgo es:
21.5333 25.6666
= 0.6758
sesgo =
6.1155
x=
13
17
Histograma
21
25
29
33
Poligono suavizado
Medidas de forma 8
Intervalos
101,4 119,4
119,4 137,4
137,4 155,4
155,4 173,4
173,4 - 191,4
191,4 - 209,4
209,4 - 227,4
227,4 - 245,4
f
13
17
21
30
21
16
12
10
2.- Los siguientes datos recogen el nmero de unidades vendidas del producto
Econopack durante un mes en tiendas de cierta franquicia diseminadas por la
Republica Mexicana
Intervalo
45 - 65
65 - 85
85 - 105
105 - 125
125 - 145
145 - 165
165 - 185
185 - 205
f
52
87
62
47
35
21
17
12
3.- Las edades de los componentes de 100 matrimonios elegidos al azar en cierta
ciudad son las siguientes:
Para cada sexo:
a) Construya su histograma y su polgono de
edades
hombres
mujeres
frecuencias.
8
5
15-25
b) Describa las representaciones graficas
23
20
25-35
construidas.
34
27
35-45
c) Determine el coeficiente de sesgo,
18
22
45-55
utilizando los dos coeficiente se Pearson.
9
18
55-65
d) La informacin proporcionada por los
8
8
65-75
coeficientes coincide con la descripcin
de la distribucin de frecuencias?
Qu sexo presenta una edad media mayor? Cul presenta mayor dispersin?
Medidas de forma 9
MEDIDAS DE ORDEN
En tema anterior, se mostr que la mediana, adems de ser una medida de tendencia
central, expresa una posicin ordenada, la cual se obtiene al dividir el conjunto de
datos ordenados en dos partes iguales.
De la abstraccin de dividir la serie ordenada de las observaciones en partes iguales
pueden surgir la necesidad de dividir dicho conjunto ordenado en cuatro partes
iguales, con lo cual se obtendran tres valores llamados cuartiles: primero, segundo y
tercero, y cada uno de ellos representa al valor que deja el 25%, el 50% y el 75% de
las observaciones con valores menores a ellos, respectivamente.
Al dividir al conjunto de datos ordenados en 10 partes iguales, obtenemos los valores
conocidos como deciles; que desde el primero hasta el noveno, dejan desde el 10%
hasta el 90% de observaciones con valores menores a ellos, respectivamente.
Por ltimo, tambin se acostumbra dividir al conjunto ordenado en cien partes iguales,
dando lugar a los percentiles; que desde el primero hasta el 99, dejan desde el 1%
hasta el 99% de observaciones con valores menores a ellos.
El clculo de estas medidas de orden sigue un procedimiento exactamente igual al
que se sigue para calcular la mediana, siendo la nica diferencia el clculo del orden
o posicin correspondiente a la medida deseada.
Medidas de forma 10
in
4 faa
Qi = LQi +
c
fQi
Donde:
i = 1, 2,3 : nmero del cuartil que deseamos determinar
LQi : Lmite real inferior del intervalo que contiene al cuartil de inters.
P( Di ) =
in
10
Donde
i = 1, 2,3, 9
Y una vez identificada su posicin dentro de una clasificacin por intervalos podemos
determinar su valor mediante la expresin:
in
10 faa
Di = LDi +
c
f
D
Donde:
i = 1, 2,3, ,9 : nmero del decil que deseamos determinar
LDi : Lmite real inferior del intervalo que contiene al i-simo decil.
Medidas de forma 11
i = 1, 2,3,,99
Y una vez identificada su posicin dentro de una clasificacin por intervalos podemos
determinar su valor mediante la expresin:
in
100 faa
Pi = LPi +
c
f Pi
Donde:
i = 1, 2,3, ,99 : nmero del percentil que deseamos determinar
LPi : Lmite real inferior del intervalo que contiene al i-simo percentil.
Medidas de forma 12
decil 1), evitando as los puntos extremos. Incluye solo el 80% de los datos
distribuidos alrededor de la mediana, por lo que un 10% de las observaciones del
extremo inferior y otro 10% de las observaciones en el extremo superior son
excluidos.
Rango percentil 10 - 90 = P90 P10
MEDIDAS DE DISPERSIN RELATIVAS
Cuando se necesita comparar dos o ms series de datos a veces no es posible
hacerlo con las medidas absolutas, ya sea porque las unidades son diferentes o
porque tienen diferente media, en stos casos deben utilizarse cantidades relativas
definida generalmente como:
Dispersin relativa =
Dispersin absoluta
media
COEFICIENTE DE VARIACIN
Es la medida de dispersin relativa ms usada y se define como el cociente de la
desviacin estndar entre la media aritmtica, expresado en porcentaje y es
adimensional
s
Coeficiente de variacin:
V=
x
OBSERVACIN: El coeficiente de variacin no es conveniente cuando la media es
muy cercana a cero.
Ejemplo: El veterinario de un zoolgico obtuvo los siguientes datos con respecto a los
pesos de los elefantes y las ratas de la pradera.
Elefantes Ratas
Media
10886 Kg. 476 g
Desviacin estndar 582.8 Kg. 72.5 g
Con lo cual el coeficiente de cada una de estas especies es:
582.8
V(elefantes) =
= 0.05350
108.86
Por lo que el peso de los elefantes tiene una variacin del 5.35%. Mientras que para
las ratas de campo se tiene que:
72.5
= 0.1523
V(ratas) =
476
la variacin es del 15.23% para el peso de las ratas de la pradera.
Por lo que se concluye que el peso de los elefantes tiene una menor variacin que el
peso de las ratas de pradera.
Medidas de forma 13
MEDIDAS DE SESGO
(Utilizando cuartiles y percentiles)
Q3 2Q2 + Q1
Q3 Q1
Medidas de forma 14
Q3 Q1
2 ( P90 P10 )
Q3 Q1
=
= 0.263 distribucin mesortica
2 ( P90 P10 )
> 0.263 distribucin platicrtica
Ejercicio: Dada la siguiente distribucin de frecuencias determine:
a)
b)
c)
d)
e)
f)
g)
h)
los cuartiles
los deciles 3, 6, 7 y 9
los percentiles 10, 28, 50, 80 y 90
Rango intercuartlico
Rango percentlico
Coeficiente de sesgo cuartlico.
Coeficiente de sesgo percentlico 10-90
Coeficiente de curtosis.
Elaborado por ELEAZAR GMEZ LARA
Sep-07
Medidas de forma 15
N Intervalo
1 124.5 - 136.5
2 136.5 - 148.5
3 148.5 - 160.5
4 160.5 - 172.5
5 172.5 - 184.5
6 184.5 - 196.5
7 196.5 - 208.5
8 208.5 - 220.5
9 220.5 - 232.5
10 232.5 - 242.5
f
7
13
24
42
33
23
19
15
9
5
fa
7
20
44
86
119
142
161
176
185
190
in
4
1 (190)
= 47.5
4
4 faa
El valor se establece mediante la expresin: Q1 = LQ1 +
c
fQ1
47.5 44
3.5
Q1 = 160.5 +
12 = 160.5 +
12 = 161.5
42
42
c = 12
Cuartil dos; La posicin se obtiene haciendo i= 2; P (Q2 ) =
2 (190)
= 95 que se
4
4 faa
El valor se determina mediante la expresin: Q2 = LQ2 +
c
f Q2
Medidas de forma 16
LQ2 = 172.5
f aa = 86
f Q2 = 33
95 86
9
Q2 = 172.5 +
12 = 172.5 + 12 = 175.77
33
33
c = 12
Cuartil tres; Posicin hacemos i= 3, P (Q3 ) =
3 (190)
= 142.5 hallada en el intervalo
4
nmero 7
3 n
4 faa
El valor se determina mediante la expresin: Q3 = LQ3 +
c
fQ3
142.5 142
0.5
Q3 = 196.5 +
12 = 196.5 +
12 = 196.81
19
19
c = 12
b) Deciles 3, 6, 7, 9
La posicin de los deciles se determina mediante la expresin: P( Di ) =
Decil 3; Su posicin se obtiene haciendo i= 3; P( D3 ) =
in
10
3 (190)
= 57 la cual est situada
10
3 n
4 faa
Se determina mediante la expresin: D3 = LD3 +
c
f D3
57 44
7
D3 = 160.5 +
12 = 160.5 + 12 = 162.5
42
42
c = 12
6 (190)
= 114 que se sita
10
4 faa
El valor se determina mediante el trmino: D6 = LD6 +
c
f
D
Medidas de forma 17
LD6 = 172.5
f aa = 86
f D6 = 33
114 86
28
D6 = 172.5 +
12 = 172.5 + 12 = 182.68
33
33
c = 12
7 (190)
= 133 situada dentro del intervalo 6.
10
LD7 = 184.5
f aa = 119
f D7 = 23
133 119
14
D7 = 184.5 +
12 = 184.5 + 12 = 191.87
23
23
c = 12
9 (190)
= 171 situada dentro del intervalo 8.
10
LD9 = 208.5
f aa = 161
f D9 = 15
171 161
10
D9 = 208.5 +
12 = 208.5 + 12 = 216.5
15
15
c = 12
in
con i = 1, 2,,99.
100
Percentil 10, La posicin se determina haciendo i=10, por lo que su posicin es:
10 (190)
P( P10 ) =
= 19 que est situada en el intervalo 2.
100
Identificando cada uno de los elementos necesarios para su clculo
LP10 = 136.5
Su posicin se determina mediante la expresin: P( Pi ) =
f aa = 7
f P10 = 13
19 7
12
P10 = 136.5 +
12 = 148.5 + 12 = 159.57
13
13
c = 12
Percentil 28, su posicin se obtiene haciendo i=28, por lo que la posicin que ocupa
28 (190)
es: P ( P28 ) =
= 53.2 la cual se localiza en el intervalo 4.
100
Determinando cada uno de los elementos necesarios para su clculo
LP28 = 160.5
f aa = 44
f P28 = 42
53.2 44
9.2
P28 = 160.5 +
12 = 160.5 +
12 = 163.12
42
42
c = 12
50 (190)
= 95
100
pertenece al intervalo 5
Elaborado por ELEAZAR GMEZ LARA
Sep-07
Medidas de forma 18
95 86
9
P28 = 172.5 +
12 = 172.5 + 12 = 175.77
33
33
c = 12
80 (190)
= 152 que pertenece al
100
intervalo 7
LP80 = 196.5
f aa = 142
f P80 = 19
152 142
10
P80 = 196.5 +
12 = 196.5 + 12 = 202.81
19
19
c = 12
90 (190)
= 171 que pertenece al intervalo 8
100
LP90 = 208.5
f aa = 161
f P80 = 15
171 161
10
P90 = 208.5 +
12 = 208.5 + 12 = 216.5
15
15
c = 12
d) Rango intercuartlico
Rango intercuartlico= Q3 Q1 = 196.81 161.50 = 35.31
e) Rango percentlico
Rango percentlico= P90 P10 = 216.5 159.57 = 56.93
f) Sesgo Cuartlico
Sesgo cuartlico =
Medidas de forma 19
h) Coeficiente de curtosis
Q3 Q1
196.81 161.5
35.31
=
=
= 0.3101
2 ( P90 P10 ) 2(216.5 159.57) 113.86
45
40
35
30
25
20
15
10
5
histograma
251
239
227
215
203
191
179
167
155
143
131
119
poligono suavizado
Ejercicios
1.- Para tener mejor conocimiento de la altura de los estudiantes de una Preparatoria
publica del Estado de Mxico con 800 alumnos, se eligieron a algunos de ellos y
obtuvo la siguiente distribucin de datos:
a) Construya su histograma y su polgono de
Estaturas
frecuencias.
Intervalos
f
b) Describa las representaciones graficas construidas.
1,50 - 1,55
13
c) Determine el coeficiente de sesgo, utilizando los dos
1,55 - 1,60
23
coeficiente se Pearson.
1,60 - 1,65
35
d) Determine el coeficiente de curtosis
1,65 - 1,70
41
e) La informacin proporcionada por los coeficientes
1,70 - 1,75
30
coincide con la descripcin de la distribucin de
1,75 - 1,80
25
frecuencias?
1,80 - 1,85
13
f) Qu se podra concluir acerca de la estatura de los
alumnos de este colegio?
Elaborado por ELEAZAR GMEZ LARA
Sep-07
Medidas de forma 20
3.- La siguiente tabla representa la edad de los empleados que trabajan en cierta
empresa:
Edad
N de Empleados
Calcular:
22-26
12
a) Edad ms frecuente
26-30
29
b) La edad que se encuentra justo en el 50% de la
30-34
27
distribucin.
34-38
19
c) La edad mnima del 40% entre los mayores
38-42
16
d) Porcentaje entre 28 y 40 aos
42-46
10
e) Porcentaje entre x s
46-50
7
f) Porcentaje entre x 2 s
f) Calcule la curtosis e interprete
g) Calcule el coeficiente de asimetra e interprete.
4.- De la siguiente distribucin de calificaciones en cierto examen de lectura:
Intervalo
f
68
3
8 10
10
10 12
25
12 14
38
14 16
42
16 18
45
Calcular::
a). Porcentaje de calificaciones entre x 2s .
b).El intervalo donde cae el 60% central.
c). Porcentaje de los que obtuvieron ms de 15 puntos.
d).La mayor nota del 25% que obtuvo la ms baja.
e). La menor nota del 25% que obtuvo la nota ms alta.
f) Coeficiente de asimetra e intrprete.
g).Calcule la curtosis, e intrprete.