Vous êtes sur la page 1sur 20

Medidas de forma 1

UNIVERSIDAD NACIONAL AUTNOMA DE MXICO


COLEGIO DE CIENCIAS Y HUMANIDADES
PLANTEL VALLEJO
REA DE MATEMTICAS
ESTADSTICA Y PROBABILIDAD I
MEDIDAS DE FORMA
Las representaciones graficas, nos muestran la variedad de formas que pueden tomar
las distribuciones de frecuencias. Algunas de ellas son simtricas; aquellas que al
doblarlas por el centro crean dos mitades idnticas, lo que nos indica que tales
distribuciones tienen la misma cantidad de valores extremos en ambas direcciones,
alta y baja. Algunas otras tienen ms valores extremos en una direccin que en otra,
por lo que se dice que son asimtricas (faltas de simetra) o que estn sesgadas.
En las distribuciones que no toman la forma de una curva simtrica, tiene mucha
importancia obtener dos medidas adicionales, las de asimetra y curtosis.
Las medidas de asimetra revelan si en la distribucin hay una concentracin de datos
en alguno de sus extremos, el superior o el inferior, con respecto a un eje que pasa
por su centro.
Las medidas de curtosis establecen la diferencia de las distribuciones en trminos de
puntiagudez, algunas de ellas son bastante picudas, otras son bastante planas y
otras no son ni muy planas ni muy puntiagudas.
Para establecer patrones de comportamiento en las distribuciones de frecuencias, de
una poblacin o muestra, stas se comparan con distribuciones tericas que se
toman como modelos o patrones, y que nos permiten comparar, describir y
caracterizar a una distribucin de frecuencias.
Una de las distribuciones tericas de mayor uso en la investigacin es la distribucin
normal, la cual se toma como modelo para poder establecer las medidas de forma y
de curtosis.
DISTRIBUCIN NORMAL
Una de las ms importantes distribuciones tericas es la distribucin normal,
conocida tambin con los nombres de curva normal o campana de Gauss.
De Moivre en 1773 realizo un trabajo sobre la curva normal. Carl Friedrich Gauss y
Laplace, contemporneos de De Moivre, la dedujeron de forma independiente.
En sus inicios, la curva normal se aplic para estudiar la distribucin de los errores
(desviacin) respecto al promedio aritmtico, de aqu que tambin se le conoce con el
nombre de curva normal de error.
La curva normal, es un modelo terico o ideal que se logr a partir de un anlisis
matemtico ms que de una investigacin y recoleccin de datos real.
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 2

La aplicacin de la curva normal es muy amplia en situaciones reales de


investigacin, ya que puede utilizarse para describir distribuciones de datos, para
interpretar la desviacin estndar y para el clculo de probabilidades.
La distribucin normal es esencial para la toma de decisiones en estadstica, ya que
basada en ella se puede generalizar los resultados de muestras a poblaciones.
La grafica de una distribucin normal tiene la forma de una campana en la que la
mayor frecuencia se localiza en el centro y sus extremos se acercan al eje horizontal
sin que lleguen a tocarlo. Es simtrica con respecto a la media, por lo que hay la
misma cantidad de datos menores a la media y mayores que sta. Como la mxima
frecuencia coincide con la media aritmtica por esta razn en la distribucin normal
son iguales la media, la moda y la mediana.
DISTRIBUCION NORMAL

SESGO
Cuando una curva est equilibrada, con relacin a su eje vertical, se dice que es
simtrica, cuando esto no ocurre, se dice que es asimtrica. Por lo que el grado de
asimetra se le conoce como sesgo:
Sesgo: es el grado de asimetra, o falta de simetra de una distribucin.
Cuando existe sesgo los valores observados se concentran en una sola direccin,
con respecto a un eje que pase por su centro, por lo que la distribucin tendr una
cola pronunciada. La posicin de esta cola indica en donde estn localizados los
relativamente pocos valores extremos y determina la direccin del sesgo.
La asimetra puede ser de dos tipos; negativa o positiva.
La asimetra se identifica por la direccin de la cola de la curva, cuando se encuentra
a la derecha; la asimetra es positiva, cuando est a la izquierda la asimetra es
negativa. Es decir, si la curva de frecuencias (polgono de frecuencias suavizado) de
una distribucin tiene una cola mas larga a la derecha del mximo central que a la
izquierda, entonces se dice que esta sesgada a la derecha o que tiene un sesgo
positivo. Si es al contrario se dice que est sesgada a la izquierda o que tiene sesgo
negativo.
En las distribuciones unimodales sesgadas, la media tiende a situarse con respecto a
la moda al mismo lado que la cola ms larga.
La grafica o curva de una distribucin de frecuencias unimodal, moderadamente
sesgada, presenta tres situaciones:
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 3

a) Simtrica: Cuando existe un valor central alrededor del cual son igualmente
probables valores mayores o valores menores. En una distribucin simtrica y
unimodal, la media, la moda y la mediana coinciden.

x = x = x

b) Asimtrica positiva: Una distribucin unimodal con una larga cola a la derecha,
indica que los valores extremos se encuentran a la derecha de distribucin de
frecuencias. En una distribucin unimodal con una larga cola a la derecha, se cumple
que la moda es menor que la mediana y sta a su vez es menor que la media.

x < x < x

c) Asimtrica negativa: Una distribucin unimodal con una larga cola a la izquierda,
dejar ver que los valores extremos se encuentran a la izquierda de la distribucin de
frecuencias. En una distribucin unimodal con una larga cola a la izquierda, se
cumple que: la media es menor que la mediana y la mediana su vez es menor que la
moda.

x < x < x

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 4

COEFICIENTES DE PEARSON
En las distribuciones simtricas, la media, la mediana y la moda coinciden y a medida
que la distribucin se aparta de la simetra estos valores se alejan entre s, por lo que
la moda, la mediana y la media no coinciden en las distribuciones asimtricas,
alejndose de la cima y acercndose a la cola.
La moda est mas cerca del punto ms alto, que es donde se encuentran los valores
con mayor frecuencia, por el contrario la media se encuentra mas cerca de la cola,
donde estn localizados los relativamente pocos datos con valores extremos, por esta
situacin la ms comn de las medidas de asimetra es la diferencia entre la moda y
la media que es la ms sensible a los valores extremos
Una medida relativa de asimetra se expresa simblicamente como:
sesgo = sk =

media moda ( x x )
=
s
s

Si por alguna razn la moda no se encuentra bien definida, sta se puede sustituir por
la mediana, y el sesgo se puede determinar mediante la expresin:
sesgo = sk =

3( x x)
s

Estas medidas se conocen como el primero y segundo coeficiente de Pearson y


varan entre el intervalo + 3, es cero para la distribucin normal o la curva que es
simtrica. .
En resumen: El coeficiente de sesgo se puede determinar mediante el primer
coeficiente de Person:
x x
sesgo =
s

< 0 asimetrca negativa (cola izquierda )

la distribucin es simetrca
= 0
> 0 asimetrca positiva (cola derecha )

y si no es posible determinar el valor de la moda, es posible calcular el sesgo


mediante el segundo coeficiente de Pearson.
3( x x)
sesgo =
s

< 0 asimetrca negativa (cola izquierda )

la distribucin es simetrca
= 0
> 0 asimetrca positiva (cola derecha)

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 5

Ejemplo 1: Calcular el sesgo para la siguiente distribucin de frecuencias:

f m

mx

11.5
14.5
17.5
20.5
23.5

46
87
175
123
94

-6
-3
0
3
6

Intervalo
10 - 13
13 - 16
16 - 19
19 - 22
22 - 25

4
6
10
6
4
30

(m x )2
36
9
0
9
36

f (m x ) 2
144
54
0
54
144

525

396

Tenemos que:

525
= 17.5
30
d1
4
x = Lx +
c = 16 +
3 = 17.5
4+4
d1 + d 2
x=

396
= 13.2
30
s = 13.2 = 3.63
s2 =

Por lo que el sesgo es:


sesgo =

17.5 17.5
=0
3.63

Por lo que la distribucin de frecuencias es: simtrica.


Para comprobarlo construyamos el histograma y el polgono de frecuencias
correspondiente.

12
10
8
6
4
2

Histograma

26.5

23.5

20.5

17.5

14.5

11.5

8.5

Poligono suavizado

Al revisar el histograma y el polgono, se puede observar que efectivamente la grafica


es simtrica, con respecto al eje que pasa por la media (17.5).

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 6

Ejemplo 2: Calcular el sesgo de la siguiente distribucin de frecuencias:


Intervalo
10 - 13
13 - 16
16 - 19
19 - 22
22 - 25

f m

5
10
9
3
1

11.5
14.5
17.5
20.5
23.5

57.5
145.0
157.5
61.5
23.5
445.0

28

mx
4.39
1.39
1.61
4.61
7.61

(m x ) 2

f (m x ) 2

19.2972
1.9401
2.5829
21.2258
57.8686

96.4860
19.4005
23.2462
63.6773
57.8686
260.6786

445
= 15.8929
28
d1
5
x = Lx +
c = 13 +
3 = 15.5
5 +1
d1 + d 2
x=

260.6786
= 9.3039
28
s = 9.3039 = 3.0512

s2 =
Por lo que el sesgo es:

sesgo =

15.8929 15.5
= 0.1287
3.0512

Puesto que el sesgo es positivo podemos afirmar que la distribucin es asimtrica en


forma positiva, por lo que tiene una cola derecha.
Al trazar en forma conjunto su histograma y polgono de frecuencias podemos
detectar que la distribucin de datos tiene una moderada cola derecha, es decir se
tienen pocos valores extremos al lado derecho por lo que el polgono de frecuencias
decrece lentamente conforme el valor de la variable aumenta.

Con lo que podemos concluir que la distribucin de frecuencias es: asimtrica


positiva.
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 7

Ejemplo 3 Calcular el sesgo para la siguiente distribucin de frecuencias:


Intervalo
7 - 11
11 - 15
15 - 19
19 - 23
23 - 27
27- 31

f m

mx

3
5
7
8
12
10

9
13
17
21
25
29

27
65
119
168
300
290

-12.5333
-8.5333
-4.5333
-0.5333
3.4667
7.4667

45

(m x ) 2
157.0844
72.8178
20.5511
0.2844
12.0178
55.7511

969

f (m x ) 2
471.2533
364.0889
143.8578
2.2756
144.2133
557.5111
1 683.2000

969
= 21.5333
45
d1
4
x = Lx +
c = 23 +
4 = 25.6666
2+4
d1 + d 2
1683.2000
s2 =
= 37.40
45
s = 37.40 = 6.1155
Por lo que el sesgo es:
21.5333 25.6666
= 0.6758
sesgo =
6.1155
x=

Con un sesgo es negativo podemos aseverar que la distribucin es asimtrica en


forma negativa, por lo que tiene una cola izquierda
Al construir en forma conjunta el histograma y polgono de frecuencias podemos
apreciar que la distribucin de datos tiene una moderada cola izquierda, es decir se
tienen algunos valores extremos al lado izquierdo por lo que el polgono de
frecuencias decrece lentamente conforme el valor de la variable disminuye.
14
12
10
8
6
4
2
0
5

13

17

Histograma

21

25

29

33

Poligono suavizado

Por lo que la distribucin de frecuencias es: asimtrica negativa.

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 8

1.- Para la distribucin de frecuencias proporcionado:


a) Construya su histograma y su polgono de frecuencias.
b) Describa las representaciones graficas construidas.
c) Determine el coeficiente de sesgo, utilizando los dos
coeficiente se Pearson.
d) La informacin proporcionada por los coeficientes
coincide con la descripcin de la distribucin de
frecuencias?

Intervalos
101,4 119,4
119,4 137,4
137,4 155,4
155,4 173,4
173,4 - 191,4
191,4 - 209,4
209,4 - 227,4
227,4 - 245,4

f
13
17
21
30
21
16
12
10

2.- Los siguientes datos recogen el nmero de unidades vendidas del producto
Econopack durante un mes en tiendas de cierta franquicia diseminadas por la
Republica Mexicana
Intervalo
45 - 65
65 - 85
85 - 105
105 - 125
125 - 145
145 - 165
165 - 185
185 - 205

f
52
87
62
47
35
21
17
12

a) Construya su histograma y su polgono de frecuencias.


b) Describa las representaciones graficas construidas.
c) Determine el coeficiente de sesgo, utilizando los dos
coeficiente se Pearson.
d) La informacin proporcionada por los coeficientes coincide
con la descripcin de la distribucin de frecuencias?

3.- Las edades de los componentes de 100 matrimonios elegidos al azar en cierta
ciudad son las siguientes:
Para cada sexo:
a) Construya su histograma y su polgono de
edades
hombres
mujeres
frecuencias.
8
5
15-25
b) Describa las representaciones graficas
23
20
25-35
construidas.
34
27
35-45
c) Determine el coeficiente de sesgo,
18
22
45-55
utilizando los dos coeficiente se Pearson.
9
18
55-65
d) La informacin proporcionada por los
8
8
65-75
coeficientes coincide con la descripcin
de la distribucin de frecuencias?
Qu sexo presenta una edad media mayor? Cul presenta mayor dispersin?

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 9

MEDIDAS DE ORDEN
En tema anterior, se mostr que la mediana, adems de ser una medida de tendencia
central, expresa una posicin ordenada, la cual se obtiene al dividir el conjunto de
datos ordenados en dos partes iguales.
De la abstraccin de dividir la serie ordenada de las observaciones en partes iguales
pueden surgir la necesidad de dividir dicho conjunto ordenado en cuatro partes
iguales, con lo cual se obtendran tres valores llamados cuartiles: primero, segundo y
tercero, y cada uno de ellos representa al valor que deja el 25%, el 50% y el 75% de
las observaciones con valores menores a ellos, respectivamente.
Al dividir al conjunto de datos ordenados en 10 partes iguales, obtenemos los valores
conocidos como deciles; que desde el primero hasta el noveno, dejan desde el 10%
hasta el 90% de observaciones con valores menores a ellos, respectivamente.
Por ltimo, tambin se acostumbra dividir al conjunto ordenado en cien partes iguales,
dando lugar a los percentiles; que desde el primero hasta el 99, dejan desde el 1%
hasta el 99% de observaciones con valores menores a ellos.
El clculo de estas medidas de orden sigue un procedimiento exactamente igual al
que se sigue para calcular la mediana, siendo la nica diferencia el clculo del orden
o posicin correspondiente a la medida deseada.

CUARTILES, DECILES Y PERCENTILES


Los cuantiles son valores de la distribucin de frecuencias que dividen a sta en
partes iguales, es decir, en intervalos, que contienen el mismo nmero o porcentaje
de valores. Los ms usados son los cuartiles, los deciles y los percentiles.
Cuando se divide a la distribucin en cuatro partes obtenemos los Cuartiles,:
Q1 , Q2 , Q3 , si la divisin es en 10 intervalos iguales se generan los Deciles:
D1 , D2 , D3 , , D9 , y por ltimo si la dividimos en 100 parte obtenemos los Percentiles
o centiles: P1 , P2 , P3 , , P99
Los cuantiles permiten hacer un anlisis minucioso de una distribucin de
frecuencias, se utilizan habitualmente cuando se quiere ubicar un dato dentro del
conjunto. Por ejemplo, pertenece el dato x al 50% superior?, al 10% inferior?, al
50 % central?, etc.
Cuartiles
Si una serie de datos se coloca en orden creciente de magnitud el valor de posicin
media, que divide al conjunto de datos en dos partes iguales es la mediana. Por
extensin de esta idea se puede pensar en aquellos valores que dividen al conjunto
en cuatro partes iguales.
Estos valores representados por Q1 , Q2 , Q3 a los cuales se les llaman cuartiles,
primero, segundo y tercero respectivamente.
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 10

La localizacin de los cuartiles la podemos determinar mediante la expresin:


in
P (Qi ) =
4
Donde
i = 1, 2,3
Una vez identificada su posicin dentro de una clasificacin por intervalos podemos
determinar su valor mediante la expresin:

in

4 faa
Qi = LQi +
c
fQi

Donde:
i = 1, 2,3 : nmero del cuartil que deseamos determinar
LQi : Lmite real inferior del intervalo que contiene al cuartil de inters.

f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-simo


cuartil
fQi : Frecuencia del intervalo que contiene al i-simo cuartil.
c: amplitud o ancho de intervalo.
DECILES
A los valores que dividen a los datos en diez partes iguales se les llama Deciles y se
representan por
D1 , D2 , D3 , , D9
La localizacin de los deciles la podemos determinar mediante la expresin:

P( Di ) =

in
10

Donde

i = 1, 2,3, 9
Y una vez identificada su posicin dentro de una clasificacin por intervalos podemos
determinar su valor mediante la expresin:
in

10 faa
Di = LDi +
c
f
D

Donde:
i = 1, 2,3, ,9 : nmero del decil que deseamos determinar
LDi : Lmite real inferior del intervalo que contiene al i-simo decil.

f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-simo


decil
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 11

f Di : Frecuencia del intervalo que contiene al i-simo decil.


c: amplitud o ancho de intervalo.
PERCENTILES
A los valores que dividen al conjunto de datos en 100 partes iguales se les llaman
percentiles y se representan por: P1 , P2 , P3 , , P99
La localizacin de los percentiles la podemos determinar mediante la expresin:
in
P( Pi ) =
100

i = 1, 2,3,,99
Y una vez identificada su posicin dentro de una clasificacin por intervalos podemos
determinar su valor mediante la expresin:
in

100 faa
Pi = LPi +
c
f Pi

Donde:
i = 1, 2,3, ,99 : nmero del percentil que deseamos determinar
LPi : Lmite real inferior del intervalo que contiene al i-simo percentil.

f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-simo


percentil
f Pi : Frecuencia del intervalo que contiene al i-simo percentil.
c: amplitud o ancho de intervalo.
OBSERVACIN: x = D5 = Q2 = P50
MEDIDAS DE DISPERSIN
(Mediante cuartiles, deciles y percentiles)
a) Rango intercuartlico.- Cuando aumenta la dispersin de una distribucin de
frecuencias, aumenta la distancia entre los cuartiles, por lo que esta distancia puede
usarse como base de una medida de variabilidad
El intervalo intercuartil, es el rango entre el cuartil 3 y el cuartil 1. Es el intervalo que
incluye slo el 50% de los datos distribuidos alrededor de la mediana. Para construirlo
se desechan el 25% de las observaciones del extremo derecho y el 25% de las
observaciones en el extremo superior.
Rango intercuartlico = Q = Q3 Q1
b) Rango Percentil 10 90. Mide la dispersin del 80% de los datos centrales y se
obtiene de la diferencia entre el Percentil 90 y el Percentil 10 (o entre el decil 9 y el
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 12

decil 1), evitando as los puntos extremos. Incluye solo el 80% de los datos
distribuidos alrededor de la mediana, por lo que un 10% de las observaciones del
extremo inferior y otro 10% de las observaciones en el extremo superior son
excluidos.
Rango percentil 10 - 90 = P90 P10
MEDIDAS DE DISPERSIN RELATIVAS
Cuando se necesita comparar dos o ms series de datos a veces no es posible
hacerlo con las medidas absolutas, ya sea porque las unidades son diferentes o
porque tienen diferente media, en stos casos deben utilizarse cantidades relativas
definida generalmente como:
Dispersin relativa =

Dispersin absoluta
media

COEFICIENTE DE VARIACIN
Es la medida de dispersin relativa ms usada y se define como el cociente de la
desviacin estndar entre la media aritmtica, expresado en porcentaje y es
adimensional
s
Coeficiente de variacin:
V=
x
OBSERVACIN: El coeficiente de variacin no es conveniente cuando la media es
muy cercana a cero.
Ejemplo: El veterinario de un zoolgico obtuvo los siguientes datos con respecto a los
pesos de los elefantes y las ratas de la pradera.
Elefantes Ratas
Media
10886 Kg. 476 g
Desviacin estndar 582.8 Kg. 72.5 g
Con lo cual el coeficiente de cada una de estas especies es:
582.8
V(elefantes) =
= 0.05350
108.86
Por lo que el peso de los elefantes tiene una variacin del 5.35%. Mientras que para
las ratas de campo se tiene que:
72.5
= 0.1523
V(ratas) =
476
la variacin es del 15.23% para el peso de las ratas de la pradera.
Por lo que se concluye que el peso de los elefantes tiene una menor variacin que el
peso de las ratas de pradera.

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 13

MEDIDAS DE SESGO
(Utilizando cuartiles y percentiles)

Las medidas de sesgo en funcin de cuartiles y percentiles son las siguientes:


Coeficiente de sesgo cuartlico
En una distribucin simtrica los cuartiles quedan simtricamente colocados respecto
a la mediana, pero si es asimtrica un cuartil se separa ms que otro. El coeficiente
de sesgo cuartlico mide esta diferencia:
skQ =

Q3 2Q2 + Q1
Q3 Q1

Si la asimetra es a la derecha Q3 estar ms lejos de la mediana que Q1 ; si la


asimetra es a la izquierda Q1 est ms alejada de la mediana que Q3 .
Esta medida vara siempre entre + 1, si es cero la distribucin es normal.
Coeficiente de sesgo percentlico
En una distribucin simtrica los percentiles quedan simtricamente colocados
respecto a la mediana, pero si la distribucin es asimtrica un percentil se separa ms
que otro. Por lo que con el coeficiente de sesgo percentlico mide estas diferencias:
sk p =

P90 2 P50 + P10


P90 P10

Su interpretacin y aplicacin es similar a la del sesgo cuartlico.


CURTOSIS:
La curtosis es el grado de apuntamiento de una distribucin de frecuencias, que se
mide con relacin a la distribucin normal, es decir, el coeficiente de curtosis analiza
el grado de concentracin que presentan los valores alrededor de la zona central de
una distribucin de frecuencias.
Al comparar cun aguda, concentrada, o puntiaguda es la distribucin de inters con
respecto a la Distribucin Normal, se pueden presentar tres diferentes grados de
apuntalamiento.

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 14

Distribucin leptocrtica: es aquella que presenta un elevado grado de concentracin


de datos alrededor de los valores centrales de la variable, es decir, es aquella
distribucin que presenta apuntamiento relativo alto y su polgono de frecuencias es
algo puntiagudo.
Distribucin mesocrtica: cuando la distribucin de frecuencias presenta un grado de
concentracin medio alrededor de los valores centrales de la variable (que es igual a
la que presenta una distribucin normal), es decir el polgono de frecuencias no es ni
puntiagudo ni achatado.
Distribucin platicrtica: la que presenta un reducido grado de concentracin
alrededor de los valores centrales de la variable, es decir, el polgono de frecuencias
es plano o achatado.
Coeficiente de curtosis percentlico
Para medir el grado de apuntamiento o curtosis de una distribucin, tomaremos como
referencia la posicin que guardan los cuartiles y percentiles dentro de una
distribucin.
Haciendo uso de estas medidas, el coeficiente de curtosis percentlico, est dada por:

Q3 Q1
2 ( P90 P10 )

El que toma el valor de 0.263 cuando la distribucin es normal y al comparar los


coeficientes de curtosis con este valor nos seala que una distribucin es

Leptocrtica si es menor que 0.263


Mesocrtica si es igual a 0.263
Platicrtica si es mayor que 0.263
Po lo que al calcular el coeficiente de curtosis podemos determinar el grado de
apuntamiento de la distribucin y el tipo al cual pertenece la distribucin.
< 0.263 distribucin leptocrtica

Q3 Q1
=
= 0.263 distribucin mesortica
2 ( P90 P10 )
> 0.263 distribucin platicrtica
Ejercicio: Dada la siguiente distribucin de frecuencias determine:

a)
b)
c)
d)
e)
f)
g)
h)

los cuartiles
los deciles 3, 6, 7 y 9
los percentiles 10, 28, 50, 80 y 90
Rango intercuartlico
Rango percentlico
Coeficiente de sesgo cuartlico.
Coeficiente de sesgo percentlico 10-90
Coeficiente de curtosis.
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 15

N Intervalo
1 124.5 - 136.5
2 136.5 - 148.5
3 148.5 - 160.5
4 160.5 - 172.5
5 172.5 - 184.5
6 184.5 - 196.5
7 196.5 - 208.5
8 208.5 - 220.5
9 220.5 - 232.5
10 232.5 - 242.5

f
7
13
24
42
33
23
19
15
9
5

fa
7
20
44
86
119
142
161
176
185
190

La estrategia para determinar cuartiles, deciles y percentiles, es la misma, primero se


establece su posicin, a continuacin se determina el intervalo que contiene a la
medida de inters y posteriormente se evala la expresin correspondiente para
obtener su valor. Con el fin de facilitar el procedimiento se determin la frecuencia
acumulada de cada intervalo.
a) Cuartiles
Su posicin se determina mediante la expresin: P (Qi ) =

in
4

Cuartil uno; La posicin de este cuartil se obtiene haciendo i= 1; P (Q1 ) =

1 (190)
= 47.5
4

que se localiza dentro del intervalo numero 4.

4 faa
El valor se establece mediante la expresin: Q1 = LQ1 +
c
fQ1

Ahora identificando cada uno de los elementos necesarios para su clculo


LQ1 = 160.5
f aa = 44
f Q1 = 42

47.5 44
3.5
Q1 = 160.5 +
12 = 160.5 +
12 = 161.5
42

42

c = 12
Cuartil dos; La posicin se obtiene haciendo i= 2; P (Q2 ) =

2 (190)
= 95 que se
4

encuentra ubicada dentro del intervalo numero 5.


2n

4 faa
El valor se determina mediante la expresin: Q2 = LQ2 +
c
f Q2

Nuevamente identificando cada uno de los elementos necesarios para su clculo

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 16

LQ2 = 172.5
f aa = 86
f Q2 = 33

95 86
9
Q2 = 172.5 +
12 = 172.5 + 12 = 175.77
33
33

c = 12
Cuartil tres; Posicin hacemos i= 3, P (Q3 ) =

3 (190)
= 142.5 hallada en el intervalo
4

nmero 7
3 n

4 faa
El valor se determina mediante la expresin: Q3 = LQ3 +
c
fQ3

Identificando cada uno de los elementos necesarios para su clculo


LQ3 = 196.5
f aa = 142
f Q3 = 19

142.5 142
0.5
Q3 = 196.5 +
12 = 196.5 +
12 = 196.81
19

19

c = 12

b) Deciles 3, 6, 7, 9
La posicin de los deciles se determina mediante la expresin: P( Di ) =
Decil 3; Su posicin se obtiene haciendo i= 3; P( D3 ) =

in
10

3 (190)
= 57 la cual est situada
10

dentro del intervalo numero 4.

3 n

4 faa
Se determina mediante la expresin: D3 = LD3 +
c
f D3

Ahora conociendo cada uno de los elementos necesarios para su clculo


LD3 = 160.5
f aa = 44
f D3 = 42

57 44
7
D3 = 160.5 +
12 = 160.5 + 12 = 162.5
42
42

c = 12

Decil 6; La posicin se obtiene haciendo i= 6; P ( D6 ) =

6 (190)
= 114 que se sita
10

dentro del intervalo numero 5.


6n

4 faa
El valor se determina mediante el trmino: D6 = LD6 +
c
f
D

Los elementos necesarios para su clculo

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 17

LD6 = 172.5
f aa = 86
f D6 = 33

114 86
28
D6 = 172.5 +
12 = 172.5 + 12 = 182.68
33
33

c = 12

Decil 7; Posicin con i= 7; P( D7 ) =

7 (190)
= 133 situada dentro del intervalo 6.
10

LD7 = 184.5
f aa = 119
f D7 = 23

133 119
14
D7 = 184.5 +
12 = 184.5 + 12 = 191.87
23

23

c = 12

Decil 9; Posicin con i= 9; P ( D9 ) =

9 (190)
= 171 situada dentro del intervalo 8.
10

LD9 = 208.5
f aa = 161
f D9 = 15

171 161
10
D9 = 208.5 +
12 = 208.5 + 12 = 216.5
15
15

c = 12

c) Percentiles 10, 28, 50, 80, 90

in
con i = 1, 2,,99.
100
Percentil 10, La posicin se determina haciendo i=10, por lo que su posicin es:
10 (190)
P( P10 ) =
= 19 que est situada en el intervalo 2.
100
Identificando cada uno de los elementos necesarios para su clculo
LP10 = 136.5
Su posicin se determina mediante la expresin: P( Pi ) =

f aa = 7
f P10 = 13

19 7
12
P10 = 136.5 +
12 = 148.5 + 12 = 159.57
13
13

c = 12

Percentil 28, su posicin se obtiene haciendo i=28, por lo que la posicin que ocupa
28 (190)
es: P ( P28 ) =
= 53.2 la cual se localiza en el intervalo 4.
100
Determinando cada uno de los elementos necesarios para su clculo
LP28 = 160.5
f aa = 44
f P28 = 42

53.2 44
9.2
P28 = 160.5 +
12 = 160.5 +
12 = 163.12
42

42

c = 12

Percentil 50, para su posicin hacemos i=50, por lo que P ( P50 ) =

50 (190)
= 95
100

pertenece al intervalo 5
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 18

Para este percentil se tiene que:


LP50 = 172.5
f aa = 86
f P50 = 33

95 86
9
P28 = 172.5 +
12 = 172.5 + 12 = 175.77
33
33

c = 12

Percentil 80, su posicin cuando i=80, P ( P80 ) =

80 (190)
= 152 que pertenece al
100

intervalo 7
LP80 = 196.5
f aa = 142
f P80 = 19

152 142
10
P80 = 196.5 +
12 = 196.5 + 12 = 202.81
19

19

c = 12

Percentil 90, P ( P90 ) =

90 (190)
= 171 que pertenece al intervalo 8
100

LP90 = 208.5
f aa = 161
f P80 = 15

171 161
10
P90 = 208.5 +
12 = 208.5 + 12 = 216.5
15
15

c = 12

d) Rango intercuartlico
Rango intercuartlico= Q3 Q1 = 196.81 161.50 = 35.31
e) Rango percentlico
Rango percentlico= P90 P10 = 216.5 159.57 = 56.93
f) Sesgo Cuartlico
Sesgo cuartlico =

Q3 2Q2 + Q1 196.81 2(175.77) + 161.50 6.77


=
=
= 0.19
Q3 Q1
196.81 161.50
35.31

Por lo que la distribucin es asimtrica positiva (cola derecha).


g) Sesgo Percentlico 10-90
Sesgo percentlico =

P90 2 P50 + P10 216.5 2(175.77) + 159.57 24.53


=
=
= 0.4308
P90 P10
216.5 159.57
56.93

Corroborando que distribucin es asimtrica positiva (cola derecha).

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Medidas de forma 19

h) Coeficiente de curtosis

Q3 Q1
196.81 161.5
35.31
=
=
= 0.3101
2 ( P90 P10 ) 2(216.5 159.57) 113.86

Como el coeficiente de curtosis es mayor que 0.26, podemos deducir que la


distribucin tiene una forma platicrtica.
Para concluir observemos que el polgono suavizado est descrito de la siguiente
forma: Es un distribucin unimodal, la cual esta sesgada a la derecha, tenindose una
cola derecha, adems la curtosis nos indica que en general la distribucin es
platicrtica, ya que decrece a ambos lados, del punto ms alto, de forma suave, es
decir es algo plana.

45
40
35
30
25
20
15
10
5

histograma

251

239

227

215

203

191

179

167

155

143

131

119

poligono suavizado

Ejercicios
1.- Para tener mejor conocimiento de la altura de los estudiantes de una Preparatoria
publica del Estado de Mxico con 800 alumnos, se eligieron a algunos de ellos y
obtuvo la siguiente distribucin de datos:
a) Construya su histograma y su polgono de
Estaturas
frecuencias.
Intervalos
f
b) Describa las representaciones graficas construidas.
1,50 - 1,55
13
c) Determine el coeficiente de sesgo, utilizando los dos
1,55 - 1,60
23
coeficiente se Pearson.
1,60 - 1,65
35
d) Determine el coeficiente de curtosis
1,65 - 1,70
41
e) La informacin proporcionada por los coeficientes
1,70 - 1,75
30
coincide con la descripcin de la distribucin de
1,75 - 1,80
25
frecuencias?
1,80 - 1,85
13
f) Qu se podra concluir acerca de la estatura de los
alumnos de este colegio?
Elaborado por ELEAZAR GMEZ LARA
Sep-07

Medidas de forma 20

2. La distribucin de acciones de una sociedad es:


a) Determinar el nmero medio de acciones que
acciones
accionistas
posee un accionista.
0-50
23
b) Nmero de acciones que ms frecuentemente
50-100
72
posee un accionista.
100-150
62
c) Nmero de acciones que debe poseer un
150-200
48
accionista para que la mitad de los restantes
200-250
19
accionistas tengan menos acciones que l.
250-300
8
d) Construya su histograma y su polgono de
300-350
14
frecuencias.
350-400
7
e) Describa
las
representaciones
graficas
400-500
7
construidas.
f) Determine el coeficiente de sesgo, utilizando los dos coeficiente se Pearson.
g) Determine el coeficiente de curtosis.
h) Que conclusiones se pueden obtener con estos resultados?

3.- La siguiente tabla representa la edad de los empleados que trabajan en cierta
empresa:
Edad
N de Empleados
Calcular:
22-26
12
a) Edad ms frecuente
26-30
29
b) La edad que se encuentra justo en el 50% de la
30-34
27
distribucin.
34-38
19
c) La edad mnima del 40% entre los mayores
38-42
16
d) Porcentaje entre 28 y 40 aos
42-46
10
e) Porcentaje entre x s
46-50
7
f) Porcentaje entre x 2 s
f) Calcule la curtosis e interprete
g) Calcule el coeficiente de asimetra e interprete.
4.- De la siguiente distribucin de calificaciones en cierto examen de lectura:
Intervalo
f

68
3

8 10
10

10 12
25

12 14
38

14 16
42

16 18
45

Calcular::
a). Porcentaje de calificaciones entre x 2s .
b).El intervalo donde cae el 60% central.
c). Porcentaje de los que obtuvieron ms de 15 puntos.
d).La mayor nota del 25% que obtuvo la ms baja.
e). La menor nota del 25% que obtuvo la nota ms alta.
f) Coeficiente de asimetra e intrprete.
g).Calcule la curtosis, e intrprete.

Elaborado por ELEAZAR GMEZ LARA


Sep-07

Vous aimerez peut-être aussi