Académique Documents
Professionnel Documents
Culture Documents
+ + + +
+ + + +
+ + + +
8.<.1 =a$iabl#s Disc$#tas
E'#!plo.
20
En .+ familias se observa la variable, >, nmero de hi&os. #os datos recopilados
son los siuientes: , + 1 * 1 * . , < .
1 * , . * + < * . 1 * < *
< , < * 1 1 < < < + < . .
, + < .
#a tabla de distribucin de frecuencias es%
x i ni fi 3i Fi
+ . +.1++ . +.1++
1 L +.1,+ 1+ +.*,+
* J +.*++ 1J +..,+
< 1+ +.*,+ *J +.I++
. I +.1I, <, +.JI,
, , +.1*, .+ 1.+++
6nterpretacin de las frecuencias%
n< ? J sinifica BJ familias tienen * hi&osC
f, ? +,1I, sinifica B el 1I,,Z de las familias tienen . hi&osC
3. ? *J sinifica B*J familias tienen a lo ms < hi&osC
F. ? +,., sinifica Bel .,Z de las familias tienen a lo ms * hi&osC
'na variable discreta se presenta rficamente mediante un historama y un
rfico acumulativo de frecuencias.
0isto2$a!a
Es un rfico de barras o rectnulos
En el e&e de las abscisas se escriben los valores de la variable. Estos se ubican
en los puntos medios de las bases de las barras o rectnulos.
En el e&e de las ordenadas se escriben las frecuencias absolutas o relativas
#a altura del rectnulo equivale al valor de la frecuencia absoluta o relativa
del valor de la variable respectivo.
:$4&ico Ac"!"lati%o d# ,$#c"#cias
Es un rfico escalonado
En el e&e de las abscisas se escriben los valores de la variable
En el e&e de las ordenadas se escriben las frecuencias absolutas o relativas
acumuladas
-ada escaln equivale a la frecuencia absoluta o relativa del valor de la
variable.
21
E'#!plo.
El historama para las frecuencias relativas del e&emplo < es%
f i
+.*,+
+.*++
+.1I,
+.1,+
+.1*,
+.1++
+ 1 * < . , > i
E'#!plo.
El rfico de frecuencias absolutas acumuladas del e&emplo < es%
3 i
.+
<,
*J
1J
1+
.
+ 1 * < . , > i
8.<.8 =a$iabl#s Coti"as
22
'na variable continua se tabula en intervalos de clase, de la forma [ j j
x x
,
1 [
donde 1
j
x
es el lmite inferior del intervalo y j
x
es el lmite superior del
intervalo.
(ara construir una distribucin de frecuencias basada en intervalos de clase se
siue el siuiente procedimiento%
Fi&ar el nmero de intervalos BQC donde
20 5 k
-alcular la amplitud, a, de los intervalos,
k
x x
a
min max
,
donde
max
x
es la mayor de las observaciones y
min
x
es la menor de
las observaciones.
#a amplitud debe ser un nmero sencillo.
Formar los intervalos de clase, que en eneral son de la siuiente
forma%
[ 1 0
, x x
[ , [ 2 1
, x x
[ , [ 3 2
, x x
[ , ......, [ k k
x x
,
1 [
0
x
puede ser la menor de las observaciones.
#os intervalos se elien de manera que los puntos medios coincidan
con los datos realmente observados. Esto tiende a aminorar el llamado
Berror de arupamientoC en los anlisis matemticos posteriores.
-alcular las !a$cas d# clas#
i
x
que son los puntos medios de los
intervalos. Es decir%
k i
x x
x
j j
i
,...., 3 , 2 , 1
2
1
)i los intervalos son de iual amplitud, entonces la distancia entre dos marcas de
clase consecutivas es la amplitud de los intervalos. Esto es%
a x x
1 & &
+
E'#!plo.
#a inversin anual en millones de dlares de un rupo de industrias pesqueras se
detalla a continuacin.
1< S ** <I *1 I *+ 1J <, *1 J *+
1L << 1+ <1 *S 11 1+ *L *. * 1J S
*. *+ + ** 1. ** , 1S 1I 1* *S 1J
1* *J *1 J < *I *< 11 < 1L <* <+
<. 1* <+ , 1S <S *, . S *. 1+ 1,
23
)e construir un tabla de distribucin de frecuencias con Q ? , intervalos.
-onsiderando que
0 39
min max
x y x
, entonces
8 8 . 7
5
0 39
a
#a tabla de distribucin de frecuencias es%
] i i
x x
1 ]
i
x
i
n
i
f
3 i F i
+ D J . J +,1<<< J +,1<<<
J D 1L 1* 1L +,*LLI *. +,.+++
1L D *. *+ 1J +,<+++ .* +,I+++
*. D <* *J 1* +,*+++ ,. +,S+++
<* D .+ <L L +,1+++ L+ 1,++++
L+
El historama para esta tabla de distribucin de frecuencias es%
n i
1J
1L
1*
J
L
+ J 1L *. <* .+ x i
)e debe tener presente que la base de los rectnulos equivale a la amplitud
comn de los intervalos de clase.
Ta$#a.
[-mo se construye el historama, si los intervalos de clase son de diferentes
amplitudes\
24
(ara raficar variables tabulada en intervalos de clase tambi$n se pueden usar el
polono y la o&iva.
Pol2oo.
En el e&e de las abscisas se escriben las marcas de clase.
En el e&e de las ordenadas se escriben las frecuencias absolutas o
relativas.
)e unen con una polional los puntos 8marca de clase, frecuencia
respectiva9.
El polono para la tabla anterior es%
1J
1L
1*
J
L
+ . 1* *+ *J <L .+
O'i%a.
En el e&e de las abscisas se escriben los intervalos de clase.
En el e&e de las ordenadas se representan las frecuencias absolutas o
relativas acumuladas.
)e unen mediante una polional los puntos formados por el lmite
superior del intervalo y la frecuencia absoluta o relativa acumulada del
intervalo.
25
#a o&iva para la tabla de distribucin de frecuencias anterior es%
L+
,.
.*
*.
J
J 1L *. <* .+ x i
8.* E7ERCICIOS
1. -omplete una tabla de distribucin de frecuencias de cinco intervalos de
amplitud constante, si se tiene la siuiente informacin de la variable continua ^.
z* ? + H z. ? . H 3* ? J H n. ? , H f1 ? +,1, H f< ? +,* H F< ? +,L
26
*. -omplete la siuiente tabla de distribucin de frecuencias
i
w
i
n
i
f
i
N
i
F
i i
f w
D * +,*.
+ +,.
I 1I +,J.
. +,1*
1,*
*. El nmero de accidentes laborales 8>9 ocurridos mensualmente en una
empresa de cierto sector industrial, presenta informacin en la siuiente tabla
de distribucin de frecuencias.
i
x
i
f
i
F
tabla la complete f
*
,
f )i
. *
+ +.1,
1
* +.<
< +.J+
.
, +.+J
4. #os dividendos mensuales 8>9 paados por ,+ deudores habitacionales, se
presentan en la siguiente tabla de distribucin de frecuencias
] i i
x x
1
]
i
n
i
f
i
N
i
F
D * +.+J
D
D 1, <+
D +.S*
D 1+
-omplete la tabla de distribucin de frecuencias e interprete las siuientes
frecuencias%
. * . *
F , 3 , f , n
, f <
E
f . , n * E n <
27
<. MEDIDAS ESTADSTICAS
!espu$s de confeccionar las tablas de distribucin de frecuencias, es preciso
calcular medidas estadsticas para analizar la informacin y comparar entre si dos
o ms muestras o poblaciones, ya que normalmente la inteliencia humana no es
capaz de efectuar dichos anlisis o comparaciones por imposibilidad material de
retener los datos precisos para ello.
#as medidas estadsticas ms usadas son las medidas de tendencia central y las
medidas de variabilidad.
<.1 =E!6!1) !E 0E3!E3-61 -E3021#
)on medidas estadsticas que proporcionan valores tpicos o representativos de
un con&unto de datos. 0ales valores tienden a situarse en el centro del recorrido de
la variable y en torno a ellos se arupan las observaciones.
#a medidas de tendencia central ms conocidas son% media aritm$tica, mediana,
y moda.
<.1.1 MEDIA ARITMETICA.
#a media aritm$tica se simboliza por
9 =8> o >
.
)i
{ }
n < * 1
x ,......, x , x , x
es un con&unto de datos, entonces la media aritm$tica
es%
n
x
n
x ...... x x x
>
n
1 i
i
n < * 1
+ + + +
+ + + +
donde las
i
x
son los valores de la variable discreta o las marcas de clase de la
variable continua y las
i
n
son las respectivas frecuencias absolutas.
28
E'#!plo.
#a media aritm$tica para el con&unto de datos _I, ,, L, I, ., ., ,, L, 1` es%
,
S
.,
S
1 L , . . I L , I
x
+ + + + + + + +
E'#!plo.
)ea > la inversin anual, en millones de dlares, de un rupo de industrias
pesqueras.
6nversin. x6 3i xi ni
+ D J . J . a J ? <*
J D 1L 1* 1L 1* a 1L ? 1S*
1L D *. *+ 1J *+ a 1J ? <L+
*. D <* *J 1* *J a 1* ? <<L
<* D .+ <L L <L a L ? *1L
L+ 11<L
S<<<<<<<< , 1J
L+
11<L
x
#a inversin media de las L+ empresas de la industria pesquera es de
1J.S<<.<<<,<< dlares.
#a media aritm$tica de un con&unto de datos oriinales, difiere de la obtenida de
una tabla de distribucin de frecuencias. #a razn estriba en el supuesto de
uniformidad de la distribucin de frecuencias dentro de cada intervalo, supuesto
que en eneral no se cumple. En todo caso, esta p$rdida de precisin est ms
que compensada por las venta&as que sinifica tener una tabla de distribucin de
frecuencias.
#a media aritm$tica tambi$n se puede calcular usando las frecuencias relativas
T#o$#!a.
i
Q
1 i
i
f x 9 x =8
!emostracin.
n
n x ......... n x n x
9 x =8
Q Q * * 1 1
+ + +
29
n
n
x .......
n
n
x
n
n
x
Q
Q
*
*
1
1
+ + +
i
Q
1 i
i
Q Q * * 1 1
f x
f x ........ f x f x
+ + +
E'#!plo.
El nmero de accidentes 8 > 9 que ocurren mensualmente en una industria de
sector industrial, se presentan en la siuiente tabla de distribucin de frecuencias%
i
x
i
f
i i
f x
+ +.1, +.++
1 +.*, +.*,
* +.<+ +.L+
< +.1+ +.<+
. +.1* +..J
, +.+J +..+
*,+<
En la empresa ocurren en promedio *,+< accidentes por mes
Ta$#a
-alcule la media aritm$tica, usando frecuencias relativas, en el e&emplo de la
inversin de las industrias pesqueras
MEDIA ARITMETICA PONDERADA
Existen variables cuyos valores poseen, por su naturaleza, distintas importancias
dentro de un con&unto. En estos casos la media aritm$tica de la variable no se
calcula de la forma en que fue definida, sino afectando cada valor de la variable
por un coeficiente o peso o ponderacin.
#a media aritm$tica ponderada se calcula por%
+ + + +
+ + + +
p
1 i
i
p
1 i
i i
p < * 1
p p < < * * 1 1
N
N x
N ...... N N N
N x .... N x N x N x
=8x9
30
#a media aritm$tica para datos arupados en una tabla de distribucin de
frecuencias es una media aritm$tica ponderada, donde las ponderaciones son las
respectivas frecuencias absolutas o relativas de los valores de la variable.
E'#!plo.
!ada la siuiente informacin del a"o 1SS,
(as !ensidad 8 hab Y Qm
*
9 )uperficie 8 Qm
*
9
Francia
Krecia
6talia
1+,
IJ
1S*
,.,.L<+
1<1.SS+
<+1.*I+
-alcular la densidad poblacional promedio en estos tres pases
)olucin.
-onsiderando que estos tres pases tienen distintas superficies 8ponderaciones9,
se calcula una media aritm$tica ponderada
2
/ 14 , 128
270 . 301 990 . 131 630 . 545
270 . 301 192 990 . 131 78 630 . 545 105
km hab x
+ +
+ +
En estadstica la diferencia
A x
i
con 1 nmero real, se llama d#s%iaci o
d#s%o de los valores de la variable respecto de 1
PROPIEDADES DE +A MEDIA ARITMETICA
1. #a media aritm$tica de una constante es la misma constante
*. #a suma de las desviaciones de los valores de la variable respecto de la media
aritm$tica, es cero. Es decir%
arupados datos para + n 9 x x 8
arupados no datos para + 9 x 8x
i
Q
1 i
i
n
1 i
i
!emostracin.
)e demostrar la propiedad para datos arupados
31
+ n x x n
n x x n
n x n x
9 n x n x 8 n 9 x x 8
i
Q
1 i
i i
Q
1 i
i
i i
Q
1 i
i i
Q
1 i
i
<. #a suma de las desviaciones cuadrticas de los valores de la variable
respecto de la media aritm$tica, es mnima. Es decir,
2
1
) x x
n
i
i
k
i
i i
n A x
1
2
. -omo 1 es un nmero real desconocido, la suma
anterior es una funcin de 1. 1plicando el criterio de la seunda derivada para
analizar esta funcin, se tiene%
( ) ( )
( )
% tiene se , crtico valor el calcular para + 9 1 8 f /aciendo
*n1 n x *
n 1 n x *
n 1 1 x * 9 1 8 f
% es funcin la de derivada primera #a n 9 1 x 8 9 1 f8
Q
1 i
i i
i i i
n
1 i
i i
Q
1 i
Q
1 9 i
i
*
i
+
32
. + n * 9 x 8 f + *n 9 1 8 f adems
crtico. valor el es x
n
n x
1
n x * 1 n *
+ 1 *n n x *
Q
1 i
i i
Q
1 i
i i
i
Q
1 i
i
> >
+
(or lo tanto
9 1 f8
tiene un mnimo en 1 x .
Esta propiedad tambi$n se expresa en el siuiente teorema
T#o$#!a d# >oi2
#a suma de desvos cuadrticos de los valores de la variable, con respecto al
nmero real 1, es mayor que con respecto a la media aritm$tica x %
( ) ( ) x 1 si x x 1 x
n
1 i
n
1 i
*
i
*
i
>
!emostracin.
( ) ( )
[ ] [ ]
( ) ( ) ( ) ( )
( )
( )
>
>
+
,
_
+
n
1 i
*
i
+ x 1 n
n
1 i
*
+
n
1 i
i
n
1 i
*
i
n
1 i
*
i
n
1 i
*
i
n
1 i
*
i
x x
x 1 x x 1 x * x x
x 1 x x
x x 1 x 1 x
*
.. Es una medida que toma en consideracin todos los valores de la distribucin.
(or esta misma razn es muy sensible a la presentacin de observaciones
extremas o anmalas que hacen que la media se desplace hacia ellas. En
consecuencia no es recomendable usar la media como medida de tendencia
central en estos casos, pues la cantidad obtenida no es representativa del total
de delos datos.
33
,. #a media es el promedio ms usado. 1 partir de ella se puede obtener el %alo$
total 8Malor de la suma de todas las observaciones9
0otal ?
b
1 c
c
x x n
<.1.8 M#diaa.
(ara un con&unto de datos ordenados, la mediana, denotada por =e, es aquel
valor de la variable que supera a no ms del ,+Z de los datos y es superado por
no ms del ,+Z restante.
!a" !in
# 50 # 50
x Me x
CA+CU+O DE +A MEDIANA.
i9 !atos no 1rupados
)u clculo se realiza, una vez ordenados los datos, del siuiente modo%
)i el nmero de datos es impar, el valor de la mediana ser el que ocupa el
luar central, en la posicin
2
1 + n
)i el nmero de observaciones es par, la mediana ser el promedio de los
dos valores centrales, en las posiciones
1
2 2
+
n
y
n
.
(or lo tanto la mediana para datos no arupados es
'
+
+
par es n si
*
x x
impar es n si x
=e
1
*
n
*
n
*
1 n
E'#!plo.
#a mediana para el con&unto de datos 1,, 1<, 1< 1., 1., 1I, 1S, 1J, 1L se calcula
de la siuiente manera%
34
el con&unto ordenado es 1<, 1<, 1., 1., 1,, 1L, 1I, 1J, 1S
n ? S impar, se calcula
5
2
10
2
1 9
2
1
+
+ n
la mediana es el dato que ocupa la quinta posicin, lueo =e ?
5
x
? 1,
E'#!plo.
#a mediana para el con&unto de datos <<, <S, <J, <I, <L, <<, <,, <., <L, <. , se
calcula de la siuiente manera%
el con&unto de datos ordenados es <<, <<, <., <., <,, <L, <L, <I, <J, <S
n ? 1+ par, se calcula 6 1 5 1
2
5
2
10
2
+ +
n
y
n
la mediana es el promedio entre
6 5
x y x
, por lo tanto la mediana es
=e ? 5 , 35
2
36 35
2
6 5
+ x x
ii9 !atos 1rupados
a9 Mariables !iscretas.
#a mediana es aquel valor de la variable, cuya frecuencia absoluta acumulada es
inmediatamente mayor a la mitad de las observaciones o es la menor de las que
superan a
2
n
E'#!plo.
En la siuiente tabla de distribucin de frecuencias, se tiene la informacin del
nmero de hi&os 8>9 , en ochenta familias. -alcule la mediana
)olucin.
i
x
i
n
i
N
hijos Me
n
4 40
2
80
2
+ , ,
1 J 1<
* 1+ *<
35
ya que 3 , ? ,+ es la menor de las frecuencias
absolutas acumuladas que superan a
40
2
n
< 1* <,
. 1, ,+
, 1< L<
L 1+ I<
I I J+
J+
Obs#$%aci.
*
x x
=e
entonces par, es n y 3 acumulada absoluta frecuencia la a iual es
*
n
)i
1 p p
p
+
+
b9 Mariable -ontinua
En este caso el problema consiste en determinar un punto dentro del intervalo al
que pertenece la mediana. El intervalo que contiene a la mediana ser aquel cuya
frecuencia absoluta acumulada es mayor o iual a la mitad de las observaciones.
(ara calcular la mediana se usa la siuiente frmula de interpolacin.
&
&
1 &
1 &
a
n
3
*
n
x =e
donde%
1 &
x
j
x
=e j
x
#os trinulos 1!5 y 1E- son trinulos rectnulos seme&antes, lueo
1-
15
1E
1!
-omo
&
&
1 &
1 &
&
1 &
&
1 &
& 1 & &
1 &
& 1 & &
i &
a
n
3
*
n
x =e
n
3
*
n
a
x =e
n 3 3 1-
3
*
n
15
a x x 1E
x =e 1!
E'#!plo.
-onsiderando la tabla de distribucin de frecuencias de la inversin de la industria
pesquera, se tiene%
30
2
60
2
n
la mediana pertenece al tercer intervalo puesto que F< ? .* es la
menor de las frecuencias absolutas que superan a
2
n
dlares de millones L 1J, =e
J a
1J
*. <+
1L =e
% medianaes la #ueo
+
Ta$#a.
[)e puede calcular la mediana cuando en una tabla de distribucin de frecuencias
se conoce solamente las frecuencias relativas\ Fundamente su respuesta.
37
PROPIEDADES DE +A MEDIANA
1. #a mediana es una medida de posicin que no es afectada por valores
extremos. 1s por e&emplo la mediana para el con&unto de datos ., ,, L, I,
J, S es L,, y la media aritm$tica tambi$n es L,, pero, si los datos fuesen .,
,, L, I, J, 1++ la mediana siue siendo L,,, mientras que la media
aritm$tica es *1,J<<<
*. (uede ser calculada aunque el intervalo aunque el intervalo inferior o el
superior no tenan alunos de los lmites
<. Es de calculo rpido y de interpretacin sencilla
<.1.8.1 CUARTI+ES
-omo extensin de esta medida de tendencia central, ser fcil ampliar el
concepto a otras medidas que dividan la masa de informacin en otras
proporciones, y no slo en mitades. 0al es el caso de los cuartiles que dividen a la
distribucin en cuatro partes de iual nmero de datos.
!a" 3 2 1 !in
# 25 # 25 # 25 # 25
x Q Q Q x
P1 es el valor de la variable que es superado por no ms del *,Z de las
observaciones y es superado por no ms del I,Z de los datos restantes.
P* es la mediana
P< es el valor de la variable que supera a no ms del I,Z de los datos y es
superado por no ms del *,Z restante de las observaciones.
!e esta manera los cuartiles, para datos arupados, se calculan mediante las
siuientes frmulas%
&
&
1 &
1 & < &
&
1 &
1 & 1
a
n
3
.
n <
x P y a
n
3
.
n
x P
<.1.8.8 PERCENTI+ES.
38
#os percentiles dividen a la distribucin e unos por cientos. (or lo tanto el primer
cuartil es el percentil veinticinco, la mediana es el percentil cincuenta y el tercer
cuartil es el percentil setenta y cinco.
(i es el iD$simo percentil con i ? 1, *, <,;.,SS y se define como el valor de la
variable que supera a no ms de iZ de las observaciones y es superado por no
ms del 81++ D i9Z restante. )e calculan por la frmula%
&
&
1 &
1 & i
a
n
3
1++
n i
x (
E'#!plo.
-on los datos de la inversin de la industria pesquera, calcule%
i9 (*+ , P< y (J+
ii9 la mayor inversin del 1*Z de las empresas que menos invierten.
iii9 la menor inversin del JZ de las empresas que ms invierten
)olucin.
i9 8a9 -lculo de (*+
*+
( 1*
1++
L+ *+
1++
n *+
+
b9 -lculo de P<
<
P .,
1++
L+ I,
1++
n I,
+
El I,Z de las empresas invierten a lo ms *L millones de dlares.
c9 -lculo de (J+
J+
( .J
1++
L+ J+
1++
n J+
+
El J+Z de las empresas invierten a lo ms *J millones de dlares.
ii9 En este caso se debe calcular el percentil 1*
12
2 , 7
100
60 12
100
12
P
n
+
El 1*Z de las empresas invierte a lo ms I,* millones de dlares.
iii9 1qu se debe calcular el percentil S*
S*
( ,,,*
1++
L+ S+
1++
n S*
+
El S*Z de las empresas invierte a lo menos <<,L millones de dlares.
<.1.< MODA.
#a moda 8 =o 9 es aquel valor de la variable que posee la mayor frecuencia
absoluta o relativa
E'#!plo.
i9 #a moda para el con&unto _ ,, <, ., ,, <, I, <, J, <, L ` es <
ii9 #a moda para el con&unto _ ,, <, ., ,, <, I, <, J, , ` es < y ,
iii9 (ara la distribucin de frecuencias del nmero de hi&os 8>9 es%
i
x
i
n
=o ? . hi&os
+ ,
1 J
* 1+
40
< 1*
. 1,
, 1<
L 1+
I I
(ara calcular la moda en caso que los datos est$n arupados en intervalos de
clase, primero se determina el intervalo modal, aquel que posee la mayor
frecuencia absoluta o relativa. En seundo luar, para calcularla, se usa la
frmula de interpolacin%
&
1 & 1 &
1 &
1 &
a a
n n
n
x =o
+
+
+
+
donde%
1 i
x
j
x
1
j
x
o
M
j
x
1 +
j
x
1 & o & 1 & 1 & 1 & 1 & o
1 & o
1 &
o &
1 &
n = x n x n n =
x =
n
= x
n
% tiene se anterior, lo a acuerdo !e
+ +
41
( )
( )
( )
&
1 & 1 &
1 &
1 & o
& 1 & 1 & 1 & 1 &
1 & 1 & & 1 & 1 &
1 & 1 & & 1 & 1 & 1 & o
a
n n
n
x =
a n n n x
x n a x n
x n x n n n =
+
+
+ +
+
+ +
+
+
+ +
+ +
+ +
E'#!plo.
(ara el e&emplo de la inversin de la industria pesquera la moda es%
6nversin
i
n
#a moda pertenece al tercer intervalo
,.< 1J..*J.,I1 '.).d =o
< 1S,.*J,I1. J
1L 1*
1*
1L =o
+
+
+ D J J
J D 1L 1L
1L D *. 1J
*. D <* 1*
<* D .+ L
Obs#$%aci.
i9 #a media aritm$tica es la me&or medida de tendencia central, es
imprescindible para otros clculos y se debe calcular para variables
medidas en a lo menos en una escala de intervalos. 3o se puede calcular la
media con datos arupados cuando la distribucin es muy asim$trica, o los
intervalos no son de iual amplitud, o son abiertos, etc.
ii9 #a mediana se calcula a caracteres medidas en a lo menos en una escala
ordinal y espacialmente cuando no se puede hallar la media.
iii9 #a moda se calcula a caracteres medidas en cualquier tipo de escalas.
<.* MEDIDAS DE =ARIABI+IDAD.
#as medidas de tendencia central indican los valores alrededor de los cuales se
arupan de observaciones.
#as medidas de variabilidad o dispersin muestran si los valores de la
observaciones estn arupados alrededor de una medida de tendencia central, y
por lo tanto, si estn prximo o separados entre s.
42
El concepto de variabilidad o dispersin se relaciona con la mayor o menor
concentracin de los datos en torno de una medida de tendencia central.
#as medidas de dispersin ms usadas son% el recorrido o rano, la desviacin
media y la varianza.
)i se desea obtener una cuanta de la variabilidad desde un unto de vista
adimensional, con ob&eto de poder comparar diferentes variables entre si o
diferentes poblaciones o muestras con respecto de una misma variable, se recurre
a las medidas de dispersin relativas como el coeficiente de variabilidad.
<.8.1 RECORRIDO
El recorrido se denota por la letra 2, es la diferencia entre la mayor y menor
observacin de la variable, %
min max
x x 2
#as venta&as de esta medida de dispersin son su facilidad de clculo y que viene
expresada en las mismas unidades que la variable. (ero posee alunos
inconvenientes% se puede ver muy afectada por aluna observacin extrema, y no
se usan, en su clculo, todas las observaciones 8slo dos de ellas9
<.8.8 DES=IACION MEDIA.
#a desviacin media, denotada por !.=., es el promedio de los valores absolutos,
de las desviaciones de los valores de la variable respecto de su media aritm$tica.
Es decir%
'
0 5 18.625 20
1 8 21.800 24
2 10 17.250 20
3 12 8.700 12
4 15 4.125 0
5 13 16.575 13
6 10 22.750 20
7 7 22.925 21
80 132.75 130
#a desviacin media o mediana est basada en cada valor de la variable y se
calcula con respecto a la media aritm$tica o la mediana, por lo tanto mide la
dispersin alrededor de una medida de tendencia central.
<.8.< =a$ia)a.
#a varianza, denotada por M8x9 o )
*
8x9, es el promedio de los cuadrados, de las
desviaciones de los valores de la variable respecto de su media aritm$tica. Es
decir%
44
( )
( )
'
* *
x x M8x9 tanto lo (or
E'#!plo.
#a variable > representa al nmero de cheques cobrados diariamente en J+
sucursales de un banco en una cierta ciudad.
6ntervalos xi ni >i ni x
*
i ni
45
*
*
* *
*
cheques9 8 *,IIL
11+**. 1<L+++
x x 8x9 )
1<L+++
J+
1+JJ++++
x
cheques <<*
J+
*L,L+
x
+ D J+ .+ L *.+ SL++
J+ D 1L+ 1*+ J SL+ 11,*++
1L+ D *.+ *++ 1+ *+++ .+++++
*.+ D <*+ *J+ 1* <<L+ S.+J++
<*+ D .++ <L+ 1, <.++ 1S..+++
.++ D .J+ ..+ 1< ,I*+ *,1LJ++
.J+ D ,L+ ,*+ S .LJ+ *.<<L++
,L+ D L.+ L++ I .*++ *,*++++
J+ *L,L+ 1+JJ++++
PROPIEDADES DE +A =ARIAN?A.
1. #a varianza de una variable es un nmero real no neativo. Es decir
0 )
2
x S
!emostracin.
!e cuerdo a la definicin de la varianza para datos arupados, esta es%
( )
( ) ( ) ( ) + n x x + n x x + n y + x x
lado otro (or . + n con
n
n x x
M8x9
i
*
Q
1 i
i
*
i i
*
i
Q
1 i
i
*
i
>
/ / +
+ +
+
+ +
+
+ +
En este caso la desviacin estndar de la variable W es%
8x9 ) a 8x9 M a 8x9 M a M8y9 8y9 )
* *
CASOS PARTICU+ARES.
8x9 ) 8y9 ) y 8x9 M 8y9 M , b x y entonces b, > W )i b9
8x9 ) a 8y9 ) y 8x9 M a 8y9 M , x a y entonces >, a W )i a9
*
+ +
Obs#$%aci.
#a transformacin
b > a W +
, tambi$n es aplicable a la mediana y a la moda.
48
E'#!plo
1. En una empresa el promedio de los sueldos es d.,+.+++ y la desviacin
estndar es de d<+.+++. [Pu$ sucede con el coeficiente de variacin si%
i9 los sueldos aumentan en *1,<Z\
ii9 los sueldos aumentan en d,+.+++ cada uno\
iii9 los sueldos aumentan en 1J,,Z ms d.*.++ cada uno\
)olucin.
L,LIZ +,+LLI
.,+.+++
<,.+++
x
)8x9
-.M.8x9 tanto lo (or
, <+.+++ 8x9 ) y .,+.+++ x
rea&uste, del antes sueldos > ea
S
L.LIZ +,+LLI
,.,.J,+
<L.<S+
y
)8y9
-.M.8y9
#ueo
. <L.<S+ d <+.+++ a 1,*1<
)8x9 1,*1< 8y9 )
,.,.J,+ d .,+.+++ 1,*1<
x 1.*1< y > 1,*1< W i9
L,1JZ +,+L1J -.M.8u9
#ueo
<,.,,+ d 8x9 ) 1,1J, )8u9
d,I,.*,+ .*.+++ x 1,1J, u .*.+++ > 1,1J, ' iii9
LZ +,+L
,++.+++
<+.+++
z
)8z9
-.M.8z9
tanto lo (or
. d<+.+++ )8x9 )8z9
,++.+++ d ,+.+++ .,+.+++
,+.+++ x z ,+.+++ > ^ ii9
+ +
+
+ +
*. #a tabla siuiente muestra los inresos mensuales, en miles de pesos, de un
rupo de traba&adores de un banco, que loraron despu$s de un rea&uste.
49
El rea&uste aplicado correspondi al 1+Z de los inresos, ms un bono de d,.+++
i9 -alcule el inreso medio antes del rea&uste.
ii9 -uantos traba&adores presentaban, antes del rea&uste, un sueldo que
difiere del inreso medio en al menos d1,.+++.
iii9 -alcule la mediana antes del rea&uste.
)olucin.
)ean >% inresos despu$s del rea&uste,
<*+
J+
*,L++
x
W% inresos antes del rea&uste
*JL,<L.
1.1
, <*+
1.1
, x
y
1,1
, >
W , W 1,1 > i9
+
(or lo tanto el inreso medio antes del rea&uste es de d *JL.<L.
ii9 )e pide calcular el nmero de traba&adores que estn contenidos en el intervalo
<<L,, x <+<,,
<+1,<L.
1.1
, x
*I1,<L.
<+1,<L. y *I1,<L.
1, *JL,<L. y 1, 1, *JL,<L. y
< <
<
<
< <
< < <
)e debe calcular la cantidad de traba&adores cuyos inresos despu$s del
rea&uste estn comprendido entre <+<,, y <<L,, miles de pesos.
<+<,, (
i
pertenece al tercer intervalo y se puede determinar el porcenta&e i
Z .+,+S Z i L+
*I
*L i +,J
*S+ <+<,,
+
6nresos
i
x
i
n
i
N
i i
n x
1I+ D *<+ *++ S S 1J++
*<+ D *S+ *L+ 1I *L ..*+
*S+ D <,+ <*+ *I ,< JL.+
<,+ D .1+ <J+ 1S I1 I**+
.1+ D .I+ ..+ J J+ <,*+
J+ *,L++
50
(or otro lado
<<L,, (
&
pertenece al tercer intervalo y porcenta&e & se
calcula de la siuiente manera
Z ,J,LL Z & L+
*I
*L & +,J
*S+ <<L,,
+
(or lo tanto, el porcenta&e de traba&adores cuyos inresos estn comprendidos
entre <+<,, y <<L,, es h Z ? ,J,LL Z D .+,+S Z ? 1J, ,I Z , es decir,
aproximadamente 1, personas.
iii9 (uesto que el inreso antes del rea&uste es
1,1
, >
W
, entonces
1,1
, 8x9 =e
8x9 =e
+
(or lo tanto la mediana de la variable W, es%
*JI,<I.
1.1
, <*1,111
8y9 =e