Vous êtes sur la page 1sur 24

Universidad Nacional de Salta

Facultad de Ciencias Econmicas, Jurdicas y Sociales


Ctedra de Estadstica









INDICADORES DESCRIPTIVOS
NOTAS COMPLEMENTARIAS

ESTADSTICA I






Hugo Miguel Rodrguez, Mara Esther Capilla
Ao 2010




Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 2























Introduccin
Estas notas complementarias estn destinadas a nuestros alumnos de Estadstica I
de la Facultad de Ciencias Econmicas, Jurdicas y Sociales de la UNSa. Tienen por
objeto brindarles informacin adicional sobre temas abordados en clase y estimular su
creatividad de modo que, a partir de la lectura e interpretacin de ellas, elaboren sus
propios ejemplos de aplicacin. Esta ltima actividad es de gran ayuda para la
compresin de los temas.
Se incluyen demostraciones de propiedades de los indicadores ms frecuentemente
utilizados. En todos los casos, sin que ello le quite generalidad a los conceptos, en la
notacin utilizada se ha considerado que los datos corresponden a una poblacin.

Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 3

Propiedades de la media aritmtica
1. Si a una variable se le suma o resta una constante positiva, la media aritmtica se
incrementa o disminuye en dicha constante.
Demostracin: Sean
N
x x x ,..., ,
2 1
los valores que toma la variable X en una
poblacin de N elementos y sea c X Z = , donde c es una constante positiva.
( ) |
.
|

\
|
= = =

= = = =
N
i
N
i
i
N
i
i
N
i
i Z
c x
N
c x
N
z
N
1 1 1 1
1 1 1

c Nc
N
x
N
Nc x
N
X
N
i
i
N
i
i
= = |
.
|

\
|
=

= =

1 1 1
1 1
(1)

2. Si a una variable se la multiplica por una constante, la media aritmtica queda
multiplicada por dicha constante.
Demostracin: Sean
N
x x x ,..., ,
2 1
los valores que toma la variable X en una
poblacin de N elementos y sea dX Z = , donde d es una constante.
X
N
i
N
i
i i
N
i
i Z
d x
N
d
dx
N
z
N
= = = =

= = = 1 1 1
1 1
(2)

3. La media aritmtica de la suma de k variables es igual a la suma de las medias
aritmticas de cada una de las k variables.
Demostracin para 2 = k : Sean ( ) ( ) ( )
N N
y x y x y x , ,..., , , ,
2 2 1 1
los valores que toma la
variable bidimensional ( ) Y X, en una poblacin de N elementos y sea Y X Z + = .
( ) |
.
|

\
|
+ = + = =

= = = =
N
i
i
N
i
i
N
i
i i
N
i
i Z
y x
N
y x
N
z
N
1 1 1 1
1 1 1

Y X
N
i
i
N
i
i
y
N
x
N
+ = + =

= = 1 1
1 1
(3)

4. La suma de los desvos de las observaciones respecto a su media aritmtica es
siempre igual a cero.
Demostracin: Sean
N
x x x ,..., ,
2 1
los valores que toma la variable X en una
poblacin de N elementos; sean adems , la media aritmtica de los N
elementos y ( )
i
x el desvo de la i-sima observacin respecto a la media.
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 4

( ) N x x x
N
i
i
N
i
N
i
i
N
i
i
= =

= = = = 1 1 1 1
(4)
Considerando que por definicin N x x
N
N
i
i
N
i
i
= =

= = 1 1
1
, reemplazando en (4)
resulta:
( ) 0
1
= =

=
N N x
N
i
i
(5)

5. La suma de los desvos cuadrticos de las observaciones respecto a su media
aritmtica es menor que la suma de los desvos cuadrticos de las observaciones
respecto a cualquier otro valor.
Demostracin: Sean
N
x x x ,..., ,
2 1
los valores que toma la variable X en una
poblacin de N elementos; sea adems , la media aritmtica de los N elementos
y A una constante distinta de . Es posible expresar A de la siguiente manera:
+ = A con 0 = (7)
Si consideramos ahora la suma de los desvos cuadrticos de las observaciones
respecto a la constante A, vemos que podemos expresarla en funcin de la media
aritmtica de X . En efecto,
( ) ( ) | | | |

= = =
= + =
N
i
i
N
i
i
N
i
i
x x A x
1
2
1
2
1
2
(8)
Agrupando convenientemente y desarrollando el cuadrado resulta:
( ) ( ) | | ( ) ( ) | |

= = =
+ = =
N
i
i i
N
i
i
N
i
i
x x x A x
1
2 2
1
2
1
2
2
( ) ( )

= =
+ =
N
i
i
N
i
i
x N x
1
2
1
2
2 (9)
Como por (5) se verifica que ( ) 0
1
=

=
N
i
i
x , resulta que
( ) ( )
2
1
2
1
2
N x A x
N
i
i
N
i
i
+ =

= =
(10)
Como se cumple que 0
2
> N , se verifica siempre que,
( ) ( )

= =
>
N
i
i
N
i
i
x A x
1
2
1
2
(11)

Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 5

6. Media combinada. La media aritmtica de un grupo de observaciones puede ser
expresada en funcin de las medias de los subgrupos que lo componen, ponderadas
por el tamao de stos.
Sea una poblacin de N elementos en la que se distinguen dos grupos de tamao
1
N y
2
N de manera que
2 1
N N N + = . Adems indicamos con
1
1 12 11
,..., ,
N
x x x a los
valores que toma la variable X en la primer grupo y con
2
2 22 21
,..., ,
N
x x x a los
valores que toma la variable X en el segundo grupo. Por ltimo, sean
1
y
2
las
medias del primer y segundo grupo respectivamente. Por definicin, la media
aritmtica de los N elementos de la poblacin es:
2 1
1
2
1
1
2 1
2 22 21 1 12 11
2 1
2 1
... ...
N N
x x
N N
x x x x x x
N
i
i
N
i
i
N N
+
+
=
+
+ + + + + + +
=

= =
-
(12)
Como por definicin de
1
y
2
se verifican las siguientes igualdades,
1 1
1
1
1
N x
N
i
i
=

=

2 2
1
2
2
N x
N
i
i
=

=
(13)
la media aritmtica de la poblacin de N elementos puede expresarse en funcin
las medias de los subgrupos. En efecto,
2 1
2 2 1 1
N N
N N
+
+
=
-

(14)
Adems como se evidencia en (15), la ponderacin o peso de cada promedio es
proporcional al tamao del grupo a partir del que fue calculado.
2
2
1
1

N
N
N
N
+ =
-
(15)

Una propiedad de la mediana
La suma de los valores absolutos de las observaciones respecto a su mediana es
menor que la suma de los desvos absolutos de las observaciones respecto a cualquier
otro valor.
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 6

Demostracin: Sean
N
x x x ,..., ,
2 1
los valores que toma la variable X en una
poblacin de N elementos; sea adems Me , la mediana de los N elementos y A una
constante distinta de Me .
Consideremos ahora a los valores de X ordenados en forma creciente,
( ) ( ) ( ) N
x x x ,..., ,
2 1
, y supongamos que la constante A se encuentra en el intervalo
( ) ( )
| |
1
,
+ p p
x x , de tal manera que se verifica la siguiente expresin:
( ) ( ) ( ) ( ) ( ) ( ) N p p p
x x x A x x x s s s s s s s s
+ +
... ...
2 1 2 1
(16)
Analizaremos a continuacin la suma de los valores absolutos de los desvos de las
observaciones respecto a A considerando, sin perder generalidad, los valores ordenados
de menor a mayor. Vemos que esta suma puede descomponerse como se expresa a
continuacin.
( ) ( ) ( )
+ = = =
+ =
N
p i
i
p
i
i
N
i
i
A x A x A x
1 1 1
(17)
- Si 2 N p > , como la mediana est ubicada en el centro de los datos de la serie
ordenada, para toda constante 0 > se cumple que A Me = + y reemplazando en
(17) resulta,
( ) ( )
( )
( )
( )

+ = = =
+ + =
N
p i
i
p
i
i
N
i
i
Me x x Me A x
1 1 1
(18)
Podemos desarrollar algebraicamente la expresin en (18) de la siguiente manera:
( ) ( )
( )
( )
( ) ( )

+ = = =
+ + =
N
p i
i
p
i
i
N
i
i
p N Me x p x Me A x
1 1 1

( )
( )
( )
( ) ( ) N p Me x x Me
N
p i
i
p
i
i
+ + =

+ = =
2
1 1

( )
( ) N p Me x
N
i
i
+ =

=
2
1
(19)
Como 2 N p > se verifica que 0 2 > N p . Por lo tanto resulta que
( ) ( )
= =
>
N
i
i
N
i
i
Me x A x
1 1
(20)

- Si 2 N p < , siendo la constante 0 > , podemos expresar como A Me = .
Luego reemplazando en (17) y desarrollando algebraicamente la expresin
resultante podemos escribir:
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 7

( ) ( )
( )
( )
( )

+ = = =
+ + =
N
p i
i
p
i
i
N
i
i
Me x x Me A x
1 1 1
(21)
( ) ( )
( )
( )
( ) ( )

+ = = =
+ + =
N
p i
i
p
i
i
N
i
i
p N Me x p x Me A x
1 1 1

( )
( )
( )
( ) ( ) p N Me x x Me
N
p i
i
p
i
i
2
1 1
+ + =

+ = =

( )
( ) p N Me x
N
i
i
2
1
+ =

=
(22)
Como 2 N p < , entonces 0 2 > p N y tambin en este caso se cumple que
( ) ( )
= =
>
N
i
i
N
i
i
Me x A x
1 1
(23)

Como adems el resultado de una suma no depende del orden de los sumandos, las
expresiones en (20) y (23) se verifican sin considerar la serie ordenada de los datos y
puede generalizarse de la siguiente manera:

= =
>
N
i
i
N
i
i
Me x A x
1 1
(24)
Del anlisis efectuado para los posibles valor de p se deduce que la suma de los
desvos absolutos de las observaciones respecto a A es mnima solo cuando 2 N p = ,
es decir cuando A est posicionada en el centro de las observaciones y por lo tanto
coincide con
e
M .
El Diagrama 1 muestra una forma de corroborar grficamente esta propiedad para
un conjunto pequeo de observaciones. Sobre una recta se representan las
observaciones, la mediana y al valor arbitrario A. Luego, se grafican los segmentos que
corresponden a las distancias de cada observacin respecto a A y respecto a la
e
M . La




Diagrama 1. Distancias entre 5 observaciones respecto a
su
e
M y respecto a un valor arbitrario A.

Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 8

comparacin de ambos grupos a simple vista conduce al resultado de la propiedad
demostrada algebraicamente.
En lugar de tomar un nmero impar de observaciones para el que el valor de la
mediana es nico, se sugiere ahora construir el Diagrama 1 para un nmero par de
observaciones, por ejemplo seis. Se ver que en ese caso cualquier valor comprendido
en el intervalo
( ) ( )
| |
4 3
, x x minimiza la suma de los desvos absolutos de las
observaciones respecto a l. Esto es consistente con una definicin ms rigurosa de la
mediana segn la que la mediana es un nmero que no supera ni es superado por ms
del 50% de las observaciones. Por convencin, cuando la cantidad de observaciones es
par, se toma la mediana igual al promedio aritmtico de los dos valores centrales.
Considerando esta propiedad se puede responder a la siguiente pregunta dnde
ubicara una empresa su centro de distribucin si posee varias sucursales sobre la misma
ruta y desea minimizar el costo del transporte de la mercadera?

Media geomtrica
Sea
N
x x x ,..., ,
2 1
los valores que toma una variable X en una poblacin de N
elementos. La media geomtrica G se define como la raz ensima del producto de los
dichos valores.
N
N
x x x G = ...
2 1
(25)
Si las observaciones estn agrupadas en una distribucin de frecuencias, indicando
con
i
f a la frecuencia absoluta del valor
i
x , para N i ,..., 2 , 1 = , podemos expresar a la
media geomtrica como
N
f
N
f f
N
x x x G = ...
2 1
2 1

(26)
Se utiliza principalmente para promediar porcentajes, cifras relativas y tasas de
variacin. Las principales limitaciones para su empleo surgen cuando:
- Alguna observacin toma el valor cero, ya que en ese caso G = 0.
- N es par y existen un nmero impar de valores negativos, con lo cual G sera un
nmero imaginario.
Para su clculo pueden tomarse los logaritmos de las observaciones, como muestran
las expresiones que figuran a continuacin, y luego determinar G calculando el
antilogaritmo del valor encontrado.
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 9

=
=
N
i
i
x
N
G
1
log
1
log (27)
Si las observaciones estn agrupadas en una distribucin de frecuencias,

=
=
N
i
i i
x f
N
G
1
log
1
log (28)

Caractersticas de la media geomtrica
1. Est menos afectada por valores extremos que la media aritmtica. Para
ejemplificarlo consideremos que la variable X toma los valores
33 , 15 , 12
3 2 1
= = = x x x . El valor
3
x es mayor al doble de las observaciones
restantes y su influencia es menor sobre la media geomtrica.
20
3
60
3
33 15 12
= =
+ +
=
3 3
12 15 33 5940 18.11 G = = =

2. La media geomtrica es menor o igual a la media aritmtica. Podemos justificar
esta afirmacin en forma sencilla para dos valores
1
x y
2
x , resolviendo la siguiente
expresin que siempre es mayor o igual a cero:
( ) 0 2
2 1 2 1
2
2 1
> + = x x x x x x (29)
Luego,
2 1
2 1
2 1 2 1
2
2 x x
x x
x x x x >
+
> + (30)
Es decir que la media geomtrica de
1
x y
2
x es siempre menor o igual a su media
aritmtica.

3. El producto de las razones respecto a la media geomtrica de los valores menores
que ella es igual al producto de las razones de la media geomtrica respecto a los
valores que la superan. Es decir, si la media geomtrica G es tal que
N p p
x x G x x x s s s s s s s
+
... ...
1 2 1
, entonces se verifica:
N p p
p
x
G
x
G
x
G
G
x
G
x
G
x
=
+ +
... ....
2 1
2 1
(31)
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 10

Para ejemplificarlo consideremos que la variable X toma los valores
32 , 27 , 8 , 3
4 3 2 1
= = = = x x x x , cuya media geomtrica es 12 = G . En efecto,
3 8 12 12
12 12 27 32
=
6
1
=

4. Si para una serie de valores se calcula la razn entre cada valor y el que le antecede,
la media geomtrica es el indicador adecuado para ser utilizado como promedio de
dichas razones.
Para ejemplificar este resultado, empleamos los datos de la Tabla 1 donde se
muestran las razones de cambio de las ventas anuales de una empresa durante 5
aos consecutivos.

Tabla 1
Ao
Ventas
Miles de $
j
1 j
Ventas
Ventas
Razn
+
= Razn log
1999 300 --- ---
2000 300 1 0
2001 434 1,447 0,1605
2002 535 1,233 0,0910
2003 672 1,256 0,0990
2004 746,5 1,110 0,0453

Como puede comprobarse las medias aritmtica y geomtrica de las razones en la
tabla anterior son respectivamente 2092 , 1 = y 20 , 1 = G
El considerar la media aritmtica nos llevara a establecer una razn anual
promedio de crecimiento de las ventas igual a 20,92%, resultado que no concuerda
con la realidad observada ya que, a una tasa anual promedio de crecimiento de
20,92%, a partir del ao 2000, las ventas del ao 2004 hubieran resultado iguales a
775,55 miles de $ y no iguales a 746,50 miles de $ como muestra la Tabla 1. Por el
contrario, si determinamos la razn anual promedio de crecimiento de las ventas en
base a la media geomtrica, es decir igual al 20%, aplicada a partir del ao 2000,
determina para el ao 2004 ventas por un importe de 746,5 miles de pesos, valor
que coincide con el observado. En efecto:
300 x 1.20 = 360
360 x 1.20 = 432
432 x 1.20 = 518,4
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 11

518.4 x 1.20 = 622,08
622.08 x 1.20 = 746,5

Estamos en condiciones ahora de responder a la siguiente pregunta: Si en cierto
ao, la poblacin de nuestro pas era igual a P habitantes y n aos despus es de Q
habitantes, cual ha sido la tasa de crecimiento poblacional anual de nuestro pas en
dicho perodo?

Media armnica
Sea
N
x x x ,..., ,
2 1
los valores que toma una variable X en una poblacin de N
elementos. La media armnica H se define como la inversa de la media aritmtica de las
inversas de estos valores.

=
=
N
i i
x
N
H
1
1
(32)
Si las observaciones estn agrupadas en una distribucin de frecuencias, indicando
con
i
f a la frecuencia absoluta del valor
i
x , para N i ,..., 2 , 1 = , podemos expresar a la
media armnica como

=
=
N
i i
i
x
f
N
H
1
(33)
Podemos observar que la media armnica no puede calcularse si algn valor de X es
igual a cero.

Caractersticas de la media armnica
1. La media armnica est menos influenciada por valores extremos que la media
geomtrica y por ende est menos influencia que la media aritmtica. Para
ejemplificarlo consideremos los valores de X empleados al analizar la influencia
de valores extremos en la media geomtrica, es decir 33 , 15 , 12
3 2 1
= = = x x x ,
donde el valor de
3
x es mayor al doble de las observaciones restantes. Como puede
comprobarse la media geomtrica es 11 , 18 = G y la media armnica es 64 , 16 = H .
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 12

Estos resultados muestran la menor influencia del valor extremo
3
x sobre la media
armnica.

2. La media armnica es menor o igual a la media geomtrica. Podemos justificar esta
afirmacin fcilmente para dos valores
1
x y
2
x , resolviendo la siguiente expresin
que siempre es mayor o igual a cero:
0
2 1 1 1 1
2 1 2 1
2
2 1
> + =
|
|
.
|

\
|

x x x x x x
(34)
Luego,
2 1
2 1
2 1
2 1
2 1 2 1
1 1
2
2
1 1
1 2 1 1
x x
x x
x x
x x
x x x x
s
+
s
+
> + (35)
Es decir que la media armnica de
1
x y
2
x es siempre menor o igual a su media
geomtrica.

3. Su uso es poco frecuente pero resulta de utilidad para situaciones en que se deben
promediar razones entre dos tipos diferentes de unidades de medida que pueden ser
expresadas de manera recproca.
Para aclarar este concepto, consideremos un atleta que corre 1250 metros en 5
minutos. La razn de velocidad por minuto es
1250 metros
5 minutos
= 250 metros x minuto.
En este caso las unidades del numerador son metros y las del denominador son
minutos.
Recprocamente, la razn de tiempo por metro es
5 minutos
1250 metros
= 0,004 minutos
por metro y las unidades del numerador y denominador son minutos y metros
respectivamente.

En ciertos problemas el decidir si el promedio a emplear es la media aritmtica o la
media armnica puede ocasionar confusin. La siguiente regla ayuda para adoptar la
decisin correcta:
- La media aritmtica se utiliza cuando cada dato que interviene en el promedio se
calcula en relacin a un valor constante con la misma unidad que el denominador
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 13

- La media armnica se utiliza cuando cada dato que interviene en el promedio se
calcula en relacin a un valor constante con la misma unidad que el numerador

Ejemplo: Cul es la velocidad promedio, en Km/hora, de un vehculo que sale de
Salta hacia Tucumn y recorre los primeros 100 Km a una velocidad de 80 Km/hora, los
siguientes 100 km a 100 Km/hora y los ltimos 100 Km los hace a 120 Km/hora?
Solucin: Empleando la media aritmtica la respuesta sera:
km/hora 100
3
120 100 80
=
+ +
=
Si consideramos el tiempo en horas insumido por cada tramo observamos que el tiempo
total insumido para recorrer la distancia de 300 Km es igual a 3,0833. Este valor
multiplicado por la velocidad promedio , calculada empleando la media aritmtica,
nos llevara a concluir que la distancia recorrida es 308,3 Km., valor inconsistente con
la realidad.
Tramo Tiempo
1 hora 25 , 1
Km/hora 80
Km 100
=
2 hora 00 , 1
Km/hora 100
Km 100
=
3
hora 833 , 0
Km/hora 120
Km 100
=

Tiempo total 3,083 horas

Por el contrario, analizando el planteo del problema, observamos que los datos
expresados en Km/hora se calculan en relacin a un valor constante, que es la distancia
recorrida, expresada en Km. Corresponde entonces aplicar la media armnica,
resultando la velocidad promedio
Km/hora 3078 , 97
00833 , 0 01 , 0 0125 , 0
3
120
1
100
1
80
1
3
=
+ +
=
+ +
= H
Si multiplicamos H por el tiempo insumido para todo el trayecto, obtenemos la
distancia total recorrida. En efecto,
Km 300 Km/hora 97,3078 hora 083 , 3 =
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 14


Notemos que antes de proceder al clculo debemos expresar loa valores que
intervienen en las mismas unidades que el promedio solicitado y luego calcular su
inversa.

Ahora estamos en condiciones de resolver el siguiente problema: Si tres obreros A,
B, y C pueden producir, respectivamente, 10, 12 y 15 unidades por hora cul es el
tiempo medio requerido por unidad? (Comprobar que la respuesta correcta es 0.08108
horas/unidad)

Propiedades de la varianza
1. Si a una variable se le suma o resta una constante positiva, la varianza no se altera.
Demostracin: Sean
N
x x x ,..., ,
2 1
los valores que toma la variable X en una
poblacin de N elementos y sea c X Z = , donde c es una constante positiva.
( ) ( ) ( ) | |

= =
= =
N
i
X i
N
i
Z i Z
c c x
N
z
N
1
2
1
2 2
1 1

( )
2
1
2
1
X
N
i
X i
x
N
= =

=
(35)

2. Si a una variable se la multiplica por una constante, la varianza queda multiplicada
por el cuadrado de dicha constante.
Demostracin: Sean
N
x x x ,..., ,
2 1
los valores que toma la variable X en una
poblacin de N elementos y sea dX Z = , donde d es una constante.
( ) ( )
( ) | | ( )


= =
= =
= =
= =
N
i
X i
N
i
X i
N
i
X i
N
i
Z i Z
x d
N
x d
N
d dx
N
z
N
1
2 2
1
2
1
2
1
2 2
1 1
1 1



( )
2 2
1
2
2
X
N
i
X i
d x
N
d
= =

=
(36)

3. Varianza combinada. La varianza de un grupo de observaciones puede ser
expresada en funcin de las medias y varianzas de los subgrupos que lo componen.
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 15

Sea una poblacin de N elementos en la que se distinguen dos grupos de tamao
1
N y
2
N de manera que
2 1
N N N + = . Adems indicamos con
1
1 12 11
,..., ,
N
x x x a los
valores que toma la variable X en la primer grupo y con
2
2 22 21
,..., ,
N
x x x a los
valores que toma la variable X en el segundo grupo. Por ltimo, sean
1
y
2
1
la
media y varianza de X en el primer grupo y
2
y
2
2
, la media y varianza de X
en el segundo grupo. Por definicin, la varianza de los N elementos de la
poblacin es:
( ) ( ) ( ) ( ) ( ) ( )
2 1
2
2
2
212
2
21
2
1
2
12
2
11 2 2 1
... ...
N N
x x x x x x
N N
+
+ + + + + + +
=
- - - - - -
-


( ) ( )
2 1
1
2
2
1
2
1
2 1
N N
x x
N
i
i
N
i
i
+
+
=

=
-
=
-

(37)
Sumando y restando la media de cada grupo en las sumas de desvos cuadrticos de
los subgrupos en (37) resulta que,
( ) ( ) ( ) | |
( ) ( ) ( )( ) | |


=
- -
=
-
=
-
+ + =
+ =
1
1 1
1
1 1 1
2
1
2
1 1
1
2
1 1 1
1
2
1
2
N
i
i i
N
i
i
N
i
i
x x
x x



( ) ( ) ( ) ( )

=
- -
=
+ + =
1 1
1
1 1 1
2
1 1
1
2
1 1
2
N
i
i
N
i
i
x N x (38)
Como ( )

=

1
1
1 1
N
i
i
x =0, resulta que la suma de los desvos cuadrticos de las
observaciones del primer grupo respecto a la media combinada puede expresarse de
la siguiente manera:
( ) ( ) ( )
2
1 1
1
2
1 1
1
2
1
1 1
-
= =
-
+ =

N x x
N
i
i
N
i
i
(39)
Adems, teniendo en cuenta que ( ) N x
N
i
i
=
=
1
1
2
1 1
2
1
, la expresin en (39) puede
escribirse como:
( ) ( )
2
1 1
2
1 1
1
2
1
1
-
=
-
+ =

N N x
N
i
i
(40)
Anlogamente, para el segundo grupo,
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 16

( ) ( )
2
2 2
2
2 2
1
2
2
2
-
=
-
+ =

N N x
N
i
i
(41)
Reemplazando los resultados (40) y (41) en (37), distribuyendo el denominador
2 1
N N N + = y agrupando convenientemente resulta
( ) ( )
2
2
2
2
1
1 2
2
2 2
1
1 2
- - -
+ + + =
N
N
N
N
N
N
N
N
(42)
Generalizando (42) para el caso de k grupos obtenemos la siguiente expresin:
( )

=
-
=
-
+ =
k
i
i i
k
i
i i
N
N
N
N
1
2
1
2 2
1 1
(43)
donde el primer sumando se denomina intravarianza y mide la varianza dentro de
los grupos y el segundo sumando, llamado intervarianza, mide la varianza entre los
grupos.

Hemos demostrado que la varianza de un grupo de observaciones puede calcularse
en funcin de los indicadores de los subgrupos que lo componen. Es importante
comprender esta propiedad desde el punto de vista de la particin de la varianza
total y del anlisis de sus componentes expresadas en (43).

Ejemplo: Un curso est dividido en dos comisiones. En la comisin 1 estn
inscriptos 24 alumnos cuyo promedio de edad es 24 aos con un desvo de 1,2 aos.
Estos indicadores para los 30 alumnos de la comisin 2 son iguales a 25 y 1,3
respectivamente. Tres alumnos de la comisin 2, dos de ellos de 25 aos y el
restante de 26 deciden abandonar sus estudios. Por otra parte dos alumnos de 23
aos de la comisin 1 se cambian a la comisin 2 y un alumno de 27 aos de la
comisin 2 lo hace a la comisin 1. Estos cambios, han modificado el coeficiente
de variacin de la edad de los estudiantes?

Lo primero que haremos es resumir la informacin relativa a la situacin inicial,
previa a los abandonos y cambios de comisin, en la siguiente tabla.
Comisin
i
N
i

2
i

1 24 24 1,44
2 30 25 1,69

Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 17

Los valores de los indicadores para el grupo completo en la situacin inicial son los
siguientes:
556 , 24
54
25 30 24 24
=

=
-

( ) ( )
826 , 1
54
556 , 24 25 30 556 , 24 24 24 69 , 1 30 44 , 1 24
2 2
2
=
+ + +
=
-

055 , 0
556 , 24
826 , 1
= = CV
El Diagrama 2 es til para analizar los movimientos de los estudiantes en el
problema. Por ejemplo, el arco S12 indica elementos que salen de 1 para ingresar
a 2 y el arco S2 elementos de 2 que salen del sistema.






Diagrama 2

A continuacin describiremos las edades de los alumnos de las comisiones a travs
de tablas intermedias, a medida incorporamos sucesivamente los movimientos de
los estudiantes, hasta llegar a la situacin final.
El primer movimiento est vinculado al arco S2 ya que tres alumnos de la comisin
2 salen del sistema. La comisin 1 no sufre modificaciones, pero s la comisin 2.
Puede considerarse que dicha comisin estaba conformada por dos grupos: los 27
alumnos que quedan y los 3 que se van, cuya media = 25,333 y varianza = 0,222.
La incgnita es la media aritmtica y la varianza de las edades de los 27 alumnos
que continan en la comisin 1. Dado que la media de los 30 alumnos, que es igual
a 25 aos, es funcin de las medias de los 27 alumnos que quedan y de los 3 que se
van, podemos obtener el valor de la media desconocida de la siguiente manera:
21
21
27 3 25.333 30 25 3 25.333
25 = 24.963
30 27


+
= =
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 18

Idntico razonamiento seguimos para obtener la varianza de las edades de los 27
alumnos de la comisin 1.
( ) ( )
2 2
21
27 3 0.222 27 24.963 25 3 25.333 25
1.69
30
+ + +
=
( ) ( )
( )
2 2
21
30 1.69 3 0.222 27 24.963 25 3 25.333 25
1.839
27

+ +
= =
En este punto los indicadores descriptivos de la edad de los estudiantes son los
siguientes:
Comisin
i
N
i

2
i

1 24 24 1,44
2 27 24,963 1,839

La media y varianza del curso completo son las siguientes:
24 24 27 24.963
24.510
51
T

+
= =
( ) ( )
2 2
2
24 1.44 27 1.839 24 24 24.510 27 24.963 24.510
1.882
51
T

+ + +
= =
El prximo paso est vinculado al arco S12, dado que 2 alumnos de 23 aos de la
comisin 1 pasan a la comisin 2. La media de la edad de estos alumnos es igual a 23
y su varianza es igual a cero. En este caso el movimiento va a incidir en ambas
comisiones.
Para la comisin 1 el procedimiento es anlogo al realizado en el paso anterior.
Podemos comprobar que la media y la varianza de la edad de los 22 alumnos que
quedan en la comisin 1 son 24,091 y 1,472 respectivamente.
Para determinar los nuevos indicadores de la comisin 2, consideramos que el nuevo
grupo estar conformado por los 27 alumnos que estaban en la comisin ms los 2
que se incorporan. Por lo tanto,
21
27 24.963 2 33
24.828
29

+
= =
( ) ( )
2 2
2
21
27 1.839 2 0 27 24.963 24.828 2 23 24.828
1.96
29

+ + +
= =
Ahora estamos en condiciones de elaborar una nueva tabla intermedia y calcular los
indicadores para el curso completo. Posteriormente, si consideramos el ltimo
movimiento, vinculado al arco S21, segn el cual un alumno de 27 aos de la
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 19

comisin 2 pasa a la comisin 1, obtenemos la tabla correspondiente a la situacin
final que figura a continuacin.

Comisin
i
N
i

2
i

1 23 24,317 1,760
2 28 23,786 0,776

Empleando los resultados de la tabla anterior calculamos los indicadores para el
curso completo. Vemos que el coeficiente de variacin resulta igual a 0,047 (4,7%).
Comparando este valor con el correspondiente a la situacin inicial igual a 0,055
(5,5%) podemos decir que la variacin relativa de la edad del curso completo ha
disminuido.
23 24.317 28 23.786
23.980
51
T

+
= =
( ) ( )
2 2
2
23 1.760 28 0.776 23 24.317 23.980 28 23.786 23.980
1.266
51
T

+ + +
= =

1.266
0.047
23.980
CV = =

4. Varianza de la suma de k variables.
Demostracin para 2 = k : Sean ( ) ( ) ( )
N N
y x y x y x , ,..., , , ,
2 2 1 1
los valores que toma la
variable bidimensional ( ) Y X, en una poblacin de N elementos y sea Y X Z = .
( ) ( ) ( ) | |
( ) ( ) | |
( ) ( ) ( )( ) | |


=
=
= =
+ =
=
= =
N
i
Y i X i Y i X i
N
i
Y i X i
N
i
Y X i i
N
i
Z i Z
y x y x
N
y x
N
y x
N
z
N
1
2 2
1
2
1
2
1
2 2
2
1
1
1 1




( ) ( ) ( )( )
(

+ =

= = =
N
i
Y i X i
N
i
Y i
N
i
X i
y x y x
N
1 1
2
1
2
2
1
(44)
Por ltimo, distribuimos el factor N 1 :
( ) ( ) ( )( )

= = =
+ =
N
i
Y i X i
N
i
Y i
N
i
X i Z
y x
N
y
N
x
N
1 1
2
1
2 2
2 1 1
(45)
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 20

Vemos que el primer y segundo sumando en (45) son las varianzas de X e Y .
Adems, definimos a la covarianza de X e Y como el promedio del producto de
los desvos de X e Y respecto a sus correspondientes medias aritmticas
X
y
Y
, es decir,
( ) ( )( )

=
=
N
i
Y i X i
y x
N
Y X Cov
1
1
, (46)
Luego, reemplazando en (45) resulta:
( ) Y X Cov
Y X Z
, 2
2 2 2
+ = (47)
Realizando las operaciones algebraicas apropiadas en (46) puede demostrarse la
siguiente frmula alternativa para el clculo de la covarianza.

=
=
N
i
Y X i i
y x
N
Y X Cov
1
1
) , ( (48)

Interpretacin de la covarianza
Analizaremos a continuacin los valores que puede tomar la covarianza de acuerdo
a la relacin existente entre las variables X e Y .
1. X e Y estn relacionadas linealmente de manera que al aumentar X tambin
aumenta el valor de Y .
Sean los siguientes 4 pares de observaciones de la variable bidimensional ( ) Y X, :
(1,2), (2,1), (5,4), (6, 3.5). En la Figura 1 se muestra el diagrama de dispersin y
puede comprobarse que
y
3.5 y 2.625
x
= =




Figura 1
Calculamos a continuacin la covarianza entre las variables de acuerdo a (46):
( ) ( )( ) ( )( )
( )( ) ( )( )
25 . 8
625 . 2 5 . 3 5 . 3 6 625 . 2 4 5 . 3 5
625 . 2 1 5 . 3 2 625 . 2 2 5 . 3 1 ,
=
+ +
+ + = Y X Cov

La covarianza resulta ser positiva.

Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 21

2. X e Y estn relacionadas linealmente de manera que al aumentar X disminuye el
valor de Y . Consideramos los siguientes 4 pares de observaciones de la variable
bidimensional ( ) Y X, : (1,4), (2,3), (4,1), (5,2) donde 3 =
X
y 5 . 2 =
Y
. La Figura
2 muestra el diagrama de dispersin.





Figura 2

( ) ( )( ) ( )( )
( )( ) ( )( )
6
5 . 2 2 3 5 5 . 2 1 3 4
5 . 2 3 3 2 5 . 2 4 3 1 ,
=
+ +
+ + = Y X Cov

En este caso la covarianza es negativa.

3. X e Y son independientes.
Sean los siguientes 4 pares de observaciones de ( ) Y X, : (1,2), (1,4), (5,2), (5,4)
donde 3 =
X
y 3 =
Y





Figura 3


( ) ( )( ) ( )( )
( )( ) ( )( )
0 2 2 2 2
3 2 3 5 3 2 3 1
3 4 3 1 3 4 3 5 ,
= + =
+ +
+ + = Y X Cov

Si X e Y son independientes la covarianza es cero.

4. X e Y no son independientes pero su relacin no es lineal.
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 22

Consideramos ahora los siguientes 3 pares de observaciones ( ) Y X, : (1,2), (3,4),
(5,2) donde 3 =
X
y 3 8 =
Y






Figura 4

( ) ( ) ( ) ( )
0
2 2 2 2
3
8
2 3 5
3
8
4 3 3
3
8
4 3 1 ,
=
+ =
|
.
|

\
|
+
|
.
|

\
|
+
|
.
|

\
|
= Y X Cov

En este caso la relacin entre X e Y no es lineal y la covarianza resulta igual a
cero.

Podemos puntualizar las conclusiones que pueden derivarse de las
ejemplificaciones anteriores de la siguiente manera:
- La covarianza puede ser positiva, cero o negativa.
- Si la covarianza no es igual a cero implica que existe una relacin entre X e Y
y por lo tanto son dependientes.
- Cuando las variables X e Y son independientes la covarianza es igual a cero.
- Si la covarianza es cero no implica necesariamente que X e Y sean
independientes.

Momentos
Los momentos son indicadores caractersticos de la distribucin de una variable.
Sean
N
x x x ,..., ,
2 1
los valores que toma la variable X en una poblacin de N
elementos.
Definimos al momento natural de orden r de la siguiente manera:

=
=
N
i
r
i r
x
N
1
1
(48)
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 23

Vemos que siempre el momento natural de orden 0 resulta igual a 1 y el momento
natural de primer orden coincide con la media aritmtica. Es decir que 1
0
= y =
1
.
Adems, definimos al momento centrado de orden r empleando la siguiente
expresin:
( )

=
=
N
i
r
i r
x
N
1
1
(49)
De acuerdo a esta definicin, siempre se verifica que el momento centrado de orden 0 es
igual a 1, el momento centrado de primer orden es cero y el momento centrado de
segundo orden coincide con la varianza, es decir: 1
0
= , 0
1
= y
2
2
= .
Adems, los momentos centrados pueden expresarse en funcin de los momentos
naturales a travs de la relacin que obtenemos a continuacin:
( )
( )
( )

= =

= =

=
(

|
|
.
|

\
|
=
(

|
|
.
|

\
|
=
=
r
j
N
i
j
i
j r
N
i
r
j
j r j
i
N
i
r
i r
x
N j
r
x
j
r
N
x
N
0 1
1 0
1
1
1
1



( )

|
|
.
|

\
|
=
r
j
j
j r
j
r
0
(50)
Aplicando (50) al clculo de los momentos centrados de orden 3 y 4 resulta:
3 2 1
2
0
3
3
3 3 + + = (51)
4 3 2
2
1
3
0
4
4 6 4 4 + + = (52)
Los momentos centrados de orden 3 y 4 intervienen en el clculo de los siguientes
coeficientes de asimetra y curtosis.
- Coeficiente de asimetra de Fisher. Se define de acuerdo al siguiente cociente:
3
3
3

= a (53)
Si
3
a = 0, la distribucin es simtrica. Valores positivos de
3
a indican asimetra
positiva, o como tambin suele expresarse, la distribucin analizada es asimtrica a
la derecha. Por el contario, valores negativos de
3
a caracterizan a distribuciones
con asimetra negativa o asimtricas a la izquierda.
Universidad Nacional de Salta
Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica
Indicadores Descriptivos
Notas Complementarias


Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010. 24

- Coeficiente de curtosis. Mide el grado de apuntalamiento de una distribucin en
relacin a la distribucin normal (modelo terico que se describe empleando una
curva simtrica en forma de campana)-
4
4
4

= a (54)
Si 3
4
= a el grado de apuntalamiento de la distribucin coincide con el de la normal
y se dice que la distribucin es mesocrtica. Si
4
a es menor que 3 la distribucin se
denomina platicrtica y es ms achatada que la normal. Por el contrario, valores de
4
a mayores que 3 caracterizan a distribuciones, ms apuntaladas que la normal, que
se denominan leptocrticas.

Bibliografa
Anlisis Estadstico. Ya Lun Chou. Nueva Editorial Interamericana. Mxico 1977.
2da. Ed.
ESPA. Sistema informtico interactivo para la enseanza de la Estadstica. Hugo M.
Rodrguez, Mara Esther Capilla. Ao 2003.

Vous aimerez peut-être aussi