Vous êtes sur la page 1sur 16

RESMENES DE ESTADSTICA DESCRIPTIVA 1

Tema 1.- Estadstica. Generalidades



1.1. Estadstica: fenmenos aleatorios y causales.

La palabra "Estadstica" suele utilizarse principalmente con dos significados diferentes:
1.- Como una coleccin de datos numricos.
2.- Como ciencia.
Antes de dar una definicin de la Estadstica como ciencia, vamos a distinguir, dentro de los fenmenos
observables, dos tipos:
a) fenmenos causales: son aquellos en los que se obtienen los mismos resultados si se realizan en las mismas
condiciones, y por lo tanto, controlando determinados factores, puede predecirse el resultado final.
b) fenmenos de azar, o estadsticos o aleatorios: son aquellos que, al repetirlos en condiciones anlogas, presentan
resultados diferentes.
Definicin simplista de la Estadstica:
"La Estadstica es la ciencia que estudia los fenmenos aleatorios"
La aleatoriedad es una condicin necesaria, pero no es una condicin suficiente.
As la Estadstica se ocupa del estudio de los fenmenos aleatorios en los que existe una cierta regularidad en
su comportamiento.
Tambin se puede encontrar otra definicin de Estadstica:
"La Estadstica es la ciencia que estudia los fenmenos de masa".
1.2. La poblacin o colectivo: elementos y caracteres.
Definicin de Poblacin: "conjunto de entes (personas, animales o cosas) sobre los que se va a llevar a cabo la
investigacin estadstica".
Cada uno de los componentes de dicha poblacin se denomina elemento o unidad estadstica.
Un elemento puede ser simple (una persona) o compuesto (una familia).
Se denomina tamao de la poblacin, al nmero de elementos que constituyen la poblacin, y se acostumbra a
distinguir entre poblaciones finitas e infinitas. Esta distincin es importante, ya que segn sea una poblacin de un
tipo u otro, los mtodos estadsticos son diferentes.
El estudio de una poblacin infinita o prcticamente infinita, no se puede realizar observando todos los elementos
de la poblacin. En este caso se recurre al anlisis de un subconjunto de la poblacin que se denomina muestra.
Los elementos de la poblacin poseen una serie de cualidades o rasgos comunes que se denominan en estadstica
Caracteres.
Dentro de los caracteres de una poblacin podemos formar dos grupos:
- los caracteres cuantitativos
- los caracteres cualitativos
Cuantitativos o variables.- son aquellos caracteres susceptibles de ser cuantificados, es decir, que se pueden
describir mediante nmeros. Estos nmeros sern: valores de la variable.
Cualitativos.- son aquellos que por su naturaleza no se pueden cuantificar y por lo tanto se describen mediante
palabras. En Estadstica reciben el nombre de atributos.
Nosotros nos centraremos en el estudio de los caracteres cuantitativos. Dentro de estos, las variables las
separaremos en dos tipos: Variables continuas y variables discretas.
1.3. Estadstica Descriptiva e Inferencia Estadstica.
La Estadstica Descriptiva es la ciencia que trata de descubrir las regularidades o caractersticas existentes en un
conjunto de datos, pero si el estudio no se realiza en toda la poblacin, sino que se parte de una muestra, con la
finalidad de conocer mediante ella las caractersticas de la poblacin, entonces nos enfrentamos a un proceso
inductivo, en virtud del cual, se aprovecha la informacin suministrada por la muestra para conocer, aunque sea
aproximadamente, las caractersticas de toda la poblacin.
La muestra puede manejarse en un doble sentido:
- Describir el propio conjunto de observaciones.
- Inferir lo que ocurre en la poblacin.

RESMENES DE ESTADSTICA DESCRIPTIVA 2
Tema 2.- Distribuciones estadsticas unidimensionales. Distribuciones de frecuencias

2.1. Variable estadstica.
Definicin.- Se denomina variable estadstica, a una variable X que puede tomar los valores numricos: x
1
, x
2
,
x
3
,..., x
k
, resultantes de la observacin y medicin de uno o ms caracteres.
Cuando la observacin afecta a un solo carcter de la poblacin, es decir, cuando por cada elemento observado se
obtiene un solo nmero, diremos que la variable correspondiente es una variable unidimensional. Cuando la
observacin afecta a dos o ms caractersticas de la poblacin, la variable correspondiente se dice bidimensional o
n-dimensional.
2.2. Distribuciones unidimensionales de frecuencias.
- Frecuencia absoluta de un determinado valor de la variable x
i
(y lo representaremos por n
i
): es el nmero de
veces que se presenta ese determinado valor x
i
.
- Frecuencia relativa de un determinado valor de la variable x
i
(y lo representaremos por f
i
): es el cociente de su
frecuencia absoluta (n
i
) y el nmero total de datos.
- Frecuencia absoluta acumulada de un determinado valor de la variable x
i
(y lo representaremos por N
i
): es la
suma de las frecuencias absolutas de todos los valores de la variable menores o iguales que dicho valor x
i.

- Frecuencia relativa acumulada de un determinado valor de la variable x
i
(y lo representaremos por F
i
): es la
suma de las frecuencias relativas de todos los valores de la variable menores o iguales que dicho valor x
i.

Cuando en un conjunto de valores observados de una variable, se realizan las operaciones de: Ordenacin y
agrupacin de los valores que se repiten, (determinacin de la frecuencia de cada valor), se obtiene una tabla
estadstica de distribucin de frecuencias. A dicho conjunto de operaciones se le denomina: Tabulacin.
Las distribuciones de frecuencias se pueden clasificar en varios tipos de acuerdo con el nmero de los valores
observados de la variable, as como el nmero de observaciones totales
recorrido o rango de una variable, se define como la diferencia entre el mayor y el menor valor de la variable:
R = Mx X
i
- Mn X
i

Para facilitar el manejo matemtico de los intervalos, es preciso considerar un valor concreto de la variable como
representante de cada intervalo. Generalmente se toma como tal el valor central del intervalo, y se le denomina
marca de clase.
2.3. Representaciones grficas.
2.4.1. Representaciones grficas de una distribucin de frecuencias no agrupadas en intervalos
(1) DIAGRAMA DE BARRAS.- Consiste en un sistema de ejes de coordenadas en el que, los valores de la variable
se colocan en el eje de abcisas y las frecuencias absolutas en el de ordenadas. Sobre cada valor de la variable se
levanta una barra igual a su frecuencia absoluta.
(2) POLIGONO DE FRECUENCIAS: Sobre un sistema de ejes coordenados, se representa por un punto cada par
de valores (x
i
, n
i
) (x
i
,f
i
) uniendo mediante rectas cada par de puntos consecutivos.
(3) DIAGRAMA ACUMULATIVO DE FRECUENCIAS O DE ESCALERA: Esta curva o grfica tiene forma de
escalera, subindose un peldao al pasar de cada valor de la variable al siguiente. La altura de cada peldao est
determinada por la magnitud de la frecuencia simple (absoluta o relativa), con lo que cada peldao representa la
frecuencia acumulada que corresponde a cada valor.
2.4.2. Representaciones grficas de una distribucin de frecuencias agrupadas en intervalos.
(4) HISTOGRAMA DE FRECUENCIAS: Se construye levantando sobre cada intervalo, representado sobre el eje
de abcisas, un rectngulo cuya rea es proporcional a la frecuencia absoluta del intervalo.
(5) POLIGONO DE FRECUENCIAS ACUMULADAS.- para obtenerlo se hace lo siguiente: se levanta en el
extremo superior de cada intervalo una ordenada igual a la frecuencia acumulada correspondiente y a continuacin
se unen estos puntos. Es decir, se trata de unir mediante rectas, cada par consecutivo de los siguientes puntos:
(l
0
, 0), (l
1
, N
1
) , (l
2
, N
2
) , ... , (l
k
, N
k
) , o bien (l
0
, 0), (l
1
, F
1
) , (l
2
, F
2
) , ... , (l
k
,F
k
) .
2.4. Apndice: Operadores suma () y producto ().
a) x
1
+ x
2
+ x
3
+ x
4
= = "suma desde i igual 1 hasta 4, de los x
i
".

=
4
1 i
i
x
b) x
1
. x
2
. x
3
. x
4
=

= "producto desde i igual 1 hasta 4, de los x


i
".
=
4
1 i
i
x

RESMENES DE ESTADSTICA DESCRIPTIVA 3
Tema 3.- Distribuciones estadsticas unidimensionales. Momentos y medidas de posicin
3.1. Introduccin.
3.2. Momentos de una distribucin.
Los momentos de una distribucin son unos valores que la caracterizan, de tal modo que dos distribuciones son
iguales, si tienen todos sus momentos iguales, y son tanto ms parecidas cuanto mayor sea el nmero de momentos
iguales que tengan.
En una distribucin de frecuencias, se llama momento de orden r respecto al origen, al valor:
a
r
=
x
i
r
. n
i
i =1
k

N
=
x
1
r
n
1
+. .. ... +x
k
r
n
k
N

en donde x
i
, con i=1, .. ,k son los distintos valores de la variable, o las marcas de clase si es que la distribucin est
agrupada en intervalos; y los n
i
, con i=1, .. ,k son las frecuencias respectivas.
MOMENTOS CENTRALES: Se llama momento central de orden r, o tambin momento de orden r respecto a la
media, al valor:
m
r
=
(x
i
x )
r
n
i
i=1
k

N
=
(x
1
x )
r
n
1
+... .. . +(x
k
x )
r
n
k
N

3.3. Medidas de posicin central.
Las medidas de posicin o promedios, son unos valores alrededor de los cuales se agrupan los valores de la
variable, y que nos resumen la posicin de la distribucin sobre el eje horizontal.
La media aritmtica: se define como la suma de todos los valores de la distribucin, dividida por el nmero total
de observaciones:
x =
1
N
x
i
. n
i
i = 1
k

=
x
1
. n
1
+... .. +x
k
. n
k
N

La media geomtrica: se define como la raz N-sima del producto de los valores de la variable, elevados cada uno
de ellos a la potencia indicada por su frecuencia. Es decir:
M
G
= x
i
n
i
i =1
k

N
= x
1
n
1
. ... x
k
n
k N

La media armnica: Se define como el valor: M
A
=
N
n
i
x
i
i =1
k

=
N
n
1
x
1
+. .. ... . +
n
k
x
k

En una distribucin, la moda (Mo) se define como "aquel valor de la variable cuya frecuencia no es superada por la
frecuencia de ningn otro valor".
Para variables agrupadas en intervalos: Mo =
1 1
1
1
.
+
+

+
+
i i
i
i i
h h
h
a l
Para una distribucin discreta no agrupada en intervalos, se define la mediana, como el valor de la variable que
ocupa el lugar central, supuestos ordenados los valores de menor a mayor.
Para variables agrupadas en intervalos: Me =
i
i
i i
n
N
N
a
1
1
2
.

+ l
3.4. Medidas de posicin no central.
Los cuantiles, constituyen una generalizacin del concepto de la mediana.
En general, los q-1 valores que dividen a la distribucin en q partes iguales se denominan cuantiles de orden q.
Cuando se trate de una distrubucin agrupada en intervalos,el cuantil r-simo vendr dado por:
Q
r/q
=
i
i
i i
n
N N
q
r
a l
1
1
.
.

+
3.5. Apndice: Transformaciones lineales: cambio de origen y escala.
Si a una variable x
i
, le aplicamos un cambio de origen y escala cualquiera: u
i
= a + b x
i
entonces: m
r
(u)=
b
r
.m
r
(x)
RESMENES DE ESTADSTICA DESCRIPTIVA 4
Tema 4.- Distribuciones estadsticas unidimensionales. Medidas de dispersin

4.1. Introduccin.
Con las medidas de posicin o promedios, intentamos sintetizar una tabla de datos.
Para evaluar la representatividad de un promedio, necesitamos un indicador que, de alguna forma, nos cuantifique el
grado de separacin o dispersin de los valores de la variable respecto al promedio en cuestin.
En este tema estudiaremos las medidas de dispersin. Hay que tener en cuenta que existen dos tipos de medidas de
dispersin: las absolutas y las relativas.
4.2. Medidas de dispersin absolutas.
Con las medidas de dispersin absolutas, se trata de medir la separacin que, por trmino medio, existe entre los
distintos valores de la variable, por lo que sern medidas que vendrn expresadas en la misma clase de unidades que
las variable.
Las principales medidas de dispersin absoluta son:

-RECORRIDO O RANGO: se define como la diferencia entre el mayor y el menor valor de la variable. Es decir :
Re = Mx x
i
- Mn x
i
= x
k
- x
1


-RECORRIDO INTERCUARTILICO: llamamos as a la diferencia entre el tercer y el primer cuartil. Es decir:
R
I
= Q
3
- Q
1


-DESVIACIN ABSOLUTA MEDIA RESPECTO A LA MEDIANA: (tambin llamada desviacin media o
desviacin mediana), se define como la media aritmtica de las desviaciones, en valor absoluto, de los valores de la
variable respecto a la mediana. Es decir: Dme =
x
i
Me. n
i
i =1
k

N

-DESVIACIN ABSOLUTA MEDIA RESPECTO A LA MEDIA ARITMTICA: a la media aritmtica de las
desviaciones, en valor absoluto, respecto a la media. Es decir: Dx =
x
i
x . n
i
i =1
k

N

-LA VARIANZA: la definimos como la media aritmtica de los cuadrados de las desviaciones de los valores de la
variable respecto a la media aritmtica de la distribucin, es decir: es el momento de segundo orden respecto a la
media. Se representa por
2
y es:

2
=
x
i
x
( )
2
. n
i
i =1
k

N
= m
2

-DESVIACION TIPICA: o desviacin estndar, es igual a la raz cuadrada de la varianza, con signo positivo. Se
representa por : = +
2
= +
x
i
x ( )
2
. n
i
i =1
k

N

De todas las medidas de dispersin absoluta, la varianza y su raz cuadrada, la desviacin tpica, son las ms
importantes.
-CUASIVARIANZA: Es una medida muy similar a la varianza: S
2
=
x
i
x
( )
2
. n
i
i =1
k

N 1
, y es muy utilizada en
inferencia estadstica.
RESMENES DE ESTADSTICA DESCRIPTIVA 5
4.3. Medidas de dispersin relativas.
Con las medidas de dispersin relativas, se trata de medir la dispersin, con independencia de la clase de unidades
en que venga expresada la variable. Estas medidas, permiten comparar la dispersin existente en dos distribuciones,
incluso cuando las variables estn expresadas en distinta clase de unidades.
Entre las medidas de dispersin relativa, llamadas tambin ndices de dispersin, tenemos:

-COEFICIENTE DE APERTURA: Se define como el cociente entre el mayor y el menor valor de la variable:
A =
max x
i
min x
i
=
x
k
x
1


-RECORRIDO RELATIVO: Se define como el cociente entre el recorrido de la variable y la media aritmtica:
R
r
=
Re
x

Nos indica el nmero de veces que el recorrido contiene a la media aritmtica.

-RECORRIDO SEMI-INTERCUARTILICO: Se define como el cociente entre el recorrido intercuartlico y la suma
del primer y el tercer cuartil:
R
S
=
1 3
1 3
Q Q +
Q Q


-COEFICIENTE DE VARIACION O INDICE DE DISPERSION DE PEARSON: Es el ms empleado de los
ndices de dispersin relativos. Se define como el cociente entre la desviacin tpica y la media aritmtica. Se
designa por CV o bien por V
1
: CV = V
1
=

x

Nos indica el nmero de veces que la desviacin tpica contiene a la media aritmtica.
-NDICE DE DISPERSIN MEDIANO:
Me
Dme


4.4. Variables centradas y variables tipificadas o estandarizadas.
Llamaremos variable centrada a cualquier variable con media 0.
Llamaremos variable tipificada o estandarizada a cualquier variable con media 0 y desviacin tipica 1.
Dada una variable cualquiera X
i
. Entonces:
La variable Y
i
construida como: Y
i
= X
i
X es una variable centrada y
La variable Z
i
construida como: Z
i
=
X
i
X

es una variable tipificada


RESMENES DE ESTADSTICA DESCRIPTIVA 6
Tema 5.- Distribuciones estadsticas unidimensionales. Medidas de forma y concentracin
5.1. Introduccin.
En este tema nos vamos a referir a ciertas medidas que nos van a dar una idea de la forma de la distribucin, sin
necesidad de realizar su representacin grfica.
La distribucin NORMAL, cuya representacin grfica es la curva de Gauss, ser el modelo de comparacin para la
simetra y la curtosis de cualquier distribucin de frecuencias.
5.2. Medidas de simetra y asimetra.
Las medidas de simetra se dirigen a establecer un indicador que permita establecer el grado de simetra o asimetra
que presenta la distribucin, sin necesidad de llevar a cabo su representacin grfica.
Diremos que una distribucin es simtrica cuando lo es su representacin grfica en coordenadas cartesianas.
COEFICIENTE DE ASIMETRIA DE FISHER: g
1
=
m
3

3
=
1
N
x
i
x ( )
3
. n
i
i =1
k

1
N
x
i
x ( )
2
. n
i
i =1
k

|
\

|
.
3
2

- Si g
1
= 0, la distribucin puede ser simtrica
- Si g
1
> 0, la distribucin es asimtrica positiva (a la derecha)
- Si g
1
< 0, la distribucin es asimtrica negativa (a la izquierda)
Notar que toda distribucin simtrica tiene nulo el coeficiente de asimetra, pero el recproco no es cierto, es decir:
existen distribuciones asimtricas para las que el ndice de asimetra, g
1
, es nulo.
Karl Pearson propuso como coeficiente de asimetra el siguiente:
f
1
=
x Mo


- Si f
1
= 0, la distribucin puede ser simtrica
- Si f
1
> 0, la distribucin es asimtrica positiva (a la derecha)
- Si f
1
< 0, la distribucin es asimtrica negativa (a la izquierda)
Esta formulacin se puede aplicar a las distribuciones con un nmero impar de modas, siendo Mo la moda central.
5.3. Medidas de apuntamiento o curtosis.
La mayor o menor concentracin de frecuencias alrededor de la media y en la zona central de la distribucin, dar
lugar a una distribucin ms o menos apuntada. Para construir el coeficiente de apuntamiento se utiliza el valor:
b
2
=
4
4
m

. Dicho valor se debe comparar con 3, (que es el valor correspondiente a una Normal con la misma media
y desviacin tpica). Entonces, se define el coeficiente de apuntamiento como: g
2
= b
2
- 3 =
4
4
m

- 3
- si g
2
= 0 , se dice que la distribucin es mesocrtica (normal).
- si g
2
> 0 , la distribucin es leptocrtica (ms apuntada que la normal).
- si g
2
< 0 , distribucin platicrtica (menos apuntada que la normal).
5.4. Medidas de concentracin. Curva de Lorenz. Indice de Gini.
Las medidas de concentracin tratan de poner de relieve el mayor o menor grado de igualdad en el reparto de la
suma total de los valores de la variable. Son por tanto, indicadores del grado de equidistribucin de la variable.
Si denominamos:
x N
n x
n x
n x
q
i i
i i
i i
i
.
.
.
.
= =

= masa que se reparte entre los miembros de la clase i-sima relativa a la masa total.
p
i
= frecuencias relativas.
P
i
= frecuencias relativas acumuladas, en tanto por uno.
Q
i
= son los valores acumulados de q
i
.
La curva de Lorenz se obtiene representando los valores P
i
y Q
i
, y unindolos mediante lneas rectas.
El ndice de concentracin o ndice de GINI, representa la proporcin entre el rea que encierran la curva de
Lorenz y la diagonal, y el rea del tringulo inferior. Y su valor exacto viene dado por la expresin:
2

. . 2 1

. . .
2
1 1
i
i
k
i
i i
k
i
i i i
p
P P q P p x
x
= = =

= =
i G
P donde I

RESMENES DE ESTADSTICA DESCRIPTIVA 7
Tema 6.- Distribuciones estadsticas bidimensionales

6.1. Introduccin.
La mayora de las veces, al estudiar una poblacin, el inters se centra en el estudio de dos o ms caractersticas
simultneamente. Cada observacin dar lugar por tanto a dos o ms nmeros (suponiendo que las caractersticas
son cuantitativas). La variable estadstica correspondiente, se denomina: variable bidimensional o
pluridimensional.
El anlisis de las distribuciones estadsticas de dos o ms dimensiones, tiene por objetivo general el estudio de la
existencia o no de algn tipo de asociacin, dependencia o covariacin entre las distintas componentes.
6.2. Distribuciones bidimensionales de frecuencias. Descripcin numrica y representaciones grficas.
Llamaremos frecuencia absoluta bidimensional: al nmero de veces que se presenta conjuntamente el par de
valores (x
i
, y
j
), y se representa por n
ij
.
Llamaremos frecuencia relativa bidimensional: al cociente entre la frecuencia absoluta bidimensional y el nmero
total de datos:
N
n
f
ij
ij
=
Llamaremos distribucin bidimensional: al conjunto formado por los pares de valores de los caracteres (x
i
,y
j
),
asociado a sus frecuencias absolutas: (x
i
, y
j
, n
ij
), o las relativas.
Una forma de disponer los datos es la conocida como tabla de doble entrada:
-Si es de caracteres cuantitativos o variables se denomina tabla de correlacin
-Si es de caracteres cualitativos o atributos se denomina tabla de contingencia.
Representaciones grficas:
Las distribuciones bidimensionales se pueden representar grficamente en el espacio de tres dimensiones. En este
caso en el eje vertical se representan las frecuencias y en el plano horizontal los valores de las variables X e Y.
6.3. Distribuciones marginales.
En una distribucin bidimensional, (X,Y), se pueden considerar las distribuciones de cada una de las variables
componentes. A estas distribuciones se les llama distribuciones marginales y vienen definidas por los valores que
toma una variable y la frecuencia de los mismos, con independencia de los que tome la otra.
Para X x
i
x
1
x
2
x
3
... x
k
Para Y y
i
y
1
y
2
y
3
... y
m

n
i
n
1
n
2
n
3 ...
n
k
n
i
n
1
n
2
n
3 ...
n
m

con

=

= =
k
i
ij j
m
j
ij i
n n n n
1 1
y
6.4. Distribuciones condicionadas.
En ocasiones estaremos interesados en analizar un cierto subconjunto de la poblacin total, es decir, slo aqullos
elementos que cumplen una determinada condicin.
As en la distribucin conjunta de X e Y, podemos estar interesados slo en el anlisis de la variable X, pero
refirindonos nicamente a aquellos elementos para los que la variable Y toma un determinado valor: y
r
, por
ejemplo.
La variable X, sujeta a la condicin de que la Y tome el valor concreto y
r
, la representaremos por: (X | Y=y
r
).
De igual forma se define la variable Y condicionada al hecho de que la variable X tome el valor x
s
: (Y | X=x
s
)
La frecuencia relativa condicionada f(x
i
|y
j
), se define como la frecuencia relativa con que se presenta x
i
, dentro
del subconjunto en el que Y=y .
j
Es decir: f x
i
y
j
( )
=
f x
i
, y
j
( )
f y
j
( )
=
f
ij
f
j
=
n x
i
, y
j
( )
n y
j
( )
=
n
ij
n
j

Anlogamente: f y
j
x
i
( )
=
f x
i
, y
j
( )
f x
i
( )
=
f
ij
f
i
=
n x
i
, y
j
( )
n x
i
( )
=
n
ij
n
i

Notar que la suma de todas las frecuencias condicionadas de X para un valor dado de Y es igual a 1.
RESMENES DE ESTADSTICA DESCRIPTIVA 8
Las distribuciones condicionadas son, en realidad, unas distribuciones unidimensionales en las que se pueden
calcular las mismas caractersticas que en estas ltimas. As, en la distribucin condicionada de Y, dado X=x
i
, la
media vendr dada por la siguiente expresin:
Y x
i
= y
j
f y
j
x
i
(
j =1
m

)
;y la varianza vendr dada por:
2
y x
i
( )
= y
j
Y x
i
( )
2
. f y
j
x
i
( )
j =1
m


6.5. Momentos de las distribuciones bidimensionales.
Igual que se definen los momentos en las distribuciones unidimensionales, se pueden considerar en las
bidimensionales los momentos respecto al origen y respecto a la media.
Se definen de la siguiente manera:
Momento de orden r, s, respecto al origen:
a
r, s
=
x
i
r
. y
j
s
. n
ij
j =1
k

i =1
h

N

Momento de orden r, s, respecto a las medias:
m
r, s
=
x
i
x
( )
r
. y
j
y
( )
s
. n
ij
j = 1
k

i =1
h

N

El momento se denomina Covarianza.
11
m
El signo de la covarianza nos indica el sentido de la variacin conjunta de ambas variables. Es decir: si la
covarianza es positiva, las dos variables varan en el mismo sentido.
Definicin: Dada una distribucin bidimensional (X,Y), diremos que las variables estn incorreladas sii su
covarianza es cero.
6.6. Dependencia, independencia e incorrelacin estadstica.
Definicin: Dos variables son independientes sii la frecuencia conjunta es igual al producto de sus frecuencias
marginales. Es decir: f(x
i
, y
j
)= f(x
i
).f(y
j
), i , j.
Equivalentemente:
a) Diremos que la variable Y se distribuye independientemente de la variable X sii las frecuencias condicionadas
de y
j
(cualquiera que sea el valor de j) para los distintos valores de X, son iguales entre si. Es decir:
f(y
j
| x
1
)= f(y
j
| x
2
)= f(y
j
| x
3
)= .. = f(y
j
| x
i
)= ... = f(y
j
| x
k
), j.
b) f(y
j
)= f(y
j
| x
i
) i , j.
Definicin: Dada una distribucin bidimensional (X,Y), diremos que las variables son dependientes sii no son
independientes. Es decir: i,j f(x
i
, y
j
) f(x
i
).f(y
j
).
Propiedades: Si Y se distribuye independientemente de X
1) Las medias de Y condicionadas a distintos valores de X, coinciden entre s y, a su vez con la media marginal de
Y. Es decir:
i y x y
i
= ,

2) En general, todos los momentos respecto al origen o a la media de Y condicionados a distintos valores de X,
coinciden entre s y, a su vez, con los momentos marginales de Y.
Es decir: a
r
(y| x
i
) = a
r
(y) y m
r
(y| x
i
) = m
r
(y)
Teorema: Independencia implica incorrelacin, pero el recproco no es cierto.
RESMENES DE ESTADSTICA DESCRIPTIVA 9
Tema 7.- Regresin y correlacin en dos variables

7.1. Introduccin. Las tcnicas estadsticas de la regresin y la correlacin.
Para dar conocer la forma concreta en la que se relacionan las variables y medir el grado de asociacin de las
mismas, se han desarrollado las tcnicas estadsticas de regresin y correlacin.
La CORRELACION: estudia el grado de asociacin entre las componentes de la variable estadstica, y su objetivo
es construir coeficientes que determinen si hay o no covariacin.
La REGRESION: se encarga de la determinacin (si es posible) de aquella ESTRUCTURA DE DEPENDENCIA
que mejor exprese el tipo de relacin existente entre las componentes. Es decir, tratar de obtener ( si es posible)
una relacin funcional entre las componentes:
y = f(x) en el caso bidimensional; y = f(x
1
, x
2
, .. , x
k-1
) en el k-dimensional
Debe tenerse en cuenta que la DEPENDENCIA ESTADISTICA observada entre dos variables puede obedecer a
tres motivos diferentes:
1.- al azar
2.- Una tercera variable influye sobre las dos consideradas
3.- Una variable influye en la otra: La relacin que se establece entre las dos variables consideradas es de caracter
causal.
Las relaciones que nos interesar analizar en economa son las de carcter causal, donde una de las variables
explicativas o EXGENAS (en terminologa especficamente econmica) determinan el comportamiento de una
variable explicada (o ENDGENA).
Nos limitaremos a estudiar las relaciones en las que el comportamiento de una variable EXPLICADA se puede
hacer comprender mediante una o varias variables EXPLICATIVAS.
Una vez establecida una relacin causal o modelo terico, se debe determinar el tipo de funcin matemtica que liga
las variables exgenas con la variable endgena. Esta operacin se denomina especificacin del modelo.
7.2. Regresin minimocuadrtica en R
2
. Caso lineal.
Si tenemos un conjunto de pares (x
i
, y
i
) a los que quiero ajustar una recta: A cada x
i
, le corresponden dos valores:
un valor real: y
i
= a + b. x
i
+ e
i
y
i
y
i

, y un valor terico:
i i
x b a y . + =
*
La diferencia entre ellos: = e
i
, i ,
e
i
2
es el error o residuo, que intentaremos que sea lo menor posible.
Por lo tanto, el problema consiste en encontrar los valores de los parmetros a y b, que minimicen el error. Lo que
haremos ser minimizar

, con lo que se evitan las compensaciones, de ah la denominacin


minimocuadrtica.
De la misma forma que se ha hecho para el caso lineal, el mtodo de ajuste minimocuadrtico se aplica a otro tipo
de funcin. En general: . ) , , , , ( y
1 0
*
i r i
b b b x g =
Definicin: Dados N valores observados de la variable bidimensional (X,Y), se denomina regresin
minimocuadrtica de Y sobre X con referencia a una familia de curvas g(x
i
,b
0
,b
1
, .. ,b
r
) ,a la curva de esta familia
que minimiza la expresin:

e
i
2

= y
i
y
i

( )
2

= y
i
g x
i
, b
0
, b
1
,, b
r
( )
( )
2


De forma anloga se denomina regresin minimocuadrtica de X sobre Y.
la recta de regresin de Y|X es: y
i

y =

xy

x
2
. x
i
x ( )
Anlogamente, la recta de regresin de X|Y: x
i

x =

xy

y
2
. y
i
y ( )
Se pueden deducir las siguientes propiedades:
1.- La suma de los residuos es igual a cero: e
i
= 0
2.- Las dos rectas de regresin pasan por el punto x , y ( )
3.- La suma de los productos de los valores correspondientes del residuo y la variable exgena es cero:
e
i
. x
i
= 0
4.- La suma de los productos de los valores correspondientes del residuo y la variable terica es cero:
e
i
. y
i

= 0

RESMENES DE ESTADSTICA DESCRIPTIVA 10
7.3. Anlisis de la bondad del ajuste. Error cuadrtico medio, varianza residual y coeficiente de
determinacin.
Una vez realizado el ajuste, interesa constatar en qu medida queda explicada la variable endgena mediante el
modelo estimado.
De la distribucin original (X,Y), podemos obtener otras dos distribuciones unidimensionales: las de y e
i
, y
operando con ellas obtenemos:
*
i
y
y
i
y ( )
2
= y
i

y
( )
2

+ e
i
2


VARIACION TOTAL = VARIACION EXPLICADA + VARIACION NO EXPLICADA
y
i
y (
2

) = y
i

y
(
2
)

+ e
i
2


2
Dividiendo por N:
y
2
=
y

2
+
e

Tomaremos como indicador de la bondad del ajuste al cociente:
R
2
=
2
2
*
y
y

al que llamaremos coeficiente de determinacin. Se ve que:


2
2
2
1
y
e
R

=

El coeficiente de determinacin R
2
, nos indica el tanto por uno de la variacin de Y explicada por la variable X.
Como:
2
2
2 2
2 2
2
2
2
2
: que os tenem
.
*
x
xy
y e
y x
xy
y
y
R

= = =

7.4. Correlacin. Coeficiente de correlacin lineal.
El grado de asociacin existente entre dos variables, puede obtenerse mediante las tcnicas de correlacin. Estas
tcnicas nos proporcionan unos coeficientes que nos cuantifican ese grado de asociacin.
El coeficiente de correlacin ms importante, es el COEFICIENTE DE CORRELACIN LINEAL:
y x
xy
r

.
=
Teniendo en cuenta que
2 2
2
2
.
y x
xy
R

= , podemos observar que r= R


2


Como el coeficiente de determinacin , R
2
, vara entre 0 y 1, el coeficiente de correlacin lo har entre -1 y 1, y su
signo depender del signo de la covarianza.
Aunque el coeficiente de correlacin y el de determinacin estn estrechamente ligados, (r= R
2
) la aplicacin
que se da a cada uno de ellos es diferente:
- El coeficiente de determinacin se utiliza para medir, en un modelo causal, la proporcin de la varianza de la
variable endgena explicada por la regresin.
- El coeficiente de correlacin se utiliza para medir el grado de asociacin lineal entre dos variables
7.5. Regresiones no lineales.
Aunque la regresin lineal tiene aplicacin en numerosos problemas, en ocasiones, ya sea por la naturaleza de la
relacin que liga las variables, o ya sea por las caractersticas concretas de los datos, se precisa la utilizacin de
ajustes de funciones no lineales.
Ajuste de una parbola de 2 grado:
Una parbola de segundo grado viene dada por la expresin: y
i

= b
0
+ b
1
. x
i
+ b
2
. x
i
2

En este caso se trata de obtener los parmetros b
0
, b
1
y b
2
, que minimicen la expresin:

y
i
y
i

( )
2
= e
i
2


Con lo que se obtiene el sistema de tres ecuaciones con tres incgnitas siguiente:
y = b
0
+ b
1
. x + b
2
. a
20
a
11
= b
0
. x + b
1
. a
20
+ b
2
. a
30
a
21
= b
0
. a
20
+ b
1
. a
30
+ b
2
. a
40






En este caso la varianza residual es:
e
2
= a
02
b
0
. y b
1
. a
11
b
2
. a
21


Anlogamente se puede ajustar cualquier funcin polinmica:


y
i

= b
0
+ b
1
. x
i
+ b
2
. x
i
2
++b
k
. x
i
k

RESMENES DE ESTADSTICA DESCRIPTIVA 11
Ajuste de una funcin potencial.
Queremos ajustar: Y* = a.X
b
donde a y b son parmetros desconocidos.
Este caso se puede transformar en un caso lineal, tomando logaritmos: lnY* = ln a + b ln X y haciendo los
cambios: V* = lnY* ; A = ln a ; U = ln X V = A + b U
i

*
i
Obtenemos A y b mediante mnimos cuadrados y deshacemos el cambio: a = Antilog A = e
A

Ajuste de una funcin del tipo: Y = a.b
X,

Tomando logaritmos: lnY* = ln a.+ X lnb; y con A = ln a ; B = ln b ; V* = ln Y*, tenemos:
V* = A + BX. Resolvemos la regresin lineal, y despus obtenemos a y b como: a= e
A
y b = e
B

Ajuste de una hiprbola equiltera:
Una hiprbola equiltera, se puede expresar mediante: Y* = b
0
+ b
1

X
1

En este caso, introduciendo la transformacin:
X
1
= Z, el problema se reduce a resolver el ajuste lineal:
Y
i
* = b
0
+ b
1
Z
i

7.6. Aplicaciones de la correlacin y la regresin.
(1) LA PREDICCIN.-La prediccin consiste en determinar, a partir del modelo estimado, el valor que toma la
variable endgena, para un valor dado de la variable exgena.
A partir de un modelo estimado, podemos hacer dos tipos de predicciones:
- Para valores (X
0
) de la variable exgena que estn situados dentro del intervalo de variacin de los datos:
INTERPOLACIN.
- Para valores de la variable exgena situados fuera del intervalo de variacin de los datos: EXTRAPOLACION.
(2) CLCULO DE FUNCIONES MARGINALES.
La funcin marginal de Y respecto a X se puede definir como la variacin (en unidades) que se produce en el valor
de la variable Y, cuando vara en una unidad el valor de la variable X.
Analticamente: funcin marginal =
X d
dY

En el caso de la recta, Y* = a + bX la funcin marginal =
X d
dY
*
= b
(3) CLCULO DE ELASTICIDADES.
La elasticidad de la variable Y respecto a la variable X , la definimos como la relacin porcentual, o cambio
porcentual en la cantidad de la variable Y, que resulta del cambio en un 1% en la variable X.
Analticamente:

Y
X
=
dY
Y
dX
X
=
X
Y
dY
dX
=
d lnY
d ln X

Clculo de elasticidades:
(a) RECTA: Y* = a + bX
X d
dY
*
= b .
*
*
Y
X
Y
X
= b
(b) PARABOLA: Y* = b
0
+ b
1
X + b
2
X
2

X d
dY
*
= b
1
+ 2b
2
X .
*
*
Y
X
Y
X
= ( b
1
+ 2b
2
X)
(c) POLINOMIO DE GRADO k: Y* = b
0
+ b
1
X + b
2
X
2
+ ... + b
k
X
k


X d
dY
*
= b
1
+ 2b
2
X + ... + kb
k
X
k-1
.
*
*
Y
X
Y
X
= ( b
1
+ 2b
2
X + ... + kb
k
X
k-1
)
(d) POTENCIAL: Y* = a X
b


lnY* = lna + b ln X b
Y
X
= =
lnX d
lnY d
*
*

(e) EXPONENCIAL: Y* = a.b
X


X d
dY
*
= a.b
X
.lnb .
*
*
Y
X
Y
X
= a.b
X
.lnb = X.lnb
(f) HIPERBOLA EQUILATERA: Y* = b
0
+ b
1

X
1

2
1
*
d
dY
X
b
X

=
*
1
2
1
*
.
.
*
Y X
b
X
b
Y
X
Y
X

=
NOTA: La funcin potencial tiene la ventaja de tener un coeficiente constante, (no viene afectado por el valor que
tiene la variable X). Debido a esta propiedad, las funciones potenciales son muy utilizadas en la prctica.
RESMENES DE ESTADSTICA DESCRIPTIVA 12
Tema 8.- Nmeros ndices

8.1. Introduccin. Concepto y clasificacin de los nmeros ndices
Definicin: Llamaremos nmeros ndices a unas medidas estadsticas que sirven para comparar una magnitud o un
grupo de magnitudes en dos situaciones, una de las cuales se considera de referencia. La comparacin se puede
efectuar en el tiempo o en el espacio.
Los ndices que vamos a estudiar, van a referirse generalmente a la evolucin de una magnitud en el tiempo. As, a
la situacin inicial la llamaremos PERIODO BASE O PERIODO DE REFERENCIA y a la situacin que queremos
comparar PERIODO ACTUAL.
Los nmeros ndices podemos clasificarlos en:
a) nmeros ndices simples
b) nmeros ndices compuestos

Ponderados
No ponderados


8.2. Nmeros ndices simples.
Estos ndices se refieren a un solo artculo o concepto. Son simples relaciones o porcentajes entre dos valores del
artculo o concepto.
Para la magnitud Y, el ndice simple correspondiente al perodo t, tomando como base el perodo 0, ser:

0
100 . I
0
t
0
t
I
Y
Y
t
= =
En ocasiones se utilizan los llamados, INDICES EN CADENA, en los que se toma como base el perodo anterior a
aquel en el que se calcula el ndice. Su formulacin es: 100 .
1 1 t
t
t
t
Y
Y
+ +
= I
8.3. Nmeros ndices compuestos no ponderados.
Los ndices compuestos, son aquellos que hacen referencia a varios artculos o magnitudes. En general, para N
artculos, la informacin se puede representar en una tabla de doble entrada, de la siguiente forma:

Magnitudes 1 2 ..... N
perodo base Y
01
Y
02
..... Y
0N

perodo actual Y
t1
Y
t2
..... Y
tN

Indice simple I
1
I
2
..... I
N


El problema consiste en sintetizar la informacin de la tabla para obtener un indicador que nos ponga de relieve la
variacin existente entre los precios de los N artculos correspondientes al perodo t.
Un criterio para resolver dicho problema es el de utilizar promedios de los nmeros ndices simples:
Indice de la media aritmtica:
N
I
i
=
t
0
I
Indice de la media geomtrica:
N
i
I

=
t
0
I
Indice de la media armnica:

=
i
I
N
1
I
t
0

Otro criterio para resolver el problema, consiste en calcular un ndice simple entre agregados, es decir:
100 . 100 . I
0
0 02 01
2 1 t
0

=
+ + +
+ + +
=
i
ti
N
tN t t
Y
Y
Y Y Y
Y Y Y


Si dividimos el numerador y el denominador por N, 100 . I
0
t
0
N
Y
N
Y
i
ti

= , vemos que este ndice no es ms que un


ndice simple de las medias aritmticas. Se denomina ndice de la media agregativa.

RESMENES DE ESTADSTICA DESCRIPTIVA 13
8.4. Nmeros ndices compuestos ponderados.
Los ndices compuestos sin ponderar tienen varios inconvenientes, lo que ha dado como resultado que los ndices
sin ponderar, tengan un empleo muy limitado, a la vez que da pie a la creacin de los ndices ponderados.
Para construirlos es necesario afectar a cada magnitud simple, y por lo tanto a sus ndices, de unas ponderaciones
que midan su peso relativo dentro del conjunto en el que se consideran.
Supongamos que las diferentes ponderaciones asignadas son: w
1
, .., w
i
, ..,w
n
, de esta forma obtendremos :
Indice de la media aritmtica ponderada:

=
i
i i
w
w I .
I
Indice de la media geomtrica ponderada:

=
i
i w
w
i
I I
Indice de la media armnica ponderada:

=
i
i
i
I
w
w
I
Indice de la media agregativa ponderada: 100 .
.
.
I
0

=
i i
i ti
w Y
w Y


8.5. Indices de precios, de cantidad y de valor.
En Economa, los ndices ms utilizados, son los que se refieren a precios, cantidades y valor.
INDICES DE PRECIOS:
a) compuestos sin ponderar:
- Indice de Sauerbeck: es la media aritmtica no ponderada de los ndices simples: 100 .
0
0
N
P
P
S
i
ti
t

=
- Indice de Bradstreet y Dtot: es la media agregativa sin ponderar de los precios: 100 .
0
0

=
i
ti
t
P
P
BD
b) compuestos ponderados:
- INDICE DE LASPEYRES: 100 .
.
.
100 .
.
. .
0 0
0
0 0
0 0
0
0

= =
i i
i ti
i i
i i
i
ti
P
q p
q p
q p
q p
p
p
L
t

- INDICE DE PAASCHE: 100 .
.
.
100 .
.
. .
0 0
0
0
0

= =
ti i
ti ti
ti i
ti i
i
ti
P
q p
q p
q p
q p
p
p
P
t

- INDICE DE FISHER: 100 .
.
.
.
.
.
.
0 0 0
0
0 0 0

= =
ti i
ti ti
i i
i ti
P P P
q p
q p
q p
q p
P L F t t t
INDICE DE EDGEWORTH: 100 .
) .(
) .(
100 .
) . . (
) . . .(
0 0
0
0 0 0
0 0 0
0
0

+
+
=
+
+
=
ti i i
ti i ti
ti i i i
ti i i i
i
ti
P
q q p
q q p
q p q p
q p q p
p
p
E
t


INDICES DE CANTIDAD:
100 .
.
.
100 .
.
. .
0 0
0
0 0
0 0
0
0

= =
i i
i ti
i i
i i
i
ti
q
p q
p q
q p
q p
q
q
L
t
100 .
.
.
100 .
.
. .
0 0
0
0
0

= =
ti i
ti ti
i ti
i ti
i
ti
q
p q
p q
q p
q p
q
q
P
t


q q q
t t t
P L F
0 0 0
. =
100 .
) .(
) .(
0 0
0
0

+
+
=
ti i i
ti i ti
q
p p q
p p q
E
t


RESMENES DE ESTADSTICA DESCRIPTIVA 14
INDICES DE VALOR:
El valor de un conjunto de mercancas (producidas, consumidas, exportadas, etc...) o gasto, para dos perodos de
tiempo, el actual y el base, vendr dado, respectivamente, por las siguientes expresiones:

= =
ti ti ti t
q p V V . , V . El cociente entre ambos agregados, multiplicado por 100, es:

= =
i i i
q p V
0 0 0 0
.
100 .
.
.
100 .
0 0
0

= =
i i
ti ti
t V
q p
q p
V
V
I ndice de valor agregado de la produccin o del gasto en consumo.
Si para un cierto artculo se verifica que su valor es igual al precio por la cantidad: v=p.q, parece lgico que
exijamos que para un grupo de artculos se cumpla la misma ecuacin, y por lo tanto: para los ndices se debera
exigir que V = P.Q . Es fcil demostrar que:
a) L
p
. L
q
I
V
b) P
p
. P
q
I
V
c) F
p
. F
q
= I
V
d) L
p
. P
q
= I
V
e) P
p
. L
q
= I
V


8.6. Propiedades ms importantes de los nmeros ndices.
En estas propiedades se prescinde de multiplicar por 100.
(1) CRITERIO DE IDENTIDAD.- La cumplen todos. 1 =
t
t
I
(2) CRITERIO DE INVERSION.- 1 .
0
0
=
t
t
I I
La verifican: B-D ; F ; E No la verifican: S ; L ; P
(3) CRITERIO DE REVERSIBILIDAD DE LOS FACTORES.- I
p
. I
q
= I
V

La verifican: F No la verifican: S ; L ; P ; B-D ; E
(4) CRITERIO TRANSITIVO O CIRCULAR .- (generalizacin del criterio de inversin):
'
1 '
2
1
1 '
. . .
t
t
t
t
t
t
t
t
I I I I

+
+
+
=
La verifican: B-D No la verifican: F ; E
(5) CRITERIO DE DETERMINACION O EXISTENCIA.- si es no nulo, aunque lo sea uno de sus trminos: y
ti
=
0.
Esta propiedad la verifican todos los ndices definidos en el apartado anterior. No la cumplen los ndices basados en
promedios geomtricos y armnicos.
(6) CRITERIO DE PROPORCIONALIDAD.- En el caso de los ndices de precios, diremos que se cumple este
criterio, si al variar los precios, p
ti
, en una proporcin fija, k, el ndice se incrementa en esa misma proporcin.
Algebraicamente, esta propiedad la verifican todos los ndices, pero desde el punto de vista econmico, se deben
hacer algunas objeciones ya que, al variar los precios en cualquier proporcin, es difcil mantener el supuesto de
que las cantidades van a permanecer constantes.

8.7. Problemas para el clculo de los nmeros ndices.
Al elaborar un ndice compuesto, se presentan una serie de problemas, entre los que destacan los siguientes:
1.- Seleccin de variables.
2.- Seleccin de los lugares y tiempos de observacin.
3.- Seleccin de la base.
4.- Seleccin de frmulas y ponderaciones.
5.- Representatividad del ndice.
6.- Renovacin del ndice.
7.- Empalme o enlace de ndices nuevos con los antiguos.
8.- Cambio de base.

8.8. La deflacin de valores.
A la hora de comparar magnitudes econmicas en valor a lo largo del tiempo, se requiere que estos valores sean
homogneos, lo cual requiere deflactar la serie de valores corrientes mediante un ndice de precios adecuado. El
ndice que se utiliza para realizar esta operacin, recibe el nombre de deflactor.
Al dividir V (valor agregado a precios corrientes del perodo actual) por el ndice de precios de
Laspeyres y de Paasche, resultan lan siguienten expresiones:

=
ti ti t
q p .

q
t
i i
i ti
ti ti
P
t
t
P V
q p
q p
q p
L
V
.
.
.
.
0
0 0
0
=
=
=

=
=
=
ti i
ti i
ti ti
ti ti
P
t
t
q p
q p
q p
q p
P
V
.
.
.
.
0
0
.As pues, el ndice de Paasche es es deflactor
idneo, aunque en la prctica se utiliza en muchas ocasiones el ndice de Laspeyres por ser el nico disponible.
8.9. Indice de precios al consumo. IPC.
RESMENES DE ESTADSTICA DESCRIPTIVA 15
Tema 9.-Series cronolgicas

9.1. Series temporales o cronolgicas. Introduccin.
El estudio de las series temporales es interesante, porque permite analizar la evolucin que ha experimentado a lo
largo del tiempo una variable finita, ya sea:
- para construir un modelo descriptivo de la historia del fenmeno
- para poder predecir valores futuros.
9.2. Definicin y componentes fundamentales.
Definicin: Una serie cronolgica o temporal, es una sucesin de observaciones cuantitativas de un fenmeno,
ordenadas el tiempo. Es decir: es una estadstica de dos variables, donde una de ellas es el tiempo, la cual acta
como variable independiente o explicativa.
Dentro de las variables o magnitudes cuya evolucin se analiza a lo largo del tiempo, podemos distinguir:
- Magnitudes STOCK O NIVELES: Cuyos valores van referidos a un instante en concreto.
- Magnitudes FLUJOS O CORRIENTES: Cuyos valores van referidos a un perodo de tiempo.
Teniendo en cuenta la distincin entre magnitudes, podemos definir el PERIODO DE LA SERIE como:
- En el caso de magnitudes STOCK, como la diferencia entre dos instantes consecutivos de observacin.
- En el caso de magnitudes FLUJO, como el periodo de referencia.
Dependiendo de el perodo, podemos tener series cronolgicas anuales, mensuales, diarias, semanales, trimestrales,
plurianuales, etc...

REPRESENTACIN GRAFICA.
Todo anlisis de series temporales ha de iniciarse con una representacin grfica de la misma, poniendo en el eje de
abcisas el tiempo, y en el de ordenadas los valores de la serie.

COMPONENTES DE UNA SERIE CRONOLOGICA.
La teora clsica de las series temporales, se basa en que toda serie emprica, est formada por cuatro componentes:
T , E , C , A.
1.- TENDENCIA: Es la direccin predominante de la serie observada en un espacio de tiempo suficientemente
amplio, es decir, es el movimiento general de la serie a largo plazo.
2.- VARIACIONES ESTACIONALES O PERIODICAS: Son las oscilaciones que se producen con un periodo
igual o inferior a un ao y que se reproducen de manera reconocible en los diferentes aos.
3.- VARIACIONES CICLICAS: Son oscilaciones que se producen en un periodo superior al ao, que se deben
principalmente a la alternancia de etapas de prosperidad y de depresin en la actividad econmica.
4.- VARIACIONES ACCIDENTALES O IRREGULARES: Son movimientos de carcter aleatorio o imprevisible,
y como tales, son atribuidas a circunstancias espordicas o eventuales que afectan a la variable en estudio.
9.3.- Modelos de series cronolgicas.
El objeto del anlisis de las series cronolgicas es llegar a descomponer las componentes de la serie. Podemos
considerar las siguientes hiptesis o esquemas:
a) Modelo ADITIVO: Y
t
= T
t
+ C
t
+ E
t
+ A
t

b) Modelo MULTIPLICATIVO: Y
t
= T
t
* C
t
* E
t
* A
t

c) modelo MIXTO: Y
t
= T
t
* C
t
* E
t
+ A
t

9.4.- Descomposicin de series cronolgicas.
9.4.1.- TENDENCIA
Existen muchos mtodos para aislar el movimiento a largo plazo de la serie. Veremos dos:
1.- Mtodo de las medias mviles
Este mtodo trata de hallar la tendencia de la serie, diluyendo la importancia individual de cada observacin al
promediarla mediante una media aritmtica con las inmediatamente anteriores y posteriores.
Cada valor de y
t
vendr sustitudo por una media cuyas componentes irn variando mecnicamente, eliminndose
para cada grupo la primera observacin y aadindose la observacin siguiente.
Definiciones.-
*Dada una serie temporal, y
t
, t=1, 2, ... T.
Se denomina media mvil de longitud 2p+1 a la expresin:

=
+
=
p
p j
tj
t
p
y
1 . 2
Y
RESMENES DE ESTADSTICA DESCRIPTIVA 16
Se denomina media mvil sin centrar de longitud 2p a la expresin:

=
1
, 1
. 2
p
p j
tj
t t
p
y
Y
*Se denomina media mvil centrada de longitud 2p a la expresin:
2
1 , , 1 +
+
=
t t t t
t
Y Y
Y
Una vez obtenidas las medias mviles definitivas, la tendencia ser la lnea quebrada que las une.

2.- Mtodo de ajuste analtico.
La idea principal de este mtodo consiste en ajustar una funcin de la forma y
t
=f(t), las funciones que se suelen
tomar son:
y
t
= a+bt , funcin lineal (recta de regresin de y
t
sobre t: y
t
|t)
y
t
= a+bt+ct
2
, funcin parablica

CAMBIOS DE ORIGEN Y PERODO EN UNA ECUACION DE TENDENCIA.
(1) Cambio de origen: Mediante los cambios de origen se pretende en general que la variable temporal arranque de
un tiempo 0.
(2) Cambio de perodo: En un anlisis ms detallado de la serie cronolgica, puede ser necesario cambiar una
ecuacin de tendencia anual por una mensual, trimestral,...
Slo nos vamos a referir al caso ms sencillo (tendencia lineal)

9.4.2.- VARIACIONES ESTACIONALES.
Como ya se ha indicado anteriormente, las variaciones estacionales, constituyen una de las componentes a estudiar
en una serie cronolgica.
Su estudio tiene como finalidad el descubrir y medir las oscilaciones de orden puramente estacional, ya sea para
conocerlas o para eliminarlas, en un proceso conocido como "DESESTACIONALIZACION" de la serie
El proceso de desestacionalizacin de la serie, se lleva a cabo mediante el clculo de los "INDICES DE
VARIACION ESTACIONAL".
Existen diferentes mtodos para calcular los ndices de variacin estacional. Nosotros veremos el de las medias
mviles.

Mtodo de las razones a la media mvil.-
Este mtodo se basa en estimar el movimiento estacional a partir de la tendencia obtenida por el mtodo de las
medias mviles.
Veremos los pasos a seguir para elaborar el ndice de variacin estacional, para el caso de aceptar como modelo la
hiptesis multiplicativa. Supondremos datos mensuales, aunque todo lo que hagamos se puede aplicar igualmente a
datos trimestrales, bimensuales, etc...
1.- Dada la serie cronolgica por meses y para varios aos, se halla la tendencia por medio de las medias mviles,
tomando como perodo 12 meses. Con ello habremos determinado la componente T * C del modelo:
Y= T * C* E * A
2.- Se elimina la tendencia de los datos brutos de la serie, dividiendo cada uno de ellos por el correspondiente valor
de la media mvil calculada. Con ello se obtiene: A * E
C * T
A * E * C * T
=
3.- Se elimina la componente accidental, hallando las medias de los valores obtenidos para cada mes. Se puede
emplear tambin otro promedio, tal como la media geomtrica o la mediana.
4.- De la serie as obtenida, se calculan los ndices de variacin estacional en forma de porcentajes.
NOTAS: 1) Como los ndices de variacin estacional nos dan la influencia de la componente estacional, si
eliminamos (por cociente) esta componente estacional, obtendremos los valores desestacionalizados.
En efecto: A * C * T
E
A * E * C * T
E
Y
= = = serie desestacionalizada
2) Para hacer predicciones (teniendo en cuenta que la componente accidental no se puede prever) se
utiliza el producto de la tendencia (T*C) por la variacin estacional (IVE en tanto por uno).
9.5.- Autocorrelacin y correlacin serial.
AUTOCORRELACION: La correlacin, medida en la forma acostumbrada, entre una serie temporal y ella misma
retardada en un cierto intervalo de tiempo, recibe el nombre de autocorrelacin.
CORRELACION SERIAL: Es la correlacin que puede existir entre los datos de dos series cronolgicas distintas.