Vous êtes sur la page 1sur 38

Anlisis Estadstico de Datos Climticos

SERIES TEMPORALES II
Mario Bidegain (FC) Alvaro Diaz (FI)

Universidad de la Repblica Montevideo, Uruguay 2011

CONTENIDO
Anlisis espectral. Espectro de Potencia. Filtros estadsticos. Espectro cruzado. Periodicidades y cuasiperiodicidades. Separacin de seal y ruido.

Anlisis en el dominio de frecuencias


El anlisis en el dominio de frecuencia implica representar la serie de datos en trminos de contribuciones hechas en escalas de tiempo diferentes. Por ejemplo, una serie de tiempo de datos horarios de temperaturas de una ubicacin en latitudes medias por lo general expondr fuertes variaciones en la escala de tiempo diaria (correspondiente al ciclo diurno de calentamiento solar) y en la escala de tiempo anual (debido a la marcha de las estaciones). En el dominio de tiempo, estos ciclos aparecern como grandes valores positivos de la funcin de autocorrelacin cerca de 24 horas para el ciclo diurno, y 24 365 = 8760 horas para el ciclo anual. Pensando en la misma serie de tiempo en el dominio de frecuencia, hablamos de fuertes contribuciones a la variabilidad total de la serie temporal en los perodos de 24 y 8760 horas, o en frecuencias de 1/24 = 0.0417 1/h y 1/8760 = 0.000114 1/h.

Anlisis Armnico - Funciones Seno y Coseno


El anlisis armnico consiste en representar las fluctuaciones o variaciones en una serie de tiempo como la suma de una serie de funciones de coseno y seno. Estas funciones trigonomtricas son armnicas en el sentido que ellos son elegidas para tener frecuencias que exponen los mltiplos de nmeros enteros de la frecuencia fundamental decidida por el tamao de la muestra (p. ej., la longitud) de la serie de datos.

Funciones Peridicas
Una Funcin Peridica f(t) cumple la siguiente propiedad para todo valor de t. f(t)=f(t+T) A la constante mnima para la cual se cumple lo anterior se le llama el periodo de la funcin Repitiendo la propiedad se puede obtener: f(t)=f(t+nT), donde n=0,1, 2, 3,...

Funciones Peridicas
2t Yt = A cos( + ) T
A, amplitud de la oscilacin. T, perodo. , desfase.
1,5 DESFASE = PI/2 1,5 1 0,5 0 -0,5 1 -1 -1,5 8 15 22 29 36 43 50 57 64 71 78 85 92 99 T A

Expresiones alternativas:

1 0,5 0 -0,5 1 -1 -1,5 8 15 22 29 36 43 50 57 64 71 78 85 92 99

Yt = A cos(t + )

Yt = a cos(t ) + b sen(t ) a b a b Yt = ( i )e it + ( + i )e it 2 2 2 2

Serie Trigonomtrica de Fourier


Algunas funciones peridicas f(t) de periodo T pueden expresarse por la siguiente serie, llamada Serie Trigonomtrica de Fourier f(t) = a0 + a1cos(0t)+a2cos(20t)+... + b1sen(0t)+b2sen(20t)+... Donde 0=2/T. Es decir,

f (t) = 1 a + [a n cos(n0 t ) + b n sen ( n0 t )] 2 0


n =1

Serie Trigonomtrica de Fourier


Es posible escribir de una manera ligeramente diferente la Serie de Fourier, si observamos que el trmino ancos(n0t)+bnsen(n0t) se puede escribir como
a2 n + b2 n cos( n t ) + sen ( n t ) 0 0 2 2 2 2 a + b a + b n n n n an bn

Podemos encontrar una manera ms compacta para expresar estos coeficientes pensando en un tringulo rectngulo:

Serie Trigonomtrica de Fourier


an
bn
2 Cn = a2 + b n n

a2 n a2 n

+ +

b2 n b2 n

= cos n = sen n

n an

bn

Con lo cual la expresin queda


C n [cos n cos( n0 t ) + sen n sen (n0 t )]

= C n [cos( n0 t n )]

Serie Trigonomtrica de Fourier


Si adems definimos C0=a0/2, la serie de Fourier se puede escribir como
f ( t ) = C 0 + C n [cos( n0 t n )]
n =1

As, y

Cn = a +b

2 n

2 n

n = tan a n

1 bn

Componentes y armnicas
As, una funcin peridica f(t) se puede escribir como la suma de componentes sinusoidales de diferentes frecuencias n=n0. A la componente sinusoidal de frecuencia n0: Cncos(n0t+n) se le llama la ensima armnica de f(t). A la primera armnica (n=1) se le llama la componente fundamental y su periodo es el mismo que el de f(t)
A la frecuencia 0=2f0=2/T se le llama frecuencia angular fundamental.

Amplitudes y Periodograma
La componente de frecuencia cero C0, es el valor promedio de f(t) en cada periodo. Los coeficientes Cn y los ngulos n son respectivamente las amplitudes y los ngulos de fase de las armnicas. La descomposicin de la varianza puede presentarse en un grfico de potencia media o varianza de la armnica en funcin de la frecuencia y esto se denomina: Espectro de lnea de Fourier o Periodograma

El Periodograma
El periodograma se asimila a un sintonizador de un receptor de radio, as, la serie que observamos sera la seal emitida por una radio y el periodograma no sera mas que el dial que busca en que frecuencia se oye mejor la seal emitida.

20
6 4

15
2 0 -2 -4 -6 20 40 60 80 100 120 140 160 180 200

P ER DG
CICLO1

10

0 0 5 10 15 FREC 20 25

El Periodograma: formulacin
Modelo que sigue la serie observada:

Yt = ( a p cos i t + bi sen i t ) + t
i =1

Asumimos que las frecuencias, w, son:

i =

2pi N

pi = 1,..., k
Yt 0 = a t =1 N
N

Se determinan los parmetros, a y b, segn:

2 N p = Yt cos p o t a N t =1 N 2 = b Yt sen p o t p N t =1

N /2 a

1 = N

Y cos t
t t =1

Se calcula el periodograma I(w)

I ( p ) =

2 (a 2 + b p p)

2 0

El Periodograma: Interpretacin
El periodograma mide aportaciones a la varianza total de la serie de componentes peridicos de una frecuencia determinada (w). Si el periodograma presenta un pico en una frecuencia, indica que dicha frecuencia tiene mayor importancia en la serie que el resto. ciclo1=cos(2*pi*t/10)+cos(2*pi*t/40)+cos(2*pi*t/20)+cos(2*pi*t/25)+u
N=200; 200/10=20; 200/40=5; 200/20=10; 200/25=8
20
20

15

15 P E R D G
0 50 100 FREC 150

PERDG

10

10

0 0 5 10 15 FREC 20 25

El Periodograma: Interpretacin
De izquierda a derecha aumenta la frecuencia (disminuye el perodo)
1.5
0.0

1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5


20 40 60 80 100 120 140 160 180 200

1.0
-0.2

0.5
-0.4

0.0
-0.6

-0.5 -1.0 -1.5

-0.8

-1.0

20

40

60

80

100 120 140 160 180 200

0 0 50 100 150

El Periodograma y la transformada de Fourier


El periodograma est basado en una herramienta matemtica denominada Transformada de Fourier, segn la cual una serie, que cumpla determinados requisitos, puede descomponerse como suma de un nmero finito o infinito de frecuencias. Del mismo modo, a partir de la representacin frecuencial puede recuperarse la serie original a travs de la Transformada Inversa de Fourier. En este punto, es preciso sealar las diferencias existentes entre procesos discretos peridicos, aperidicos y estocsticos en trminos de frecuencias: Las series peridicas presenta un periodograma discreto, es decir, solo existe "masa" espectral en aquellas frecuencias contenidas en la serie, siendo stas un nmero discreto. Las series aperidicas presentan un periodograma contino, es decir, existe "masa" en un "infinito" nmero de frecuencias. Las series estocsticas presentan densidad espectral en un rango contino de frecuencias.

SERIE PERIODICA
1.5 1.0 0.5 0.0
40 100 80

SERIES APERIODICAS

60

-0.5
20

-1.0 -1.5 20 40 60 80 100 120 140 160 180 200


0 20 40 60 80 100 120 140 160 180 200

PERIODOGRAMA
20

PERIODOGRAMA
12000 10000

15

8000
PERDG 10

PERDG

6000 4000

2000
0 0 50 100 FREC 150

0 0 50 100 FREC 150

SERIES ESTOCASTICAS
3 2 1 0 -1 -2 -3 20 40 60 80 100 120 140 160 180 200

PERIODOGRAMA (DE ESA REALIZACION)


1.4 1.2 1.0 P E R D G 0.8 0.6 0.4 0.2 0.0 0 50 100 FREC 150

Estimacin del Espectro


El espectro o densidad espectral se define para procesos estocsticos estacionarios como la transformada de Fourier de la funcin de autocovarianza (teorema de WienerKhintchine). Su estimador natural es el periodograma, antes visto. Como hemos comprobado es un instrumento adecuado para la deteccin de procesos peridicos puros, sin embargo en el caso de procesos estocsticos presenta serias limitaciones, las ms importantes son la inconsistencia y la correlacin asintticamente nula entre ordenadas del periodograma. Esto implica que no converja al verdadero espectro cuando la muestra se amplia y que el periodograma muestre un comportamiento errtico.
1.4 1.2 1.0 P E R D G 0.8 0.6 0.4 0.2 0.0 0 50 100 FREC 150

h(w)

-pi

pi

Estimacin del Espectro:


METODOS NO PARAMTRICOS
A fin de solucionar los problemas antes comentados se propone, en este tipo de mtodos, ponderar el espectro por unos valores denominados ventanas espectrales Estimador sin aplicar ventanas

1 h( ) = 2

( N 1)

ir

(r ) R

r = ( N 1)

Estimador con ventanas

1 h( ) = 2

( N 1)

(r ) ( r )e ir R

r = ( N 1)

Existe un amplio nmero de ventanas espectrales: Tukey, Parzen, Hamming, etc.

Estimacin del Espectro


METODOS NO PARAMTRICOS
Si bien la utilizacin de ventanas espectrales permite eliminar la inconsistencia y la irregularidad del periodograma como estimador, el que se suavicen las ordenadas del periodograma introduce la dificultad de diferenciar frecuencias prximas. x1=cos(2*pi*t/(200/15))+cos(2*pi*t/(200/17))+u
PERIODOGRAMA NO SUAVIZADO 20

PERIODGRAMA SUAVIZADO MEDIANTE UNA VENTANA DE TUKEY-HANNING (M=50) 3.0

15 P E R D G
DENSIDAD2

2.5 2.0 1.5 1.0 0.5

10

0 0 10 20 FREC
FREC

30

40

0.0 0 10 20 30 40

Estimacin del Espectro


METODOS PARAMTRICOS
Los mtodos paramtricos, parten de suponer conocido el PGD, y modelizado en general a travs de un proceso ARMA, a partir del cual se puede recuperar una estimacin del espectro. Si la serie observada responde a un modelo ARMA (p,q):

Yt + a1Yt 1 + a 2Yt 2 + ... + a p Yt p = t + b1 t 1 + b2 t 2 + ... + bq t q


El espectro equivale a:

hY ( ) =

1 + b1e

+ b2 e

i 2

+ ... + bq e

iq 2 ip 2

1 + a1e i + a 2 e i 2 + ... + a p e

2 2

Serie original
8 6 4 2 0 -2 -4 -6 -8 20 40 60 80 100 120 140 160 180 200

Y4

Estimaciones del espectro


PERIODOGRAMA (NO ALISADO) 20
2.0
PERIO DOGRAMA ALISADO ( VENTANA TUKEY-HANNING)
350 300

15
D ENSID A D 2

1.5
250

PE RD G

1.0
200

10

0.5

150 100 50

0.0

0 0 20 40 FREC 60 80

-0.5 0 20 40 FREC 60 80
0 0 0.5 1 1.5 2 Frecuencia (0-pi) 2.5 3

COMPARACION METODOS DE ESTIMACION

450

PARAMETRICO

NO ALISADO

ALISADO

18

400

16

350

14

300

12

250

10

200

1 50

1 00

50

Espectro Cruzado I
La relacin general entre dos series climticas puede estudiarse a travs de funciones de correlacin cruzada, pero la existencia de un desplazamiento temporal de una serie respecto de la otra o de correlaciones positivas en un rango de frecuencias y negativas en otro deben detectarse por tcnicas algo mas elaboradas. La herramienta adecuada es el Espectro Cruzado, basado en la transformada de Fourier de la covarianza cruzada, que determina la relacin entre las dos series en el dominio de frecuencias evaluando la contribucin de una frecuencia a la covarianza cruzada total. La transformada de Fourier de la funcin Rxy () define la densidad coespectral de potencias o espectro cruzado.

El espectro cruzado permite evaluar el grado de correlacin entre las componentes de alta y baja frecuencia de las dos series temporales.

Espectro Cruzado II
Como la funcin de covarianza cruzada no es una funcin par, Gxy (f) es en general compleja y por lo tanto Gxy (f) = Cxy(f) i Qxy(f) Donde Cxy es el COESPECTRO y Qxy es la CUADRATURA El Coespectro especifica la contribucin de cada frecuencia f a la covarianza cruzada total de las series x(t) y y(t) para un desplazamiento temporal nulo. La Cuadratura mide la contribucin a la covarianza total cuando una de las series se desplaza temporalmente para dar un desplazamiento de 90en la fase para una frecuencia dada. El espectro cruzado tambin puede representarse en forma polar: Gxy(f) = IGxy(f)I exp(-i xy(f)) Donde Gxy(f) = sqrt(Cxy2 + Qxy2) es el espectro de Amplitudes y xy(f) = 360/2 arctg(Qxy/Cxy) es el espectro de Fases (en grados) La bondad de la relacin entre las variables x(t) y y(t) para las distintas frecuencias se puede obtener de la funcin de Coherencia: Kxy2 = IGxy(f)I2/Gx(f) Gy(f) 0 < Kxy2 < 1

Espectro Terico Modelos autorregresivos AR(1)


En el caso ms simple de un proceso AR (1) los valores positivos de la autocorrelacin inducen una memoria en la serie de tiempo que tiende a dejar de lado variaciones a corto plazo (de alta frecuencia) en la serie, y acentuar las de baja frecuencia. En trminos del espectro, estos efectos conducen a ms concentracin de la densidad en frecuencias menores, y menos densidad en frecuencias ms altas. Adems, estos efectos son cada vez ms fuertes cuanto ms cerca a 1. Estas ideas son cuantificadas por la funcin de densidad espectral terica para los procesos AR (1) :

Espectro Terico Modelos autorregresivos AR(1)

Espectro Terico Modelos autorregresivos AR(2)


El AR (1) el proceso con = 0 en realidad consiste en la serie de datos no correlacionados. Estos no exponen ninguna tendencia de acentuar altas o bajas frecuencias, entonces su espectro es constante, o chato. Como decamos otra vez por analoga con la luz visible, se le llama a esto el ruido blanco debido a la igual mezcla de todas las frecuencias. Finalmente, el AR (1) el proceso con = +0 6 tiende a producir variaciones errticas a corto plazo en la serie de tiempo, causando correlaciones negativas en desplazamientos impares y correlaciones positivas en desplazamientos pares. (Esta clase de estructura de correlacin es rara en las series temporales atmosfricas.) el espectro para este proceso est incrementado en las altas frecuencias y deprimido en las bajas frecuencias bajas, Estas series se conocen como procesos de ruido azul. En particular el espectro para el proceso AR (2):

Espectro Terico Modelos autorregresivos AR(2)


El AR (2) procesos es interesante debido a su capacidad para exponer una amplia variedad de comportamientos, incluyendo pseudoperiodicidades. Esta diversidad es reflejada en varias formas de los espectros. Los procesos con = 0.9 = -0.6, y = -0.9 = -0.5, exponen pseudoperiodicidades, como es indicado por los amplias picos en sus espectros en frecuencias intermedias. Los procesos con = 0.3 = 0.4 exponen la mayor parte de su variacin en bajas frecuencias, pero tambin muestra un pequeo mximo en altas frecuencias. El espectro para los procesos con = 0.7 = -0. 2 se parece a los espectros rojos de la figura anterior, aunque con un ms amplio mximo de baja frecuencia.

Espectro Terico Modelos autorregresivos AR(2)

Significacin estadstica de los picos espectrales en relacin a un ruido rojo


Imaginemos una serie temporal hipottica de longitud n = 200 para el cual las estimaciones de la autocorrelacin con lag 1 y la varianza de ruido blanco son r1 = 0.6 y s2, respectivamente. Un candidato razonable para describir el comportamiento de estos datos es una serie del tipo AR (1) con estos dos parmetros.

Relacin seal/ruido
La relacin seal/ruido (en ingls Signal to noise ratio SNR o S/N) se define como la relacin que hay entre la intensidad o potencia de la seal y la intensidad o potencia del ruido que la corrompe.

Espectro para la precipitacin de verano en Saint Louis (Missouri)

Espectro para la velocidad del viento en New Jersey


(Van der Hoven 1957)

Espectro para la velocidad del viento en New Jersey II


(Van der Hoven 1957)