Vous êtes sur la page 1sur 71

Identificacin de sistemas

lineales

Modelado de Sistemas
Identificacin

Seal de excitacin.
Estructura del modelo.
Mtodo de ajuste de los parmetros del
modelo.
Validacin del modelo.

Modelado de Sistemas
Como elegir la seal de excitacin?

La seal debe ser acotada.

Pero la relacin seal/ruido debe ser tan grande como


se pueda.

Espectro en relacin a la aplicacin (en un modelo


dinmico debe cubrir todo el rango de inters, en uno
esttico debe poner nfasis en bajas frecuencias).

Modelado de Sistemas
Datos de entrenamiento y de Validacin o
test

Datos de entrenamiento: Utilizados para ajustar los


parmetros del modelo.

Datos de validacin o test: Utilizados para medir la


performance del modelo.

Ambos deben cubrir toda regin del espacio de entradas que


uno desea modelar.

Modelado de Sistemas
Estructura del Modelo
La salida y ( k ) de un sistema lineal determinstico en el
instante k puede representa rse mediante el filtrado de la
entrada u ( k ) a traves del sistema lineal G ( q) con q -1 x( k ) = x( k - 1)

~
B (q)
y ( k ) = G ( q)u ( k ) = ~ u (k )
A( q )

Adicionalmente podemos considerar la parte estocstica


mediante el filtrado de ruido blanco a travs de la funcin H ( q )

~
C (q)
n( k ) = H ( q )v ( k ) = ~ v(k )
D(q)

Modelado de Sistemas
Estructura del Modelo
Un modelo lineal general que describa la parte determins tica
y la estocstica tiene la siguiente forma forma general

y( k ) = G( q )u( k ) + H ( q )v( k )

G( q ) : Funcin Transferen cia de la Entrada


H ( q ) : Funcin Transferen cia del ruido

En determinad as ocasiones puede considerarse que H y G


comparten cierta dinmica a los efectos de simplificar el tratamient o.

B( q ) C( q )
y( k ) = u( k ) + v( k )
F ( q ) A( q ) D( q ) A( q )

Modelado de Sistemas
Series Temporales

En el modelado de una serie temporal no disponemos de una entrada


o son tantas que no podemos considerar a todas en forma conjunta y
por tal razn asumimos que u( k ) = 0. El modelo se convierte en
puramente estocstico.

1
AUTORREGRESIVO (AR) y( k ) = v( k )
D( q )

PROMEDIO MVIL (MA) y( k ) = C( q )v( k )

C( q )
AUTORREGRESIVO CON PROMEDIO MVIL (ARMA) y( k ) = v( k )
D( q )

Modelado de Sistemas
Modelo General

En el modelo general se contempla el efecto de una


entrada externa u(k) (exgena) y por tal motivo en la
nomenclatura se le agrega una X.

v(k)
C( q )
D( q )

B( q ) 1
u(k) F( q ) A( q ) y(k)

Modelado de Sistemas
Algunos Modelos Usuales
v(k)
ARX OE
v(k)

1
B( q ) B( q )
u(k) A( q ) y(k) F( q ) y(k)
u(k)

v(k)
v(k) FIR
ARMAX

C( q )
1 B( q )
B( q ) u(k) y(k)
u(k) A( q ) y(k)

Modelado de Sistemas
Notar

Todos los modelos AR tienen un polinomio denominador


comun A(q) para la entrada y para el ruido.
En el modelo de Error de Salida (Output Error) el ruido no
pasa por un filtro. Es usual cuando el ruido es solo de
medida.
No se ha contemplado las demoras, pero estas siempre
pueden tenerse en cuenta mediante un retardo de la entrada
u(k-d).
Se asume que entre la entrada y la salida no hay un camino
directo. Es decir, se asume que los sistemas son
estrictamente propios.

Modelado de Sistemas
Simulacin y Prediccin

La simulacin es completamente determinstica.


En la prediccin podemos utilizar salidas previas del sistema real.
v(k)
v(k)
Proceso
H( q )
Proceso u(k) y(k)
H( q ) G( q )
u(k) y(k)
G( q )
) q -1 q -1
y( k )
Simulador )
Predictor y( k / k - 1 )
de un paso

Modelado de Sistemas
Predictor lineal optimo
Puede definirse como una combinaci n lineal de entradas y salidas filtradas

y( k / k - 1 ) = s0 u( k ) + s1u( k - 1 ) + ... + sns u( k - ns )


+ t1 y( k - 1 ) + ... + tnt y( k - nt )

o, de manera similar

y( k / k - 1 ) = S ( q )u( k ) + T ( q ) y( k ) T ( q ) no contiene el trmino t0

Puede demostrars e que los filtros S ( q ) y T ( q ) que brindan el menor error cuadrtico
de prediccin (Varianza del error de prediccin) es

G( q ) 1
y( k / k - 1 ) = u( k ) + 1 - y( k )
H( q ) H( q )

Modelado de Sistemas
Predictor lineal optimo

Dado y( k ) = G( q )u( k ) + H ( q )v( k ), el predictor optimo verifica

v( k ) = y( k ) - y( k / k - 1 )

Introducie ndo esta v( k ) en la primer ecuacin resulta

y( k ) = G( q )u( k ) + H ( q )( y( k ) - y( k / k - 1 ))

Si despejamos y( k / k - 1 ) obtenemos

G( q ) 1
y( k / k - 1 ) = u( k ) + 1 - y( k )
H( q ) H ( q )

Modelado de Sistemas
Modelo de Prediccin ARX

v(k)
ARX

1
B( q )
u(k) A( q ) y(k)

G( q ) = B( q ) / A( q ) H(q) = 1 /A(q)

y( k / k - 1 ) = B( q )u( k ) + ( 1 - A( q )) y( k )

La salida puede predecirse mediante Promedio Mvil

Modelado de Sistemas
Modelo de Prediccin ARMAX

v(k)
ARMAX

C( q )
1
B( q )
u(k) A( q ) y(k)

G( q ) = B( q ) / A( q ) H(q) = C( q ) /A(q)

B( q ) C( q ) - A( q )
y( k / k - 1 ) = u( k ) + y( k )
C( q ) C( q )

La salida no puede predecirse mediante Promedio Mvil


salvo el caso de C( q ) = 1
Modelado de Sistemas
Modelo de simulacin OE

v(k)
OE

B( q )
u(k) F( q ) y(k)

G( q ) = B( q ) / F ( q ) H(q) = 1

B( q )
y( k / k - 1 ) = u( k )
F( q )

Correspond e a un modelo para simulacin . No se utiliza


ninguna informaci n de la salida del sistema real.

Modelado de Sistemas
Matriz de regresin
e(1) y (1) y (1) v(1)
e(2) y (2) y (2) v(2)
E= Y = Y =
h=
M M M M

e( N ) y ( N ) y ( N ) v ( N )

x1 (1) x2 (1) L xn (1) q1


x (2) x (2) L x (2) q
F= 1 2 n q = 2
Matriz de M M M . Vector de
regresin parmetros
x1 ( N ) x2 ( N ) L xn ( N ) q n

Y = F donde, F puede escribirse F = [x1 x2 L xn ]

xi (1)
x (2) n : Nm. de parametros
con xi = i , para i = 1,..., n
M N : Nm. de muestras

xi ( N )

Modelado de Sistemas
Modelo polinomial

Proceso y
u e
-
1 c0

c1 y
^2 c2

^m cm
Modelo polinomial

Modelado de Sistemas
Matriz de regresin para modelo polinomial

y = c0 + c1u + c2 u 2 + ... + cm u m = ci u i
i =0

e( k ) = y( k ) - y( k )
e( k ) = y( k ) - c0 - c1u - c2 u 2 - ... - cm u m

c0
1 u( 1 ) u ( 1 ) L u ( 1 )
2 m

c1
1 u ( 2 ) u 2
( 2 ) L u m
( 2 )
= = c2
M M M M
M
1 u( N ) u ( N ) L u ( N )
2 m
c
m

Modelado de Sistemas
Modelo FIR

Proceso y
u e

b0 -

q -1 b1 y
q -2 b2

q -m bm
Modelo FIR

Modelado de Sistemas
Matriz de regresin para modelo FIR

y = b0 u( k ) + b1u( k - 1 ) + b2 u( k - 2 ) + ... + bm u( k - m )
e( k ) = y( k ) - y( k )
e( k ) = y( k ) - b0 u( k ) - b1u( k - 1 ) - b2 u( k - 2 ) - ... - bm u( k - m )

b0
u( m + 1 ) u( m ) u( m - 1 ) L u( 1 )
b1
u ( m + 2 ) u ( m + 1 ) u ( m ) L u ( 2 )
= = b2
M M M M
M
u( N ) u( N - 1 ) u( N - 2 ) L u( N - m ) b
m

Modelado de Sistemas
Modelo ARX

n(k)
Proceso y(k)
u(k)

-
B( q -1 ) A( q -1 )

e
Modelo ARX

Modelado de Sistemas
Matriz de regresin para modelo ARX
Supongamos que
B( q -1 ) = b1 q -1 + b2 q -2 + .. + bm q - m , A( q -1 ) = a1 q -1 + a2 q -2 + .. + am q - m
luego
y = b0u (k - 1) + ... + bmu (k - m) - a1 y (k - 1) - .. - am y (k - m)
e(k ) = y (k ) - y (k )
e(k ) = y (k ) - b0u (k ) - b1u (k - 1) - b2u (k - 2) - ... - bmu (k - m)
b1
u ( m) ... u (1) - y ( m) ... - y (1) M
u (m + 1) ... b
u ( 2) - y ( m + 1) ... - y ( 2)
F= q =
m

M M a1
M
u ( N - 1) ... u ( N - m ) - y ( N - 1) ... - y ( N - m )
am
Modelado de Sistemas
Cuadrados Mnimo

Batch: Identificacin fuera de lnea.


Se consideran todos los datos conjuntamente.
Debemos contar con una adecuada cantidad de
datos.
Recursiva: Identificacin en lnea.
Se considera cada dato a partir de que el mismo se
encuentra disponible.
Se debe garantizar una excitacin persistente.

Modelado de Sistemas
Cuadrados Mnimo Batch
1 T
Sea E = Y - Fq , y V (q ) = E E , luego
2
2V = E T E = (Y T - q T FT )(Y - Fq ) =
= Y T Y - Y T Fq - q T FT Y + q T FT Fq
Completand o cuadrados y asumiendo que FT F es invertible
2V = Y T Y - Y T Fq - q T FT Y + q T FT Fq
+ Y T F (FT F ) -1 FT Y - Y T F (FT F ) -1 FT Y
2V = Y T ( I - F (FT F ) -1 FT )Y + (q - (FT F ) -1 FT Y )T FT F (q - (FT F ) -1 FT Y )
El primer trmino no depende de q , Luego

)
q = (FT F ) -1 FT Y
Modelado de Sistemas
CM y Funcin de Correlacin

1

N 1 N 1 N

N i =1
2
1 (i )
i =1
1 ( i )2 ( i ) ... i =1
1 ( i ) m ( i )
1 N N
( i ) ( i ) N
1 1
1 2 ( i )m ( i )
N N N
2
2(i ) L
T = N i =1
2 1
i =1
N i =1

N M M M
1

N 1 N 1 N
m ( i )1 ( i ) m ( i )2 ( i ) L m2 ( i )
N i =1
N i =1
N i =1

1

N

N 1 ( i )Y ( i )
i =1
1 )
2 ( i )Y ( i ) = ( T )-1 T Y se transforma en
N

TY = N N

{ }
= corr i , j corr{i ,Y }
i =1
-1

1

N
m ( i )Y ( i )
N i =1

{ }
donde corr i , j : matriz de correlacin de las columnas i y j de la matriz

Modelado de Sistemas
Error: Residuo

El error es ortogonal a todas las columnas (regresores) de F


E = Y -
Y
2 2

11
- En el caso ideal (Estructura de modelo perfecta, parmetros optimos y
ausencia de ruido), dicho residuo es cero.
- En la prctica el residuo nos permite inferir la calidad de la estimacin.
Si el mismo es cercano a un ruido blanco se puede decir que el modelo
es bueno ya que toda la informacin ha sido capturada por el modelo.

Modelado de Sistemas
Nmero de Condicin
)
= ( T )-1 T Y

La matriz ( T )-1 T se conoce como pseudoinve rsa de


- Para que sea resolubre debe tener, por lo menos, tantas
filas como columnas, es decir, al menos tantas medidas
como parmetros del regresor. Para atenuar el efecto del ruido es
importante contar con muchas mas medidas que parmetros del regresor.

( T )
- El nmero de condicin de la matriz , i.e,
T

( T
)
es un indicador de la precisin mumrica de la inversa.
Modelado de Sistemas
Matriz de Covarianza
Una forma de describir la precisin de la estimacin es la siguiente

{ } {( )( )}
T
cov = E - E() - E() , E{}
. : Esperanza de {}
.

Si el ruido de la medida es blanco con varianza

{}
cov = 2 ( T )
-1

- Los regresores deben ser " grandes" y la varianza del ruido pequea,
i.e. alta relacin seal ruido.
1
- La matriz de covarianza es proporcion al a . Luego incrementa ndo
N
la cantidad de datos puede compensars e el nivel de ruido.

Modelado de Sistemas
Cuadrados Mnimo ponderado

1 T
Sea E = Y - Fq , y V (q ) = E WE , donde
2
W = [ wi ] es una matriz diagonal de M M con wi > 0, i = 1,2,..., M
Luego

)
q = (FT WF ) -1FT WY

W permite enfatizar un dato con respecto a otros.


Ejemplo : Dar mas relevancia a los datos recientes
Entonces
w1 < w2 < ... < wM

Modelado de Sistemas
Cuadrados Mnimo Recursivo

Si M es pequeo podremos aplicar Cuadrados Mnimo " Batch".


)
La forma recursiva permite actualizar a partir de nueva informaci n
disponible sin necesidad de recalcular la inversa de T .
Sea
-1
i T

k

P( k ) = ( ) =
T -1
x ( x ) : Matriz de covarianza
i

i =1
)
( k - 1 ) : Estimado en base a los k - 1 pares de datos disponible
Luego asumiendo que T es no singular para todo k
k -1

P (k )=
-1

i =1
x i ( x i )T +x k ( x k )T = P -1 ( k - 1 ) + x k ( x k )T

Modelado de Sistemas
Cuadrados Mnimo Recursivo
Sabemos que
)
q = (FT F ) -1 FT Y
Luego
-1
k k k

)
q (k ) = x i ( x i )T x i y i = P(k ) xi y i =

i =1 i =1 i =1
k -1

= P (k )


xi y i + x k y k

i =1
Entonces
k -1 k -1


) )
q (k - 1) = P(k - 1) xi y i P -1 (k - 1)q (k - 1) = xi y i
i =1 i =1
Modelado de Sistemas
Cuadrados Mnimo Recursivo
k -1


)
Tenemos que P -1 (k ) = P -1 (k - 1) + x k ( x k )T y P -1(k-1)q (k - 1) = xi y
i =1
Luego
k -1
-1 k k T )
(P (k)-x ( x ) )q (k - 1) =
i =1
xi y i

Ademas, habiamos arribado a


k -1

) k k
q (k ) = P(k ) i i
x y +x y

i =1
Entonces
q (k ) = P(k )(P
)
)
-1 )
k T )
(k ) - x ( x ) q (k - 1) + P(k ) x k y k
k

k k T )
= q (k - 1) - P(k ) x ( x ) q (k - 1) + P(k ) x k y k
) k T )
= q (k - 1) + P(k ) x ( y - ( x ) q (k - 1))
k k

Modelado de Sistemas
Cuadrados Mnimo Recursivo

) ) )
q (k ) = q (k - 1) + P(k ) x ( y - ( x ) q (k - 1))
k k k T

) )
Permite evaluar q (k ) a partir de q (k - 1) y el nuevo par de datos x k , y k

) )
y - ( x ) q (k - 1) : error de estimacin de y utilizando q (k - 1).
k k T k

Para calcular P (k ) podemos utilizar P -1 (k ) = P -1 (k - 1) + x k ( x k )T lo cual implica


una inversion de matriz en cada muestra.
Para evitar ello se utiliza el Lema de Inversin de matriz

( A + BCD ) -1 = A-1 - A-1 B (C -1 + DA-1 B ) -1 DA-1

Modelado de Sistemas
Cuadrados Mnimo Recursivo

( A + BCD) -1 = A -1 - A -1 B(C -1 + DA -1 B) -1 DA -1
P( k ) = (F T ( k )F ( k )) -1 = (F T ( k - 1)F ( k - 1) + x k ( x k )T ) -1
= ( P -1 ( k - 1) + x k ( x k )T ) -1
Definiendo A = P -1 ( k - 1), B = x k , C = 1 y D = ( x k )T

(
P( k ) = P( k - 1) - P( k - 1) x k 1 + ( x k )T P(k - 1) x k )
-1
( x k )T P(k - 1)
Junto con
) )
(
q (k ) = q (k - 1) + P(k ) x y - ( x ) q (k - 1)
k k k T
)
)
Conforman el algoritmo RLS (Recursive Least Square)

Modelado de Sistemas
Cuadrados Mnimo Recursivo

(
P(k ) = P(k - 1) - P(k - 1) x 1 + ( x ) P(k - 1) x
k k T
)
k -1
( x k )T P(k - 1)
) )
( k k k T
)
q (k ) = q (k - 1) + P(k ) x y - ( x ) q (k - 1) )
La inversin de una matriz se redujo a la inversin de un escalar.
)
Una manera usual de inicializarlo es tomar q (0) = 0, P(0) = aI con
a un escalar positivo grande.
Si se cuenta con una estimacin inical de los parmetros puede
)
utilizarse la misma como q (0) manteniendo P(0) = aI .

Modelado de Sistemas
RLS con factor de olvido

Si los parmetros varan lentamente con el tiempo podemos definir


2

( )
k
lk -i y i - ( x i )T q
1
V (q , k ) =
2
i =1
l : Factor de olvido, 0 < 1

Con esta incorporacin el algoritmo WRLS (RLS Ponderado) queda

1
l
(
P(k ) = I - P(k - 1) x lI + ( x ) P(k - 1) x
k k T k -1 k T
)
( x ) P(k - 1)

) )
( k T )
q (k ) = q (k - 1) + P(k ) x y - ( x ) q (k - 1)
k k )
Modelado de Sistemas
Evaluacin de modelos ARMAX

ARMAX
v(k)
No se puede evaluar
por CM a menos
C( q )
1
que C(q)=1
B( q )
u(k) A( q ) y(k)

G( q ) = B( q ) / A( q ) H(q) = C( q ) /A(q)

B( q ) C( q ) - A( q )
y( k / k - 1 ) = u( k ) + y( k )
C( q ) C( q )

Modelado de Sistemas
ARMAX en configuracin EE (Error de
Ecuacin)
Proceso v(k)

C( q )
A( q )

B( q )
A( q )
u(k) y(k)

B( q ) A( q )

1
C( q )

e(k)
Modelado de Sistemas
Optimizacin No lineal del ARMAX

1. Estimar un modelo ARX A( q ) = B( q )u( k ) + v( k )


a partir de los datos {u( k ), y( k )},

ARX = ( T ) T Y
-1

2. Optimizar los parmetros mediante un mtodo de


optimizacin de cuadrados mnimos no lineal. Para ello
necesitamo s calcular el error y el gradiente

e 2 ( k ) y( k )
e ( k ) = ( y( k ) - y( k )) = -2e( k )
2 2

Modelado de Sistemas
Optimizacin No lineal del ARMAX
C(q)y(k/k - 1 ) = B(q)u(k) + (C(q) - A(q)) y(k)

y(k / k - 1 ) y(k / k - 1 ) 1
C( q ) = - y( k - i ) =- y( k - i )
ai ai C( q )

y(k / k - 1 ) y(k / k - 1 ) 1
C( q ) = - u( k - i ) =- u( k - i )
bi bi C( q )

y(k / k - 1 )
y( k - i / k - i - 1 ) + C( q ) = y( k - i )
ci
y(k / k - 1 )
=-
1
( y( k - i ) - y( k - i / k - i - 1 ))
ci C( q )

Las componentes del gradiente pueden calcularse filtrando u(k-i),


y(k-i) y e(k-i) a travs del filtro 1/C(q).

Modelado de Sistemas
Otra vuelta sobre los FIR

Proceso y
u e

b0 -

q -1 b1 y
q -2 b2

q -m bm
Modelo FIR

Modelado de Sistemas
Bases de Funciones Ortonormales (FIR)

y( k ) = b0 u( k ) + b1u( k - 1 ) + b2 u( k - 2 ) + ... + bmu( k - m )

b u( k - i )
m

= i
i =0

La salida estimada proviene de una expansin en una


base ortogonal formada por retardos unitarios.
En este caso la memoria del operador retardo unitario es
de una sola muestra.

Modelado de Sistemas
Bases de Funciones Ortonormales
(Laguerre)

Si G(s) es estrictamente propia y analtica en Re (s)0, luego puede


expandirse segun
k -1
s-a

2a
G( s) = g k a >0
k =1 s+a s+a
Las funciones

i
2a s - a
Li ( s ) = i = 0 ,1,...,
(s+a ) s+a

- Son ortogonale s en L2 ( 0 , )
- La convergenc ia depende de la diferencia entre el polo dominante
del sistema y el de la expansin a .
Modelado de Sistemas
Bases de Funciones Ortonormales
(Laguerre)

u(t)
2a s-a s-a s-a
s+a s+a s+a s+a

g1 g2 gn


y(t)

Modelado de Sistemas
Laguerre: Elementos de la base en versin
discreta

Li ( q -1 ) =
(1 - a )T
2
q -1 - a
i

i = 0 ,1,2 ,...,
-1
1 - aq -1 1 - aq

q -1 : operador retardo unitario,


a : polo generador de la base,
a < 1 : a fin de preservar la estabilidad,
T : perodo de muestreo.
Si el sistema a tratar tiene retardos puros, estos pueden
agregarse multiplica ndo por q -nd .

Modelado de Sistemas
Laguerre: Elementos de la base en versin
discreta

Es importante notar que

L0 ( q -1 ) =
(1 - a )T
2

1 - aq -1
Los dems elementos de la base pueden evaluarse agregando

q -1 - a
1 - aq -1

ya que
q -1 - a
Li ( q ) = Li -1 ( q )
-1 -1
-1
i = 1,2 ,...,
1 - aq

Modelado de Sistemas
Laguerre: Elementos de la base en versin
discreta para sistemas stiff

En caso de tener que modelar un sistema Stiff puede plantearse


la siguiente estructura

i
nl
2 al s - al

m

G( s ) g li
s + al s + al
l =1 i =0

donde, con informaci n a priori de las constantes de tiempo ai , se


logran representa ciones compactas.

Modelado de Sistemas
Kautz: base en versin discreta para
sistemas resonantes

En el caso de sistemas resonantes se debe introducir un


operador con polos complejos conjugados. En este caso
deben reemplazarse los filtros de Laguerre por los de Kautz
n
G ( s ) g ky k ( s )
k =1
j -1
2cs s 2 - bs + c
y 2 j -1 ( s ) = 2 b > 0, c > 0, j = 1,2,..
s + bs + c s 2 + bs + c
j -1
2bc s 2 - bs + c
y 2 j ( s) = 2 b > 0, c > 0, j = 1,2,...
s + bs + c s 2 + bs + c

b y c se eligen de tal manera que las races sean cercanas a


las del sistema.
Modelado de Sistemas
Laguerre: Evaluacin de CM

Utilizaremos la notacin de Wahlberg, 1991.


k -1
K 1 - aq
Lk ( q, a ) = , K = (1 - a 2 )T
q-a q-a

~
y ( t ) = G ( q, q )u( t )
n
= g k Lk ( q, a )u( t )
k =1

= j ( t )T q

j (t ) = [u1 (t ),..., un (t )] , uk (t ) = Lk (q , a )u(t ), q = ( g1 ,..., gn )


T

Modelado de Sistemas
Laguerre: Evaluacin de CM

Datos { y( kT ),u( kT )},k = 1,..., N

[ y( kT ) - j ( kT ) q ]
N
~ 1
q = arg min T
q N k =1

La solucin viene dada por

N N
1
j ( kT )j ( kT )
1
j ( kT ) y( kT )
~
Rq = R= T

N k =1
N k =1

Modelado de Sistemas
Laguerre: Evaluacin de CM

El nmero de condicin de la matriz R brinda una


medida de la sensibilidad de la solucin de
cuadrados mnimo.
Dicho condicionamiento depende del grado de
persistencia de la excitacin.
Cuanto ms rica y persistente es la excitacin,
mejor condicionada ser la matriz y menos
sensible la solucin obtenida.

N
1
j ( kT )j ( kT )
N
~ 1
Rq = j ( kT ) y( kT ) R= T
N k =1 N k =1

Modelado de Sistemas
Complejidad del Modelo

Modelado de Sistemas
Complejidad del modelo

Es difcil definir la complejidad de un modelos pero puede


relacionarse con el nmero de parmetros.

Cuando ms parmetros tiene un modelo ms flexible es el


mismo.

Luego complejidad y flexibilidad pueden adoptarse como


sinnimos.

Analizaremos la influencia del nmero de parmetros en la


performance del modelo.

El error de un modelo puede descomponerse entre error en


bias y error de varianza.

Modelado de Sistemas
Varianza Varianza
Pequea Grande

Bias
Pequeo

Bias
Grande

Modelado de Sistemas
Dilema Bias Varianza
Sea un sistema (Curva Verde) con alta nolinealidad y una
evaluacin contaminada con ruido (Puntos rojos).

Modelo (azul) de muy bajo orden. Modelo (azul) de muy alto orden.
La inferencia es errnea debido La varianza de los parmetros del modelo
al alto bias del modelo. es alta
La varianza de los parmetros La inferencia es errnea debido a la alta
del modelo es baja variabilidad de los parmetros del modelo.

Modelado de Sistemas
Bias y Varianza
Sea y = f ( x) + e e : Ruido con media 0 y Var
y = f ( x) un modelo obtenido a partir de los datos y

( ) 2 2
E y - f = s + E f - f =





( )
E ( f - f ) = E ( f - E [ f ]+ E [ f ]- f ) =
2 2


= E ( f - E [ f ]) + E (E [ f ]- f ) + 2 E [(E [ f ]- f )( f - E [ f ])]
2 2


Bias Varianza A=0
=

Modelado de Sistemas

(
= E f - E f [ ])2
+ E ([] )
E
f -
f
2
+ 2 E E f [( [ ] )(
- f f - E f [ ])]
Bias Varianza =A

[( [ ] )( [ ])]
A = 2 E E f - f f - E f =

A = 2 E [ fE [ f ] - E E [ f ] - E [ f f ]+ E [ fE [ f ] =
2

E [ fE [ f ] = fE [ f ], E E [ f ] = E [ f ] ;
2 2


E [ f f ] = fE [ f ]; E [ fE [ f ] = E [ f ]
2

A = 2 fE [ f ]- E [ f ] - fE [ f ]+ E [ f ] = 0
2 2

Modelado de Sistemas
Error en Bias

Error debido a la carencia de flexibilidad del modelo ya que,


en general, los sistemas son muy complejos y es muy difcil
aproximar toda su riqueza dinmica.

Supongamos que un sistema lineal de 5to orden es modelado


por uno de 3ro. Luego aun cuando contemos con los
parmetros ptimos del modelo, el mismo no podr describir
completamente al sistema. Este error es error en bias.

Cuanto mas flexible es un modelo, menor error en bias es


esperable.

Si utilizamos un modelo lineal para aproximar un sistema no


lineal siempre tendremos error en bias. Si dicha no linealidad
es suave, dicho error podr ser despreciable.
Modelado de Sistemas
Error en Varianza

Este error es debido al apartamiento de los parmetros


respecto de sus valores ptimos.
Dado que el conjunto de datos es finito y contaminado con
ruido, los parmetros estimados nunca sern los ptimos.
Vimos que, si el ruido de la medida es blanco con varianza
{}
cov = 2 ( T )
-1

- Si el estimador es consistent e y contamos con infinitos datos el error


en varianza tiende a cero.
- Si tenemos tantos datos como parmetros la varianza es mxima.
En este caso podriamos ajustar el modelo a los datos en forma perfecta
lo cual no conforma una aproximaci on sino una interpolacion,
con lo cual estamos copiando elruido.

Modelado de Sistemas
Error en Varianza

Supongamos que una misma entrada es aplicada


varias veces a un mismo proceso.

Debido al ruido tendremos distintos conjuntos de


datos de salida.

Si estimamos un modelo por cada conjunto de datos


de entrada-salida tendremos distintos parmetros.

Obviamente, si el error es nulo los parmetros


siempre sern los mismos.

Modelado de Sistemas
Error en Varianza

Cuanto menos parmetros tiene un modelo menor ser el


error en varianza.
Principio de parsimonia: De todos los modelos que pueden
describir un proceso, el ms simple es el mejor.

Para un conjunto de datos suficientemente grande vale

n Nmero de parmetros
Error en Varianza 2
= Varianza del ruido .
N Long. conjunto de datos

Modelado de Sistemas
Dilema Bias Varianza

Modelado de Sistemas
Dilema bias varianza

Reduciendo la varianza del error se reduce la pendiente


del error en varianza y se puede utilizar un modelo mas
flexible.
Modelado de Sistemas
Best fit, elbow

65
Modelado de Sistemas
Estimador sin bias
La esperanza de los valores estimados de los
parmetros es igual al optimo (verdaderos)

N2

N2>N1

N1

opt
Modelado de Sistemas
Estimador consistente con bias

Podemos esperar que incrementando la cantidad de


datos nos acerquemos a los parmetros ptimos.

N2>N1

N2

N1

opt
Modelado de Sistemas
Estimador inconsistente con bias
Incrementando la cantidad de datos no podremos
eliminar el bias entre los parmetros estimados y los
verdaderos.

N2>N1

N2

N1

opt
Modelado de Sistemas
Estimador eficiente

El de menor varianza entre todos los que no tienen


bias.

Con bias y baja varianza

Sin bias pero alta varianza

Modelado de Sistemas
Como resolver el dilema bias varianza?

Regularizacin: Trata de reducir la complejidad del


modelo una vez alcanzados los objetivos de
aproximacin (Bias pequeo).

Agregacin: Intenta hacer crecer gradualmente la


complejidad de un modelo hasta alcanzar un mnimo
error de modelado (bias+varianza i.e., mnimo en
validacin)

Modelado de Sistemas
Regularizacin
Nos permite modificar la complejidad de un modelo sin
modificar la cantidad nominal de parmetros. El modelo
se comporta como si tuviera menos parmetros.

Se introduce un trmino de penalidad en la funcin a


minimizar.

Dado un modelo y = f ( u , )

I ( , ) = eT e + .w penal ( )

f (u( i ), )
2


N 2

w pen =
2
Rugosidad w pen = Ridge
i =1 u( i )2

Modelado de Sistemas

Vous aimerez peut-être aussi