Identificación de Sistemas Lineales

Identificacin de sistemas
lineales
Modelado de Sistemas
Identificacin
Seal de excitacin.
Estructura del modelo.
Mtodo de ajuste de los parmetros del
modelo.
Validacin del modelo.
Como elegir la seal de excitacin?
La seal debe ser acotada.
Pero la relacin seal/ruido debe ser tan grande como

se pueda.
Espectro en relacin a la aplicacin (en un modelo

dinmico debe cubrir todo el rango de inters, en uno
esttico debe poner nfasis en bajas frecuencias).
Datos de entrenamiento y de Validacin o
test
Datos de entrenamiento: Utilizados para ajustar los

parmetros del modelo.
Datos de validacin o test: Utilizados para medir la

performance del modelo.
Ambos deben cubrir toda regin del espacio de entradas que

uno desea modelar.
Estructura del Modelo
La salida y ( k ) de un sistema lineal determinstico en el
instante k puede representa rse mediante el filtrado de la
entrada u ( k ) a traves del sistema lineal G ( q) con q -1 x( k ) = x( k - 1)
~
B (q)
y ( k ) = G ( q)u ( k ) = ~ u (k )
A( q )
Adicionalmente podemos considerar la parte estocstica

mediante el filtrado de ruido blanco a travs de la funcin H ( q )
~
C (q)
n( k ) = H ( q )v ( k ) = ~ v(k )
D(q)
Estructura del Modelo
Un modelo lineal general que describa la parte determins tica
y la estocstica tiene la siguiente forma forma general
y( k ) = G( q )u( k ) + H ( q )v( k )
G( q ) : Funcin Transferen cia de la Entrada

H ( q ) : Funcin Transferen cia del ruido
En determinad as ocasiones puede considerarse que H y G

comparten cierta dinmica a los efectos de simplificar el tratamient o.
B( q ) C( q )
y( k ) = u( k ) + v( k )
F ( q ) A( q ) D( q ) A( q )
Series Temporales
En el modelado de una serie temporal no disponemos de una entrada

o son tantas que no podemos considerar a todas en forma conjunta y
por tal razn asumimos que u( k ) = 0. El modelo se convierte en
puramente estocstico.
1
AUTORREGRESIVO (AR) y( k ) = v( k )
D( q )
PROMEDIO MVIL (MA) y( k ) = C( q )v( k )
C( q )
AUTORREGRESIVO CON PROMEDIO MVIL (ARMA) y( k ) = v( k )
D( q )
Modelo General
En el modelo general se contempla el efecto de una

entrada externa u(k) (exgena) y por tal motivo en la
nomenclatura se le agrega una X.
v(k)
C( q )
D( q )
B( q ) 1
u(k) F( q ) A( q ) y(k)
Algunos Modelos Usuales
v(k)
ARX OE
v(k)
1
B( q ) B( q )
u(k) A( q ) y(k) F( q ) y(k)
u(k)
v(k)
v(k) FIR
ARMAX
C( q )
1 B( q )
B( q ) u(k) y(k)
u(k) A( q ) y(k)
Notar
Todos los modelos AR tienen un polinomio denominador

comun A(q) para la entrada y para el ruido.
En el modelo de Error de Salida (Output Error) el ruido no
pasa por un filtro. Es usual cuando el ruido es solo de
medida.
No se ha contemplado las demoras, pero estas siempre
pueden tenerse en cuenta mediante un retardo de la entrada
u(k-d).
Se asume que entre la entrada y la salida no hay un camino
directo. Es decir, se asume que los sistemas son
estrictamente propios.
Simulacin y Prediccin
La simulacin es completamente determinstica.

En la prediccin podemos utilizar salidas previas del sistema real.
v(k)
v(k)
Proceso
H( q )
Proceso u(k) y(k)
H( q ) G( q )
u(k) y(k)
G( q )
) q -1 q -1
y( k )
Simulador )
Predictor y( k / k - 1 )
de un paso
Predictor lineal optimo
Puede definirse como una combinaci n lineal de entradas y salidas filtradas
y( k / k - 1 ) = s0 u( k ) + s1u( k - 1 ) + ... + sns u( k - ns )

+ t1 y( k - 1 ) + ... + tnt y( k - nt )
o, de manera similar
y( k / k - 1 ) = S ( q )u( k ) + T ( q ) y( k ) T ( q ) no contiene el trmino t0
Puede demostrars e que los filtros S ( q ) y T ( q ) que brindan el menor error cuadrtico
de prediccin (Varianza del error de prediccin) es
G( q ) 1
y( k / k - 1 ) = u( k ) + 1 - y( k )
H( q ) H( q )
Predictor lineal optimo
Dado y( k ) = G( q )u( k ) + H ( q )v( k ), el predictor optimo verifica
v( k ) = y( k ) - y( k / k - 1 )
Introducie ndo esta v( k ) en la primer ecuacin resulta
y( k ) = G( q )u( k ) + H ( q )( y( k ) - y( k / k - 1 ))
Si despejamos y( k / k - 1 ) obtenemos
G( q ) 1
y( k / k - 1 ) = u( k ) + 1 - y( k )
H( q ) H ( q )
Modelo de Prediccin ARX
v(k)
ARX
1
B( q )
u(k) A( q ) y(k)
G( q ) = B( q ) / A( q ) H(q) = 1 /A(q)
y( k / k - 1 ) = B( q )u( k ) + ( 1 - A( q )) y( k )
La salida puede predecirse mediante Promedio Mvil
Modelo de Prediccin ARMAX
v(k)
ARMAX
C( q )
1
B( q )
u(k) A( q ) y(k)
G( q ) = B( q ) / A( q ) H(q) = C( q ) /A(q)
B( q ) C( q ) - A( q )
y( k / k - 1 ) = u( k ) + y( k )
C( q ) C( q )
La salida no puede predecirse mediante Promedio Mvil

salvo el caso de C( q ) = 1
Modelo de simulacin OE
v(k)
OE
B( q )
u(k) F( q ) y(k)
G( q ) = B( q ) / F ( q ) H(q) = 1
B( q )
y( k / k - 1 ) = u( k )
F( q )
Correspond e a un modelo para simulacin . No se utiliza

ninguna informaci n de la salida del sistema real.
Matriz de regresin
e(1) y (1) y (1) v(1)
e(2) y (2) y (2) v(2)
E= Y = Y =
h=
M M M M

e( N ) y ( N ) y ( N ) v ( N )
x1 (1) x2 (1) L xn (1) q1

x (2) x (2) L x (2) q
F= 1 2 n q = 2
Matriz de M M M . Vector de
regresin parmetros
x1 ( N ) x2 ( N ) L xn ( N ) q n
Y = F donde, F puede escribirse F = [x1 x2 L xn ]
xi (1)
x (2) n : Nm. de parametros
con xi = i , para i = 1,..., n
M N : Nm. de muestras

xi ( N )
Modelo polinomial
Proceso y
u e
-
1 c0
c1 y
^2 c2
^m cm
Modelo polinomial
Matriz de regresin para modelo polinomial
y = c0 + c1u + c2 u 2 + ... + cm u m = ci u i
i =0
e( k ) = y( k ) - y( k )
e( k ) = y( k ) - c0 - c1u - c2 u 2 - ... - cm u m
c0
1 u( 1 ) u ( 1 ) L u ( 1 )
2 m

c1
1 u ( 2 ) u 2
( 2 ) L u m
( 2 )
= = c2
M M M M
M
1 u( N ) u ( N ) L u ( N )
2 m
c
m
Modelo FIR
Proceso y
u e
b0 -
q -1 b1 y
q -2 b2
q -m bm
Modelo FIR
Matriz de regresin para modelo FIR
y = b0 u( k ) + b1u( k - 1 ) + b2 u( k - 2 ) + ... + bm u( k - m )
e( k ) = y( k ) - y( k )
e( k ) = y( k ) - b0 u( k ) - b1u( k - 1 ) - b2 u( k - 2 ) - ... - bm u( k - m )
b0
u( m + 1 ) u( m ) u( m - 1 ) L u( 1 )
b1
u ( m + 2 ) u ( m + 1 ) u ( m ) L u ( 2 )
= = b2
M M M M
M
u( N ) u( N - 1 ) u( N - 2 ) L u( N - m ) b
m
Modelo ARX
n(k)
Proceso y(k)
u(k)
-
B( q -1 ) A( q -1 )
e
Modelo ARX
Matriz de regresin para modelo ARX
Supongamos que
B( q -1 ) = b1 q -1 + b2 q -2 + .. + bm q - m , A( q -1 ) = a1 q -1 + a2 q -2 + .. + am q - m
luego
y = b0u (k - 1) + ... + bmu (k - m) - a1 y (k - 1) - .. - am y (k - m)
e(k ) = y (k ) - y (k )
e(k ) = y (k ) - b0u (k ) - b1u (k - 1) - b2u (k - 2) - ... - bmu (k - m)
b1
u ( m) ... u (1) - y ( m) ... - y (1) M
u (m + 1) ... b
u ( 2) - y ( m + 1) ... - y ( 2)
F= q =
m
M M a1
M
u ( N - 1) ... u ( N - m ) - y ( N - 1) ... - y ( N - m )
am
Cuadrados Mnimo
Batch: Identificacin fuera de lnea.

Se consideran todos los datos conjuntamente.
Debemos contar con una adecuada cantidad de
datos.
Recursiva: Identificacin en lnea.
Se considera cada dato a partir de que el mismo se
encuentra disponible.
Se debe garantizar una excitacin persistente.
Cuadrados Mnimo Batch
1 T
Sea E = Y - Fq , y V (q ) = E E , luego
2
2V = E T E = (Y T - q T FT )(Y - Fq ) =
= Y T Y - Y T Fq - q T FT Y + q T FT Fq
Completand o cuadrados y asumiendo que FT F es invertible
2V = Y T Y - Y T Fq - q T FT Y + q T FT Fq
+ Y T F (FT F ) -1 FT Y - Y T F (FT F ) -1 FT Y
2V = Y T ( I - F (FT F ) -1 FT )Y + (q - (FT F ) -1 FT Y )T FT F (q - (FT F ) -1 FT Y )
El primer trmino no depende de q , Luego
)
q = (FT F ) -1 FT Y
CM y Funcin de Correlacin
1

N 1 N 1 N
N i =1
2
1 (i )
i =1
1 ( i )2 ( i ) ... i =1
1 ( i ) m ( i )
1 N N
( i ) ( i ) N
1 1
1 2 ( i )m ( i )
N N N
2
2(i ) L
T = N i =1
2 1
i =1
N i =1

N M M M
1

N 1 N 1 N
m ( i )1 ( i ) m ( i )2 ( i ) L m2 ( i )
N i =1
N i =1
N i =1

1

N
N 1 ( i )Y ( i )
i =1
1 )
2 ( i )Y ( i ) = ( T )-1 T Y se transforma en
N
TY = N N

{ }
= corr i , j corr{i ,Y }
i =1
-1

1

N
m ( i )Y ( i )
N i =1

{ }
donde corr i , j : matriz de correlacin de las columnas i y j de la matriz
Error: Residuo
El error es ortogonal a todas las columnas (regresores) de F

E = Y -
Y
2 2
11
- En el caso ideal (Estructura de modelo perfecta, parmetros optimos y
ausencia de ruido), dicho residuo es cero.
- En la prctica el residuo nos permite inferir la calidad de la estimacin.
Si el mismo es cercano a un ruido blanco se puede decir que el modelo
es bueno ya que toda la informacin ha sido capturada por el modelo.
Nmero de Condicin
)
= ( T )-1 T Y
La matriz ( T )-1 T se conoce como pseudoinve rsa de

- Para que sea resolubre debe tener, por lo menos, tantas
filas como columnas, es decir, al menos tantas medidas
como parmetros del regresor. Para atenuar el efecto del ruido es
importante contar con muchas mas medidas que parmetros del regresor.
( T )
- El nmero de condicin de la matriz , i.e,
T

( T
)
es un indicador de la precisin mumrica de la inversa.
Matriz de Covarianza
Una forma de describir la precisin de la estimacin es la siguiente
{ } {( )( )}
T
cov = E - E() - E() , E{}
. : Esperanza de {}
.
Si el ruido de la medida es blanco con varianza
{}
cov = 2 ( T )
-1
- Los regresores deben ser " grandes" y la varianza del ruido pequea,
i.e. alta relacin seal ruido.
1
- La matriz de covarianza es proporcion al a . Luego incrementa ndo
N
la cantidad de datos puede compensars e el nivel de ruido.
Cuadrados Mnimo ponderado
1 T
Sea E = Y - Fq , y V (q ) = E WE , donde
2
W = [ wi ] es una matriz diagonal de M M con wi > 0, i = 1,2,..., M
Luego
)
q = (FT WF ) -1FT WY
W permite enfatizar un dato con respecto a otros.

Ejemplo : Dar mas relevancia a los datos recientes
Entonces
w1 < w2 < ... < wM
Cuadrados Mnimo Recursivo
Si M es pequeo podremos aplicar Cuadrados Mnimo " Batch".

)
La forma recursiva permite actualizar a partir de nueva informaci n
disponible sin necesidad de recalcular la inversa de T .
Sea
-1
i T

k
P( k ) = ( ) =
T -1
x ( x ) : Matriz de covarianza
i
i =1
)
( k - 1 ) : Estimado en base a los k - 1 pares de datos disponible
Luego asumiendo que T es no singular para todo k
k -1
P (k )=
-1

i =1
x i ( x i )T +x k ( x k )T = P -1 ( k - 1 ) + x k ( x k )T
Sabemos que
)
q = (FT F ) -1 FT Y
Luego
-1
k k k

)
q (k ) = x i ( x i )T x i y i = P(k ) xi y i =

i =1 i =1 i =1
k -1

= P (k )

xi y i + x k y k

i =1
Entonces
k -1 k -1

) )
q (k - 1) = P(k - 1) xi y i P -1 (k - 1)q (k - 1) = xi y i
i =1 i =1
k -1

)
Tenemos que P -1 (k ) = P -1 (k - 1) + x k ( x k )T y P -1(k-1)q (k - 1) = xi y
i =1
Luego
k -1
-1 k k T )
(P (k)-x ( x ) )q (k - 1) =
i =1
xi y i
Ademas, habiamos arribado a

k -1

) k k
q (k ) = P(k ) i i
x y +x y

i =1
Entonces
q (k ) = P(k )(P
)
)
-1 )
k T )
(k ) - x ( x ) q (k - 1) + P(k ) x k y k
k
k k T )
= q (k - 1) - P(k ) x ( x ) q (k - 1) + P(k ) x k y k
) k T )
= q (k - 1) + P(k ) x ( y - ( x ) q (k - 1))
k k
) ) )
q (k ) = q (k - 1) + P(k ) x ( y - ( x ) q (k - 1))
k k k T
) )
Permite evaluar q (k ) a partir de q (k - 1) y el nuevo par de datos x k , y k
) )
y - ( x ) q (k - 1) : error de estimacin de y utilizando q (k - 1).
k k T k
Para calcular P (k ) podemos utilizar P -1 (k ) = P -1 (k - 1) + x k ( x k )T lo cual implica

una inversion de matriz en cada muestra.
Para evitar ello se utiliza el Lema de Inversin de matriz
( A + BCD ) -1 = A-1 - A-1 B (C -1 + DA-1 B ) -1 DA-1
( A + BCD) -1 = A -1 - A -1 B(C -1 + DA -1 B) -1 DA -1
P( k ) = (F T ( k )F ( k )) -1 = (F T ( k - 1)F ( k - 1) + x k ( x k )T ) -1
= ( P -1 ( k - 1) + x k ( x k )T ) -1
Definiendo A = P -1 ( k - 1), B = x k , C = 1 y D = ( x k )T
(
P( k ) = P( k - 1) - P( k - 1) x k 1 + ( x k )T P(k - 1) x k )
-1
( x k )T P(k - 1)
Junto con
) )
(
q (k ) = q (k - 1) + P(k ) x y - ( x ) q (k - 1)
k k k T
)
)
Conforman el algoritmo RLS (Recursive Least Square)
(
P(k ) = P(k - 1) - P(k - 1) x 1 + ( x ) P(k - 1) x
k k T
)
k -1
( x k )T P(k - 1)
) )
( k k k T
)
q (k ) = q (k - 1) + P(k ) x y - ( x ) q (k - 1) )
La inversin de una matriz se redujo a la inversin de un escalar.
)
Una manera usual de inicializarlo es tomar q (0) = 0, P(0) = aI con
a un escalar positivo grande.
Si se cuenta con una estimacin inical de los parmetros puede
)
utilizarse la misma como q (0) manteniendo P(0) = aI .
RLS con factor de olvido
Si los parmetros varan lentamente con el tiempo podemos definir

2
( )
k
lk -i y i - ( x i )T q
1
V (q , k ) =
2
i =1
l : Factor de olvido, 0 < 1
Con esta incorporacin el algoritmo WRLS (RLS Ponderado) queda
1
l
(
P(k ) = I - P(k - 1) x lI + ( x ) P(k - 1) x
k k T k -1 k T
)
( x ) P(k - 1)

) )
( k T )
q (k ) = q (k - 1) + P(k ) x y - ( x ) q (k - 1)
k k )
Evaluacin de modelos ARMAX
ARMAX
v(k)
No se puede evaluar
por CM a menos
C( q )
1
que C(q)=1
B( q )
u(k) A( q ) y(k)
G( q ) = B( q ) / A( q ) H(q) = C( q ) /A(q)
B( q ) C( q ) - A( q )
y( k / k - 1 ) = u( k ) + y( k )
C( q ) C( q )
ARMAX en configuracin EE (Error de
Ecuacin)
Proceso v(k)
C( q )
A( q )
B( q )
A( q )
u(k) y(k)
B( q ) A( q )
1
C( q )
e(k)
Optimizacin No lineal del ARMAX
1. Estimar un modelo ARX A( q ) = B( q )u( k ) + v( k )

a partir de los datos {u( k ), y( k )},
ARX = ( T ) T Y
-1
2. Optimizar los parmetros mediante un mtodo de

optimizacin de cuadrados mnimos no lineal. Para ello
necesitamo s calcular el error y el gradiente
e 2 ( k ) y( k )
e ( k ) = ( y( k ) - y( k )) = -2e( k )
2 2
Optimizacin No lineal del ARMAX
C(q)y(k/k - 1 ) = B(q)u(k) + (C(q) - A(q)) y(k)
y(k / k - 1 ) y(k / k - 1 ) 1
C( q ) = - y( k - i ) =- y( k - i )
ai ai C( q )
y(k / k - 1 ) y(k / k - 1 ) 1
C( q ) = - u( k - i ) =- u( k - i )
bi bi C( q )
y(k / k - 1 )
y( k - i / k - i - 1 ) + C( q ) = y( k - i )
ci
y(k / k - 1 )
=-
1
( y( k - i ) - y( k - i / k - i - 1 ))
ci C( q )
Las componentes del gradiente pueden calcularse filtrando u(k-i),

y(k-i) y e(k-i) a travs del filtro 1/C(q).
Otra vuelta sobre los FIR
Proceso y
u e
b0 -
q -1 b1 y
q -2 b2
q -m bm
Modelo FIR
Bases de Funciones Ortonormales (FIR)
y( k ) = b0 u( k ) + b1u( k - 1 ) + b2 u( k - 2 ) + ... + bmu( k - m )
b u( k - i )
m
= i
i =0
La salida estimada proviene de una expansin en una

base ortogonal formada por retardos unitarios.
En este caso la memoria del operador retardo unitario es
de una sola muestra.
Bases de Funciones Ortonormales
(Laguerre)
Si G(s) es estrictamente propia y analtica en Re (s)0, luego puede

expandirse segun
k -1
s-a

2a
G( s) = g k a >0
k =1 s+a s+a
Las funciones
i
2a s - a
Li ( s ) = i = 0 ,1,...,
(s+a ) s+a
- Son ortogonale s en L2 ( 0 , )
- La convergenc ia depende de la diferencia entre el polo dominante
del sistema y el de la expansin a .
Bases de Funciones Ortonormales
(Laguerre)
u(t)
2a s-a s-a s-a
s+a s+a s+a s+a
g1 g2 gn

y(t)
Laguerre: Elementos de la base en versin
discreta
Li ( q -1 ) =
(1 - a )T
2
q -1 - a
i
i = 0 ,1,2 ,...,
-1
1 - aq -1 1 - aq
q -1 : operador retardo unitario,

a : polo generador de la base,
a < 1 : a fin de preservar la estabilidad,
T : perodo de muestreo.
Si el sistema a tratar tiene retardos puros, estos pueden
agregarse multiplica ndo por q -nd .
discreta
Es importante notar que
L0 ( q -1 ) =
(1 - a )T
2
1 - aq -1
Los dems elementos de la base pueden evaluarse agregando
q -1 - a
1 - aq -1

ya que
q -1 - a
Li ( q ) = Li -1 ( q )
-1 -1
-1
i = 1,2 ,...,
1 - aq
discreta para sistemas stiff
En caso de tener que modelar un sistema Stiff puede plantearse

la siguiente estructura
i
nl
2 al s - al

m
G( s ) g li
s + al s + al
l =1 i =0
donde, con informaci n a priori de las constantes de tiempo ai , se

logran representa ciones compactas.
Kautz: base en versin discreta para
sistemas resonantes
En el caso de sistemas resonantes se debe introducir un

operador con polos complejos conjugados. En este caso
deben reemplazarse los filtros de Laguerre por los de Kautz
n
G ( s ) g ky k ( s )
k =1
j -1
2cs s 2 - bs + c
y 2 j -1 ( s ) = 2 b > 0, c > 0, j = 1,2,..
s + bs + c s 2 + bs + c
j -1
2bc s 2 - bs + c
y 2 j ( s) = 2 b > 0, c > 0, j = 1,2,...
s + bs + c s 2 + bs + c
b y c se eligen de tal manera que las races sean cercanas a

las del sistema.
Laguerre: Evaluacin de CM
Utilizaremos la notacin de Wahlberg, 1991.

k -1
K 1 - aq
Lk ( q, a ) = , K = (1 - a 2 )T
q-a q-a
~
y ( t ) = G ( q, q )u( t )
n
= g k Lk ( q, a )u( t )
k =1
= j ( t )T q
j (t ) = [u1 (t ),..., un (t )] , uk (t ) = Lk (q , a )u(t ), q = ( g1 ,..., gn )

T
Datos { y( kT ),u( kT )},k = 1,..., N
[ y( kT ) - j ( kT ) q ]
N
~ 1
q = arg min T
q N k =1
La solucin viene dada por
N N
1
j ( kT )j ( kT )
1
j ( kT ) y( kT )
~
Rq = R= T
N k =1
N k =1
El nmero de condicin de la matriz R brinda una

medida de la sensibilidad de la solucin de
cuadrados mnimo.
Dicho condicionamiento depende del grado de
persistencia de la excitacin.
Cuanto ms rica y persistente es la excitacin,
mejor condicionada ser la matriz y menos
sensible la solucin obtenida.
N
1
j ( kT )j ( kT )
N
~ 1
Rq = j ( kT ) y( kT ) R= T
N k =1 N k =1
Complejidad del Modelo
Complejidad del modelo
Es difcil definir la complejidad de un modelos pero puede

relacionarse con el nmero de parmetros.
Cuando ms parmetros tiene un modelo ms flexible es el

mismo.
Luego complejidad y flexibilidad pueden adoptarse como

sinnimos.
Analizaremos la influencia del nmero de parmetros en la

performance del modelo.
El error de un modelo puede descomponerse entre error en

bias y error de varianza.
Varianza Varianza
Pequea Grande
Bias
Pequeo
Bias
Grande
Dilema Bias Varianza
Sea un sistema (Curva Verde) con alta nolinealidad y una
evaluacin contaminada con ruido (Puntos rojos).
Modelo (azul) de muy bajo orden. Modelo (azul) de muy alto orden.
La inferencia es errnea debido La varianza de los parmetros del modelo
al alto bias del modelo. es alta
La varianza de los parmetros La inferencia es errnea debido a la alta
del modelo es baja variabilidad de los parmetros del modelo.
Bias y Varianza
Sea y = f ( x) + e e : Ruido con media 0 y Var
y = f ( x) un modelo obtenido a partir de los datos y
( ) 2 2
E y - f = s + E f - f =

( )
E ( f - f ) = E ( f - E [ f ]+ E [ f ]- f ) =
2 2

= E ( f - E [ f ]) + E (E [ f ]- f ) + 2 E [(E [ f ]- f )( f - E [ f ])]
2 2

Bias Varianza A=0
=

(
= E f - E f [ ])2
+ E ([] )
E
f -
f
2
+ 2 E E f [( [ ] )(
- f f - E f [ ])]
Bias Varianza =A
[( [ ] )( [ ])]
A = 2 E E f - f f - E f =
A = 2 E [ fE [ f ] - E E [ f ] - E [ f f ]+ E [ fE [ f ] =
2

E [ fE [ f ] = fE [ f ], E E [ f ] = E [ f ] ;
2 2

E [ f f ] = fE [ f ]; E [ fE [ f ] = E [ f ]
2
A = 2 fE [ f ]- E [ f ] - fE [ f ]+ E [ f ] = 0
2 2
Error en Bias
Error debido a la carencia de flexibilidad del modelo ya que,

en general, los sistemas son muy complejos y es muy difcil
aproximar toda su riqueza dinmica.
Supongamos que un sistema lineal de 5to orden es modelado

por uno de 3ro. Luego aun cuando contemos con los
parmetros ptimos del modelo, el mismo no podr describir
completamente al sistema. Este error es error en bias.
Cuanto mas flexible es un modelo, menor error en bias es

esperable.
Si utilizamos un modelo lineal para aproximar un sistema no

lineal siempre tendremos error en bias. Si dicha no linealidad
es suave, dicho error podr ser despreciable.
Error en Varianza
Este error es debido al apartamiento de los parmetros

respecto de sus valores ptimos.
Dado que el conjunto de datos es finito y contaminado con
ruido, los parmetros estimados nunca sern los ptimos.
Vimos que, si el ruido de la medida es blanco con varianza
{}
cov = 2 ( T )
-1
- Si el estimador es consistent e y contamos con infinitos datos el error

en varianza tiende a cero.
- Si tenemos tantos datos como parmetros la varianza es mxima.
En este caso podriamos ajustar el modelo a los datos en forma perfecta
lo cual no conforma una aproximaci on sino una interpolacion,
con lo cual estamos copiando elruido.
Error en Varianza
Supongamos que una misma entrada es aplicada

varias veces a un mismo proceso.
Debido al ruido tendremos distintos conjuntos de

datos de salida.
Si estimamos un modelo por cada conjunto de datos

de entrada-salida tendremos distintos parmetros.
Obviamente, si el error es nulo los parmetros

siempre sern los mismos.
Error en Varianza
Cuanto menos parmetros tiene un modelo menor ser el

error en varianza.
Principio de parsimonia: De todos los modelos que pueden
describir un proceso, el ms simple es el mejor.
Para un conjunto de datos suficientemente grande vale
n Nmero de parmetros
Error en Varianza 2
= Varianza del ruido .
N Long. conjunto de datos
Dilema Bias Varianza
Dilema bias varianza
Reduciendo la varianza del error se reduce la pendiente

del error en varianza y se puede utilizar un modelo mas
flexible.
Best fit, elbow
65
Estimador sin bias
La esperanza de los valores estimados de los
parmetros es igual al optimo (verdaderos)
N2
N2>N1
N1
opt
Estimador consistente con bias
Podemos esperar que incrementando la cantidad de

datos nos acerquemos a los parmetros ptimos.
N2>N1
N2
N1
opt
Estimador inconsistente con bias
Incrementando la cantidad de datos no podremos
eliminar el bias entre los parmetros estimados y los
verdaderos.
N2>N1
N2
N1
opt
Estimador eficiente
El de menor varianza entre todos los que no tienen

bias.
Con bias y baja varianza
Sin bias pero alta varianza
Como resolver el dilema bias varianza?
Regularizacin: Trata de reducir la complejidad del

modelo una vez alcanzados los objetivos de
aproximacin (Bias pequeo).
Agregacin: Intenta hacer crecer gradualmente la

complejidad de un modelo hasta alcanzar un mnimo
error de modelado (bias+varianza i.e., mnimo en
validacin)
Regularizacin
Nos permite modificar la complejidad de un modelo sin
modificar la cantidad nominal de parmetros. El modelo
se comporta como si tuviera menos parmetros.
Se introduce un trmino de penalidad en la funcin a

minimizar.
Dado un modelo y = f ( u , )
I ( , ) = eT e + .w penal ( )
f (u( i ), )
2

N 2
w pen =
2
Rugosidad w pen = Ridge
i =1 u( i )2

Identificación de Sistemas Lineales

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Identificación de Sistemas Lineales

Transféré par

Droits d'auteur :

Formats disponibles

Identificacin de sistemas

La seal debe ser acotada.

Pero la relacin seal/ruido debe ser tan grande como

Espectro en relacin a la aplicacin (en un modelo

Datos de entrenamiento: Utilizados para ajustar los

Datos de validacin o test: Utilizados para medir la

Ambos deben cubrir toda regin del espacio de entradas que

Adicionalmente podemos considerar la parte estocstica

G( q ) : Funcin Transferen cia de la Entrada

En determinad as ocasiones puede considerarse que H y G

En el modelado de una serie temporal no disponemos de una entrada

PROMEDIO MVIL (MA) y( k ) = C( q )v( k )

En el modelo general se contempla el efecto de una

Todos los modelos AR tienen un polinomio denominador

La simulacin es completamente determinstica.

y( k / k - 1 ) = s0 u( k ) + s1u( k - 1 ) + ... + sns u( k - ns )

y( k / k - 1 ) = S ( q )u( k ) + T ( q ) y( k ) T ( q ) no contiene el trmino t0

Dado y( k ) = G( q )u( k ) + H ( q )v( k ), el predictor optimo verifica

Introducie ndo esta v( k ) en la primer ecuacin resulta

La salida puede predecirse mediante Promedio Mvil

La salida no puede predecirse mediante Promedio Mvil

Correspond e a un modelo para simulacin . No se utiliza

x1 (1) x2 (1) L xn (1) q1

Y = F donde, F puede escribirse F = [x1 x2 L xn ]

Batch: Identificacin fuera de lnea.

El error es ortogonal a todas las columnas (regresores) de F

La matriz ( T )-1 T se conoce como pseudoinve rsa de

Si el ruido de la medida es blanco con varianza

W permite enfatizar un dato con respecto a otros.

Si M es pequeo podremos aplicar Cuadrados Mnimo " Batch".

Ademas, habiamos arribado a

Para calcular P (k ) podemos utilizar P -1 (k ) = P -1 (k - 1) + x k ( x k )T lo cual implica

( A + BCD ) -1 = A-1 - A-1 B (C -1 + DA-1 B ) -1 DA-1

Si los parmetros varan lentamente con el tiempo podemos definir

Con esta incorporacin el algoritmo WRLS (RLS Ponderado) queda

1. Estimar un modelo ARX A( q ) = B( q )u( k ) + v( k )

2. Optimizar los parmetros mediante un mtodo de

Las componentes del gradiente pueden calcularse filtrando u(k-i),

y( k ) = b0 u( k ) + b1u( k - 1 ) + b2 u( k - 2 ) + ... + bmu( k - m )

La salida estimada proviene de una expansin en una

Si G(s) es estrictamente propia y analtica en Re (s)0, luego puede

q -1 : operador retardo unitario,

Es importante notar que

En caso de tener que modelar un sistema Stiff puede plantearse

donde, con informaci n a priori de las constantes de tiempo ai , se

En el caso de sistemas resonantes se debe introducir un

b y c se eligen de tal manera que las races sean cercanas a

Utilizaremos la notacin de Wahlberg, 1991.

j (t ) = [u1 (t ),..., un (t )] , uk (t ) = Lk (q , a )u(t ), q = ( g1 ,..., gn )

Datos { y( kT ),u( kT )},k = 1,..., N

La solucin viene dada por

El nmero de condicin de la matriz R brinda una

Es difcil definir la complejidad de un modelos pero puede

Cuando ms parmetros tiene un modelo ms flexible es el

Luego complejidad y flexibilidad pueden adoptarse como

Analizaremos la influencia del nmero de parmetros en la

El error de un modelo puede descomponerse entre error en

Error debido a la carencia de flexibilidad del modelo ya que,

Supongamos que un sistema lineal de 5to orden es modelado

Cuanto mas flexible es un modelo, menor error en bias es

Si utilizamos un modelo lineal para aproximar un sistema no

Este error es debido al apartamiento de los parmetros

- Si el estimador es consistent e y contamos con infinitos datos el error

Supongamos que una misma entrada es aplicada